IBM研究院最近宣布对其Granite编码基础模型开源,目标是实现高级AI工具大众化,进而推动跨行业间代码编写、维护与开发方式的全面变革。
IBM的Granite编码模型是什么水平?
Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所固有的复杂性与快速开发需求之后,IBM利用其强大的科研能力构建起一套AI驱动工具,旨在帮助开发人员驾驭涵盖众多要素的编码环境。
这项工作的顶峰就是Granite编码模型,其参数规模在30亿到340亿之间,且针对代码生成、bug修复及代码解释等任务进行了微调,旨在提高软件开发工作流程中的生产力水平。
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
这些模型经由CodeNet的丰富数据集进行训练,其中包含涉及50多种编程语言的5亿行代码,以及代码片段、问题和描述。如此广阔的训练边界有助于模型更准确、更高效地理解并生成代码。
分析师观点
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
通过在GitHub、Hugging Face、watsonx.ai及Red Hat的RHEL AI等流行平台上交付这些强大的工具,IBM不仅扩大了潜在的用户规模,还有助于推动这些模型的协同开发与定制。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
此举将带来深远的影响。首先,这显著降低了在软件开发流程中应用最先进AI工具的准入门槛。初创企业与独立开发者现在也可以访问到与商业巨头相同的强大资源,从而建立起公平的竞争环境、培育出更具活力和创新热情的开发社区。
IBM的方法不仅扩大了高级编码工具的可访问性,而且还为技能水平及可用资源各异的开发者营造出更加包容的环境。
从竞争的角度来看,IBM被定位为AI驱动的编码领域领导者,直接挑战其他也在探索类似领域、但可能尚未参与模型开源的科技巨头。通过在GitHub和Hugging Face等流行平台上发布Granite模型,IBM得以将自家方案推向开发人员的日常场景,从而提高其在软件开发社区中的影响力与知名度。
IBM此番开源的Granite模型有望对企业效率及开发者生产力带来巨大影响,进而为软件开发工具中的AI集成树立起新的基准。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。