IBM研究院最近宣布对其Granite编码基础模型开源,目标是实现高级AI工具大众化,进而推动跨行业间代码编写、维护与开发方式的全面变革。
IBM的Granite编码模型是什么水平?
Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所固有的复杂性与快速开发需求之后,IBM利用其强大的科研能力构建起一套AI驱动工具,旨在帮助开发人员驾驭涵盖众多要素的编码环境。
这项工作的顶峰就是Granite编码模型,其参数规模在30亿到340亿之间,且针对代码生成、bug修复及代码解释等任务进行了微调,旨在提高软件开发工作流程中的生产力水平。
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
这些模型经由CodeNet的丰富数据集进行训练,其中包含涉及50多种编程语言的5亿行代码,以及代码片段、问题和描述。如此广阔的训练边界有助于模型更准确、更高效地理解并生成代码。
分析师观点
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
通过在GitHub、Hugging Face、watsonx.ai及Red Hat的RHEL AI等流行平台上交付这些强大的工具,IBM不仅扩大了潜在的用户规模,还有助于推动这些模型的协同开发与定制。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
此举将带来深远的影响。首先,这显著降低了在软件开发流程中应用最先进AI工具的准入门槛。初创企业与独立开发者现在也可以访问到与商业巨头相同的强大资源,从而建立起公平的竞争环境、培育出更具活力和创新热情的开发社区。
IBM的方法不仅扩大了高级编码工具的可访问性,而且还为技能水平及可用资源各异的开发者营造出更加包容的环境。
从竞争的角度来看,IBM被定位为AI驱动的编码领域领导者,直接挑战其他也在探索类似领域、但可能尚未参与模型开源的科技巨头。通过在GitHub和Hugging Face等流行平台上发布Granite模型,IBM得以将自家方案推向开发人员的日常场景,从而提高其在软件开发社区中的影响力与知名度。
IBM此番开源的Granite模型有望对企业效率及开发者生产力带来巨大影响,进而为软件开发工具中的AI集成树立起新的基准。
好文章,需要你的鼓励
Carma Technology 针对 Uber 提起专利侵权诉讼,称其侵犯了涉及拼车系统的五项专利。案情回溯至十年前,凸显专利保护对创新者的重要性,可能对 Uber 及其他公司带来巨大影响。
东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些挑战性任务上的表现也比常规任务降低了约14个百分点,证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务,为评估AI代理在实际应用场景中的表现提供了更严格的标准。
经过暂停战略调整,Automattic 宣布重返 WordPress 开发,包括核心、Gutenberg、Playground 等模块,计划今年推出 6.9 版本,并涉及与 WP Engine 的法律争端。
这项研究提出了一种名为LIFT的新型微调方法,通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明,仅更新5%的主要权重就能在推理任务上超越全参数微调,同时保持与LoRA相当的内存效率。LIFT在常识推理、算术推理等多项任务上表现优异,还能更好地平衡学习新知识与保留原有能力。这一方法揭示了大语言模型中关键参数的重要性,为资源高效的模型定制提供了新思路。