IBM研究院最近宣布对其Granite编码基础模型开源,目标是实现高级AI工具大众化,进而推动跨行业间代码编写、维护与开发方式的全面变革。
IBM的Granite编码模型是什么水平?
Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所固有的复杂性与快速开发需求之后,IBM利用其强大的科研能力构建起一套AI驱动工具,旨在帮助开发人员驾驭涵盖众多要素的编码环境。
这项工作的顶峰就是Granite编码模型,其参数规模在30亿到340亿之间,且针对代码生成、bug修复及代码解释等任务进行了微调,旨在提高软件开发工作流程中的生产力水平。
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
这些模型经由CodeNet的丰富数据集进行训练,其中包含涉及50多种编程语言的5亿行代码,以及代码片段、问题和描述。如此广阔的训练边界有助于模型更准确、更高效地理解并生成代码。
分析师观点
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
通过在GitHub、Hugging Face、watsonx.ai及Red Hat的RHEL AI等流行平台上交付这些强大的工具,IBM不仅扩大了潜在的用户规模,还有助于推动这些模型的协同开发与定制。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
此举将带来深远的影响。首先,这显著降低了在软件开发流程中应用最先进AI工具的准入门槛。初创企业与独立开发者现在也可以访问到与商业巨头相同的强大资源,从而建立起公平的竞争环境、培育出更具活力和创新热情的开发社区。
IBM的方法不仅扩大了高级编码工具的可访问性,而且还为技能水平及可用资源各异的开发者营造出更加包容的环境。
从竞争的角度来看,IBM被定位为AI驱动的编码领域领导者,直接挑战其他也在探索类似领域、但可能尚未参与模型开源的科技巨头。通过在GitHub和Hugging Face等流行平台上发布Granite模型,IBM得以将自家方案推向开发人员的日常场景,从而提高其在软件开发社区中的影响力与知名度。
IBM此番开源的Granite模型有望对企业效率及开发者生产力带来巨大影响,进而为软件开发工具中的AI集成树立起新的基准。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。