IBM研究院最近宣布对其Granite编码基础模型开源,目标是实现高级AI工具大众化,进而推动跨行业间代码编写、维护与开发方式的全面变革。
IBM的Granite编码模型是什么水平?
Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所固有的复杂性与快速开发需求之后,IBM利用其强大的科研能力构建起一套AI驱动工具,旨在帮助开发人员驾驭涵盖众多要素的编码环境。
这项工作的顶峰就是Granite编码模型,其参数规模在30亿到340亿之间,且针对代码生成、bug修复及代码解释等任务进行了微调,旨在提高软件开发工作流程中的生产力水平。
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
这些模型经由CodeNet的丰富数据集进行训练,其中包含涉及50多种编程语言的5亿行代码,以及代码片段、问题和描述。如此广阔的训练边界有助于模型更准确、更高效地理解并生成代码。
分析师观点
Granite模型通过将复杂的日常编码任务转为自动化以提高生产力。这不仅加快了开发流程,还帮助开发人员能够专注于软件开发中更具创造性与战略性的任务。对企业来说,Granite大模型则有助于加快产品上市速度、增强软件质量。
通过在GitHub、Hugging Face、watsonx.ai及Red Hat的RHEL AI等流行平台上交付这些强大的工具,IBM不仅扩大了潜在的用户规模,还有助于推动这些模型的协同开发与定制。
此外,其中还蕴藏着无限的创新潜能。如今开源社区已经能够修改并重构Granite模型,因此新的应用方案和配套工具可能陆续出现,进而重新定义软件开发中的现行标准与实践。
此举将带来深远的影响。首先,这显著降低了在软件开发流程中应用最先进AI工具的准入门槛。初创企业与独立开发者现在也可以访问到与商业巨头相同的强大资源,从而建立起公平的竞争环境、培育出更具活力和创新热情的开发社区。
IBM的方法不仅扩大了高级编码工具的可访问性,而且还为技能水平及可用资源各异的开发者营造出更加包容的环境。
从竞争的角度来看,IBM被定位为AI驱动的编码领域领导者,直接挑战其他也在探索类似领域、但可能尚未参与模型开源的科技巨头。通过在GitHub和Hugging Face等流行平台上发布Granite模型,IBM得以将自家方案推向开发人员的日常场景,从而提高其在软件开发社区中的影响力与知名度。
IBM此番开源的Granite模型有望对企业效率及开发者生产力带来巨大影响,进而为软件开发工具中的AI集成树立起新的基准。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。