英伟达和微软发布新的小语言模型

英伟达近日发布了一款轻量级语言模型Mistral-NeMo-Minitron 8B，该模型在一系列任务中的表现均优于同等规模的神经网络。

该模型的代码以开源许可的形式发布在Hugging Face网站上。该模型发布的前一天，微软刚刚推出了几个自己的开源语言模型。与英伟达的新算法一样，这些新模型也是为了在处理能力有限的设备上运行而设计的。

Mistral-NeMo-Minitron 8B是英伟达上个月推出的Mistral NeMo 12B语言模型的缩小版。后者是与Mistral AI SAS合作开发的算法，Mistral AI SAS是一家人工智能初创公司，已经募集了大量的资金。英伟达利用了两种名为“剪枝”和“提炼”的机器学习技术创建了Mistral-NeMo-Minitron 8B。

“剪枝”是一种通过删除代码库中不必要的组件来降低模型硬件要求的方法。神经网络由无数个人工神经元组成，每个人工神经元的代码片段都能执行一组相对简单的计算。其中一些代码片段在处理用户请求时发挥的作用不如其他代码片段活跃，这意味着可以在不显著降低人工智能输出质量的情况下删除这些代码片段。

在对 Mistral NeMo 12B进行“剪枝”后，英伟达进入了该项目的所谓“提炼”阶段。“提炼”是工程师将人工智能知识转移到另一个硬件效率更高的神经网络的过程。在这种情况下，第二个模型就是今天亮相的Mistral-NeMo-Minitron 8B，它比原来的模型少了40亿个参数。

开发人员还可以通过从头开始训练一个全新的模型来降低人工智能项目的硬件要求。与这种方法相比，“提炼”有几个优势，尤其是能提高人工智能的输出质量。将大型模型“提炼”为小型模型的成本也更低，因为这项任务不需要那么多训练数据。

英伟达表示，在开发过程中结合使用“剪枝”和“提炼”技术显著提高了Mistral-NeMo-Minitron 8B 的效率。英伟达的高管Kari Briski在一篇博文中介绍说，“其体积小到足以在配备了Nvidia RTX的工作站上运行，同时在人工智能支持的聊天机器人、虚拟助手、内容生成器和教育工具的多个基准测试中依然表现出色。”

Mistral-NeMo-Minitron 8B发布的前一天，微软刚刚开源了自己的三个语言模型。与英伟达的新算法一样，它们的开发也考虑到了硬件效率。

这些模型中最紧凑的名为Phi-3.5-mini-instruct。它拥有38亿个参数，可以处理多达 128,000个标记的数据提示，这使它能够摄取冗长的商业文档。微软进行的一项基准测试表明，Phi-3.5-mini-instruct在执行某些任务时比Llama 3.1 8B和Mistral 7B更出色，而后两者的参数数量大约是前者的两倍。

本周二，微软还开源了另外两个语言模型。第一个是Phi-3.5-vision-instruct，它是Phi-3.5-mini-instruct的一个版本，可以执行图像分析任务，比如解释用户上传的图表。它与Phi-3.5-MoE-instruct同时推出，后者是一个更大的模型，拥有608亿个参数。当用户输入提示时，只有十分之一的参数会激活，这大大减少了推理所需的硬件数量。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

英伟达和微软发布新的小语言模型

来源：至顶网软件与服务频道

2024

08/22

10:54

分享

点赞

后Transformer模型系统能够推动变革

德国实验室推出DeepSeek R1-0528变体，速度提升200%

Sakana AI 推出 TreeQuest：多模型团队表现超越单一大语言模型30%

蚂蚁国际联合国际掉期与衍生工具协会ISDA在新加坡发布跨境支付通证化行业框架

AI时代的“摆渡人”：从云起到智深，源信网络的七年穿越

OpenAI投资人Vinod Khosla：AI如何五年掌握80%工作技能？

微软启动新一轮裁员计划，9000名员工受影响

Wonder Dynamics联合创始人加入2025年TechCrunch Disrupt AI舞台

全球风投二季度复苏迹象显现，AI交易主导资本流向

什么是Perplexity？这款AI聊天机器人全方位解读

英超联赛推出AI工具提升球迷体验

Lovable计划融资1.5亿美元，估值达20亿美元

思科与英伟达扩大合作，助力企业加速应用AI技术

黄仁勋CES记者会实录：AI扩展没有物理限制，英伟达只专注做好两件事

英伟达推进合作，旨在加速人工智能代理在医疗保健研究中的应用

微软开源旗下的Phi-4小型语言模型

微软打造的迷你AI PC问世

微软计划在2025财年斥资800亿美元建设人工智能数据中心

让实时互动和AI，同频共振

微软发布主要使用合成数据训练的Phi-4语言模型

微软预览新型节水数据中心设计

市值一夜蒸发6400亿！回顾英伟达被调查始末，华为或成最终赢家？

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: