微软首次推出27亿参数的Phi-2模型，性能超过许多大型语言模型

微软发布了一款名为Phi-2的人工智能模型，并称其性能可媲美甚至超越规模是其25倍的模型。

微软发布了一款名为Phi-2的人工智能模型，该模型表现出了不凡的能力，其性能可媲美甚至超越规模是其25倍的、更大、更成熟的模型。

微软在近日的一篇博文中宣布，Phi-2是一个拥有27亿参数的语言模型，与其他基础模型相比，它在复杂的基准测试中表现出了 "先进的性能"，这些测试评估了推理、语言理解、数学、编码和常识能力。Phi-2现在通过微软Azure人工智能工作室的模型目录发布，这意味着研究人员和开发人员现在就可以将其集成到第三方应用程序中。

Phi-2由微软首席执行官Satya Nadella（如图）于11月在Ignite大会上首次发布，其强大的功能得益于该公司所称的“教科书质量”数据（专门针对知识），以及学习其他模型传递的洞见的技术。

Phi-2 的有趣之处在于，传统上，大型语言模型的能力总是与其总体规模密切相关，而总体规模是以参数来衡量的。参数越大的模型通常能力越强，但 Phi-2 的出现改变了这种状况。

微软表示，Phi-2在某些基准测试中显示出与更大型的基础模型相匹敌甚至超越它们的能力，包括Mistral AI 70亿参数的Mistral、Meta Platforms公司130亿参数的Llama 2，甚至在某些基准测试中超过了700亿参数的Llama-2。

最令人惊讶的说法可能是，它的性能甚至超过了谷歌的 Gemini Nano，后者是上周发布的 Gemini系列LLM中效率最高的一款。Gemini Nano 专为设备上的任务而设计，可以在智能手机上运行，实现文本摘要、高级校对、语法修正以及上下文智能回复等功能。

微软的研究人员说，Phi-2涉及的测试非常广泛，包括语言理解、推理、数学、编码挑战等。

微软首次推出27亿参数的Phi-2模型，性能超过许多大型语言模型

该公司表示，Phi-2之所以能取得如此优异的成绩，是因为它是用精心挑选的教科书级数据训练而成，这些数据旨在教授推理、知识和常识，这意味着它可以从更少的信息中学到更多的东西。微软的研究人员还使用了一些技术，允许从更小的模型中获取知识。

研究人员表示，值得注意的是，Phi-2可以不使用基于人类反馈的强化学习或者教学性微调等技术就实现强劲的性能，这些技术通常用于改善人工智能模型行为。尽管没有使用这些技术，但是与其他使用了这些技术的开源模型相比，Phi-2在减少偏见和有毒内容方面依然表现卓越。该公司认为这是量身定制的数据整理的功劳。

微软首次推出27亿参数的Phi-2模型，性能超过许多大型语言模型

Phi-2是微软研究人员所称的“小型语言模型（SLM）”系列的最新版本。该系列第一个模型是 Phi-1，于今年早些时候首次发布，拥有13亿参数，针对基本的Python编码任务进行了微调。今年9月，该公司又推出了拥有13亿参数的Phi-1.5，使用新的数据源进行训练，其中包括用自然语言编程生成的各种合成文本。

微软表示，Phi-2的高效性使其成为研究人员探索增强人工智能安全性、可解释性和语言模型道德发展等领域的理想平台。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

微软首次推出27亿参数的Phi-2模型，性能超过许多大型语言模型

来源：至顶网软件与服务频道

2023

12/13

10:32

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: