微软开源其小型语言模型 Phi-4

微软发布了名为 Phi-4 的小型语言模型的开源代码。该模型具有 140 亿参数，能够生成文本和解决数学问题。经过内部评估，Phi-4 在某些基准测试中的表现优于参数量是其 5 倍的大型模型。这一举动加入了科技巨头开源小型语言模型的潮流中。

微软公司今天发布了小型语言模型 Phi-4 的代码，这个模型能够生成文本并解决数学问题。

微软上个月首次详细介绍了这个模型。最初，Phi-4 只能通过微软的 Azure Foundry 人工智能开发服务访问。现在，该模型可以在 Hugging Face（一个流行的开源 AI 项目托管网站）上下载。

Phi-4 是微软在 2023 年推出的小型语言模型系列的第四代产品。它拥有 140 亿参数，这些配置设置决定了神经网络如何处理数据。微软研究人员使用 1,920 个英伟达 H100 图形处理器组成的集群，用了 21 天时间对其进行训练。

该模型基于业界标准的 Transformer 架构，这也是大多数大语言模型的基础架构。当接收到用户提示时，Transformer 模型会将输入分解为单个词，并通过分析周围的文本来确定每个词的含义。此外，它们会优先处理被认为最相关的上下文部分。

Phi-4 采用了所谓的仅解码器型 Transformer 架构。标准的 Transformer 模型会分析单词前后的文本来确定其含义，而仅解码器模型只关注单词之前的文本，这减少了需要处理的数据量，从而降低了推理成本。

在一篇研究论文中，微软详细介绍了使用两种后训练优化技术来提升 Phi-4 的输出质量。这些方法被称为直接偏好优化和监督微调。两种方法都涉及向语言模型提供示例，说明它应该如何生成提示响应。

在内部评估中，微软将 Phi-4 与参数量是其五倍的 Llama 3.3 70B 进行了比较。公司表示，Phi-4 在流行的 GPQA 和 MATH 基准测试中表现更好。这两个测试数据集分别包含科学问题和数学问题。

Phi-4 加入了过去一年主要科技公司开源的小型语言模型不断增长的行列。

去年二月，谷歌推出了一系列名为 Gemma 的小型语言模型。该系列算法的参数量在 20 亿到 270 亿之间。据谷歌称，270 亿参数版本的性能可以超过规模是其两倍以上的模型。

最近，Meta 发布了两个参数量不到 50 亿的 Llama 3.2 模型。随后，该公司开源了这些模型的更高效版本，这些版本采用了称为量化的机器学习技术。该技术通过压缩神经网络摄入的数据来减少处理所需的硬件资源。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

微软开源其小型语言模型 Phi-4

来源：SiliconANGLE

2025

01/09

13:04

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会