微软正在开发AI优化芯片,以降低训练生成式AI模型(例如为OpenAI ChatGPT聊天机器人提供动力的模型)的成本。
The Information近日援引两位知情人士的话说,至少从2019年开始,微软就一直在研发代号为“Athena”的新芯片组。微软和OpenAI的员工已经可以使用新芯片,并正在使用这些芯片在GPT-4等大型语言模型上测试芯片的性能。
训练大型语言模型需要摄取和分析大量数据,以便为AI创建新的输出内容来模仿人类对话,这是生成式AI模型的一大标志,这个过程需要大量(大约数万个)针对AI进行优化了的计算机芯片,其成本可能是非常高的。
据说微软正在开发用于自己产品的新型芯片,以减少对第三方芯片的依赖,并降低成本。目前,计算机芯片设计商Nvidia在AI芯片市场占据主导地位,去年发布了最新的H100 GPU。微软将加入Amazon、Google和Meta Platforms的行列,都针对AI开发和构建自己的定制化芯片。
SemiAnalysis首席分析师Dylan Patel告诉The Information:“微软希望在其所有应用中使用大型语言模型,包括Bing、Microsoft 365和GitHub,要使用现成的硬件进行大规模部署,那么每年的花费将达到数百亿美金。”
微软在2023年初向OpenAI投资100亿美元,迅速开始将其AI技术集成到微软的各项服务中,包括带有Bing Chat功能的Bing搜索引擎、Microsoft 365、面向企业用户的Dynamics 365以及面向安全专业人员的Security Copilot。
报道指出,微软的这些芯片其目的并不是取代Nvidia的芯片,相反,这些芯片是为了增强微软现有的基础设施。据The Information称,微软已经规划好了该芯片的未来几代。
目前尚不清楚微软是否计划为Azure云AI客户发布这些芯片,或者是否仅供内部使用,但微软确实提供了基于Nvidia H100芯片组的AI优化云实例。目前还不清楚这会给微软和Nvidia去年年底公布的AI超级计算机合作关系带来怎样的影响。
据报道,微软预计新芯片将在2024年亮相。
好文章,需要你的鼓励
"当我看到梵高的每一笔中都有他的痛苦时,才明白我们看的不是作品,而是作者的人生。AI正以惊人的速度接近人类水平通用智能,让Google从'伦敦那帮疯子在搞AGI'转变为全公司共识。DeepMind让AI'合理地幻觉'来创造突破,就像Astra技术让用户第一次惊呼'AI能做到比想象更多'——这不仅是技术革命,更是重新定义创造力的开始。"
英伟达2025Q1营收440亿美元创纪录,数据中心业务暴涨73%至390亿美元。黄仁勋直言:"中国是全球最大AI市场,出口管制只会让美国失去平台领导权。Blackwell架构推动推理性能提升30倍,微软已部署数万块GPU,AI工厂正成为各国数字基础设施核心。"
来自耶路撒冷希伯来大学的研究团队开发了WHISTRESS,一种创新的无需对齐的句子重音检测方法,能够识别说话者在语音中强调的关键词语。研究者基于Whisper模型增加了重音检测组件,并创建了TINYSTRESS-15K合成数据集用于训练。实验表明,WHISTRESS在多个基准测试中表现优异,甚至展示了强大的零样本泛化能力。这项技术使语音识别系统不仅能理解"说了什么",还能捕捉"如何说"的细微差别,为人机交互带来更自然的体验。
这项研究提出了"力量提示"方法,使视频生成模型能够响应物理力控制信号。研究团队来自布朗大学和谷歌DeepMind,他们通过设计两种力提示——局部点力和全局风力,让模型生成符合物理规律的视频。惊人的是,尽管仅使用约15,000个合成训练样本,模型展现出卓越的泛化能力,能够处理不同材质、几何形状和环境下的力学交互。研究还发现模型具有初步的质量理解能力,相同力量对不同质量物体产生不同影响。这一突破为交互式视频生成和直观世界模型提供了新方向。