微软正在开发AI优化芯片,以降低训练生成式AI模型(例如为OpenAI ChatGPT聊天机器人提供动力的模型)的成本。
The Information近日援引两位知情人士的话说,至少从2019年开始,微软就一直在研发代号为“Athena”的新芯片组。微软和OpenAI的员工已经可以使用新芯片,并正在使用这些芯片在GPT-4等大型语言模型上测试芯片的性能。
训练大型语言模型需要摄取和分析大量数据,以便为AI创建新的输出内容来模仿人类对话,这是生成式AI模型的一大标志,这个过程需要大量(大约数万个)针对AI进行优化了的计算机芯片,其成本可能是非常高的。
据说微软正在开发用于自己产品的新型芯片,以减少对第三方芯片的依赖,并降低成本。目前,计算机芯片设计商Nvidia在AI芯片市场占据主导地位,去年发布了最新的H100 GPU。微软将加入Amazon、Google和Meta Platforms的行列,都针对AI开发和构建自己的定制化芯片。
SemiAnalysis首席分析师Dylan Patel告诉The Information:“微软希望在其所有应用中使用大型语言模型,包括Bing、Microsoft 365和GitHub,要使用现成的硬件进行大规模部署,那么每年的花费将达到数百亿美金。”
微软在2023年初向OpenAI投资100亿美元,迅速开始将其AI技术集成到微软的各项服务中,包括带有Bing Chat功能的Bing搜索引擎、Microsoft 365、面向企业用户的Dynamics 365以及面向安全专业人员的Security Copilot。
报道指出,微软的这些芯片其目的并不是取代Nvidia的芯片,相反,这些芯片是为了增强微软现有的基础设施。据The Information称,微软已经规划好了该芯片的未来几代。
目前尚不清楚微软是否计划为Azure云AI客户发布这些芯片,或者是否仅供内部使用,但微软确实提供了基于Nvidia H100芯片组的AI优化云实例。目前还不清楚这会给微软和Nvidia去年年底公布的AI超级计算机合作关系带来怎样的影响。
据报道,微软预计新芯片将在2024年亮相。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。