据The Information近日报道,微软计划建造一台拥有数百万处理器的超级计算机,以支持OpenAI的研究。
该系统将面向人工智能工作负载运行。据报道,微软高管将这台超级计算机命名为“星际之门”(Stargate),据信这是微软更广泛计划的一部分,微软还将建造其他几个人工智能集群。该项目预计耗资高达 1000 亿美元。
OpenAI已经使用微软的基础设施来训练其人工智能模型。2020 年,这家云计算和软件巨头披露,它已经建造了一台 Azure 托管的超级计算机,配备了10000块显卡,以支持OpenAI的工作。据这两家公司称,该系统在推出时是全球最快的五台超级计算机之一。
去年3月,微软提供了与OpenAI 基础设施合作的最新情况。该公司详细介绍了其这家人工智能开发商建造的、最初为10000块GPU超级计算机的升级情况,该系统目前包含数以万计的 A100 芯片。微软高管Scott Guthrie表示,该系统的成本“可能高于”数亿美元。
今天来自 The Information 的报道显示,更多升级正在进行中。据该刊物的消息来源称,微软计划在 2030 年之前再建立几个人工智能基础设施。据报道,该计划分为五个阶段,据信微软和 OpenAI 目前正处于第三个阶段的中间。
第四阶段预计将建造一台新的超级计算机,“大约”在2026年启动。第五阶段则将以微软高管内部称为“星际之门”的系统为中心。这台超级计算机及其数以百万计的芯片预计最早将于2028年投入使用。
截至去年3月,微软主要使用英伟达(Nvidia)公司的显卡为其OpenAI的超级计算基础设施提供动力。这种情况在未来有可能发生改变。11 月,该公司详细介绍了内部开发的名为 Azure Maia的人工智能加速器,该加速器配备了1050亿个晶体管。
OpenAI有可能不会是星际之门和微软预计部署的其他新人工智能集群的唯一用户。去年,微软详细说明了它已经使用为 OpenAI 构建的超级计算基础设施来训练自己的人工智能模型。微软还向云计算客户提供硬件,它也可能在星际之门上采用这种方法,以便更快地收回该系统可能高昂的成本。
鉴于星际之门预计最早将于 2028 年上线,它很可能不会被用来训练OpenAI的GPT-4的后继者。上周,Insider 报道称,GPT-5 将在几个月后投入使用。据悉,OpenAI 已经有了该模型的工作原型,其功能比 GPT-4 有“实质性的提升”。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
KAIST研究团队开发出RL-ZVP方法,首次让AI从训练中的"无用数据"学习。传统方法遇到全对或全错答案时会停止学习,但RL-ZVP通过分析词汇重要性给予精确反馈。在数学推理测试中,该方法比现有技术提升高达8.6个准确率点,且训练过程更稳定。这项突破重新定义了AI训练范式,证明了被忽视的训练数据实际蕴含巨大学习潜力。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
中国传媒大学团队发现,通过巧妙设计"视觉句子"框架,一个预训练的视频生成模型经过轻量级调整后能够统一处理多种视觉任务,包括图像生成、深度预测、物体分割等。该方法无需大量任务特定数据,每个任务仅用20个样本就能实现良好效果,展现了从专用AI向通用AI转变的可能性。