随着云服务商优先考虑AI研发、而非传统服务器升级,资本支出正迎来一波猛增。
云基础设施正在经历一场剧变,各家服务提供商争相部署和配置用于AI模型训练的服务器,甚至不惜以推迟其标准服务器硬件的正常更新周期为代价。
这波生成式AI热潮正在重塑众多云服务商的优先事项序列。最近一份报告显示,今年云数据中心基础设施的资本支出将增长30%。
但Omdia云与数据中心研究主管Vlad Galabov进一步表示,哪怕是这样的预测恐怕也跟不上现实情况的发展。
Galabov指出,“一部分云服务提供商刚刚表示,他们可能会将资本支出提高到超出此前预测的水平。再次提醒,预估的资本支出已经增加了约三分之一,如果说还要进一步提高,那么将达到前所未有的规模。”
事实上,根据Omdia目前的估计,今年AI服务器将占到整体服务器资本支出的一半以上(66%),Galabov表示这的确非同寻常。
他同时提到,“我们从未见过如此颠覆性的态势。现在,我们在此前的支出预测基础上又上调了约100亿美元。”
这笔大规模投资来自更广泛的群体,而不仅仅是三大云服务商——也就是亚马逊云科技、Azure和Google Cloud。其中涵盖前十大云服务提供商,但同时也囊括了越来越多像CoreWeave这样正在大力投资于专业AI云服务的提供商。
虽然目前66%的服务器支出用于支持AI硬件,但这部分开销所对应的系统仍未占据云数据中心的大部分部署比例。事实上,根据Omdia的数据,AI服务器仅占出货量的19%,这也从侧面表明这些塞满GPU的设备有多么昂贵。
这就引发了新的问题:所有这些AI系统上的支出,是否会影响云服务商对现有服务器的更新能力。而且实际情况似乎还更加复杂,毕竟各大云基础设施运营商还在更多定制化芯片上砸下了数十亿美元,希望让相应平台运行得更加高效。
Galabov指出,“在最大的云服务提供商当中,我们正在积极整合其非AI服务器基础设施,尽可能帮助其降低AI之外的成本。”
他告诉我们,最典型的例子之一就是谷歌对其视频处理服务器的处置。该公司开发了一款名为视频编码单元(VCU)的定制化处理器,针对H.264视频进行了优化,其中一个协处理器甚至能够取代两台英特尔Skylake服务器。
这意味着在公司的下一波更新期间,他们不再使用较新的服务器一对一替换Skylake服务器,而是通过一套配置有12个VCU的系统替换多台旧服务器。
除此之外,谷歌还针对一种更加高效的视频压缩格式VP9优化了该处理器,也就是说一台拥有20块VCU的服务器可以直接取代好几个机架的Skylake服务器。
Galabov解释称,“也就是说他们无法更新好几个服务器机架,而可以用一台针对该应用程序高度加速和高度优化的服务器将其替代,借此大大节约资金。”
“我们预计这种情况后续会越来越多。Meta也在做类似的尝试,这很可能成为一种普遍趋势。数据库应用程序可能也会经历类似的优化周期,Web基础设施应用程序同样如此。”
(例如Pliops等公司已经推出了硬件加速器,能够提高许多数据库的底层键值存储性能。)
与此同时,不少企业也没有放弃自己的基础设施、转头使用公有云资源,近期反而出现了一种将部分工作负载带回内部的趋势——也就是所谓“云遣返”。
其中一个原因就是,许多公司发现使用公有云资源的成本可能根本就不比自主运营IT系统低,甚至往往更高。这背后虽然有着诸多因素的影响(亚马逊云科技就常被指责存在计费方式过于复杂的问题),但多数情况下似乎主要由资源管理不善所引发。
Galabov表示,“基础设施成本膨胀和基础设施利用不足,导致许多企业投入云怀抱”。但在转向云后,一部分用户继续沿用过去的管理实践,即在习惯上仍然保留大量冗余基础设施容量,最终导致需要为并未实际使用的资源而付费。
出于这个原因,Galabov认为未来市场应当更多关注设施规模的合理性,或者将工作负载放置在最合理的位置。Omdia将其称为“云智能”,Galabov则表示这种表达已经成为行业术语。
Galabov表示至少在不久的将来,他相信企业将越来越多地依赖IT即服务平台(例如Dell Apex或者HPE Greenlake)进行内部计算。
这些平台既能够为客户提供与公有云服务相同的好处,同时设施又位于他们自己的数据中心或者主机托管站点之内。供应商可以提供完整且预先配置的基础设施,负责提供管理服务,并设有随用随付等计费选项。
他表示,“我个人认为应该不会出现大规模的下云趋势,这更像是一种小规模的优化手段。”
这方面的证据是,企业在云基础设施服务上的支出比以往任何时候都更加强劲,今年第一季度的增幅达21%,来到760多亿美元。
目前,所有这些支出中约有72%都流向了三大云服务商。不过同一项调查也发现,Snowflake、MongoDB和甲骨文等二线云运营商的同比增长率更高。
也许这些挑战者以及CoreWeave等专业AI提供商将逐渐削弱三大云巨头的主导地位,或者说目前针对三大厂商的反垄断审查将进一步推动市场开放,让云领域的竞争变得愈发激烈。无论最终结果如何,云服务都将屹立不倒、坚定前行。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。