随着云服务商优先考虑AI研发、而非传统服务器升级,资本支出正迎来一波猛增。
云基础设施正在经历一场剧变,各家服务提供商争相部署和配置用于AI模型训练的服务器,甚至不惜以推迟其标准服务器硬件的正常更新周期为代价。
这波生成式AI热潮正在重塑众多云服务商的优先事项序列。最近一份报告显示,今年云数据中心基础设施的资本支出将增长30%。
但Omdia云与数据中心研究主管Vlad Galabov进一步表示,哪怕是这样的预测恐怕也跟不上现实情况的发展。
Galabov指出,“一部分云服务提供商刚刚表示,他们可能会将资本支出提高到超出此前预测的水平。再次提醒,预估的资本支出已经增加了约三分之一,如果说还要进一步提高,那么将达到前所未有的规模。”
事实上,根据Omdia目前的估计,今年AI服务器将占到整体服务器资本支出的一半以上(66%),Galabov表示这的确非同寻常。
他同时提到,“我们从未见过如此颠覆性的态势。现在,我们在此前的支出预测基础上又上调了约100亿美元。”
这笔大规模投资来自更广泛的群体,而不仅仅是三大云服务商——也就是亚马逊云科技、Azure和Google Cloud。其中涵盖前十大云服务提供商,但同时也囊括了越来越多像CoreWeave这样正在大力投资于专业AI云服务的提供商。
虽然目前66%的服务器支出用于支持AI硬件,但这部分开销所对应的系统仍未占据云数据中心的大部分部署比例。事实上,根据Omdia的数据,AI服务器仅占出货量的19%,这也从侧面表明这些塞满GPU的设备有多么昂贵。
这就引发了新的问题:所有这些AI系统上的支出,是否会影响云服务商对现有服务器的更新能力。而且实际情况似乎还更加复杂,毕竟各大云基础设施运营商还在更多定制化芯片上砸下了数十亿美元,希望让相应平台运行得更加高效。
Galabov指出,“在最大的云服务提供商当中,我们正在积极整合其非AI服务器基础设施,尽可能帮助其降低AI之外的成本。”
他告诉我们,最典型的例子之一就是谷歌对其视频处理服务器的处置。该公司开发了一款名为视频编码单元(VCU)的定制化处理器,针对H.264视频进行了优化,其中一个协处理器甚至能够取代两台英特尔Skylake服务器。
这意味着在公司的下一波更新期间,他们不再使用较新的服务器一对一替换Skylake服务器,而是通过一套配置有12个VCU的系统替换多台旧服务器。
除此之外,谷歌还针对一种更加高效的视频压缩格式VP9优化了该处理器,也就是说一台拥有20块VCU的服务器可以直接取代好几个机架的Skylake服务器。
Galabov解释称,“也就是说他们无法更新好几个服务器机架,而可以用一台针对该应用程序高度加速和高度优化的服务器将其替代,借此大大节约资金。”
“我们预计这种情况后续会越来越多。Meta也在做类似的尝试,这很可能成为一种普遍趋势。数据库应用程序可能也会经历类似的优化周期,Web基础设施应用程序同样如此。”
(例如Pliops等公司已经推出了硬件加速器,能够提高许多数据库的底层键值存储性能。)
与此同时,不少企业也没有放弃自己的基础设施、转头使用公有云资源,近期反而出现了一种将部分工作负载带回内部的趋势——也就是所谓“云遣返”。
其中一个原因就是,许多公司发现使用公有云资源的成本可能根本就不比自主运营IT系统低,甚至往往更高。这背后虽然有着诸多因素的影响(亚马逊云科技就常被指责存在计费方式过于复杂的问题),但多数情况下似乎主要由资源管理不善所引发。
Galabov表示,“基础设施成本膨胀和基础设施利用不足,导致许多企业投入云怀抱”。但在转向云后,一部分用户继续沿用过去的管理实践,即在习惯上仍然保留大量冗余基础设施容量,最终导致需要为并未实际使用的资源而付费。
出于这个原因,Galabov认为未来市场应当更多关注设施规模的合理性,或者将工作负载放置在最合理的位置。Omdia将其称为“云智能”,Galabov则表示这种表达已经成为行业术语。
Galabov表示至少在不久的将来,他相信企业将越来越多地依赖IT即服务平台(例如Dell Apex或者HPE Greenlake)进行内部计算。
这些平台既能够为客户提供与公有云服务相同的好处,同时设施又位于他们自己的数据中心或者主机托管站点之内。供应商可以提供完整且预先配置的基础设施,负责提供管理服务,并设有随用随付等计费选项。
他表示,“我个人认为应该不会出现大规模的下云趋势,这更像是一种小规模的优化手段。”
这方面的证据是,企业在云基础设施服务上的支出比以往任何时候都更加强劲,今年第一季度的增幅达21%,来到760多亿美元。
目前,所有这些支出中约有72%都流向了三大云服务商。不过同一项调查也发现,Snowflake、MongoDB和甲骨文等二线云运营商的同比增长率更高。
也许这些挑战者以及CoreWeave等专业AI提供商将逐渐削弱三大云巨头的主导地位,或者说目前针对三大厂商的反垄断审查将进一步推动市场开放,让云领域的竞争变得愈发激烈。无论最终结果如何,云服务都将屹立不倒、坚定前行。
好文章,需要你的鼓励
当前软件工程团队正在试验基于AI代理的编码工具和大语言模型,以提高开发速度和质量。然而,AI编码工具的效果很大程度上取决于使用方式。开发者需要提供结构化的问题描述、明确的执行要求和相关上下文,同时建立适当的防护机制。AI不仅能处理重复性任务,还能识别和评估替代方案,从被动助手演进为工作流程推进器。成功的关键在于将AI视为合作伙伴而非快捷工具,并将其整合到软件交付的全生命周期中。
NVIDIA研究团队开发出名为Lyra的AI系统,能够仅凭单张照片生成完整3D场景,用户可自由切换观察角度。该技术采用创新的"自蒸馏"学习方法,让视频生成模型指导3D重建模块工作。系统还支持动态4D场景生成,在多项测试中表现优异。这项技术将大大降低3D内容创作门槛,为游戏开发、电影制作、VR/AR应用等领域带来重大突破。
Salesforce发布企业级AI智能体平台Agentforce 360,将AI智能体融入几乎所有应用中。该平台采用混合推理引擎Atlas,结合大语言模型的概率思维和业务规则的精确性,支持语音交互和深度集成。以Slack为主要界面,提供Agentforce Builder开发环境,能将非结构化文档转换为可查询记录。Salesforce内部已部署该系统,每周处理180万次对话,主动服务活动增长40%。
谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像,配以详细文字说明,使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型,为遥感领域AI应用开辟了全新道路。