不少解决方案提供商看好AWS投入巨资打造专门针对AWS基础设施优化芯片的计划,该计划将使合作伙伴在AI市场竞争中占据优势,因为电力成本更低,供应链优势更大。
“我们已经看到AI的大量应用,而且企业意识到,‘哦,芯片不仅价格昂贵,而且天哪,它们消耗了这么多能源’,所以电费也在飞涨,”AWS合作伙伴公司ClearScale的首席执行官Jimmy Chui表示。
“所以你可以想象,在一个巨大的数据中心里,一切都在高速运转,高速处理——你会非常非常快地消耗掉电力,”Chui说。
例如,Oracle正致力于通过核反应堆为其数据中心供电,以满足AI的电力需求。
“我们找到的位置和发电厂已经获得了三座核反应堆的建设许可,”Oracle董事长、联合创始人Larry Ellison在本周举行的季度财报电话会议上这样表示。“这些都是为数据中心供电的小型模块化核反应堆。这真是太疯狂了。”
AWS首席执行官Matt Garman表示,AWS这家规模达1050亿美金的云计算公司将继续构建自己的AI芯片组,而且将其与庞大的基础设施放在一起进行优化。
“我们不必构建这些处理器以运行在通用环境中。它们将完全运行在我们的服务器、数据中心和网络堆栈中,因此我们可以为客户进行优化,我们可以疯狂地优化这一点,而且我们有一个非常优秀的芯片制造团队。”
自主研发的AWS芯片将促进供应链
ClearScale首席执行官表示,随着AWS自主研发AI处理器,供应链问题对客户的影响将变得越来越小。
由于全球企业客户的需求量很大,IT行业一直受到AI处理器相关供应链短缺问题的困扰。
Chui表示:“他们具有购买和设计这些芯片的能力,同时也能在供应方面确保顺利。”
“我们已经看到,特别是在AI领域,这些超高性能芯片有订单积压是因为他们无法让这些芯片速度足够快。在这方面,AWS自己的芯片将是非常有利的,特别是在这些AI工作负载增加的情况下,”Chui说。
AWS合作伙伴PTP的管理合伙人Ethan Simmons也认为,AWS自主研发的AI处理器将有助于客户降低成本并获得AI芯片。他说:“出于各种原因,拥有AI硬件是非常重要的,只有像AWS这样的企业才能做到这一点,我很高兴[AWS首席执行官Garman]专注于正确的事情上。”
AWS CEO:“拥有自己的定制处理器可以帮助客户省钱”
近年来,AWS将注意力转向了打造AI处理器,例如AWS Inferentia机器学习芯片和Trainium ML处理器,用于训练深度学习模型。
AWS最初决定内部开发定制芯片是为了通过Nitro支持其虚拟化技术并能够影响客户成本。
Garman说:“这意味着我们不必从第三方购买这些芯片,从而能够降低成本。我们认为,在某些情况下,我们自己的定制处理器可以帮助客户省钱。”
AWS还和英特尔、AMD以及Nvidia等全球最具创新性的、最大的芯片制造商建立了紧密的合作伙伴关系。
“我们坚信,AWS是运行英特尔、AMD和Nvidia处理器的最佳场所,我们认为,通过提供我们自己的处理器,我们可以打造出一些具有差异化的功能,”Garman说道。
AWS在竞争中领先
ClearScale公司的Chui表示,AWS专门为AWS新AI服务设计的芯片是“极其重要的”,就像它为AWS平台和云服务设计芯片时一样。
AWS目前在AI方面处于领先地位,因为大多数其他竞争对手和厂商只是专注于AI实验或最初用例。
“我们都在尝试AI或者尝试进入AI领域。现在正是打造属于自己的芯片的好时机,这种芯片非常高效,可以运行在特定的基础设施上,降低成本。因为一旦现在正在尝试的人都开始行动起来,并将其投入生产,我们可能会看到能源使用和成本呈现爆炸态势,”Chui说道。
AWS计划在今年年底推出新的Trainium2处理器。
Garman表示:“我们对该平台感到非常兴奋,认为我们有机会大幅降低客户成本,同时提高性能。”
好文章,需要你的鼓励
TPU与GPU之间的竞争正在重塑AI硬件市场格局。GPU基于并行处理,能处理多样化任务,而TPU专门针对张量矩阵运算进行优化。谷歌TPU采用类似RISC的设计理念,通过限制功能来提升特定运算效率。随着Meta计划在2027年采购数十亿美元的TPU芯片,Anthropic宣布使用百万TPU训练Claude模型,TPU生态系统正在获得发展动力,对英伟达的GPU霸主地位构成挑战。
Meta与华盛顿大学联合研究团队开发出无需人类标注的AI评判官自我训练框架。该方法通过生成合成对比数据、自我判断筛选和反复学习,使110亿参数的AI评判官在多项视觉语言任务中超越GPT-4o等大型模型,成本仅为传统方法的1%,为AI自主学习和评估开辟新路径。
本文提出2026年AI发展十大预测,包括AI估值修正、投资泡沫持续、AGI不仅依赖大语言模型、AI代理将加剧工作替代等。作者强调社会接受度对技术发展的重要性,认为成功企业将重构运营模式以AI为核心,同时指出政府仍将重视STEM教育而忽视社会科学的价值。
华中科技大学团队开发出4DLangVGGT技术,首次实现AI系统对4D动态场景的语言理解。该技术突破传统方法需要逐场景训练的限制,能跨场景通用部署。系统结合几何感知和语义理解,不仅能识别物体还能描述其时间变化过程。实验显示在多项指标上超越现有方法1-2%,为机器人、AR/VR、智能监控等领域提供重要技术支撑。