据路透社报道,公有云基础设施巨头AWS有可能成为第一个采用AMD新AI芯片的大客户。

然而,AWS已经决定不会从AMD竞争对手Nvidia那里购买整个系统。
据报道,全球最大的云计算公司AWS正在考虑采用AMD近日刚刚宣布推出的Instinct MI300X加速器。MI300X芯片专为生成式AI工作负载而设计,旨在为企业提供Nvidia GPU的替代方案,后者目前在AI行业占据主导地位。
AWS弹性计算云副总裁Dave Brown在接受路透社采访时表示,目前AWS尚未决定是否使用AMD这款新的芯片。
该报告发布后,AMD股价上涨了约1%。本周二,在AMD宣布推出MI300X芯片但未透露任何愿意使用该芯片的主要客户之后,股价下跌近4%。
AMD公司首席执行官Lisa Su在活动结束后告诉路透社,AMD对赢得AWS等云提供商特别感兴趣。为此,AMD提供了一个菜单,其中包含了为ChatGPT等服务提供动力所需的系统的所有组成部分,客户可以选择他们想要使用的组件,并将其接入行业标准连接。
根据Su的说法:“很多人都想要选择,他们想要能够在他们的数据中心定制他们所需的东西。”
Brown告诉路透社,AWS和AMD目前正在合作研究如何利用MI300X芯片。“他们围绕接入现有系统的设计所做的一些工作,让我们能够从中受益。”
AWS喜欢从零开始构建自己的服务器,这一事实对AMD可能是有利的。Constellation Research分析师Holger Mueller表示,AWS对用于驱动这些服务器的AI硬件实现多样化,是很有意义的。
Mueller说:“随着生成式AI的兴起,云计算厂商之间的军备竞赛开辟了一条新的战线,他们都在争夺运行这些工作负载所需的芯片,云厂商们知道,客户的一些专有工作服在可能在不同AI芯片组上运行得更好,因此他们希望有更多的选择。但围绕新芯片展开对话是一回事,而构建实际的关键任务硬件又是另一回事,所以只有到未来才能这是否会带来任何结果。”
AWS需要使其产品多样化,这也解释了为什么AWS不想提供由Nvidia DGX Cloud的整套系统。该系统是一台“AI超级计算机”,捆绑了数百个GPU,可随时处理一些最密集的AI工作负载。它目前是Oracle提供的,据报道Nvidia也询问了AWS是否也愿意向其客户提供DGX平台。但根据Brown的说法,AWS拒绝了,称自己更愿意零散地购买Nvidia的GPU。
AWS确实允许客户访问Nvidia最先进的H100 GPU,但仅限于AWS设计的服务器系统。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。