不少解决方案提供商看好AWS投入巨资打造专门针对AWS基础设施优化芯片的计划,该计划将使合作伙伴在AI市场竞争中占据优势,因为电力成本更低,供应链优势更大。
“我们已经看到AI的大量应用,而且企业意识到,‘哦,芯片不仅价格昂贵,而且天哪,它们消耗了这么多能源’,所以电费也在飞涨,”AWS合作伙伴公司ClearScale的首席执行官Jimmy Chui表示。
“所以你可以想象,在一个巨大的数据中心里,一切都在高速运转,高速处理——你会非常非常快地消耗掉电力,”Chui说。
例如,Oracle正致力于通过核反应堆为其数据中心供电,以满足AI的电力需求。
“我们找到的位置和发电厂已经获得了三座核反应堆的建设许可,”Oracle董事长、联合创始人Larry Ellison在本周举行的季度财报电话会议上这样表示。“这些都是为数据中心供电的小型模块化核反应堆。这真是太疯狂了。”
AWS首席执行官Matt Garman表示,AWS这家规模达1050亿美金的云计算公司将继续构建自己的AI芯片组,而且将其与庞大的基础设施放在一起进行优化。
“我们不必构建这些处理器以运行在通用环境中。它们将完全运行在我们的服务器、数据中心和网络堆栈中,因此我们可以为客户进行优化,我们可以疯狂地优化这一点,而且我们有一个非常优秀的芯片制造团队。”
自主研发的AWS芯片将促进供应链
ClearScale首席执行官表示,随着AWS自主研发AI处理器,供应链问题对客户的影响将变得越来越小。
由于全球企业客户的需求量很大,IT行业一直受到AI处理器相关供应链短缺问题的困扰。
Chui表示:“他们具有购买和设计这些芯片的能力,同时也能在供应方面确保顺利。”
“我们已经看到,特别是在AI领域,这些超高性能芯片有订单积压是因为他们无法让这些芯片速度足够快。在这方面,AWS自己的芯片将是非常有利的,特别是在这些AI工作负载增加的情况下,”Chui说。
AWS合作伙伴PTP的管理合伙人Ethan Simmons也认为,AWS自主研发的AI处理器将有助于客户降低成本并获得AI芯片。他说:“出于各种原因,拥有AI硬件是非常重要的,只有像AWS这样的企业才能做到这一点,我很高兴[AWS首席执行官Garman]专注于正确的事情上。”
AWS CEO:“拥有自己的定制处理器可以帮助客户省钱”
近年来,AWS将注意力转向了打造AI处理器,例如AWS Inferentia机器学习芯片和Trainium ML处理器,用于训练深度学习模型。
AWS最初决定内部开发定制芯片是为了通过Nitro支持其虚拟化技术并能够影响客户成本。
Garman说:“这意味着我们不必从第三方购买这些芯片,从而能够降低成本。我们认为,在某些情况下,我们自己的定制处理器可以帮助客户省钱。”
AWS还和英特尔、AMD以及Nvidia等全球最具创新性的、最大的芯片制造商建立了紧密的合作伙伴关系。
“我们坚信,AWS是运行英特尔、AMD和Nvidia处理器的最佳场所,我们认为,通过提供我们自己的处理器,我们可以打造出一些具有差异化的功能,”Garman说道。
AWS在竞争中领先
ClearScale公司的Chui表示,AWS专门为AWS新AI服务设计的芯片是“极其重要的”,就像它为AWS平台和云服务设计芯片时一样。
AWS目前在AI方面处于领先地位,因为大多数其他竞争对手和厂商只是专注于AI实验或最初用例。
“我们都在尝试AI或者尝试进入AI领域。现在正是打造属于自己的芯片的好时机,这种芯片非常高效,可以运行在特定的基础设施上,降低成本。因为一旦现在正在尝试的人都开始行动起来,并将其投入生产,我们可能会看到能源使用和成本呈现爆炸态势,”Chui说道。
AWS计划在今年年底推出新的Trainium2处理器。
Garman表示:“我们对该平台感到非常兴奋,认为我们有机会大幅降低客户成本,同时提高性能。”
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。