今天 ,AWS在AWS re:Invent大会推出两款新一代自研芯片,用于通用云计算和高效AI训练,分别是Graviton4 和 Trainium2。
AWS使用基于Arm的Graviton系列处理器为客户提供高性能并降低成本,以处理Amazon Elastic Compute Cloud(EC2)中的各种云计算工作负载。据Amazon称,与当前的Graviton3这一代处理器相比,Graviton4的计算能力提高了30%,核心数量增加了50%,内存带宽增加了75%。
AWS计算和网络副总裁David Brown表示:“Graviton4标志着我们在短短五年内推出的第四代芯片,是我们为各种工作负载打造的最强大的、最节能的芯片。芯片支撑着每个客户工作负载,这是AWS创新的一个关键领域。”
Amazon自2018年以来一直在使用Graviton1构建自己的定制芯片,为A1 EC2实例提供动力。每一代Graviton都带来了更高的性能、效率和更低的成本。2021年,Brown曾表示,Graviton的上市为AWS生态系统带来了重大增长,因为客户看到工作负载立即就得到了改善。
截至目前,AWS在全球提供超过150种不同的、支持Graviton的Amazon EC2实例,并且已经部署了超过200万个Graviton处理器。
AWS最新的内存优化型Amazon EC2 R8g实例将支持Graviton4处理器,让客户能够大规模改进高性能数据库、内存缓存和大数据分析工作负载的运行。R8g实例将提供比当前R7g实例多3倍的大容量虚拟CPU和3倍的内存。Amazon表示,新的R8g实例目前已推出预览版,计划在未来几个月内全面上市。
Trainium2:专为云端AI训练设计的下一代芯片
随着当今生成式AI应用背后的AI基础模型和大型语言模型变得越来越大,它们需要处理大量数据集,意味着训练模型的时间和成本也在不断增加。那些最大的、最先进的模型可以扩展到数千亿到数万亿个数据点,可以生成文本、图像、音频、视频和软件代码。
今天,AWS发布了Trainium2,一款专门用于训练FM和LLM的高性能芯片,具有多达数万亿个参数,训练性能是第一代芯片的4倍,内存容量是其3倍。AWS还表示,该芯片的能效比第一代提高了2倍。
Brown表示:“随着人们对生成式AI兴趣日益高涨,Trainium2将帮助客户以更低的成本和更高的能源效率更快速地训练他们的机器学习模型。”
Trainium芯片充当了高性能人工智能和机器学习工作负载的深度学习算法AI加速器,还针对训练AI应用中使用的自然语言处理、计算机视觉和推荐模型进行了优化,例如文本摘要、代码生成、问答、图像和视频生成。
Trainium2将在新的Amazon EC2 Trn2实例中提供,其中单个实例包含16个Trainium2芯片。客户将能够在下一代EC2 UltraCluster中将这些实例扩展到多达10000个Trianum2芯片,并与AWS Elastic Fabric Adapter的Pb级网络互连,能够提供高达65 exaflops的计算能力。Amazon表示,按照这样的规模,客户将能够在一周内而不是几个月培训多达3000亿个参数的大型语言模型。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。