今天 ,AWS在AWS re:Invent大会推出两款新一代自研芯片,用于通用云计算和高效AI训练,分别是Graviton4 和 Trainium2。

AWS使用基于Arm的Graviton系列处理器为客户提供高性能并降低成本,以处理Amazon Elastic Compute Cloud(EC2)中的各种云计算工作负载。据Amazon称,与当前的Graviton3这一代处理器相比,Graviton4的计算能力提高了30%,核心数量增加了50%,内存带宽增加了75%。
AWS计算和网络副总裁David Brown表示:“Graviton4标志着我们在短短五年内推出的第四代芯片,是我们为各种工作负载打造的最强大的、最节能的芯片。芯片支撑着每个客户工作负载,这是AWS创新的一个关键领域。”
Amazon自2018年以来一直在使用Graviton1构建自己的定制芯片,为A1 EC2实例提供动力。每一代Graviton都带来了更高的性能、效率和更低的成本。2021年,Brown曾表示,Graviton的上市为AWS生态系统带来了重大增长,因为客户看到工作负载立即就得到了改善。
截至目前,AWS在全球提供超过150种不同的、支持Graviton的Amazon EC2实例,并且已经部署了超过200万个Graviton处理器。
AWS最新的内存优化型Amazon EC2 R8g实例将支持Graviton4处理器,让客户能够大规模改进高性能数据库、内存缓存和大数据分析工作负载的运行。R8g实例将提供比当前R7g实例多3倍的大容量虚拟CPU和3倍的内存。Amazon表示,新的R8g实例目前已推出预览版,计划在未来几个月内全面上市。
Trainium2:专为云端AI训练设计的下一代芯片
随着当今生成式AI应用背后的AI基础模型和大型语言模型变得越来越大,它们需要处理大量数据集,意味着训练模型的时间和成本也在不断增加。那些最大的、最先进的模型可以扩展到数千亿到数万亿个数据点,可以生成文本、图像、音频、视频和软件代码。
今天,AWS发布了Trainium2,一款专门用于训练FM和LLM的高性能芯片,具有多达数万亿个参数,训练性能是第一代芯片的4倍,内存容量是其3倍。AWS还表示,该芯片的能效比第一代提高了2倍。
Brown表示:“随着人们对生成式AI兴趣日益高涨,Trainium2将帮助客户以更低的成本和更高的能源效率更快速地训练他们的机器学习模型。”
Trainium芯片充当了高性能人工智能和机器学习工作负载的深度学习算法AI加速器,还针对训练AI应用中使用的自然语言处理、计算机视觉和推荐模型进行了优化,例如文本摘要、代码生成、问答、图像和视频生成。
Trainium2将在新的Amazon EC2 Trn2实例中提供,其中单个实例包含16个Trainium2芯片。客户将能够在下一代EC2 UltraCluster中将这些实例扩展到多达10000个Trianum2芯片,并与AWS Elastic Fabric Adapter的Pb级网络互连,能够提供高达65 exaflops的计算能力。Amazon表示,按照这样的规模,客户将能够在一周内而不是几个月培训多达3000亿个参数的大型语言模型。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。