AWS发布用于云和AI的下一代Graviton4和Trainium2芯片

AWS在AWS re:Invent大会推出两款新一代自研芯片。

今天，AWS在AWS re:Invent大会推出两款新一代自研芯片，用于通用云计算和高效AI训练，分别是Graviton4 和 Trainium2。

AWS使用基于Arm的Graviton系列处理器为客户提供高性能并降低成本，以处理Amazon Elastic Compute Cloud（EC2）中的各种云计算工作负载。据Amazon称，与当前的Graviton3这一代处理器相比，Graviton4的计算能力提高了30%，核心数量增加了50%，内存带宽增加了75%。

AWS计算和网络副总裁David Brown表示：“Graviton4标志着我们在短短五年内推出的第四代芯片，是我们为各种工作负载打造的最强大的、最节能的芯片。芯片支撑着每个客户工作负载，这是AWS创新的一个关键领域。”

Amazon自2018年以来一直在使用Graviton1构建自己的定制芯片，为A1 EC2实例提供动力。每一代Graviton都带来了更高的性能、效率和更低的成本。2021年，Brown曾表示，Graviton的上市为AWS生态系统带来了重大增长，因为客户看到工作负载立即就得到了改善。

截至目前，AWS在全球提供超过150种不同的、支持Graviton的Amazon EC2实例，并且已经部署了超过200万个Graviton处理器。

AWS最新的内存优化型Amazon EC2 R8g实例将支持Graviton4处理器，让客户能够大规模改进高性能数据库、内存缓存和大数据分析工作负载的运行。R8g实例将提供比当前R7g实例多3倍的大容量虚拟CPU和3倍的内存。Amazon表示，新的R8g实例目前已推出预览版，计划在未来几个月内全面上市。

Trainium2：专为云端AI训练设计的下一代芯片

随着当今生成式AI应用背后的AI基础模型和大型语言模型变得越来越大，它们需要处理大量数据集，意味着训练模型的时间和成本也在不断增加。那些最大的、最先进的模型可以扩展到数千亿到数万亿个数据点，可以生成文本、图像、音频、视频和软件代码。

今天，AWS发布了Trainium2，一款专门用于训练FM和LLM的高性能芯片，具有多达数万亿个参数，训练性能是第一代芯片的4倍，内存容量是其3倍。AWS还表示，该芯片的能效比第一代提高了2倍。

Brown表示：“随着人们对生成式AI兴趣日益高涨，Trainium2将帮助客户以更低的成本和更高的能源效率更快速地训练他们的机器学习模型。”

Trainium芯片充当了高性能人工智能和机器学习工作负载的深度学习算法AI加速器，还针对训练AI应用中使用的自然语言处理、计算机视觉和推荐模型进行了优化，例如文本摘要、代码生成、问答、图像和视频生成。

Trainium2将在新的Amazon EC2 Trn2实例中提供，其中单个实例包含16个Trainium2芯片。客户将能够在下一代EC2 UltraCluster中将这些实例扩展到多达10000个Trianum2芯片，并与AWS Elastic Fabric Adapter的Pb级网络互连，能够提供高达65 exaflops的计算能力。Amazon表示，按照这样的规模，客户将能够在一周内而不是几个月培训多达3000亿个参数的大型语言模型。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

AWS发布用于云和AI的下一代Graviton4和Trainium2芯片

来源：至顶网软件与服务频道

2023

11/29

10:52

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

OpenAI权威报告！美国再不抓紧，1750亿美元将投资中国

AWS亮相CES公布将AI引入汽车领域的合作成果

趋势丨光谱技术与民用市场，相逢在AI

电源管理芯片产业分析报告（2024完整版）

英特尔：旗下的“主打”18A 产品将于2025 年下半年投产

重塑全球市场：AI革命推动专用芯片需求一路高涨

AWS CISO谈网络安全“融入”芯片、安全服务和应用市场

数据中心液冷散热技术及应

联发科天玑芯片发布会定档 12 月 23 日举行，预计发布天玑 8400 芯片

海光16核CPU首曝：多核性能如何？

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: