亚马逊网络服务公司(AWS)近日宣布,将推出第四代最节能的高性能定制芯片Graviton4,用于云计算工作负载。
AWS使用基于Arm的Graviton系列处理器为亚马逊弹性计算云(Amazon Elastic Compute Cloud)中现有的各种云计算工作负载提供高性能并降低成本。AWS EC2产品管理总监Rahul Kulkarni 在接受SiliconANGLE采访时表示,Graviton4是对Graviton3的重大升级,计算能力提高了30%,内核增加了50%,内存带宽增加了75%。
Kulkarni表示,Graviton平台始于2018年的Graviton1,它涉及EC2平台背后名为Nitro的基础技术,后者是一种轻量级管理程序,可以实现计算、存储、内存和网络选项的虚拟化。当时,AWS 希望提供一个完整的计算平台堆栈,而Graviton基于Arm的架构效果很好。
Kulkarni表示:“随着一代又一代产品的推出,我们扩大了Gravito适用的工作负载范围。” 第一代产品作为网络应用的概念验证,第二代产品扩大了扩展工作负载的范围,第三代产品内置了浮点运算、机器学习功能和高性能计算。
Kulkarni补充表示:“我们排名前100的客户全部都在Graviton上运行生产工作负载,我们有超过5万名客户在实际使用Graviton。”
目前,Graviton处理器在EC2上有150多种不同的实例类型,它们代表了不同的“样式”,可提供不同的计算、内存和存储属性,满足客户的需要。据亚马逊称,该公司迄今已在30个地区设计、测试和部署了200多万个Graviton CPU。
发布之后,Graviton4 芯片将在Amazon EC2 R8g实例中提供,该实例允许客户提升大规模运行的高性能数据库、内存缓存和大数据分析工作负载执行。R8g实例样式支持每个虚拟处理器 8 GB内存,最多可扩展到192个处理器。Kulkarni表示,这将是推出的第一种实例类型,但计划是要让Graviton4可以实现每一种x86实例系列。
亚马逊表示,SAP、Epic Games和SmugMug等的大客户已经注意到使用Graviton4的R8g实例带来的显著收益。
Honeycomb的现场首席技术官Liz Fong-Jones在接受SiliconANGLE采访时表示:“我们掌握的数据显示,Graviton3和Graviton4的性能提升幅度在25%到35%之间。”Honeycomb是一个全栈软件可观察性平台,从2021年左右的Graviton2开始就一直在使用 Graviton 芯片,并且早就投资转向基于Arm的架构。
Fong-Jones表示,从基于x86 的芯片转换到Graviton 时,整体性能“尾部延迟”(即应用程序响应大多数请求所需的时间)大为改善。然后,随着 Graviton 处理器一代又一代地推出,处理更大的工作负载成为可能。
Fong-Jones表示:“从 Graviton2 到 Graviton3,现在又从 Graviton3 到 Graviton4,我们看到的是尾部延迟保持稳定,性能非常稳定。我们看到吞吐量大幅提高,而完成特定工作负载的CPU利用率在降低。”“这意味着在同样的规模下,你可以在既定数量的实例上处理更多的工作负载。”
鉴于第一块 Graviton 芯片于2018年从 AWS装配线上下线,该公司已经以平均不到一年半产出一款芯片的速度生产出了定制芯片。当被问及公司是否打算保持这种节奏时,Kulkarni表示:“绝对、绝对、绝对会是这样!”
Kulkarni补充表示:“这不是空谈。”“这是基于过去历史的展望,这很大程度上取决于我们的创业实验室和芯片团队的成熟度,他们能够以这种可预测的速度提供这种质量的芯片。”
他解释说,AWS 无法承受任何新一代产品的多次迭代,因为硅片价格的波动可能意味着成本结构的上升。这可能会影响公司帮助客户节省成本的能力,而这一点正是主打性价比的Graviton 系列芯片的核心宗旨。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。