亚马逊网络服务公司(AWS)近日宣布,将推出第四代最节能的高性能定制芯片Graviton4,用于云计算工作负载。
AWS使用基于Arm的Graviton系列处理器为亚马逊弹性计算云(Amazon Elastic Compute Cloud)中现有的各种云计算工作负载提供高性能并降低成本。AWS EC2产品管理总监Rahul Kulkarni 在接受SiliconANGLE采访时表示,Graviton4是对Graviton3的重大升级,计算能力提高了30%,内核增加了50%,内存带宽增加了75%。
Kulkarni表示,Graviton平台始于2018年的Graviton1,它涉及EC2平台背后名为Nitro的基础技术,后者是一种轻量级管理程序,可以实现计算、存储、内存和网络选项的虚拟化。当时,AWS 希望提供一个完整的计算平台堆栈,而Graviton基于Arm的架构效果很好。
Kulkarni表示:“随着一代又一代产品的推出,我们扩大了Gravito适用的工作负载范围。” 第一代产品作为网络应用的概念验证,第二代产品扩大了扩展工作负载的范围,第三代产品内置了浮点运算、机器学习功能和高性能计算。
Kulkarni补充表示:“我们排名前100的客户全部都在Graviton上运行生产工作负载,我们有超过5万名客户在实际使用Graviton。”
目前,Graviton处理器在EC2上有150多种不同的实例类型,它们代表了不同的“样式”,可提供不同的计算、内存和存储属性,满足客户的需要。据亚马逊称,该公司迄今已在30个地区设计、测试和部署了200多万个Graviton CPU。
发布之后,Graviton4 芯片将在Amazon EC2 R8g实例中提供,该实例允许客户提升大规模运行的高性能数据库、内存缓存和大数据分析工作负载执行。R8g实例样式支持每个虚拟处理器 8 GB内存,最多可扩展到192个处理器。Kulkarni表示,这将是推出的第一种实例类型,但计划是要让Graviton4可以实现每一种x86实例系列。
亚马逊表示,SAP、Epic Games和SmugMug等的大客户已经注意到使用Graviton4的R8g实例带来的显著收益。
Honeycomb的现场首席技术官Liz Fong-Jones在接受SiliconANGLE采访时表示:“我们掌握的数据显示,Graviton3和Graviton4的性能提升幅度在25%到35%之间。”Honeycomb是一个全栈软件可观察性平台,从2021年左右的Graviton2开始就一直在使用 Graviton 芯片,并且早就投资转向基于Arm的架构。
Fong-Jones表示,从基于x86 的芯片转换到Graviton 时,整体性能“尾部延迟”(即应用程序响应大多数请求所需的时间)大为改善。然后,随着 Graviton 处理器一代又一代地推出,处理更大的工作负载成为可能。
Fong-Jones表示:“从 Graviton2 到 Graviton3,现在又从 Graviton3 到 Graviton4,我们看到的是尾部延迟保持稳定,性能非常稳定。我们看到吞吐量大幅提高,而完成特定工作负载的CPU利用率在降低。”“这意味着在同样的规模下,你可以在既定数量的实例上处理更多的工作负载。”
鉴于第一块 Graviton 芯片于2018年从 AWS装配线上下线,该公司已经以平均不到一年半产出一款芯片的速度生产出了定制芯片。当被问及公司是否打算保持这种节奏时,Kulkarni表示:“绝对、绝对、绝对会是这样!”
Kulkarni补充表示:“这不是空谈。”“这是基于过去历史的展望,这很大程度上取决于我们的创业实验室和芯片团队的成熟度,他们能够以这种可预测的速度提供这种质量的芯片。”
他解释说,AWS 无法承受任何新一代产品的多次迭代,因为硅片价格的波动可能意味着成本结构的上升。这可能会影响公司帮助客户节省成本的能力,而这一点正是主打性价比的Graviton 系列芯片的核心宗旨。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。