本周一,AWS在re:Invent大会有关基础设施的主题演讲中,展示了用于Elastic Compute Cloud的新CPU芯片硬件,新版本的Nitro管理程序,以及支持该芯片的实例。
Amazon表示,全新的Graviton3E芯片是对Graviton系列产品线的升级,与标准Graviton3相比具有显着的性能改进,在基于矢量的工作负载上性能有35%的提升。
AWS效用计算高级副总裁Peter DeSantis(如图)在主题演讲中解释说,该芯片在用于生命科学和金融建模等方面时有更突出的表现,并且针对矢量工作负载和浮点工作负载进行了优化,这些工作负载在高性能计算领域很常见,尤其是涉及金融、天气预报、生命科学、材料科学和化学等大规模数据建模的研究。
基于Arm定制处理器的Graviton系列是由AWS开发的,旨在以更低的成本在EC2中为客户提供卓越的高性能计算。Graviton3在运行某些应用时的性能水平比Graviton2高出80%,甚至显着改善了加密和视频编码。
而此次推出的Graviton3E,将支持一套全新的EC2实例,包括即将推出的HPC7G实例,用于200 GB专用网络带宽的高性能计算工作负载。该实例有多种配置选择,最多64个虚拟CPU和128GiB内存,不过这些实例要到2023年才会上线。
Graviton3E处理器还将可用于C7gn实例,该实例主要针对网络密集型工作负载,例如虚拟网络设备——防火墙、虚拟路由器、负载均衡器和类似服务——数据分析和紧密耦合的计算集群。Graviton3E能够支持200 Gbps的网络带宽,数据包性能提高200%。这些实例今天已经推出了预览版。
DeSantis解释说,这两个新的实例都将采用今天发布的Nitro 5硬件管理程序,这款新的第五代Nitro卡几乎将板载计算能力翻了一番,同时DRAM带宽增加了50%,每秒数据包增加60%,延迟降低30%,每瓦性能提高40%。
DeSantis表示,有了新的Nitro,C7gn实例将以最低延迟和最高吞吐量实现数据包处理性能高达50%的提升。
据他称,之所以能够做到这一点,是因为AWS团队将Nitro定制芯片上的晶体管数量增加了一倍。
好文章,需要你的鼓励
时尚零售巨头维多利亚的秘密因安全事件导致网站和线上订单服务中断,已立即启动应急响应、邀请第三方专家协助恢复运营,实体店仍正常营业。
IBM研究院AI团队开发的POBs基准测试揭示了大型语言模型在主观话题上表现出明显偏好,尤其倾向于进步-集体主义观点。研究发现,增加测试时计算(思考时间)对减少模型偏见效果有限,且更新版本的模型反而表现出更强烈的立场和更低的一致性。这项研究提供了评估AI系统意识形态倾向的工具,帮助用户和企业做出更明智的选择。
Carma Technology 针对 Uber 提起专利侵权诉讼,称其侵犯了涉及拼车系统的五项专利。案情回溯至十年前,凸显专利保护对创新者的重要性,可能对 Uber 及其他公司带来巨大影响。
东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些挑战性任务上的表现也比常规任务降低了约14个百分点,证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务,为评估AI代理在实际应用场景中的表现提供了更严格的标准。