本周一,AWS在re:Invent大会有关基础设施的主题演讲中,展示了用于Elastic Compute Cloud的新CPU芯片硬件,新版本的Nitro管理程序,以及支持该芯片的实例。
Amazon表示,全新的Graviton3E芯片是对Graviton系列产品线的升级,与标准Graviton3相比具有显着的性能改进,在基于矢量的工作负载上性能有35%的提升。
AWS效用计算高级副总裁Peter DeSantis(如图)在主题演讲中解释说,该芯片在用于生命科学和金融建模等方面时有更突出的表现,并且针对矢量工作负载和浮点工作负载进行了优化,这些工作负载在高性能计算领域很常见,尤其是涉及金融、天气预报、生命科学、材料科学和化学等大规模数据建模的研究。
基于Arm定制处理器的Graviton系列是由AWS开发的,旨在以更低的成本在EC2中为客户提供卓越的高性能计算。Graviton3在运行某些应用时的性能水平比Graviton2高出80%,甚至显着改善了加密和视频编码。
而此次推出的Graviton3E,将支持一套全新的EC2实例,包括即将推出的HPC7G实例,用于200 GB专用网络带宽的高性能计算工作负载。该实例有多种配置选择,最多64个虚拟CPU和128GiB内存,不过这些实例要到2023年才会上线。
Graviton3E处理器还将可用于C7gn实例,该实例主要针对网络密集型工作负载,例如虚拟网络设备——防火墙、虚拟路由器、负载均衡器和类似服务——数据分析和紧密耦合的计算集群。Graviton3E能够支持200 Gbps的网络带宽,数据包性能提高200%。这些实例今天已经推出了预览版。
DeSantis解释说,这两个新的实例都将采用今天发布的Nitro 5硬件管理程序,这款新的第五代Nitro卡几乎将板载计算能力翻了一番,同时DRAM带宽增加了50%,每秒数据包增加60%,延迟降低30%,每瓦性能提高40%。
DeSantis表示,有了新的Nitro,C7gn实例将以最低延迟和最高吞吐量实现数据包处理性能高达50%的提升。
据他称,之所以能够做到这一点,是因为AWS团队将Nitro定制芯片上的晶体管数量增加了一倍。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。