本周一,AWS在re:Invent大会有关基础设施的主题演讲中,展示了用于Elastic Compute Cloud的新CPU芯片硬件,新版本的Nitro管理程序,以及支持该芯片的实例。
Amazon表示,全新的Graviton3E芯片是对Graviton系列产品线的升级,与标准Graviton3相比具有显着的性能改进,在基于矢量的工作负载上性能有35%的提升。
AWS效用计算高级副总裁Peter DeSantis(如图)在主题演讲中解释说,该芯片在用于生命科学和金融建模等方面时有更突出的表现,并且针对矢量工作负载和浮点工作负载进行了优化,这些工作负载在高性能计算领域很常见,尤其是涉及金融、天气预报、生命科学、材料科学和化学等大规模数据建模的研究。
基于Arm定制处理器的Graviton系列是由AWS开发的,旨在以更低的成本在EC2中为客户提供卓越的高性能计算。Graviton3在运行某些应用时的性能水平比Graviton2高出80%,甚至显着改善了加密和视频编码。
而此次推出的Graviton3E,将支持一套全新的EC2实例,包括即将推出的HPC7G实例,用于200 GB专用网络带宽的高性能计算工作负载。该实例有多种配置选择,最多64个虚拟CPU和128GiB内存,不过这些实例要到2023年才会上线。
Graviton3E处理器还将可用于C7gn实例,该实例主要针对网络密集型工作负载,例如虚拟网络设备——防火墙、虚拟路由器、负载均衡器和类似服务——数据分析和紧密耦合的计算集群。Graviton3E能够支持200 Gbps的网络带宽,数据包性能提高200%。这些实例今天已经推出了预览版。
DeSantis解释说,这两个新的实例都将采用今天发布的Nitro 5硬件管理程序,这款新的第五代Nitro卡几乎将板载计算能力翻了一番,同时DRAM带宽增加了50%,每秒数据包增加60%,延迟降低30%,每瓦性能提高40%。
DeSantis表示,有了新的Nitro,C7gn实例将以最低延迟和最高吞吐量实现数据包处理性能高达50%的提升。
据他称,之所以能够做到这一点,是因为AWS团队将Nitro定制芯片上的晶体管数量增加了一倍。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。