AMD 的第四代 Eypc 处理器日前登陆 AWS,并提供通用和高性能计算(HPC)任务的选择。
第四代 Eypc虚拟机率先在亚马逊的 Hpc7a 实例上推出,据称针对计算和内存带宽受限的工作负载(如计算流体动力学和数值天气预报)进行了优化。亚马逊声称新实例的速度与使用 AMD 第三代 Epycs 的旧版套件 Hpc6a 实例相比快了 2.5 倍。
新的虚拟机提供 24、48、96 和 192 个内核的选择。通常情况下,列出的 vCPU 数量是指线程个数,但亚马逊称新虚拟机的同时多线程(SMT)已被禁用,目的是最大限度地提高性能。这意味着亚马逊使用的是一对 96 核 CPU,很可能是Epyc 9654,时钟频率可提升至 3.7GHz。
我们所知道的是,亚马逊并没有使用 AMD 的高速缓存堆叠 Genoa-X CPU。这些芯片是AMD芯片制造商在今年 6 月的数据中心和人工智能活动中推出的,可提供高达1.1GB的L3缓存。即使没有海量的额外 L3,AMD 的第四代 Epycs 也增加了许多功能,可能有益于HPC和基于人工智能的工作负载。这些功能包括支持 AVX-512、矢量神经网络指令 (VNNI)、BFloat 16 和更高的内存带宽(每个插槽最多 12 个 DDR5 通道)。

亚马逊的 Hpc7a 实例可配备四个 SKU,每个 SKU可 配备 24 到 192 个 vCPU
这些实例的内核个数是可以调整的(这将有利于那些按内核许可运行的工作负载),其余规格保持不变。所有四个 SKU 均配备了 768GB 内存以及由亚马逊弹性织物适配器提供的300Gbps节点间网络和25Gbps的外部带宽。
这种标配并非偶然。客户可以通过保持内存配置的一致性进而调整每个内核的内存或带宽的特定比例。这对于HPC工作负载非常有益,因为HPC工作负载更常受到内存带宽的限制,而不是内核数量的限制。其实并不是只有 AMD 的实例这样做,亚马逊在之前发布的基于 Graviton3E 的 Hpc7g 实例中也采用了同样的方法。
高速节点之间的网络也很重要,原因是亚马逊希望客户将工作负载分布到多个实例上运行,就像集群中的节点一样,而不是在单个虚拟机中运行。因此,这些节点支持亚马逊的 批量和平行集群(Batch and ParallelCluster)编排平台以及 Lustre FSx存储服务。
对于一些可能不需要最快时钟速度或内存带宽的用户,亚马逊还推出了早在 6 月份就预告过的 M7a 通用实例。
亚马逊声称这些实例的性能比基于 Epyc Milan 的 M6a VM 高出多达 50%,并且可以使用多达 192 个 vCPU,每个 vCPU的时钟频率可达3.7GHz。假设亚马逊在这些实例中使用了 SMT(我们已联系亚马逊以求澄清),这表明亚马逊很可能在这些实例中用了单个 Epyc 9654,最高频率恰好是 3.7GHz。

亚马逊的 M7a 实例包最多可配备 192 个 vCPU 和 768GB 内存
这些虚拟机的配置有十多种,从 1GB 内存和 12.5Gbps 网络带宽的单 vCPU到768GB 内存和 50Gbps 网络吞吐量的 192 vCPU 大型实例。
所有这些实例都由亚马逊的定制Nitro数据处理单元(DPU)支持,DPU可以卸载主机CPU的许多功能,如网络、存储和安全等等。
亚马逊的M7a实例现在已经在该云服务提供商美国的北弗吉尼亚、俄亥俄、俄勒冈和爱尔兰数据中心中提供给普通用户使用。
好文章,需要你的鼓励
亚马逊股价在盘后交易中暴涨超12%,业绩轻松超越分析师预期。公司每股收益1.95美元,大幅超出1.57美元预期;营收1801.7亿美元,同比增长13%。AWS云业务表现亮眼,季度营收330亿美元,同比增长20%,创近年来最强增长。CEO贾西表示AWS增长速度达到2022年以来最快水平,主要得益于AI资源需求激增。公司将2025年资本支出预期从1180亿美元上调至1250亿美元,用于AI数据中心建设。
泰国SCBX公司研究团队首次针对泰语开发了语义对话结束检测技术,通过分析文字内容而非声音停顿来判断对话是否结束。研究比较了多种AI模型方案,发现微调的小型变压器模型能在110毫秒内做出准确判断,显著优于传统静音检测方法。该技术能识别泰语特有的句尾助词等语言特征,为银行客服、智能家居、教育等场景的语音交互系统提供了更自然流畅的解决方案。
微软正将Copilot AI功能集成到Microsoft 365伴侣应用中,包括人员、文件和日历三个任务栏工具。这些轻量级应用仅面向企业和商业客户,将于10月底开始自动安装。Copilot将基于组织数据提供上下文感知的提示和摘要功能。人员应用可显示近期沟通记录,文件应用支持文档摘要和数据分析,日历应用将提供会议摘要。目前人员和文件功能已上线,日历功能即将推出。
浙江大学研究团队提出Graph2Eval框架,这是首个基于知识图谱的AI代理自动化评测系统。该框架通过知识图谱持续生成新测试任务,解决传统固定数据集评估的局限性。框架支持文档理解和网页交互两类任务,构建了包含1319个任务的测试集。实验验证显示该方法能有效区分不同AI系统能力,为AI代理评估开辟新路径。