近日AWS表示,将推出一种新消费模式,主要针对那些希望为短期AI工作负载保留云托管GPU访问路径的企业。

Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML目前已经全面上市,这个模式让客户可以保留对位于Amazon EC2 UltraCluster中的“数百个”Nvidia最先进H100 Tensor Core GPU的访问权限,这些GPU主要面向高性能机器学习工作负载。
要访问EC2 Capacity Blocks,客户只需指定所需的集群大小、未来的开始日期和所需的持续时间,他们就能够确保有可靠地、可预测且不间断访问关键AI项目的GPU资源。
AWS表示,EC2 Capacity Blocks为客户解决了很多问题。如今,最强大的人工智能工作负载(例如训练大型语言模型)往往需要大量的计算能力,而Nvidia GPU被认为是用金钱可以买到的最好的硬件之一。然而,随着今年围绕生成式AI的热议,Nvidia的芯片突然出现供应短缺,没有足够的芯片供应给有需要的公司。
AWS表示,对于那些容量需求有波动的客户来说,GPU短缺尤其严重。由于他们不需要持续使用GPU,因此当他们确实需要这些资源时,可能会很难访问这些资源。为了解决这个问题,许多客户承诺购买较长时间的GPU容量,但在不使用时却将其闲置。EC2 Capacity Blocks为此类客户提供了一种更灵活的、更可预测的方式,可以在较短时间内采购GPU容量,从而为他们提供帮助。
AWS首席开发者布道师Channy Yun将EC2 Capacity Blocks预订比作预订酒店房间。他在一篇博客文章中解释说:“当你在预订酒店的时候,你可以指定想要入住房间的日期和入住时长,以及你想要的床的尺寸——例如大床或特大号床。EC2 Capacity Blocks预定也是如此,你可以选择需要GPU实例的日期、持续时间以及预留的大小(实例数量)。在预留开始日期,你就可以访问预留的EC2 Capacity Blocks并启动P5实例。”
AWS解释说,EC2 Capacity Blocks部署在EC2 UltraClusters中,并与Elastic Fabric Adapter Pt级网络互连,以确保低延迟和高吞吐量连接。正因为如此,它可以扩展到数百个GPU。客户可以提前八周预订1到64个实例的GPU集群,时间为1到14天。AWS表示,这种模式非常适合AI模型的训练和微调、短期实验运行、以及应对预期的需求激增例如推出新产品的时候。
AWS公司计算和网络副总裁David Brown表示:“借助Amazon EC2 Capacity Blocks,我们为企业和初创公司增加了一种新的方式,让他们能够以可预测的方式获取Nvidia GPU容量,用于构建、训练和部署他们的生成式AI应用。”
AWS客户现在可以使用AWS Management Console、Command Line Interface或者Software Development Kit来查找和预留GPU容量,从AWS美国东部(俄亥俄)区域开始,稍后将增加更多区域和本地区域。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。