AWS发布新消费模式：为短期AI负载提供更灵活的Nvidia GPU资源

AWS将推出一种新消费模式，主要针对希望为短期AI工作负载保留云托管GPU访问路径的企业。

近日AWS表示，将推出一种新消费模式，主要针对那些希望为短期AI工作负载保留云托管GPU访问路径的企业。

Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML目前已经全面上市，这个模式让客户可以保留对位于Amazon EC2 UltraCluster中的“数百个”Nvidia最先进H100 Tensor Core GPU的访问权限，这些GPU主要面向高性能机器学习工作负载。

要访问EC2 Capacity Blocks，客户只需指定所需的集群大小、未来的开始日期和所需的持续时间，他们就能够确保有可靠地、可预测且不间断访问关键AI项目的GPU资源。

AWS表示，EC2 Capacity Blocks为客户解决了很多问题。如今，最强大的人工智能工作负载（例如训练大型语言模型）往往需要大量的计算能力，而Nvidia GPU被认为是用金钱可以买到的最好的硬件之一。然而，随着今年围绕生成式AI的热议，Nvidia的芯片突然出现供应短缺，没有足够的芯片供应给有需要的公司。

AWS表示，对于那些容量需求有波动的客户来说，GPU短缺尤其严重。由于他们不需要持续使用GPU，因此当他们确实需要这些资源时，可能会很难访问这些资源。为了解决这个问题，许多客户承诺购买较长时间的GPU容量，但在不使用时却将其闲置。EC2 Capacity Blocks为此类客户提供了一种更灵活的、更可预测的方式，可以在较短时间内采购GPU容量，从而为他们提供帮助。

AWS首席开发者布道师Channy Yun将EC2 Capacity Blocks预订比作预订酒店房间。他在一篇博客文章中解释说：“当你在预订酒店的时候，你可以指定想要入住房间的日期和入住时长，以及你想要的床的尺寸——例如大床或特大号床。EC2 Capacity Blocks预定也是如此，你可以选择需要GPU实例的日期、持续时间以及预留的大小（实例数量）。在预留开始日期，你就可以访问预留的EC2 Capacity Blocks并启动P5实例。”

AWS解释说，EC2 Capacity Blocks部署在EC2 UltraClusters中，并与Elastic Fabric Adapter Pt级网络互连，以确保低延迟和高吞吐量连接。正因为如此，它可以扩展到数百个GPU。客户可以提前八周预订1到64个实例的GPU集群，时间为1到14天。AWS表示，这种模式非常适合AI模型的训练和微调、短期实验运行、以及应对预期的需求激增例如推出新产品的时候。

AWS公司计算和网络副总裁David Brown表示：“借助Amazon EC2 Capacity Blocks，我们为企业和初创公司增加了一种新的方式，让他们能够以可预测的方式获取Nvidia GPU容量，用于构建、训练和部署他们的生成式AI应用。”

AWS客户现在可以使用AWS Management Console、Command Line Interface或者Software Development Kit来查找和预留GPU容量，从AWS美国东部（俄亥俄）区域开始，稍后将增加更多区域和本地区域。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

AWS发布新消费模式：为短期AI负载提供更灵活的Nvidia GPU资源

来源：至顶网软件与服务频道

2023

11/02

10:27

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会