近日AWS表示,将推出一种新消费模式,主要针对那些希望为短期AI工作负载保留云托管GPU访问路径的企业。
Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML目前已经全面上市,这个模式让客户可以保留对位于Amazon EC2 UltraCluster中的“数百个”Nvidia最先进H100 Tensor Core GPU的访问权限,这些GPU主要面向高性能机器学习工作负载。
要访问EC2 Capacity Blocks,客户只需指定所需的集群大小、未来的开始日期和所需的持续时间,他们就能够确保有可靠地、可预测且不间断访问关键AI项目的GPU资源。
AWS表示,EC2 Capacity Blocks为客户解决了很多问题。如今,最强大的人工智能工作负载(例如训练大型语言模型)往往需要大量的计算能力,而Nvidia GPU被认为是用金钱可以买到的最好的硬件之一。然而,随着今年围绕生成式AI的热议,Nvidia的芯片突然出现供应短缺,没有足够的芯片供应给有需要的公司。
AWS表示,对于那些容量需求有波动的客户来说,GPU短缺尤其严重。由于他们不需要持续使用GPU,因此当他们确实需要这些资源时,可能会很难访问这些资源。为了解决这个问题,许多客户承诺购买较长时间的GPU容量,但在不使用时却将其闲置。EC2 Capacity Blocks为此类客户提供了一种更灵活的、更可预测的方式,可以在较短时间内采购GPU容量,从而为他们提供帮助。
AWS首席开发者布道师Channy Yun将EC2 Capacity Blocks预订比作预订酒店房间。他在一篇博客文章中解释说:“当你在预订酒店的时候,你可以指定想要入住房间的日期和入住时长,以及你想要的床的尺寸——例如大床或特大号床。EC2 Capacity Blocks预定也是如此,你可以选择需要GPU实例的日期、持续时间以及预留的大小(实例数量)。在预留开始日期,你就可以访问预留的EC2 Capacity Blocks并启动P5实例。”
AWS解释说,EC2 Capacity Blocks部署在EC2 UltraClusters中,并与Elastic Fabric Adapter Pt级网络互连,以确保低延迟和高吞吐量连接。正因为如此,它可以扩展到数百个GPU。客户可以提前八周预订1到64个实例的GPU集群,时间为1到14天。AWS表示,这种模式非常适合AI模型的训练和微调、短期实验运行、以及应对预期的需求激增例如推出新产品的时候。
AWS公司计算和网络副总裁David Brown表示:“借助Amazon EC2 Capacity Blocks,我们为企业和初创公司增加了一种新的方式,让他们能够以可预测的方式获取Nvidia GPU容量,用于构建、训练和部署他们的生成式AI应用。”
AWS客户现在可以使用AWS Management Console、Command Line Interface或者Software Development Kit来查找和预留GPU容量,从AWS美国东部(俄亥俄)区域开始,稍后将增加更多区域和本地区域。
好文章,需要你的鼓励
微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
苹果与清华合作提出EpiCache技术,解决AI长期对话中的记忆管理难题。该方法将对话自动分割成话题片段,为每个话题建立专门记忆库,实现智能匹配和高效检索。实验显示,EpiCache比传统方法准确率提高40%,内存使用减少4-6倍,响应速度提升2.4倍,为资源受限环境下的AI对话系统提供了实用解决方案。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
清华大学与英伟达合作提出DiffusionNFT,一种革命性的AI图像生成训练方法。该方法通过对比正负样本进行学习,避免了复杂的概率计算,训练效率比传统方法提升25倍。研究团队在多项测试中验证了其优越性,不仅大幅提升了图像质量和文字渲染能力,还实现了无需分类器引导的高效训练,为AI图像生成技术的普及和应用奠定了重要基础。