一年前,当云社区聚集在拉斯维加斯参加AWS re:Invent的时候,生成式AI几乎还没有备提及,而本周AWS在年度大会上发布了一系列公告,强调生成式AI将成为其发展的首要任务。
AWS推出了Generative AI Stack,旨在为客户提供利用AI的应用、用于构建大型语言模型的新工具、以及加速模型训练和推理的基础设施成果。
AWS公司首席执行官Adam Selipsky(如图)表示:“围绕生成式AI模型的创新是爆炸性的,将重塑我们在工作和家庭中与之交互的每一款应用。我们正在以一种完全不同的方式来探讨生成式AI这个整体概念。”
广泛的能力
Selipsky在这次re:Invent大会上近两个半小时的主题演讲中,分享了有关生成式AI策略的细节,其中一个重点在芯片领域取得的进展,AWS在现有产品基础上构建了新的生成式AI功能,并继续通过Nvidia和Anthropic PBC等主要合作伙伴追求创新。
Selipsky表示:“拥有最广泛和最深入的能力是很重要的,我们开始利用AWS彻底从头重新思考IT基础设施。”
重新思考IT基础设施的一个关键因素就要涉及到硅。AWS通过Nitro虚拟机管理程序以及后续几代的Trainium、Graviton和Inferentia处理器在硅技术方面取得了不错的成绩。
本周一晚上,AWS公司公用事业计算高级副总裁Peter DeSantis公布了AWS无服务器产品和横向扩展数据库的一系列进展,突出了芯片所发挥的作用。“Nitro是AWS开始构建定制芯片的一个原因,”DeSantis在他的演讲中这样说道。
今天,Selipsky宣布推出了AWS Trainium2,一款用于生成式AI和机器学习训练的专用芯片,以及Graviton4。他还公布了Nvidia扩大合作伙伴关系,其中包括把Nvidia的DGX Cloud人工智能训练即服务平台引入AWS。
“DGX Cloud是Nvidia的AI工厂,”Nvidia公司首席执行官黄仁勋表示,Selipsky邀请他走上re:Invent演讲台发表演讲,他指出,DGX Cloud将有16000个GPU连接到一台超级计算机。“这就像65台超级计算机合而为一。”
ChatGPT的潜在竞争对手
硅芯片这一层的额外火力,最终将催生一系列新产品,而且AWS希望这些产品能够吸引企业的兴趣,并有可能成为OpenAI ChatGPT生成式AI解决方案的替代方案。今天,AWS发布了Amazon Q,这是AWS生成式AI战略的一个关键要素。Amazon Q是一款在工作场所使用的生成式AI助手。该工具的功能还将添加到Amazon QuickSight云原生商业智能服务中,使客户能够为工作场所应用打造量身定制的解决方案,包括通过Amazon Connect进行呼叫中心管理。
AWS分析服务、数据库和AI领导力副总裁G2 Krishnamoorthy在接受媒体采访时谈到Amazon Q to QuickSight在生成式AI堆栈中的应用:“您需要这一层为服务构建者而设计的功能,它就像一个助手,可以帮助你完成各种任务。”
Amazon Q最初主要面向开发人员和IT专业人员,明年可能会被广大企业广泛采用。开发人员能够在几分钟内以对话方式将新功能迭代到代码中。
“Amazon Q也是您的业务专家,”Selipsky说。“它是完全可定制的。”
Amazon Q的可定制性,是AWS寻求部署生成式AI堆栈的一个关键差异化因素。Selipsky表示,客户想要不同的模型,他当然也注意到了OpenAI本月因首席执行官Sam Altman的突然离职和最终回归所引发的一场混乱。
Selipsky说:“不会有一种模式能够统治所有,您需要尝试不同的模型,需要一个真正的模型提供商选项。我认为过去10天发生的事件,已经非常清楚地表明了这一点。”
Selipsky没有直接提及我们熟知的名字,而是在主题演讲中提到了AWS相对于“其他云提供商”的竞争地位。当他宣布AWS在用于生成式AI和机器学习训练的专用处理器方面取得的进展时,这一点尤其引人注目。
“与此同时,许多云提供商只是在谈论他们自己的机器学习芯片,”Selipsky说。
在今天的公告发布之前,AWS在本周一还发布了一系列公告,在第一位主题演讲者上台之前,AWS就已经在re:Invent大会上发布了80多条新闻稿,传递的信息很明确:AWS无意放弃在公有云食物链顶端的地位,并且打算继续发挥自身的优势。
Selipsky表示:“在亚马逊,我们下了大胆的赌注,最重要的重塑都是属于你们的。”
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。