这位帮助将闲置计算容量转变成世界上最大的云计算业务的高管今天在AWS re:Invent的舞台上宣布亚马逊将重塑人工智能模型世界。
Andy Jassy于2021年接替Jeff Bezos,成为零售巨头亚马逊的首席执行官。在拉斯维加斯举行的AWS云计算大会上,他三年来首次登台,宣布推出六种新的基础模型。这些产品被命名为“Amazon Nova”,Jassy将其定位为“提供智能和行业领先性价比的、最先进的新基础模型”。
这些模型将支持在一系列多模态任务中处理文本、图像和视频。企业客户对各种人工智能表现出强烈的兴趣,亚马逊对此日益重视,因而推出了这些新模型。
Jassy表示:“这有点出乎我们的意料。”“一直以来,我们的经验都是永远不会有一种工具可以统治世界。”
推理的重要性与日俱增
AWS首席执行官Matt Garman在近三个小时的主题演讲中发布了一系列新产品,进一步印证了Jassy关于多种工具的观点。虽然Garman强调了AWS在计算、存储、开发者工具和数据库方面的进步,但该公司围绕人工智能的新闻,以及它将如何支持企业对这一快速发展领域的兴趣,才是大会开幕当天的重头戏。
其中最重要的是Amazon Bedrock的一系列增强功能,Amazon Bedrock是该公司的全面托管服务,用于构建和扩展具有高性能基础模型的生成式人工智能应用。今天发布的六个新模型都将集成到Bedrock之中。
Bedrock的新功能包括防止人工智能幻觉的Automated Reasoning(自动推理)检查、构建并协调多个人工智能代理的工具,以及能以更低成本、更快地将知识从大型模型转移到小型模型的Model Distillation(模型蒸馏)。
AWS今天发布的人工智能明显聚焦推理,即人工智能模型做出预测或结论的过程。Garman表示:“我的观点是,生成式人工智能推理将成为每个应用程序的核心构件。”“每个应用程序都将以某种方式使用推理。为此,你需要一个能够大规模提供推理的平台。这就是我们构建 Bedrock的原因。”
亚马逊本身也一直在积极使用Bedrock和各种人工智能工具来运行其业务的关键环节,Jassy在周二的演讲中强调了这一点。这家在线零售商重建了一个聊天机器人,它能够预测客户来电是否与退货有关,并感知随后的对话是否会让客户产生挫败感。
Jassy认为,推动人工智能应用的主要因素有两个。他表示:“我们看到全球企业中最成功的案例是在降低成本和提高生产力两个方面。”“随着生成式人工智能应用规模的扩大,计算成本真的很重要。”
扩张与横向扩展
规模和成本已成为AWS人工智能方法背后的关键驱动因素。随着企业界斥资数十亿美元开发人工智能基础设施,AWS下注工作负载性能将最终决定对云计算的需求。
在周一晚间的re:Invent演讲中,AWS公用事业计算高级副总裁Peter DeSantis简单介绍了该公司如何看待人工智能基础设施的未来,即采用“扩张”的方式,专注于提高单个系统的容量,而不是采用“横向扩展”的方式,构建多个相同的系统,在多台机器上分配工作负载。
DeSantis表示:“人工智能工作负载不是横向扩展型的工作负载,而是扩张类型的工作负载。”“我们构建更大模型的途径是构建更强大的服务器。”
该公司本周发布的公告揭示了AWS 计划如何通过内部芯片开发工作来实现这一愿景。AWS今天宣布全面推出由Trainium2 驱动的Elastic Compute Cloud(弹性计算云)或 EC2实例和UltraServers,这将使用户能够以更高的性能和成本效率训练和部署人工智能模型。
DeSantis指出:“Trainium2 不仅是我们最强大的 AI 服务器,其扩张的速度也超过了我们曾经拥有的所有服务器。”
Jassy在10月份的财报回顾时表示,今年,亚马逊的云计算业务增长态势明显,该公司的人工智能服务已经创造了数十亿美元的年化收入。广大客户群想通过人工智能投资获得回报,AWS今天的发布显然是希望利用这一趋势。
Jassy表示:“我们优先考虑那些我们认为对客户真正重要的技术。”“我们将为你提供你能够找到的、最广泛、最好的功能。”
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。