这位帮助将闲置计算容量转变成世界上最大的云计算业务的高管今天在AWS re:Invent的舞台上宣布亚马逊将重塑人工智能模型世界。
Andy Jassy于2021年接替Jeff Bezos,成为零售巨头亚马逊的首席执行官。在拉斯维加斯举行的AWS云计算大会上,他三年来首次登台,宣布推出六种新的基础模型。这些产品被命名为“Amazon Nova”,Jassy将其定位为“提供智能和行业领先性价比的、最先进的新基础模型”。
这些模型将支持在一系列多模态任务中处理文本、图像和视频。企业客户对各种人工智能表现出强烈的兴趣,亚马逊对此日益重视,因而推出了这些新模型。
Jassy表示:“这有点出乎我们的意料。”“一直以来,我们的经验都是永远不会有一种工具可以统治世界。”
推理的重要性与日俱增
AWS首席执行官Matt Garman在近三个小时的主题演讲中发布了一系列新产品,进一步印证了Jassy关于多种工具的观点。虽然Garman强调了AWS在计算、存储、开发者工具和数据库方面的进步,但该公司围绕人工智能的新闻,以及它将如何支持企业对这一快速发展领域的兴趣,才是大会开幕当天的重头戏。
其中最重要的是Amazon Bedrock的一系列增强功能,Amazon Bedrock是该公司的全面托管服务,用于构建和扩展具有高性能基础模型的生成式人工智能应用。今天发布的六个新模型都将集成到Bedrock之中。
Bedrock的新功能包括防止人工智能幻觉的Automated Reasoning(自动推理)检查、构建并协调多个人工智能代理的工具,以及能以更低成本、更快地将知识从大型模型转移到小型模型的Model Distillation(模型蒸馏)。
AWS今天发布的人工智能明显聚焦推理,即人工智能模型做出预测或结论的过程。Garman表示:“我的观点是,生成式人工智能推理将成为每个应用程序的核心构件。”“每个应用程序都将以某种方式使用推理。为此,你需要一个能够大规模提供推理的平台。这就是我们构建 Bedrock的原因。”
亚马逊本身也一直在积极使用Bedrock和各种人工智能工具来运行其业务的关键环节,Jassy在周二的演讲中强调了这一点。这家在线零售商重建了一个聊天机器人,它能够预测客户来电是否与退货有关,并感知随后的对话是否会让客户产生挫败感。
Jassy认为,推动人工智能应用的主要因素有两个。他表示:“我们看到全球企业中最成功的案例是在降低成本和提高生产力两个方面。”“随着生成式人工智能应用规模的扩大,计算成本真的很重要。”
扩张与横向扩展
规模和成本已成为AWS人工智能方法背后的关键驱动因素。随着企业界斥资数十亿美元开发人工智能基础设施,AWS下注工作负载性能将最终决定对云计算的需求。
在周一晚间的re:Invent演讲中,AWS公用事业计算高级副总裁Peter DeSantis简单介绍了该公司如何看待人工智能基础设施的未来,即采用“扩张”的方式,专注于提高单个系统的容量,而不是采用“横向扩展”的方式,构建多个相同的系统,在多台机器上分配工作负载。
DeSantis表示:“人工智能工作负载不是横向扩展型的工作负载,而是扩张类型的工作负载。”“我们构建更大模型的途径是构建更强大的服务器。”
该公司本周发布的公告揭示了AWS 计划如何通过内部芯片开发工作来实现这一愿景。AWS今天宣布全面推出由Trainium2 驱动的Elastic Compute Cloud(弹性计算云)或 EC2实例和UltraServers,这将使用户能够以更高的性能和成本效率训练和部署人工智能模型。
DeSantis指出:“Trainium2 不仅是我们最强大的 AI 服务器,其扩张的速度也超过了我们曾经拥有的所有服务器。”
Jassy在10月份的财报回顾时表示,今年,亚马逊的云计算业务增长态势明显,该公司的人工智能服务已经创造了数十亿美元的年化收入。广大客户群想通过人工智能投资获得回报,AWS今天的发布显然是希望利用这一趋势。
Jassy表示:“我们优先考虑那些我们认为对客户真正重要的技术。”“我们将为你提供你能够找到的、最广泛、最好的功能。”
好文章,需要你的鼓励
今年是AI智能体的爆发年。聊天机器人正演进为能代表用户执行任务的自主智能体,企业持续投资智能体平台。调研显示,超半数高管表示其组织已在使用AI智能体,88%在智能体上投入过半AI预算的公司已从至少一个用例中获得投资回报。Gartner预测,到2026年40%的企业软件应用将包含智能体AI,2035年智能体AI可能驱动约30%的企业应用软件收入。企业开始将AI智能体视为员工,建立招聘培训体系。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
谷歌的Nano Banana Pro AI模型生成的图像逼真度令人震惊,其关键在于完美模拟了手机相机的拍照特征。这些AI生成的图像具备手机拍照的典型特点:明亮平坦的曝光、较大的景深范围、略显粗糙的细节处理,甚至包含噪点。该模型还能自动添加符合情境的细节元素,如房产照片的水印等,使图像更加真实可信。这种技术进步意味着辨别AI生成内容变得更加困难。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。