这位帮助将闲置计算容量转变成世界上最大的云计算业务的高管今天在AWS re:Invent的舞台上宣布亚马逊将重塑人工智能模型世界。
Andy Jassy于2021年接替Jeff Bezos,成为零售巨头亚马逊的首席执行官。在拉斯维加斯举行的AWS云计算大会上,他三年来首次登台,宣布推出六种新的基础模型。这些产品被命名为“Amazon Nova”,Jassy将其定位为“提供智能和行业领先性价比的、最先进的新基础模型”。
这些模型将支持在一系列多模态任务中处理文本、图像和视频。企业客户对各种人工智能表现出强烈的兴趣,亚马逊对此日益重视,因而推出了这些新模型。
Jassy表示:“这有点出乎我们的意料。”“一直以来,我们的经验都是永远不会有一种工具可以统治世界。”
推理的重要性与日俱增
AWS首席执行官Matt Garman在近三个小时的主题演讲中发布了一系列新产品,进一步印证了Jassy关于多种工具的观点。虽然Garman强调了AWS在计算、存储、开发者工具和数据库方面的进步,但该公司围绕人工智能的新闻,以及它将如何支持企业对这一快速发展领域的兴趣,才是大会开幕当天的重头戏。
其中最重要的是Amazon Bedrock的一系列增强功能,Amazon Bedrock是该公司的全面托管服务,用于构建和扩展具有高性能基础模型的生成式人工智能应用。今天发布的六个新模型都将集成到Bedrock之中。
Bedrock的新功能包括防止人工智能幻觉的Automated Reasoning(自动推理)检查、构建并协调多个人工智能代理的工具,以及能以更低成本、更快地将知识从大型模型转移到小型模型的Model Distillation(模型蒸馏)。
AWS今天发布的人工智能明显聚焦推理,即人工智能模型做出预测或结论的过程。Garman表示:“我的观点是,生成式人工智能推理将成为每个应用程序的核心构件。”“每个应用程序都将以某种方式使用推理。为此,你需要一个能够大规模提供推理的平台。这就是我们构建 Bedrock的原因。”
亚马逊本身也一直在积极使用Bedrock和各种人工智能工具来运行其业务的关键环节,Jassy在周二的演讲中强调了这一点。这家在线零售商重建了一个聊天机器人,它能够预测客户来电是否与退货有关,并感知随后的对话是否会让客户产生挫败感。
Jassy认为,推动人工智能应用的主要因素有两个。他表示:“我们看到全球企业中最成功的案例是在降低成本和提高生产力两个方面。”“随着生成式人工智能应用规模的扩大,计算成本真的很重要。”
扩张与横向扩展
规模和成本已成为AWS人工智能方法背后的关键驱动因素。随着企业界斥资数十亿美元开发人工智能基础设施,AWS下注工作负载性能将最终决定对云计算的需求。
在周一晚间的re:Invent演讲中,AWS公用事业计算高级副总裁Peter DeSantis简单介绍了该公司如何看待人工智能基础设施的未来,即采用“扩张”的方式,专注于提高单个系统的容量,而不是采用“横向扩展”的方式,构建多个相同的系统,在多台机器上分配工作负载。
DeSantis表示:“人工智能工作负载不是横向扩展型的工作负载,而是扩张类型的工作负载。”“我们构建更大模型的途径是构建更强大的服务器。”
该公司本周发布的公告揭示了AWS 计划如何通过内部芯片开发工作来实现这一愿景。AWS今天宣布全面推出由Trainium2 驱动的Elastic Compute Cloud(弹性计算云)或 EC2实例和UltraServers,这将使用户能够以更高的性能和成本效率训练和部署人工智能模型。
DeSantis指出:“Trainium2 不仅是我们最强大的 AI 服务器,其扩张的速度也超过了我们曾经拥有的所有服务器。”
Jassy在10月份的财报回顾时表示,今年,亚马逊的云计算业务增长态势明显,该公司的人工智能服务已经创造了数十亿美元的年化收入。广大客户群想通过人工智能投资获得回报,AWS今天的发布显然是希望利用这一趋势。
Jassy表示:“我们优先考虑那些我们认为对客户真正重要的技术。”“我们将为你提供你能够找到的、最广泛、最好的功能。”
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。