一年前,当云社区聚集在拉斯维加斯参加AWS re:Invent的时候,生成式AI几乎还没有备提及,而本周AWS在年度大会上发布了一系列公告,强调生成式AI将成为其发展的首要任务。

AWS推出了Generative AI Stack,旨在为客户提供利用AI的应用、用于构建大型语言模型的新工具、以及加速模型训练和推理的基础设施成果。
AWS公司首席执行官Adam Selipsky(如图)表示:“围绕生成式AI模型的创新是爆炸性的,将重塑我们在工作和家庭中与之交互的每一款应用。我们正在以一种完全不同的方式来探讨生成式AI这个整体概念。”
广泛的能力
Selipsky在这次re:Invent大会上近两个半小时的主题演讲中,分享了有关生成式AI策略的细节,其中一个重点在芯片领域取得的进展,AWS在现有产品基础上构建了新的生成式AI功能,并继续通过Nvidia和Anthropic PBC等主要合作伙伴追求创新。
Selipsky表示:“拥有最广泛和最深入的能力是很重要的,我们开始利用AWS彻底从头重新思考IT基础设施。”
重新思考IT基础设施的一个关键因素就要涉及到硅。AWS通过Nitro虚拟机管理程序以及后续几代的Trainium、Graviton和Inferentia处理器在硅技术方面取得了不错的成绩。
本周一晚上,AWS公司公用事业计算高级副总裁Peter DeSantis公布了AWS无服务器产品和横向扩展数据库的一系列进展,突出了芯片所发挥的作用。“Nitro是AWS开始构建定制芯片的一个原因,”DeSantis在他的演讲中这样说道。
今天,Selipsky宣布推出了AWS Trainium2,一款用于生成式AI和机器学习训练的专用芯片,以及Graviton4。他还公布了Nvidia扩大合作伙伴关系,其中包括把Nvidia的DGX Cloud人工智能训练即服务平台引入AWS。
“DGX Cloud是Nvidia的AI工厂,”Nvidia公司首席执行官黄仁勋表示,Selipsky邀请他走上re:Invent演讲台发表演讲,他指出,DGX Cloud将有16000个GPU连接到一台超级计算机。“这就像65台超级计算机合而为一。”
ChatGPT的潜在竞争对手
硅芯片这一层的额外火力,最终将催生一系列新产品,而且AWS希望这些产品能够吸引企业的兴趣,并有可能成为OpenAI ChatGPT生成式AI解决方案的替代方案。今天,AWS发布了Amazon Q,这是AWS生成式AI战略的一个关键要素。Amazon Q是一款在工作场所使用的生成式AI助手。该工具的功能还将添加到Amazon QuickSight云原生商业智能服务中,使客户能够为工作场所应用打造量身定制的解决方案,包括通过Amazon Connect进行呼叫中心管理。
AWS分析服务、数据库和AI领导力副总裁G2 Krishnamoorthy在接受媒体采访时谈到Amazon Q to QuickSight在生成式AI堆栈中的应用:“您需要这一层为服务构建者而设计的功能,它就像一个助手,可以帮助你完成各种任务。”
Amazon Q最初主要面向开发人员和IT专业人员,明年可能会被广大企业广泛采用。开发人员能够在几分钟内以对话方式将新功能迭代到代码中。
“Amazon Q也是您的业务专家,”Selipsky说。“它是完全可定制的。”
Amazon Q的可定制性,是AWS寻求部署生成式AI堆栈的一个关键差异化因素。Selipsky表示,客户想要不同的模型,他当然也注意到了OpenAI本月因首席执行官Sam Altman的突然离职和最终回归所引发的一场混乱。
Selipsky说:“不会有一种模式能够统治所有,您需要尝试不同的模型,需要一个真正的模型提供商选项。我认为过去10天发生的事件,已经非常清楚地表明了这一点。”
Selipsky没有直接提及我们熟知的名字,而是在主题演讲中提到了AWS相对于“其他云提供商”的竞争地位。当他宣布AWS在用于生成式AI和机器学习训练的专用处理器方面取得的进展时,这一点尤其引人注目。
“与此同时,许多云提供商只是在谈论他们自己的机器学习芯片,”Selipsky说。
在今天的公告发布之前,AWS在本周一还发布了一系列公告,在第一位主题演讲者上台之前,AWS就已经在re:Invent大会上发布了80多条新闻稿,传递的信息很明确:AWS无意放弃在公有云食物链顶端的地位,并且打算继续发挥自身的优势。
Selipsky表示:“在亚马逊,我们下了大胆的赌注,最重要的重塑都是属于你们的。”
好文章,需要你的鼓励
联想在CES展会上发布了AI助手Qira,该系统可跨联想和摩托罗拉设备生态运行,包括智能手机、可穿戴设备、PC和平板等。Qira不仅是聊天机器人,还能执行实际任务,如设备间文件传输。该系统具备情境感知能力,通过融合知识库创建个性化体验。联想强调隐私保护,优先本地处理数据。Qira将于2026年第一季度首先在联想设备上推出。摩托罗拉还展示了搭载Qira的AI可穿戴设备Project Maxwell概念产品。
剑桥大学研究团队首次系统探索AI在多轮对话中的信心判断问题。研究发现当前AI系统在评估自己答案可靠性方面存在严重缺陷,容易被对话长度而非信息质量误导。团队提出P(SUFFICIENT)等新方法,但整体问题仍待解决。该研究为AI在医疗、法律等关键领域的安全应用提供重要指导,强调了开发更可信AI系统的紧迫性。
在CES 2026主题演讲中,麦肯锡全球管理合伙人鲍勃·斯特恩费尔斯和通用催化剂CEO赫曼特·塔内贾表示,AI正以前所未有的速度重塑技术领域。塔内贾指出,Anthropic估值在一年内从600亿美元飙升至数千亿美元,预计将出现新一波万亿美元公司。然而,非技术企业对AI全面采用仍持观望态度。两位高管强调,人们必须认识到技能培训和再培训将是终身事业,传统的22年学习40年工作模式已被打破。
威斯康星大学研究团队开发出Prithvi-CAFE洪水监测系统,通过"双视觉协作"机制解决了AI地理基础模型在洪水识别上的局限性。该系统巧妙融合全局理解和局部细节能力,在国际标准数据集上创造最佳成绩,参数效率提升93%,为全球洪水预警和防灾减灾提供了更准确可靠的技术方案。