一年前,当云社区聚集在拉斯维加斯参加AWS re:Invent的时候,生成式AI几乎还没有备提及,而本周AWS在年度大会上发布了一系列公告,强调生成式AI将成为其发展的首要任务。
AWS推出了Generative AI Stack,旨在为客户提供利用AI的应用、用于构建大型语言模型的新工具、以及加速模型训练和推理的基础设施成果。
AWS公司首席执行官Adam Selipsky(如图)表示:“围绕生成式AI模型的创新是爆炸性的,将重塑我们在工作和家庭中与之交互的每一款应用。我们正在以一种完全不同的方式来探讨生成式AI这个整体概念。”
广泛的能力
Selipsky在这次re:Invent大会上近两个半小时的主题演讲中,分享了有关生成式AI策略的细节,其中一个重点在芯片领域取得的进展,AWS在现有产品基础上构建了新的生成式AI功能,并继续通过Nvidia和Anthropic PBC等主要合作伙伴追求创新。
Selipsky表示:“拥有最广泛和最深入的能力是很重要的,我们开始利用AWS彻底从头重新思考IT基础设施。”
重新思考IT基础设施的一个关键因素就要涉及到硅。AWS通过Nitro虚拟机管理程序以及后续几代的Trainium、Graviton和Inferentia处理器在硅技术方面取得了不错的成绩。
本周一晚上,AWS公司公用事业计算高级副总裁Peter DeSantis公布了AWS无服务器产品和横向扩展数据库的一系列进展,突出了芯片所发挥的作用。“Nitro是AWS开始构建定制芯片的一个原因,”DeSantis在他的演讲中这样说道。
今天,Selipsky宣布推出了AWS Trainium2,一款用于生成式AI和机器学习训练的专用芯片,以及Graviton4。他还公布了Nvidia扩大合作伙伴关系,其中包括把Nvidia的DGX Cloud人工智能训练即服务平台引入AWS。
“DGX Cloud是Nvidia的AI工厂,”Nvidia公司首席执行官黄仁勋表示,Selipsky邀请他走上re:Invent演讲台发表演讲,他指出,DGX Cloud将有16000个GPU连接到一台超级计算机。“这就像65台超级计算机合而为一。”
ChatGPT的潜在竞争对手
硅芯片这一层的额外火力,最终将催生一系列新产品,而且AWS希望这些产品能够吸引企业的兴趣,并有可能成为OpenAI ChatGPT生成式AI解决方案的替代方案。今天,AWS发布了Amazon Q,这是AWS生成式AI战略的一个关键要素。Amazon Q是一款在工作场所使用的生成式AI助手。该工具的功能还将添加到Amazon QuickSight云原生商业智能服务中,使客户能够为工作场所应用打造量身定制的解决方案,包括通过Amazon Connect进行呼叫中心管理。
AWS分析服务、数据库和AI领导力副总裁G2 Krishnamoorthy在接受媒体采访时谈到Amazon Q to QuickSight在生成式AI堆栈中的应用:“您需要这一层为服务构建者而设计的功能,它就像一个助手,可以帮助你完成各种任务。”
Amazon Q最初主要面向开发人员和IT专业人员,明年可能会被广大企业广泛采用。开发人员能够在几分钟内以对话方式将新功能迭代到代码中。
“Amazon Q也是您的业务专家,”Selipsky说。“它是完全可定制的。”
Amazon Q的可定制性,是AWS寻求部署生成式AI堆栈的一个关键差异化因素。Selipsky表示,客户想要不同的模型,他当然也注意到了OpenAI本月因首席执行官Sam Altman的突然离职和最终回归所引发的一场混乱。
Selipsky说:“不会有一种模式能够统治所有,您需要尝试不同的模型,需要一个真正的模型提供商选项。我认为过去10天发生的事件,已经非常清楚地表明了这一点。”
Selipsky没有直接提及我们熟知的名字,而是在主题演讲中提到了AWS相对于“其他云提供商”的竞争地位。当他宣布AWS在用于生成式AI和机器学习训练的专用处理器方面取得的进展时,这一点尤其引人注目。
“与此同时,许多云提供商只是在谈论他们自己的机器学习芯片,”Selipsky说。
在今天的公告发布之前,AWS在本周一还发布了一系列公告,在第一位主题演讲者上台之前,AWS就已经在re:Invent大会上发布了80多条新闻稿,传递的信息很明确:AWS无意放弃在公有云食物链顶端的地位,并且打算继续发挥自身的优势。
Selipsky表示:“在亚马逊,我们下了大胆的赌注,最重要的重塑都是属于你们的。”
好文章,需要你的鼓励
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
微软研究院发布突破性多语言AI技术UPDESH,通过"自下而上"数据生成策略,让AI真正理解不同文化背景下的语言表达。该技术基于各语言维基百科内容生成950万个训练数据点,覆盖13种印度语言,显著提升低资源语言AI性能,为构建文化敏感型AI系统提供新路径。
麻省理工学院研究发现过度依赖AI会导致认知债务,削弱基本思维能力。研究表明交替进行无辅助思考和AI支持工作的模式能保持认知敏锐度。这种认知高强度间歇训练模仿体能训练中的HIIT模式,通过短时间高强度思考与恢复期交替进行,可以强化大脑神经回路,防止认知衰退,提升独立思考能力。
NVIDIA团队提出RLBFF方法,将AI训练中的复杂评价转化为明确的二元判断标准,解决了传统人类反馈模糊和可验证奖励局限的问题。该方法在多个权威测试中取得突破性成果,其中JudgeBench获得第一名,训练的模型性能媲美知名商业模型但成本仅为其5%,为AI训练领域带来重要方法论创新。