多年来,亚马逊云科技一直在通过模块构建的形式进行拓展,到今天为止已经拥有数百个构建块。
今年6月上任成为亚马逊云科技首席执行官的Matt Garman,今天首次站上re:Invent的讲台,讲述了计算、存储、数据库、推理、Amazon Q等个多个重要模块中的创新。
今年6月上任成为亚马逊云科技首席执行官的Matt Garman
在会前一天的embargo沟通会上很多内容就已经被提及,但是唯一没有曝光的就是亚马逊云科技自己又做了一个模型Amazon Nova。
为什么是“又”,2023年re: Invent上,亚马逊云科技就推出了Amazon Titan模型,包括Amazon Titan Text和Amazon Titan Embeddings。今天发布的Amazon Nova是源自Amazon Titan还是重新启动目前还不得而知。
AI“军备竞赛”再次提速!
大模型如今已成为行业必争之地。之前亚马逊云科技和Anthropic深度绑定,前者向后者分两次,累计投资了80亿美金,这也让亚马逊云科技在推Amazon Bedrock平台时,将Anthropic的模型作为核心重点。
亚马逊云科技的经验一直是,永远不会有一种工具可以统治世界。亚马逊首席执行官Andy Jassy也强调,推动全球企业采用人工智能的关键在于降低成本和提高生产力。为回应客户对人工智能的浓厚兴趣,亚马逊云科技在今年推出了新模型。
亚马逊首席执行官Andy Jassy
现在亚马逊云科技又站回到大模型的台前,这也是Andy Jassy三年来首次登台re:Invent,他一口气宣布推出Amazon Nova六种新基础模型,包括:
Amazon Nova Micro一款仅处理文本的模型,能够以极低的延迟和成本提供响应;
Amazon Nova Lite一款极具成本效益的多模态模型,能够快速处理图像、视频和文本输入;
Amazon Nova Pro一款功能强大的多模态模型,可在准确性、速度和成本之间实现绝佳平衡,适合多种任务;
Amazon Nova Premier是亚马逊的顶级多模态模型,专为复杂推理任务而生,并可用于作为“教师模型”来蒸馏定制模型。
此外,亚马逊云科技还推出了两款专注于创意内容生成的模型:Amazon Nova Canvas用于生成高质量图像;Amazon Nova Reel用于制作高质量视频。
Amazon Nova Canva允许用户使用提示生成和编辑图像,并为生成的图像的配色方案和布局提供控件。Amazon Nova Reel可以制作六秒的视频,未来视频时长将达到2分钟。
六个新模型都将集成到Bedrock之中。Andy Jassy声称Amazon Nova模型是同类产品中最快的模型之一,也是运行成本最低的模型之一。
Andy Jassy还预告了明年将要推出的两种Amazon Nova模型,一种是Amazon Nova Speech-to-Speech语音转语音模型,一种是Amazon Nova Any-to-Any任意模态生成任意模态模型。
首日的另外一大亮点是Apple苹果来到re: Invent,这也是其对亚马逊云科技的高调认可。
据Apple机器学习和AI高级总监Benoit Dupin说,Apple使用亚马逊云科技的服务已经有十多年,为Siri、iPad、Apple Music、Apple TV、News、App Store提供支持。
Apple机器学习和AI高级总监Benoit Dupin
此次合作的最新内容是Apple Intelligence,其由Apple自己的大型语言模型、扩散模型和适配器提供支持,并在Apple设备上本地运行,也可以在Apple自己的服务器上使用私有云计算运行。
Apple在AI和ML生命周期的许多阶段都利用了亚马逊云科技的服务,从微调模型到优化和构建可供部署的最终适配器,亚马逊云科技提供了可扩展、高效和高性能的加速器技术,对于帮助Apple扩展其培训基础设施以满足创新需求起到了关键作用。
Apple还从x86和G4实例分别迁移到Graviton和Inferentia2提供搜索服务,其机器学习推理工作负载的效率提高了40%以上。“Apple 还处于评估 Trainium 2的早期阶段,在 Trainium 2上对其模型进行预训练时,效率将提高50%。”Benoit Dupin说。
沙利文大中华区总监李庆也看到,本届re:Invent大会的新发布更加侧重于产品的实际应用和工具优化,这表明过去一年中,全球用户正在积极使用亚马逊云科技进行生成式AI应用的探索和创新。有两个方面让他印象深刻:一是随着全球企业对生成式AI的深入应用,数据不仅实现跨区域的传输与协同,更实现跨地域、跨区域的深度连接;二是亚马逊云科技进一步优化生成式AI的应用,从数据存储、治理到管理的全流程提升,旨在简化 AI 对数据的使用,同时强化模型功能、增加AI agent管理和应对模型幻觉的功能。
可以看到凭借Amazon Nova、Amazon Q等创新产品和服务,亚马逊云科技正在不断巩固其在云计算市场的领先地位,同时在人工智能领域逐步赢得更多主导权。
当然这一切的价值还会回归于用户,也就是Matt Garman 最后所说“We invent so you can reinvent,我们创新,为了助你重塑未来”。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。