电商巨头亚马逊今天(9月25日)表示,将向人工智能公司Anthropic投资高达40亿美元,并在该公司中占据少数股权。
此举凸显了亚马逊正在积极布局人工智能领域,以与微软和谷歌等竞争对手保持同频。
Anthropic是由前OpenAI高管于大约两年前创立的公司,该公司最近推出了名为Claude 2的新型AI聊天机器人。
亚马逊希望进入这一领域,这一领域有OpenAI的ChatGPT技术和Anthropic的Claude聊天机器人。
两家公司表示,它们正在形成战略合作关系,推进生成式人工智能,初创公司选择AWS作为其主要云服务基础设施。Anthropic表示,它将为AWS提供早期访问特权以进行模型定制和精细调整。
Anthropic还将使用定制的、AWS设计的芯片来训练支撑其人工智能应用的基础模型,该基础模型是在大量数据上训练的大型人工智能系统,可以适应解决各种任务。
今年,人工智能芯片公司Nvidia是从生成式AI热潮中获益最大的芯片公司。
Nvidia的关键产品是GPU,可用于训练AI大模型。Nvidia的股价上涨曾一度超过200%,之所以有这样的增长,正是因为行业对于人工智能的热情持续高涨。
在某种程度上,亚马逊与Anthropic的交易旨在表明还有其他可用于人工智能领域应用的芯片。
AWS客户将能够通过亚马逊Bedrock,基于Anthropic的AI大模型进行软件开发,该服务允许客户在云端使用现有模型构建生成式AI应用,而不是训练自己的模型。
亚马逊希望将自己定位为人工智能的一站式购物平台。
这家电商巨头设计自己的芯片来训练AI大模型,通过亚马逊Bedrock,客户还可以使用现有模型设计自己的生成式AI应用,所有这些都是在亚马逊云上进行的,该公司也销售自己的人工智能应用。
Anthropic已经有一些知名支持者,包括谷歌和Salesforce Ventures,这样的支持是在科技巨头继续对人工智能公司进行大规模投资的背景下出现的。
其中,微软在今年1月对ChatGPT制造商OpenAI进行了数十亿美元的投资是这一系列事件的导火索。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。