谷歌本周二表示,谷歌计划向大型企业收取每个用户每月30美元的费用,以使用其添加到Gmail和其它生产力应用程序中的人工智能增强功能。
这项名为Duet AI的技术的费用与微软的365 Copilot增强功能一样多,该功能可能在明年上半年推出。
自从去年底OpenAI推出ChatGPT聊天机器人以来,这两家公司一直在竞相将生成式人工智能应用于更多核心产品中。这些费用是叠加在企业已经支付的办公软件订阅费用之上的,谷歌表示,它允许公司在订阅之前可以免费试用。
对于较小的组织和个人用户,公司尚未确定定价,谷歌副总裁兼总经理Aparna Pappu表示。
“我们制定的价格考虑了客户愿意为我们将捆绑在其中的企业价值付费的情况,”Pappu在接受CNBC采访时说。
谷歌在今年5月以每个用户30美元的价格开始接受Duet AI for Google Workspace的预订,但Pappu并未公开披露。随后,微软在7月宣布了这个定价。
“我们有点惊讶看到我们在雷德蒙德的朋友们提出了与我们完全相同的定价模式,”Pappu说。
微软总部位于华盛顿州雷德蒙德,谷歌的收入主要来自互联网搜索引擎和其它在线广告,与微软相比,谷歌对企业软件的依赖较小。Workspace收入归于Alphabet的谷歌云类别,与谷歌的云基础设施一起,这两个部门在第二季度共产生了80亿美元的收入。同期,微软的Office产品和云服务为公司带来了135亿美元的收入。
谷歌表示,Workspace现在拥有1000万付费客户,比3月的900万和2020年的600万新增用户要多不少。实际上,自今年早些时候推出新AI功能以来,已有超过100万人通过“可信任的测试人员”计划尝试了这些功能。Pappu表示,现在有超过1000个客户正在试用这些工具。
在Gmail和Google Docs中,用户可以输入简单的文本提示,并告诉Duet AI生成结果。在Google Slides中,可以通过输入几个描述性文本来创建图像。对于那些无法参加视频会议的人,Duet AI还可以帮助在Google Meet中制定项目计划和记录笔记。
Pappu表示,她最近要求Duet AI使用来自其他来源的信息为产品定位文件生成文本,并为演示文稿制作插图。内衣品牌Adore Me是其早期客户之一,该品牌的员工使用Duet AI来准备文案,谷歌的一位发言人表示。
微软已经在其365 Copilot中宣传了一些相关功能。今年5月,该公司宣布为600个客户推出付费早期访问计划。全球有超过30亿人使用谷歌工作区。谷歌工作区的消费者版本的Duet AI预计将在“明年初”推出,Pappu表示。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。