谷歌对其推出近三个月的搜索生成体验(SGE)进行了更新,这是谷歌在搜索中由人工智能驱动的对话模式,目的在于帮助用户更好地学习和理解网上的信息。这些功能包括查看不熟悉术语定义的工具、有助于提高跨语言理解和编码信息的工具,以及让用户在浏览时利用 SGE 的其他有趣的功能。
谷歌解释说,这些改进能帮助人们更好地理解复杂的概念或复杂的主题,提高他们的编码技能等。
其中一项新功能将允许用户将鼠标悬停在某些单词上以预览其定义并查看与该主题相关的图像或图表,然后可以点击它们以了解更多信息。此功能将在 Google 的 AI 生成的针对某些主题(例如 STEM、经济、历史等)或问题的响应中提供,用户也可能会遇到不理解的术语或想要更深入了解的概念。
Bing Chat 也提供了与此类似的功能,通过突出显示页面上的相关文本,从选项菜单中选择 Bing 进行对话,在对话中用户可以了解有关该主题的更多信息。
另一个新功能将帮助那些使用 SGE 进行编程的人。谷歌表示,新功能将让理解和调试生成的代码变得更加容易。
目前,SGE 提供人工智能生成的概述,帮助完成与编程语言和工具相关的任务。帮助用户找到问题的答案或查看生成的代码片段。新的更新现在将使用语法突出显示对代码段进行颜色区别,从而更容易识别关键字、注释和字符串等不同元素。
浏览时的 SGE 可能是最有趣的新功能,但目前它只是搜索实验室的早期实验,可在 Android 和 iOS 版 Google 应用程序以及更高版本的桌面版 Chrome 上使用。
该功能能帮助用户与发布商和创作者提供的长文本内容互动,从而更轻松地找到他们想要的内容。
例如,在某些网页上,用户可以点击查看人工智能生成的文章要点列表,其中包含可直接转到您要查找的部分的链接。
该页面还将包括一个“在页面上浏览”的选项,用户可以在其中查看文章回答的问题,然后跳转到相关部分。
此功能让人想起现有的内容突出显示搜索功能,当您搜索特定术语并找到匹配结果时,该功能会跳转到相关文本。然而,这次它是由人工智能生成的。
竞争对手Bing Chat 也提供了类似的功能,让用户在在线阅读文章或文档时点击 Bing Chat 图标,并要求 Chat 生成总结内容 ——因此这成了 Google 的追赶点。
谷歌指出,此功能不会为付费文章提供人工智能摘要,出版商可以通过在帮助中心将其内容指定为付费文章来选择阻止该功能。
谷歌和必应并不是唯一考虑如何使用人工智能来总结文章内容的公司。Instagram 创始人开发的新闻阅读应用 Artifact自 2023 年 4 月更新起也开始提供人工智能摘要功能。
浏览时的 SGE 可作为搜索实验室中的独立实验,并将自动向已选择加入 SGE 的用户推出。
这些功能是继 SGE 的其他新增功能之后推出的,其中包括本月早些时候推出的一项功能,该功能可显示与用户搜索查询相关的视频和图像。
搜索实验室可通过 Android 和 iOS 上的 Google 应用程序以及桌面上的 Chrome 进行访问。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。