Google 宣布推出一项新的 AI 功能,利用 Gemini AI 机器人根据 Gmail 中的邮件内容自动将事件添加到 Google 日历中。
当 Gemini 识别到邮件中描述的事件时,会显示一个新的"添加到日历"按钮来启动交互。点击该按钮后,Gemini 提示侧边栏将会打开,确认事件已添加,根据 Google 提供的截图显示,如果需要修改任何内容,还可以使用编辑按钮。虽然用户之前就可以通过 Gemini 的侧边栏添加事件,但现在这个过程已经实现自动化。
这项功能类似于 Google 过去的非 AI 功能,可以根据某些预约或旅行邮件自动添加或更新 Google 日历事件。Google 表示,该功能目前正在向 Workspace 商业版、企业版和教育版用户,以及 Google One AI Premium 订阅用户推出。
在我的测试中,这项功能表现良好,甚至能识别出测试邮件中的两个独立事件。但是它的运行方式与 Google 描述的略有不同 —— 它并不是直接添加事件,而是先确认详细信息,然后询问是否要将其添加到日历中。当我回复"是"时,它才会添加事件,而且侧边栏中并没有出现编辑按钮。不过,我可以直接点击事件跳转到 Google 日历中查看,这一点还是很方便的。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。