谷歌公司今天宣布收购 HTC Vive 工程团队的部分成员,以加速开发其新的面向虚拟现实和扩展现实头显的 Android XR 操作系统。
这个新操作系统是谷歌与三星电子和高通科技合作开发的,它将作为下一代 VR 和 AR 设备的操作系统,并将搭载谷歌旗舰级的 Gemini AI 模型。
根据 HTC 的公告,谷歌同意支付 2.5 亿美元现金。作为交易的一部分,谷歌将获得 HTC XR 知识产权的非独占许可,同时 HTC XR 团队的"部分员工"将加入谷歌。
HTC 在扩展现实领域有着悠久而辉煌的历史,该公司于 2016 年与游戏发行商 Valve 合作推出了首批高性能虚拟现实头显之一的 HTC Vive。在过去十年中,公司持续创新技术,不断推出性能强大的 VR 头显。
谷歌去年底推出了 Android XR,这是一个开放、统一的 XR 头显和眼镜平台。类似于谷歌为智能手机创建 Android 的方式,Android XR 可能成为 VR 和 AR 硬件开发者与 Meta 和苹果等行业巨头竞争的途径。
谷歌表示,这将为包括 Lynx Mixed Reality、索尼集团和 Xreal 在内的高通合作伙伴提供一条路径,使其能够构建具有完整扩展现实功能的 Android XR 设备,从而加速大规模普及。
苹果推出了运行在其 2024 年发布的 Vision Pro 混合现实头显上的 VisionOS 操作系统,而 Meta 则在同年为其 Meta Quest 头显推出了 Horizon OS。
首款预计搭载 Android XR 的设备是三星代号为 "Project Moohan" 的头显 (如图所示)。根据实际体验报告,该设备类似于苹果的高端 Vision Pro,并借鉴了部分已停产的 Meta Quest Pro 的设计理念。三星表示计划首先向开发者推出这款头显,但尚未给出商业发布的具体时间表。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。