Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航

让AI模型如何在少量训练数据支持下学会在物理世界中行走，目前已经取得了快速进展。这项研究能够显著缩短AI模型获得视觉导航能力的时间。以前，实现这类目标要需要利用大量数据集配合重复“强化学习”才能实现。

Meta Platforms公司人工智能部门日前表示，他们正在教AI模型如何在少量训练数据支持下学会在物理世界中行走，目前已经取得了快速进展。

这项研究能够显著缩短AI模型获得视觉导航能力的时间。以前，实现这类目标要需要利用大量数据集配合重复“强化学习”才能实现。

Meta AI研究人员表示，这项关于AI视觉导航的探索将给虚拟世界带来重大影响。而项目的基本思路并不复杂：帮助AI像人类那样，单纯通过观察和探索实现在物理空间导航。

Meta AI部门解释道，“比如，如果要让AR眼镜指引我们找到钥匙，就必须想办法帮助AI理解陌生的、不断变化的环境布局。毕竟这是非常细化的小需求，不可能永远依赖于极占算力资源的高精度预置地图。人类不需要了解咖啡桌的确切位置或长度就能不产生任何碰撞、轻松绕着桌角走动。”

为此，Meta决定将精力集中在“具身AI”身上，即通过3D模拟中的交互机制训练AI系统。在这一领域，Meta表示已经建立起一套值得期待的“点目标导航模型”，无需任何地图或GPS传感器即可在新环境中导航。

该模型使用一种名为视觉测量的技术，允许AI根据视觉输入跟踪自身当前位置。Meta表示，这项数据增强技术能够快速训练出有效的神经模型，且无需人工数据注释。Meta还提到，他们已经在自家Habitat 2.0具身AI训练平台（利用Realistic PointNav基准任务运行虚拟空间模拟）上完成了测试，成功率达到94%。

Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航

Meta方面解释道，“虽然我们的方法还没有完全解决数据集中的所有场景，但这项研究已经初步证明，现实环境的导航能力不一定需要显式映射来实现。”

为了在不依赖地图的情况下进一步完善AI导航训练，Meta建立了一套名为Habitat-Web的训练数据集，其中包含10万多种由人类演示的不同对象-目标导航方法。通过运行在网络浏览器上的Habitat模拟器就能顺利接入Amazon.com的Mechanical Turk服务，用户能够以远程方式安全操作虚拟机器人。Meta表示，由此产生的数据将作为训练素材，帮助AI代理获得“最先进的结果”。扫视房间了解整体空间特点、检查角落是否有障碍物等，都是值得AI向人类学习的高效对象搜索行为。

此外，Meta AI团队还开发出所谓“即插即用”模块化方法，可以通过一套独特的“零样本体验学习框架”帮助机器人在多种语义导航任务和目标模式中实现泛化。通过这种方式，AI代理在缺少资源密集型地图和训练的前提下仍可获得基本导航技能，无需额外调整即可在3D环境中执行不同任务。

Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航

Meta公司解释道，这些代理在训练中会不断搜索图像目标。它们会收到一张在环境中随机位置拍摄的照片，然后通过自主导航尝试找到拍摄点位。Meta研究人员们表示，“我们的方法将训练数据削减至1/12.5，成功率则比最新的迁移学习技术还高出14%。”

Constellation Research公司分析师Holger Mueller在采访中表示，Meta的这项最新进展有望在其元宇宙发展计划中发挥关键作用。他认为，如果未来虚拟世界能够成为常态，那AI必须有能力理解这个新空间，而且理解的成本还不能太高。

Mueller补充道，“AI理解物理世界的能力需要由基于软件的方法获得扩展。Meta目前走的就是这条路，而且在具身AI方面取得了进步，开发出无需训练即可自主理解周边环境的软件。我很期待看到这方面成果在实践层面的早期应用。”

这些现实用例可能已经离我们不远了。Meta公司表示，下一步计划就是把这些成果从导航推进到移动操作，开发出能够执行特定任务的AI代理（比如识别出钱包并将其交还给主人）。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航

来源：至顶网软件与服务频道

2022

06/17

17:55

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: