DeepMind表示要给人工智能增加想象力？我们来仔细看看吧原创

因击败世界顶尖围棋选手而名声大噪的谷歌人工智能精品店——DeepMind以消灭人类在智力方面的优越感妄想而著称，发现为其软件代理注入想象力有助于它们更好地学习。

至顶网软件频道消息：因击败世界顶尖围棋选手而名声大噪的谷歌人工智能精品店——DeepMind以消灭人类在智力方面的优越感妄想而著称，发现为其软件代理注入想象力有助于它们更好地学习。

本周发表的两篇论文——《Imagination-Augmented Agents for Deep Reinforcement Learning》和《Learning model-based planning from scratch》（从头开始基于模型的规划）——总部在英国人工智能业务的研究人员描述了通过想象力规划提升深度强化学习的新奇技术。

强化学习是机器学习的一种形式。它包含了通过与特定环境进行交互而学习的软件代理程序，通常通过反复尝试和犯错。深度学习是一种机器的形式，涉及受到人类大脑启发的算法——被称为神经网络。而这两种技术可以一起使用。

可以使用包含软件代理运行规则的模型来完成深层强化学习。例如，为了教会软件如何玩视频游戏，研究人员可能希望提供一个包含游戏信息的模型，这样可以避免在学习过程中代价高昂的尝试和犯错。或者研究人员可能会选择无模型的强化学习，期望软件代理最终自己选择游戏。

每种方法都有自身的缺点，基于模型的方法缺少在模型中未捕获的信息，而无需模型的方法需要大量数据集并且缺乏行为灵活性。DeepMind的工作尝试融合这两种方法的优点。

这些研究人员在他们的第一篇论文中解释说：“对环境模型的结构和可能存在的缺陷没有做出任何假设，我们的方法是以端对端的方式学习提取从模型模拟中收集的有用知识——特别不依赖于模拟的回报。”他们表示，“这样就可以让代理受益于基于模型的想象，而又不会陷入传统基于模型方式的陷阱。”

他们正在描述的是能够在行动之前思考的软件。

死胡同

DeepMind的研究人员提出通过构建，评估和执行计划来学习的软件代理。它将试错学习与模拟结合作为“飞行前”检查的一种形式，以便评估最有希望的途径，同时避免明显的死胡同。

研究人员用Sokoban测试了他们的想象力代理，这是一个拼图视频游戏，是1981年在日本创建的，其中包含了在仓库里移动盒子以及飞船导航游戏。

Sokoban允许玩家推盒子，但是不可以拉动盒子，这意味着可能会有一些动作会让游戏中的难题无法解决。因此，如果是人类玩家，游戏就会建议他们在开始行动之前先制订一个计划。研究人员认为，因为DeepMind代理也能够进行这样的规划，所以也非常适合这个游戏。

想象代理设法解决了所提出的Sokoban中85％的关卡，而标准无模型代理则为只能完成60％。它的表现也超过了一个拷贝模型代理，这是一个不使用有想象规划增强版的标准代理。

研究人员在一篇博客中解释说：“对于这两个任务来说，想象增强代理在很大程度上胜过无想象的基准：它们以较少的经验学习，能够处理环境建模的缺陷。”他们表示，“因为代理能够从内部模拟中提取更多的知识，和传统的搜索方法——例如蒙特卡洛树搜索——相比，它们能够使用更少的想象，完成更多的任务。”

在行动之前思考让机器学习工作变得更慢，但研究人员认为：“这在不可逆转的领域至关重要，在这些环境中某些行动可能会产生灾难性的后果，例如Sokoban。”

来源：至顶网软件频道

0赞

好文章，需要你的鼓励

DeepMind表示要给人工智能增加想象力？我们来仔细看看吧 原创

来源：至顶网软件频道

2017

07/23

23:06

分享

点赞

MCP难以满足合规要求：受监管行业对开放智能体交换持谨慎态度

IBM推出基于定制Power11处理器的新服务器系列

选择飞书，就是选择企业长期值得信赖的AI伙伴

超七成家长称学校未教授编程课程

新型AI模型的深度研究功能及其应用探索

日本浮动数据中心船舶项目将于2027年投入运营

2025年已诞生至少36家新晋科技独角兽企业

突破AI存储瓶颈，大幅提升边缘推理性能

Google默认启用Gemini访问第三方应用功能引发隐私担忧

AGI和AI超智能被盗是一个极具诱惑的选择

F5携手NVIDIA全面增强AI时代的性能、多租户与安全能力

Gartner：到2030年，80%企业软件和应用将为多模态，2024年尚不足10%

MCP难以满足合规要求：受监管行业对开放智能体交换持谨慎态度

IBM推出基于定制Power11处理器的新服务器系列

超七成家长称学校未教授编程课程

新型AI模型的深度研究功能及其应用探索

日本浮动数据中心船舶项目将于2027年投入运营

2025年已诞生至少36家新晋科技独角兽企业

突破AI存储瓶颈，大幅提升边缘推理性能

Google默认启用Gemini访问第三方应用功能引发隐私担忧

AGI和AI超智能被盗是一个极具诱惑的选择

独角兽、人工智能与医疗健康的未来：HLTH Europe 2025大会亮点回顾

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

DeepMind表示要给人工智能增加想象力？我们来仔细看看吧原创