OpenAI及DeepMind两团队令未来的AI机器更安全原创

OpenAI和DeepMind的研究人员使用的新算法从人类反馈中学习，他们希望这样做能使人工智能更安全。

两家公司均为强化学习的专家，强化学习是机器学习的一个领域，其基本思想是，如果代理在特定的环境里采取正确的行动完成了任务就给予奖励。该目标是通过一种算法来指定的，代理经过程序后就会追逐奖励，例如游戏中的获胜点。

强化学习在训练机器如何玩如Doom或Pong等游戏或通过模拟驾驶自主驾驶汽车等案例中取得了成功。强化学习是探索代理行为的一个有效的方法，但如果硬编码算法错了或产生不良影响的话，这种方法可能也有危险。

arXiv上发表的一篇论文描述了一种有助于防止此类问题的新方法。首先，代理在其环境中执行随机动作。预测的奖励则是基于人类的判断，而且奖励被反馈到强化学习算法中，以改变代理的行为。

系统在人类指导下制定最佳行动及学习目标

研究人员将这种算法用于训练一个弯曲的灯柱往后仰。代理的两个视频然后再交给人观看，观看者选择哪一个的后仰动作更佳一些。

经过一段时间后，代理就逐渐学习了如何根据奖励函数最有效地解释人类的判断来学习目标。强化学习算法用于指导代理的行为，并可以持续在人类的批准下进行改进。

网上可找到相关的视频。（https://www.youtube.com/watch?v=oC7Cw3fu3gU）

人类评估者花掉的时间不足一个小时。但要完成做饭或发送电子邮件等更复杂的任务就会需要更多的人类反馈，从财务的角度来看则是昂贵的。

文章的作者之一达里奥·阿莫德（Dario Amodei）是OpenAI的一名研究人员，他表示，未来研究的重点会放在减少监督方面。

他告诉记者，“泛泛而言，名为半监督学习的技术在这一块可能有帮助。另一种可能性是提供更信息密集的反馈形式，如语言，或是让人类在屏幕上具体指出表示良好行为的部分。更多的信息密集反馈可能会让人类在更短的时间内更多地与算法进行沟通。“

上述研究人员在其他模拟机器人任务和Atari游戏里测试了他们的算法，结果显示机器有时可以实现超人式的性能。但这在很大程度上取决于人类评估者的判断。

OpenAI在一篇博文里表示，“我们算法的性能只能和人类评估者对于什么是正确行为的直觉一样好，所以，如果人类对一个任务没有很好的把握，那他们可能提供不了太多有用的反馈。”

阿莫德表示，目前的结果仅局限于非常简单的环境。但这种方法大有可能对有些很难学习的任务有用，这些任务的奖励功能很难量化，例如驾驶、组织事件、写作或技术支持的提供。

来源：至顶网软件频道

0赞

好文章，需要你的鼓励

OpenAI及DeepMind两团队令未来的AI机器更安全 原创

来源：至顶网软件频道

2017

06/14

17:00

分享

点赞

情感AI的十字路口：从马斯克的虚拟伴侣到腾讯的共情革命

CoDesign 2025国际研讨会在大阪召开 共探高性能计算与AI融合新路径

自写互联网：Dfinity的Caffeine AI是否为应用开发者敲响警钟

Meta利用AI创造低碳混凝土并用于数据中心地板浇筑

Slack宣称其AI能够理解公司的专业术语和行话

Adobe新AI工具将搞怪噪音转换成逼真音效

AI是新的Android恶意软件吗？手机厂商争夺用户注意力的战争

NetBox Labs获得3500万美元融资推动基础设施运营现代化

边缘计算趋势：采用现状、挑战与未来展望

Liqid发布支持CXL 2.0内存池的可组合GPU服务器

Uber携手Lucid和Nuro部署2万辆自动驾驶出租车

Mistral的Le Chat聊天机器人推出"深度研究"模式，生产力大幅提升

Docker统一容器开发与AI智能体工作流程

自写互联网：Dfinity的Caffeine AI是否为应用开发者敲响警钟

Meta利用AI创造低碳混凝土并用于数据中心地板浇筑

Slack宣称其AI能够理解公司的专业术语和行话

Adobe新AI工具将搞怪噪音转换成逼真音效

AI是新的Android恶意软件吗？手机厂商争夺用户注意力的战争

Liqid发布支持CXL 2.0内存池的可组合GPU服务器

Uber携手Lucid和Nuro部署2万辆自动驾驶出租车

Mistral的Le Chat聊天机器人推出"深度研究"模式，生产力大幅提升

AWS为S3新增向量存储桶以降低RAG存储成本

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

OpenAI及DeepMind两团队令未来的AI机器更安全原创

CoDesign 2025国际研讨会在大阪召开共探高性能计算与AI融合新路径