谷歌DeepMind项目的研究人员报告称,他们的人工智能刚刚变得更加人性化了一些:它现在会记住的事情。
在人工智能进步中需要克服的障碍之一是,你可以训练它完成一项任务,但让它记住它做了什么,并能够在未来使用这些专门知识却完全是另一回事。这被称为“灾难性遗忘”,DeepMind的研究人员表示,他们越来越接近于解决这一难题了。
在一篇博客文章中,DeepMind解释说:“当一个新任务被引入时,新的适应改写了神经网络以前获得的知识。”
简单地说,你可以训练人工智能来识别犬科动物的特征,但如果你想要切换到识别人类,它将不得不重新训练,不会保留其对狗的知识,这一点上人工智能不像人类。游戏玩法也是如此。被创造出来玩扑克的人工智能需要被覆盖后才能成为象棋大师。
DeepMind的研究人员表示,他们跟踪神经科学的研究,以及大脑是如何记住过去最重要的东西,就像动物知道某些危险是因为他们的大脑保留了最重要的数据。
DeepMind的James Kirkpatrick表示,他们已经训练他们的人工智能做到了非常类似的事情,在面对一个新的任务的时候,保留重要的数据,并覆盖不那么重要的数据。Kirkpatrick对The Guardian表示,“如果网络可以重新使用它已经学到的东西,它就那么会做的。”
他们是通过训练人工智能来学习如何顺序玩10个经典的Atari游戏做到这一点的,每个游戏需要不同的策略,但有时需要类似的技能。在学习了如何玩这些游戏——其中包括一些令人难忘的游戏,如Space Invaders and Defender——之后,人工智能学会了把十个游戏中的七个游戏玩得像人类一样好。
同时,研究人员表示,虽然他们已经证明人工智能可以顺序地学习游戏,但这并不意味着会带来更好的结果。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。