领导人工智能(AI)潮流的大咖DeepMind和OpenAI日前开放旗下了的训练平台,目标是进一步开发通用智能。
DeepMind隶属Alphabet的人工智能部门。DeepMind周一宣布开源DeepMind实验室。DeepMind实验室是DeepMind旗下用于基于代理的AI研究的3D游戏平台。
DeepMind团队在一篇博客文章中表示,3 D世界是从第一人称的角度观察到的,在3 D世界里开发通用智能会更容易一些。所谓的通用智能是指适应不断变化的环境和在未预先编程环境里运作的能力。
该博文指,“毕竟,自然世界里唯一已知的通用智能例子起源于动物的物理和感官,是一个进化、发展和学习 的组合。动物和人类智能的大部分极有可能是丰富环境的直接结果,若无环境这些智能是不大可能出现的。”
DeepMind实验室里的代理以漂浮物“个体”的形式出现,其推进器激活后,代理可以四处浮动。DeepMind实验室平台的研究重点放在导航、内存、一人称角度3D视觉、电机控制、规划、策略和时间管理上。用户可以利用GitHub上的资源在平台上添加新的定制层,包括诸如游戏逻辑和奖励计划以及在代理培训期间动态生成的小说地图布局等功能。
另外,由Elon Musk、亚马逊网络服务和其他商家打造的非营利AI公司OpenAI也宣布推出名为Universe的软件平台,Universe可用游戏、网站和其他应用里的AI通用智能的测试和训练。Universe能将各种程序转换成支持Gym的训练环境。Gym是OpenAI开源工具包,可用于开发和比较各种强化学习算法。
OpenAI的博文称,“我们的目标是开发一种单一的智能代理,该代理可以灵活地应用其过去在Universe环境里的经验,快速掌控不熟悉的困难环境,此举将会是通用智能领域里重大的一步。”
OpenAI团队的解释称,Universe里的代理通过观察屏幕的像素和产生键盘和鼠标命令操作远程桌面。Universe在VNC远程桌面后面运行程序,Universe的程序库将代理转成一个VNC客户端。新发布的版本含数千个环境,包括Flash游戏、诸如slither.io的浏览器任务和游戏。此外,OpenAI已拿到了EA、微软工作室、Valve、Wolfram和其他商家的的许可,Universe人工智能代理因此可以访问许多游戏和应用程序。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。