在科技迅猛发展的当下,人工智能的边界不断扩展,探索其无限可能已成为时代的呼声。2024年4月27日,通用人工智能论坛将作为中关村论坛平行论坛在北京正式召开,届时将带来一系列通用人工智能领域最新科技成果。
4月17 日上午,北京通用人工智能研究院(通研院)举行媒体见面会,展示了他们在通用人工智能领域取得的突破性成果。这些创新不仅标志着技术的飞跃,也预示着未来生活方式的革新。
全球首个通用智能人,小女孩“通通”
要塑造真正的通用智能体,或许得回到人类作为通用智能体的原点,那是一个充满好奇、逐步学习和成长的阶段,从儿童时期开始学习常识,形成价值观,在生活中自主完成各种任务。小女孩“通通”(Little Girl)就是这样一个正在被构建的通用智能体。
在会场,研究人员介绍了人类与“通通”交互的三种方式:语音交互、VR交互和利用动捕设备投影,并现场进行了演示。当研究人员与“通通”说话时,她可以把语言和当前场景进行关联,并实时展示对于指令的分析解答,这体现了她推理和决策过程的透明和可解释性。
在实际操作中,“通通”可以根据其价值倾向——如好奇心、情感和整洁——自主执行任务,实现对环境的探索、收拾房间、擦拭污渍等。在清洗被弄脏的抹布够不到水槽时,她无需人类提示,便自行找到并使用凳子来完成清洗任务,其行为堪比3到4岁的人类儿童。
作为首个由价值与因果驱动的AGI系统原型,“通通”以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑,因此无需依赖大规模计算资源和海量数据便能实现自主学习和成长。
面向未来,“通通”的应用前景广阔,包括智能家居、健康管理、教育培训和娱乐互动等多个领域。
通用人工智能科研平台“通境”,激发具身智能潜力
具身智能是迈向通用人工智能的重要一步,为了把这一概念的巨大潜力转换为实际的产业应用,通研院推出了“通境” (TongVerse)通用人工智能科研平台。该平台作为“AI+机器人”仿真训练场,集成了大规模场景生成能力,支持人形机器人、复合协作机器人等多类型机器人的技能训练,为机器人进入真实世界打好提前量。
TongVerse平台拥有超过10000个覆盖从工业生产到居家生活各种环境的仿真场景,提供了一个几乎和真实世界无异的训练空间。此外,TongVerse还支持动态开放环境下的机器人动力学仿真。在应用场景上,TongVerse不仅服务于科研,还面向智能制造、特种行业等实际需求,提供多场景、多任务的机器人应用解决方案。
智能体在通用人工智能科研平台“通境” (TongVerse)中训练
值得一提的是,“通通”也将在“通境”平台上接受训练。通过自研视觉-语言-运动联合解译架构,智能体不仅能够“看到”和“理解”事物,还能将这些理解转化为精准的动作和语言,让智能体的行为反应更加自然和流畅。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。