在科技迅猛发展的当下,人工智能的边界不断扩展,探索其无限可能已成为时代的呼声。2024年4月27日,通用人工智能论坛将作为中关村论坛平行论坛在北京正式召开,届时将带来一系列通用人工智能领域最新科技成果。
4月17 日上午,北京通用人工智能研究院(通研院)举行媒体见面会,展示了他们在通用人工智能领域取得的突破性成果。这些创新不仅标志着技术的飞跃,也预示着未来生活方式的革新。
全球首个通用智能人,小女孩“通通”
要塑造真正的通用智能体,或许得回到人类作为通用智能体的原点,那是一个充满好奇、逐步学习和成长的阶段,从儿童时期开始学习常识,形成价值观,在生活中自主完成各种任务。小女孩“通通”(Little Girl)就是这样一个正在被构建的通用智能体。
在会场,研究人员介绍了人类与“通通”交互的三种方式:语音交互、VR交互和利用动捕设备投影,并现场进行了演示。当研究人员与“通通”说话时,她可以把语言和当前场景进行关联,并实时展示对于指令的分析解答,这体现了她推理和决策过程的透明和可解释性。
在实际操作中,“通通”可以根据其价值倾向——如好奇心、情感和整洁——自主执行任务,实现对环境的探索、收拾房间、擦拭污渍等。在清洗被弄脏的抹布够不到水槽时,她无需人类提示,便自行找到并使用凳子来完成清洗任务,其行为堪比3到4岁的人类儿童。
作为首个由价值与因果驱动的AGI系统原型,“通通”以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑,因此无需依赖大规模计算资源和海量数据便能实现自主学习和成长。
面向未来,“通通”的应用前景广阔,包括智能家居、健康管理、教育培训和娱乐互动等多个领域。
通用人工智能科研平台“通境”,激发具身智能潜力
具身智能是迈向通用人工智能的重要一步,为了把这一概念的巨大潜力转换为实际的产业应用,通研院推出了“通境” (TongVerse)通用人工智能科研平台。该平台作为“AI+机器人”仿真训练场,集成了大规模场景生成能力,支持人形机器人、复合协作机器人等多类型机器人的技能训练,为机器人进入真实世界打好提前量。
TongVerse平台拥有超过10000个覆盖从工业生产到居家生活各种环境的仿真场景,提供了一个几乎和真实世界无异的训练空间。此外,TongVerse还支持动态开放环境下的机器人动力学仿真。在应用场景上,TongVerse不仅服务于科研,还面向智能制造、特种行业等实际需求,提供多场景、多任务的机器人应用解决方案。
智能体在通用人工智能科研平台“通境” (TongVerse)中训练
值得一提的是,“通通”也将在“通境”平台上接受训练。通过自研视觉-语言-运动联合解译架构,智能体不仅能够“看到”和“理解”事物,还能将这些理解转化为精准的动作和语言,让智能体的行为反应更加自然和流畅。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。