在科技迅猛发展的当下,人工智能的边界不断扩展,探索其无限可能已成为时代的呼声。2024年4月27日,通用人工智能论坛将作为中关村论坛平行论坛在北京正式召开,届时将带来一系列通用人工智能领域最新科技成果。
4月17 日上午,北京通用人工智能研究院(通研院)举行媒体见面会,展示了他们在通用人工智能领域取得的突破性成果。这些创新不仅标志着技术的飞跃,也预示着未来生活方式的革新。
全球首个通用智能人,小女孩“通通”
要塑造真正的通用智能体,或许得回到人类作为通用智能体的原点,那是一个充满好奇、逐步学习和成长的阶段,从儿童时期开始学习常识,形成价值观,在生活中自主完成各种任务。小女孩“通通”(Little Girl)就是这样一个正在被构建的通用智能体。
在会场,研究人员介绍了人类与“通通”交互的三种方式:语音交互、VR交互和利用动捕设备投影,并现场进行了演示。当研究人员与“通通”说话时,她可以把语言和当前场景进行关联,并实时展示对于指令的分析解答,这体现了她推理和决策过程的透明和可解释性。
在实际操作中,“通通”可以根据其价值倾向——如好奇心、情感和整洁——自主执行任务,实现对环境的探索、收拾房间、擦拭污渍等。在清洗被弄脏的抹布够不到水槽时,她无需人类提示,便自行找到并使用凳子来完成清洗任务,其行为堪比3到4岁的人类儿童。
作为首个由价值与因果驱动的AGI系统原型,“通通”以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑,因此无需依赖大规模计算资源和海量数据便能实现自主学习和成长。
面向未来,“通通”的应用前景广阔,包括智能家居、健康管理、教育培训和娱乐互动等多个领域。
通用人工智能科研平台“通境”,激发具身智能潜力
具身智能是迈向通用人工智能的重要一步,为了把这一概念的巨大潜力转换为实际的产业应用,通研院推出了“通境” (TongVerse)通用人工智能科研平台。该平台作为“AI+机器人”仿真训练场,集成了大规模场景生成能力,支持人形机器人、复合协作机器人等多类型机器人的技能训练,为机器人进入真实世界打好提前量。
TongVerse平台拥有超过10000个覆盖从工业生产到居家生活各种环境的仿真场景,提供了一个几乎和真实世界无异的训练空间。此外,TongVerse还支持动态开放环境下的机器人动力学仿真。在应用场景上,TongVerse不仅服务于科研,还面向智能制造、特种行业等实际需求,提供多场景、多任务的机器人应用解决方案。
智能体在通用人工智能科研平台“通境” (TongVerse)中训练
值得一提的是,“通通”也将在“通境”平台上接受训练。通过自研视觉-语言-运动联合解译架构,智能体不仅能够“看到”和“理解”事物,还能将这些理解转化为精准的动作和语言,让智能体的行为反应更加自然和流畅。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
Upstage AI构建韩语宽度搜索基准KO-WIDESEARCH,测试20个AI系统填写完整结构化表格的能力,揭示AI善于找成员却难以填对每格的核心缺陷。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。