10与11日,阿里巴巴宣布成立承载“NASA计划”的实体组织——“达摩院”,定位于进行基础科学和颠覆式技术创新研究。马云表示,未来3年内,将为达摩院投入1000亿元以上。
达摩院刚刚成立,然而进展神速。今日阿里巴巴宣布,微软亚洲研究院首席研究员聂再清博士、谷歌Tango和DayDream项目技术主管李名杨博士入职阿里巴巴人工智能实验室(以下简称AI Labs)。其中聂再清将担任AI Labs北京研发中心总负责人,李名杨任AI Labs机器视觉杰出科学家。
据介绍,聂再清博士加入AI Labs前就职于微软亚洲研究院,任首席研究员,主要负责微软自然语言理解、实体挖掘的研发工作。在对象级别搜索与大数据挖掘方面申请国际专利十余项。他带领团队旨在通过大数据挖掘和众包,建立Web-scale知识图谱,是微软学术搜索、人立方,以及企业智能助理EDI的发起人和负责人,也是微软自然语言理解平台LUIS的技术负责人。相关技术已经应用在Bing、Office、Cortana等产品上。加入AI Labs之后,除负责北京研发中心的各项研发工作外,还将重点突破知识图谱和自然语言理解这两个研究方向。
李名杨博士此前就职于谷歌,担任Daydream/Tango项目技术主管。他的主要研究领域是视觉-惯导里程计(VIO)和即时定位与地图重建(SLAM),并在该领域拥有20多篇顶级论文及相关专利。在谷歌期间,他的研究重心为多传感器融合和SLAM领域,包括技术的理论创新和商业化。他推进了tango项目与全世界多个高校之间的合作研发计划,也将SLAM技术融合进了多个终端产品中,包括tango手机和ARcore。
这一消息也被视为达摩院成立后的“第一枪”。此前“达摩院”首批公布的研究领域包括:量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等,涵盖机器智能、智联网、金融科技等多个产业领域。聂再清与李名杨的入职,也预示AI Labs未来的产品方向,除了天猫精灵这一语音交互产品外,很有可能会推出基于视觉交互,甚至“机器人”类型的人工智能产品。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。