10与11日,阿里巴巴宣布成立承载“NASA计划”的实体组织——“达摩院”,定位于进行基础科学和颠覆式技术创新研究。马云表示,未来3年内,将为达摩院投入1000亿元以上。
达摩院刚刚成立,然而进展神速。今日阿里巴巴宣布,微软亚洲研究院首席研究员聂再清博士、谷歌Tango和DayDream项目技术主管李名杨博士入职阿里巴巴人工智能实验室(以下简称AI Labs)。其中聂再清将担任AI Labs北京研发中心总负责人,李名杨任AI Labs机器视觉杰出科学家。
据介绍,聂再清博士加入AI Labs前就职于微软亚洲研究院,任首席研究员,主要负责微软自然语言理解、实体挖掘的研发工作。在对象级别搜索与大数据挖掘方面申请国际专利十余项。他带领团队旨在通过大数据挖掘和众包,建立Web-scale知识图谱,是微软学术搜索、人立方,以及企业智能助理EDI的发起人和负责人,也是微软自然语言理解平台LUIS的技术负责人。相关技术已经应用在Bing、Office、Cortana等产品上。加入AI Labs之后,除负责北京研发中心的各项研发工作外,还将重点突破知识图谱和自然语言理解这两个研究方向。
李名杨博士此前就职于谷歌,担任Daydream/Tango项目技术主管。他的主要研究领域是视觉-惯导里程计(VIO)和即时定位与地图重建(SLAM),并在该领域拥有20多篇顶级论文及相关专利。在谷歌期间,他的研究重心为多传感器融合和SLAM领域,包括技术的理论创新和商业化。他推进了tango项目与全世界多个高校之间的合作研发计划,也将SLAM技术融合进了多个终端产品中,包括tango手机和ARcore。
这一消息也被视为达摩院成立后的“第一枪”。此前“达摩院”首批公布的研究领域包括:量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等,涵盖机器智能、智联网、金融科技等多个产业领域。聂再清与李名杨的入职,也预示AI Labs未来的产品方向,除了天猫精灵这一语音交互产品外,很有可能会推出基于视觉交互,甚至“机器人”类型的人工智能产品。
好文章,需要你的鼓励
字节跳动智能创作实验室发布革命性AI视频数据集Phantom-Data,解决视频生成中的"复制粘贴"问题。该数据集包含100万个跨场景身份一致配对,通过三阶段构建流程实现主体检测、多元化检索和身份验证,显著提升文本遵循能力和视频质量。
ByteDance智能创作实验室发布的Phantom-Data是首个大规模跨情境主体一致性视频生成数据集,包含约100万个身份一致配对样本。该数据集通过创新的三阶段构建管道,从5300万视频和30亿图像中精选高质量跨场景配对,有效解决AI视频生成中的"复制粘贴"问题,显著提升文本遵循能力和视觉质量。
被盗凭证导致80%的企业数据泄露。随着AI智能体投入生产,管理10万员工的企业将需要处理超过100万个身份。传统身份访问管理架构无法应对智能体AI的大规模部署。领先厂商正采用蓝牙低功耗技术替代硬件令牌,实现基于距离的身份验证。行为分析可实时捕获被入侵的智能体,零信任架构扩展至智能体部署。这代表了自云计算普及以来最重要的安全变革。
普林斯顿大学研究团队开发了ReasonFlux-PRM,这是首个能深度理解AI复杂思维过程的评分系统。不同于传统只看最终答案的评估方法,新系统能评判AI思考轨迹的每个步骤质量,在数学和科学推理任务上实现了平均4.5%-12.1%的性能提升,为AI教育和训练提供了突破性的解决方案。