10与11日,阿里巴巴宣布成立承载“NASA计划”的实体组织——“达摩院”,定位于进行基础科学和颠覆式技术创新研究。马云表示,未来3年内,将为达摩院投入1000亿元以上。
达摩院刚刚成立,然而进展神速。今日阿里巴巴宣布,微软亚洲研究院首席研究员聂再清博士、谷歌Tango和DayDream项目技术主管李名杨博士入职阿里巴巴人工智能实验室(以下简称AI Labs)。其中聂再清将担任AI Labs北京研发中心总负责人,李名杨任AI Labs机器视觉杰出科学家。
据介绍,聂再清博士加入AI Labs前就职于微软亚洲研究院,任首席研究员,主要负责微软自然语言理解、实体挖掘的研发工作。在对象级别搜索与大数据挖掘方面申请国际专利十余项。他带领团队旨在通过大数据挖掘和众包,建立Web-scale知识图谱,是微软学术搜索、人立方,以及企业智能助理EDI的发起人和负责人,也是微软自然语言理解平台LUIS的技术负责人。相关技术已经应用在Bing、Office、Cortana等产品上。加入AI Labs之后,除负责北京研发中心的各项研发工作外,还将重点突破知识图谱和自然语言理解这两个研究方向。
李名杨博士此前就职于谷歌,担任Daydream/Tango项目技术主管。他的主要研究领域是视觉-惯导里程计(VIO)和即时定位与地图重建(SLAM),并在该领域拥有20多篇顶级论文及相关专利。在谷歌期间,他的研究重心为多传感器融合和SLAM领域,包括技术的理论创新和商业化。他推进了tango项目与全世界多个高校之间的合作研发计划,也将SLAM技术融合进了多个终端产品中,包括tango手机和ARcore。
这一消息也被视为达摩院成立后的“第一枪”。此前“达摩院”首批公布的研究领域包括:量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等,涵盖机器智能、智联网、金融科技等多个产业领域。聂再清与李名杨的入职,也预示AI Labs未来的产品方向,除了天猫精灵这一语音交互产品外,很有可能会推出基于视觉交互,甚至“机器人”类型的人工智能产品。
好文章,需要你的鼓励
滑铁卢大学研究团队开发出LOCKET技术,解决AI服务"按需付费"的商业化难题。该技术通过创新的"适配器融合"方式替代易泄露的密码验证,实现100%有效拒绝未授权功能,同时保持已授权功能性能损失不超过7%。面对恶意攻击的成功率控制在5%以下,为AI服务提供商提供了可行的精细化定价解决方案。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
KAIST研究团队开发出Diffusion-Link技术,通过扩散模型解决AI系统中音频与文字信息的"沟通障碍"。该技术采用轻量级设计,无需外部知识即可将音频特征转换为文字特征,在音频字幕生成任务上取得突破性成果,零样本性能提升52.5%,为多模态AI系统发展开辟新路径。