成立两年后,达摩院今日对外公布了研究成果及进展。
截至2019年9月,达摩院在国际顶级学术会议上累计发表近450多篇论文,在自然语言处理、智能语音、视觉计算等领域算法夺得40多项世界第一,已成为阿里聚集科技人才和基础技术研发的“技术基石”。
在过去两年里,达摩院建立了遍布全球的研发网络,在中国、东南亚、欧洲、中东、北美、以色列等地均设立了研发中心,并与全球150多所知名高校的100多个科研团队开展科研项目合作。
2年前,阿里巴巴宣布成立达摩院,马云要求达摩院“活得要比阿里巴巴长”、“服务全世界至少20亿人口”、“必须面向未来、用科技解决未来的问题”,不少世界级科学家纷纷加入达摩院,潜心扎根基础科学研究。
目前达摩院内“高手如林”,拥有10多位IEEE FELLOW、30多位知名高校教授、超过一半的科学家拥有名校博士学历。
2018年9月,达摩院首次对外公布了其组织架构,设立机器智能、数据计算、机器人、金融科技和X等研究实验室,即“4+X”研究架构。达摩院同时为各大实验室配备了产品和工程团队,更好帮助科学家把猜想变成现实。
这些实验室在国际顶级技术赛事上获得了40余项世界第一,同时成功将研究成果落地各行各业:
达摩院语音实验室自研的语音识别算法(DFSMN)在世界最大的免费语音识别数据库LibriSpeech上获得第一,阿里语音助手被《麻省理工科技评论》选为2018十大科技进展;
达摩院语言技术实验室接连在国际顶级大赛WMT 获5项第一,已实现了48个语言翻译方向,支持俄、西、法、阿、土,泰、印尼、越南等多种语言翻译。其中,电商覆盖了语向,超越了谷歌和亚马逊;
达摩院视觉实验室在在WebVision竞赛中获得冠军,可以识别超过100万种物理实体;在城市大脑方向,达摩院实现了城市数字化描述,支持走失老人的快速找回、交通流优化、消防应急等等多种服务支持。在中国人口总量排名前20的城市里,一半以上都部署了达摩院的城市大脑服务。
达摩院区块链实验室已申请专利500余项,连续三年蝉联全球区块链企业专利申请数量排行榜第一,让奶粉、红酒、大米、化妆品等数亿商品有了自己的身份证;
达摩院自动驾驶实验室推出了业界首个实现车路协同的自动驾驶方案,在多个半封闭园区实现了L4级别自动驾驶物流车日常化运营……
在攀登世界科技高峰上,达摩院也交出了出色的答卷。达摩院成功孵化出了平头哥半导体公司,已经推出3款面向公开市场的芯片类产品,包括最强RISC-V芯片处理器玄铁910,芯片设计平台无剑平台以及最强AI推理芯片含光800,全面推动芯片算力进入普惠时代。
在量子计算领域,达摩院量子实验室于 2018 年率先研制出当前世界最强的量子电路模拟器——“太章”,美国《连线》杂志称这一发现有望打破谷歌的提出“量子霸权”。
作为一家面向未来的研究,达摩院同时还致力于推动整个社会加强对于基础科学研究发展的关注,先后举办了全球数学竞赛和青橙奖,为青年一代科学家提供开放的数据资源和应用场景等全方位支持。
好文章,需要你的鼓励
许多CIO在实施AI战略时因良好初衷反而导致失败。专家指出,仅为AI而做AI会浪费资金且无实际成果,应先评估业务价值。CIO常见错误包括:让风险规避型利益相关者施加过度限制、仅依赖现成AI工具而不深度整合、在人员和流程问题未解决时强推技术转型。成功的关键是确保AI解决方案真正节省时间并带来业务价值,需要有权威的负责人推动决策,同时不惧怕小规模试错,快速迭代改进。
谷歌研究院开发出一种革命性的人工智能技术,通过学习人类眼动轨迹来提升视觉问答能力。该技术像训练侦探一样教会AI关注图像中的关键区域,准确率提升3-10%。研究发表于CVPR 2024,在教育、医疗、无人驾驶等领域具有广阔应用前景,为AI向人类智慧靠近开辟了新路径。
Kahoot是一个基于游戏的学习平台,涵盖科学、历史、地理、英语和数学等领域。该平台于2023年推出AI功能,AI生成器可从主题、文档、网站或视频链接即时创建互动学习体验,帮助教师减少备课时间,让学习更具吸引力和个性化。平台支持50种语言,拥有120亿用户,还提供翻译工具和AI驱动的学习推荐功能。
英国卡迪夫大学研究团队通过脑电图技术发现,当人们体验虚假听觉(即"听到"实际不存在的语音)时,大脑的神经活动模式与听到真实声音时几乎相同。研究揭示了大脑会根据语言经验和上下文自动"填补"缺失的语音片段,这一发现对理解听觉障碍、改进助听设备以及开发更智能的语音识别系统具有重要意义。