AI的语言理解能力又进一步了!7月30日,在全球线上举行的人工智能顶会SIGIR 2020上,阿里巴巴研究团队表现突出,共有29项研究成果入选,是全球论文数量最多的科技公司。据悉,阿里在多个成果中展现了AI在理解文本信息任务上的突破。
SIGIR是信息检索研究领域最权威的学术会议,其覆盖了文本分析、计算、机器学习和推荐系统等领域,微软、谷歌、Facebook等顶级科技公司都曾在该会议上集中发布研究成果。据悉,SIGIR 2020共收到 1180 篇论文,但最终仅有340篇入选。
相比大家熟知的语音识别、图像识别,理解复杂的文本信息是更难的人工智能任务。此次,阿里巴巴研究团队在SIGIR 2020上率先提出多种创新思路,可大幅提升机器理解文本信息的效率。
阿里研究成果在SIGIR 2020上展示
在其中一篇论文中,阿里提出了一种能够理解文本言外之意的方法,通过推敲给定隐晦文本的全局语义、局部语义,以及可能存在的噪音,有效提高了模型识别隐晦文本是否包含色情、暴力等内容的精确率。
达摩院机器智能实验室主任金榕表示,“信息检索和自然语言处理技术是人工智能的基础技术,实现突破不仅需要全新的模型,还需要结合实际应用提出更创新的训练和推理方法,阿里巴巴经济体丰富的场景为自然语言处理等技术的研究提供了绝佳条件。
过去两年,阿里在信息检索CIKM Cup、机器翻译WMT、阅读理解MS MARCO等自然语言处理领域顶级赛事获得了多项世界冠军;不仅如此,阿里还率先在情绪识别等前沿领域布局,可以让机器读懂人类情绪。目前,阿里自然语言技术已在金融、新零售、通讯、互联网、医疗、电力等领域服务超十亿用户。
好文章,需要你的鼓励
机器人AI软件开发商FieldAI宣布通过两轮融资筹集4.05亿美元,其中3.15亿美元由贝索斯探险基金、Prysm和淡马锡领投。该公司开发的软件平台可让机器人在建筑工地等复杂环境中导航,采用专有的场域基础模型技术。该软件无需地图、GPS或预定义路径即可运行,支持人形机器人、自动驾驶车辆等多种系统。目前已在数百个工业环境中部署,估值达20亿美元。
谷歌DeepMind开发的GenCast AI系统在天气预报领域实现重大突破,在97.2%的测试指标上超越传统数值预报系统。该系统基于扩散模型和四十年历史数据训练,能在8分钟内完成全球七天天气预报,比传统方法快数十倍。GenCast采用概率性预报方法,为决策者提供多种天气情景,在极端天气预测方面表现尤为出色,为农业、能源、交通等领域带来广阔应用前景。
Epic公司CEO朱迪·福克纳宣布推出"医疗智能"概念,在其电子病历系统中开发智能AI代理。该系统基于超过3亿患者记录的Cosmos数据集,包含四个核心AI代理:患者导航员Emmie、临床医生助手ART、诊疗决策支持Cosmos AI和管理优化器Penny。这些代理能够提供预测性健康监测、简化临床试验匹配、优化医疗流程。Epic与微软深度合作,利用Azure AI确保系统规模化和可靠性,旨在构建统一的智能医疗生态系统。
北京大学团队推出TransMLA技术,可将现有GQA架构语言模型直接转换为高效MLA架构,无需重新训练。该技术通过RoRoPE、FreqFold和BKV三项创新实现了最高10.6倍的推理速度提升,在93%内存压缩下仅需60亿词元微调即可恢复性能,为AI模型优化提供了经济实用的解决方案。