AI的语言理解能力又进一步了!7月30日,在全球线上举行的人工智能顶会SIGIR 2020上,阿里巴巴研究团队表现突出,共有29项研究成果入选,是全球论文数量最多的科技公司。据悉,阿里在多个成果中展现了AI在理解文本信息任务上的突破。
SIGIR是信息检索研究领域最权威的学术会议,其覆盖了文本分析、计算、机器学习和推荐系统等领域,微软、谷歌、Facebook等顶级科技公司都曾在该会议上集中发布研究成果。据悉,SIGIR 2020共收到 1180 篇论文,但最终仅有340篇入选。
相比大家熟知的语音识别、图像识别,理解复杂的文本信息是更难的人工智能任务。此次,阿里巴巴研究团队在SIGIR 2020上率先提出多种创新思路,可大幅提升机器理解文本信息的效率。
阿里研究成果在SIGIR 2020上展示
在其中一篇论文中,阿里提出了一种能够理解文本言外之意的方法,通过推敲给定隐晦文本的全局语义、局部语义,以及可能存在的噪音,有效提高了模型识别隐晦文本是否包含色情、暴力等内容的精确率。
达摩院机器智能实验室主任金榕表示,“信息检索和自然语言处理技术是人工智能的基础技术,实现突破不仅需要全新的模型,还需要结合实际应用提出更创新的训练和推理方法,阿里巴巴经济体丰富的场景为自然语言处理等技术的研究提供了绝佳条件。
过去两年,阿里在信息检索CIKM Cup、机器翻译WMT、阅读理解MS MARCO等自然语言处理领域顶级赛事获得了多项世界冠军;不仅如此,阿里还率先在情绪识别等前沿领域布局,可以让机器读懂人类情绪。目前,阿里自然语言技术已在金融、新零售、通讯、互联网、医疗、电力等领域服务超十亿用户。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。