AI的语言理解能力又进一步了!7月30日,在全球线上举行的人工智能顶会SIGIR 2020上,阿里巴巴研究团队表现突出,共有29项研究成果入选,是全球论文数量最多的科技公司。据悉,阿里在多个成果中展现了AI在理解文本信息任务上的突破。
SIGIR是信息检索研究领域最权威的学术会议,其覆盖了文本分析、计算、机器学习和推荐系统等领域,微软、谷歌、Facebook等顶级科技公司都曾在该会议上集中发布研究成果。据悉,SIGIR 2020共收到 1180 篇论文,但最终仅有340篇入选。
相比大家熟知的语音识别、图像识别,理解复杂的文本信息是更难的人工智能任务。此次,阿里巴巴研究团队在SIGIR 2020上率先提出多种创新思路,可大幅提升机器理解文本信息的效率。
阿里研究成果在SIGIR 2020上展示
在其中一篇论文中,阿里提出了一种能够理解文本言外之意的方法,通过推敲给定隐晦文本的全局语义、局部语义,以及可能存在的噪音,有效提高了模型识别隐晦文本是否包含色情、暴力等内容的精确率。
达摩院机器智能实验室主任金榕表示,“信息检索和自然语言处理技术是人工智能的基础技术,实现突破不仅需要全新的模型,还需要结合实际应用提出更创新的训练和推理方法,阿里巴巴经济体丰富的场景为自然语言处理等技术的研究提供了绝佳条件。
过去两年,阿里在信息检索CIKM Cup、机器翻译WMT、阅读理解MS MARCO等自然语言处理领域顶级赛事获得了多项世界冠军;不仅如此,阿里还率先在情绪识别等前沿领域布局,可以让机器读懂人类情绪。目前,阿里自然语言技术已在金融、新零售、通讯、互联网、医疗、电力等领域服务超十亿用户。
好文章,需要你的鼓励
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。
作者对Chrome、Edge和Firefox三款主流浏览器的内置AI功能进行了实测对比。Chrome依托Gemini提供搜索摘要与提示词保存功能;Edge集成Copilot,可针对网页、PDF及多标签页进行问答;Firefox则支持多款AI聊天机器人,并提供更强的隐私保护。综合体验后,作者最终选择Edge作为AI辅助浏览的首选,但仍以Firefox作为默认浏览器。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。