AI的语言理解能力又进一步了!7月30日,在全球线上举行的人工智能顶会SIGIR 2020上,阿里巴巴研究团队表现突出,共有29项研究成果入选,是全球论文数量最多的科技公司。据悉,阿里在多个成果中展现了AI在理解文本信息任务上的突破。
SIGIR是信息检索研究领域最权威的学术会议,其覆盖了文本分析、计算、机器学习和推荐系统等领域,微软、谷歌、Facebook等顶级科技公司都曾在该会议上集中发布研究成果。据悉,SIGIR 2020共收到 1180 篇论文,但最终仅有340篇入选。
相比大家熟知的语音识别、图像识别,理解复杂的文本信息是更难的人工智能任务。此次,阿里巴巴研究团队在SIGIR 2020上率先提出多种创新思路,可大幅提升机器理解文本信息的效率。
阿里研究成果在SIGIR 2020上展示
在其中一篇论文中,阿里提出了一种能够理解文本言外之意的方法,通过推敲给定隐晦文本的全局语义、局部语义,以及可能存在的噪音,有效提高了模型识别隐晦文本是否包含色情、暴力等内容的精确率。
达摩院机器智能实验室主任金榕表示,“信息检索和自然语言处理技术是人工智能的基础技术,实现突破不仅需要全新的模型,还需要结合实际应用提出更创新的训练和推理方法,阿里巴巴经济体丰富的场景为自然语言处理等技术的研究提供了绝佳条件。
过去两年,阿里在信息检索CIKM Cup、机器翻译WMT、阅读理解MS MARCO等自然语言处理领域顶级赛事获得了多项世界冠军;不仅如此,阿里还率先在情绪识别等前沿领域布局,可以让机器读懂人类情绪。目前,阿里自然语言技术已在金融、新零售、通讯、互联网、医疗、电力等领域服务超十亿用户。
好文章,需要你的鼓励
科技领袖Pat Gelsinger加入Gloo创业公司,致力于为信仰社区开发价值导向的AI技术平台,探索科技如何成为促进社会正向发展的力量。
科技巨头和初创公司正在开发人形机器人,利用先进AI模型赋能机器人可以执行家务和物流工作,但仍面临诸多技术和信任挑战。
来自加州帕洛阿尔托的 AI 初创公司 Reve AI 正式发布了 Reve Image 1.0 文本生成图像模型。该模型在提示词遵循度、美学效果和文字渲染方面表现出色,目前可在 preview.reve.art 免费体验。作为该公司的首个产品,Reve Image 凭借其卓越的性能已跃居第三方基准测试榜首,超越了包括 Midjourney v6.1 和 Google Imagen 3 在内的多个竞品。
OpenAI 终于为其旗舰聊天机器人 ChatGPT 启用了 GPT-4o 的原生多模态图像生成功能。与传统的 DALL-E 3 相比,这项新功能作为同一模型的一部分,能够同时理解和生成文本、代码和图像,展现出更高质量的图像生成能力和更准确的文字渲染效果,已经获得用户的高度赞誉。