AI的语言理解能力又进一步了!7月30日,在全球线上举行的人工智能顶会SIGIR 2020上,阿里巴巴研究团队表现突出,共有29项研究成果入选,是全球论文数量最多的科技公司。据悉,阿里在多个成果中展现了AI在理解文本信息任务上的突破。
SIGIR是信息检索研究领域最权威的学术会议,其覆盖了文本分析、计算、机器学习和推荐系统等领域,微软、谷歌、Facebook等顶级科技公司都曾在该会议上集中发布研究成果。据悉,SIGIR 2020共收到 1180 篇论文,但最终仅有340篇入选。
相比大家熟知的语音识别、图像识别,理解复杂的文本信息是更难的人工智能任务。此次,阿里巴巴研究团队在SIGIR 2020上率先提出多种创新思路,可大幅提升机器理解文本信息的效率。
阿里研究成果在SIGIR 2020上展示
在其中一篇论文中,阿里提出了一种能够理解文本言外之意的方法,通过推敲给定隐晦文本的全局语义、局部语义,以及可能存在的噪音,有效提高了模型识别隐晦文本是否包含色情、暴力等内容的精确率。
达摩院机器智能实验室主任金榕表示,“信息检索和自然语言处理技术是人工智能的基础技术,实现突破不仅需要全新的模型,还需要结合实际应用提出更创新的训练和推理方法,阿里巴巴经济体丰富的场景为自然语言处理等技术的研究提供了绝佳条件。
过去两年,阿里在信息检索CIKM Cup、机器翻译WMT、阅读理解MS MARCO等自然语言处理领域顶级赛事获得了多项世界冠军;不仅如此,阿里还率先在情绪识别等前沿领域布局,可以让机器读懂人类情绪。目前,阿里自然语言技术已在金融、新零售、通讯、互联网、医疗、电力等领域服务超十亿用户。
好文章,需要你的鼓励
OpenAI发布ChatGPT Atlas AI浏览器,支持网页问答、历史查询和邮件改写等功能。同时曝光秘密项目Mercury,雇佣约100名前投行精英以每小时150美元训练AI金融模型。公司还因用户滥用Sora生成马丁·路德·金视频而暂停相关功能。此外,医疗AI搜索引擎OpenEvidence获2亿美元融资,估值60亿美元。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
随着Chrome和Safari主导浏览器市场,众多替代浏览器正在挑战这些行业巨头。本文梳理了当前顶级替代浏览器,包括AI驱动的浏览器如Perplexity的Comet、Arc公司的Dia、Opera的Neon和OpenAI的Atlas;注重隐私的浏览器如Brave、DuckDuckGo、Ladybird和Vivaldi;以及专注特定领域的浏览器如Opera Air和SigmaOS。这些浏览器通过AI集成、隐私保护、定制化和专注用户福祉等特色功能,为用户提供了多样化的浏览体验选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。