美国当地时间3月14日,微软公司的研究人员透露,他们已经开发出了能够一种能够翻译文本的人工智能,它翻译的准确性可以与人类相媲美。
该系统由三个独立的团队构建,旨在将中文新闻文章的句子翻译成英文。它结合了几种新兴的神经网络方法以达到人类的准确性,其中包括微软专门为该项目开发的一些方法。
黄学东(音译:Xuedong Huang)(如图)是负责微软语音、自然语言和机器翻译工作的技术专家,他表示该系统是这个最具挑战的自然语言处理任务中的一个“重要里程碑”。他表示:“让机器翻译能够达到人类的水平是我们所有人的梦想。”他说:“只是我们没有意识到我们能够这么快就实现这一点。”
这个系统在将英文文本翻译成中文的时候,用到了一种被称为双重学习的方法。这种方法提供了一种参考,让人工智能可以检查自己的准确性并从错误中学习。同样是微软发明的另一项技术让这个系统能够通过重复来优化翻译的内容,这种方法类似于人类修改自己写作内容的方式。
该公司已经证明,这个系统可以通过翻译来自被称为newstest2017的研究数据集中的文本达到人类的翻译准确度。测试包含了多轮评估,每一轮评估都会查看人工智能翻译的几百个句子。根据微软的说法,一个由外部语言学家组成的团队将人工智能翻译的结果和人类的翻译结果进行比对,以此进行验证。
让说英语的人能够看懂用中文写就的新闻文章还只是冰山一角。微软计划利用这项创新技术,让这个系统能够在其他语言的翻译上也达到人类的准确度,并将其纳入到该公司的产品之中。
该公司提供了类似于谷歌翻译的免费翻译服务,还有面向企业的商业版本。而且,微软在星期一还透露了计划推出为其团队聊天服务推出内联翻译功能,这样一来,使用不同语言的专业人员就可以更轻松地进行沟通了。
这个新的人工智能系统的技术理论上说也可以应用于语音,但是微软的研究人员周明(音译:Ming Zhou)表示,实时翻译仍然是一个挑战,这个问题还有待解决。无论如何,该公司已经表明人工智能能够媲美人类准确度的这一事实代表了这个研究方向上的一个重大里程碑。
这一事实也标志着微软最近在深度学习领域获得的一系列突破性的成果。此前,该公司开发的人工智能在一项斯坦福大学的阅读测试中达到了人类参与者的平均水平,此项测试被用于评估神经网络的基准。这一成就比来自中国的网络巨头阿里巴巴集团控股有限公司的团队晚了一天,那个团队是首个在该测试中达到这个里程碑的团队。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。