谷歌在11月宣布,它将使用一种被称为神经机器翻译的人工智能技术完全改变谷歌翻译理解语言的方式,此举的最终目标是创建一个通用语言翻译器。
今天,公司在另外三种语言——印地语,俄语和越南语——上使用了该系统,此举使其更接近该公司的愿景。
即使对于计算机来说,翻译语言也很难。谷歌翻译一直是一项令人印象深刻的技术,但它的翻译很少能够像自然的说话者那么流利,特别是对于更大的文本块来说更是如此。谷歌表示神经机器翻译正在改变这种局面,不仅让谷歌翻译能够更好地理解语言,还能够创建更自然的翻译。
谷歌翻译以前采用了基于短语的机器翻译方式,这种方式会把句子分解成短语,并单独翻译每个部分。虽然每个部分本身的翻译可能是准确的,但当它们被重新组合成一整个句子,就并不是总能够按照适当的方式表达意思了。对于以这种语言为母语的人来说,短语和句子的结构听起来会有点奇怪,即使他们能够大概理解句子的意思。
谷歌翻译(Google Translate)的产品主管Barak Turovsky解释说:“神经翻译比我们之前的技术好多了,因为我们一次性翻译整个句子,而不是句子的一部分。” Barak Turovsky 表示,“这使得翻译通常更准确,更接近人们说语言的方式。”
神经机器翻译试图采用和人类更类似的方式去理解句子,通过消化上下文的线索能够更好地掌握整个句子的意思。谷歌在其研究博客上指出,他们对于从中文到英文的翻译进行了测试,对于相同的文字,神经翻译的错误比基于短语的翻译的错误减少了55%到85%。谷歌承认神经翻译“依然可能会犯下人类翻译永远不会犯的重大错误”,但是该公司将这种方法称为机器翻译发展的一个“重要里程碑”。
Turovsky表示,谷歌将在未来几周内在另外几种语言上推出其改进后的人工智能翻译,而且谷歌希望最终将其推广到谷歌翻译支持的所有103种语言上。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。