美国当地时间3月14日,微软公司的研究人员透露,他们已经开发出了能够一种能够翻译文本的人工智能,它翻译的准确性可以与人类相媲美。
该系统由三个独立的团队构建,旨在将中文新闻文章的句子翻译成英文。它结合了几种新兴的神经网络方法以达到人类的准确性,其中包括微软专门为该项目开发的一些方法。
黄学东(音译:Xuedong Huang)(如图)是负责微软语音、自然语言和机器翻译工作的技术专家,他表示该系统是这个最具挑战的自然语言处理任务中的一个“重要里程碑”。他表示:“让机器翻译能够达到人类的水平是我们所有人的梦想。”他说:“只是我们没有意识到我们能够这么快就实现这一点。”
这个系统在将英文文本翻译成中文的时候,用到了一种被称为双重学习的方法。这种方法提供了一种参考,让人工智能可以检查自己的准确性并从错误中学习。同样是微软发明的另一项技术让这个系统能够通过重复来优化翻译的内容,这种方法类似于人类修改自己写作内容的方式。
该公司已经证明,这个系统可以通过翻译来自被称为newstest2017的研究数据集中的文本达到人类的翻译准确度。测试包含了多轮评估,每一轮评估都会查看人工智能翻译的几百个句子。根据微软的说法,一个由外部语言学家组成的团队将人工智能翻译的结果和人类的翻译结果进行比对,以此进行验证。
让说英语的人能够看懂用中文写就的新闻文章还只是冰山一角。微软计划利用这项创新技术,让这个系统能够在其他语言的翻译上也达到人类的准确度,并将其纳入到该公司的产品之中。
该公司提供了类似于谷歌翻译的免费翻译服务,还有面向企业的商业版本。而且,微软在星期一还透露了计划推出为其团队聊天服务推出内联翻译功能,这样一来,使用不同语言的专业人员就可以更轻松地进行沟通了。
这个新的人工智能系统的技术理论上说也可以应用于语音,但是微软的研究人员周明(音译:Ming Zhou)表示,实时翻译仍然是一个挑战,这个问题还有待解决。无论如何,该公司已经表明人工智能能够媲美人类准确度的这一事实代表了这个研究方向上的一个重大里程碑。
这一事实也标志着微软最近在深度学习领域获得的一系列突破性的成果。此前,该公司开发的人工智能在一项斯坦福大学的阅读测试中达到了人类参与者的平均水平,此项测试被用于评估神经网络的基准。这一成就比来自中国的网络巨头阿里巴巴集团控股有限公司的团队晚了一天,那个团队是首个在该测试中达到这个里程碑的团队。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。