论文查个重就叫苦连天? Meta已用AI审查维基百科的引文了！

Meta此次发布的AI系统旨在通过对一部分论文引文审查工作实施自动化，来简化维基百科编辑们的工作。该系统可以扫描一篇文章并识别文章中是否存在有可疑引文的信息片段，此外还能够推荐相关性更高的来源，用这些来源替换有问题的引用。

Meta Platforms开发了一种人工智能（AI）系统，可以扫描维基百科的文章，分析文章引用来源，确定其中一些是否需要更改。

Meta今天详细介绍了这个AI系统，此外还根据开源许可发布了该系统的代码。

维基百科的编辑们通过检查检索信息的来源，来确保维基百科文章中某些信息是否准确，而检查文章所有引用来源是一个非常耗时的过程。维基百科有数百万页，其中一些页面包含多达数百条引文。

例如，一篇关于某款Apple产品的维基百科文章，可能会意外引用Apple网站上讨论另外一个产品的页面，而Meta的这个新IA系统可以发现该引用是错误的，还可以推荐文章应该引用Apple网站上的准确页面。

Meta利用来自维基百科的400万条信息文本片段对该系统进行训练，使其可以检测出错误的引用。此外，Meta还创建了一个名为Sphere的数据集，其中包含来自开放网络的1.34亿个文档。当系统在维基百科文章中发现引用有问题的时候，系统就会搜索Sphere数据集中的文档，找到相关性更高的来源。

该系统找到可替换有问题的引用的新来源，这个过程涉及到多个步骤。

由于Sphere数据集包含1.34亿份文档，因此搜索相关引用可能需要大量时间。Meta研究人员开发了一系列专业指数加快了这个过程。在数据管理过程中，索引是快捷方式的集合，可以更快速地找到特定信息。

Meta的AI系统使用Meta开发的索引加快搜索Sphere数据集以查找引用，这比其他方法速度更快。当系统找到可能被引用为来源的文档时，就会从文档中提取出相关性最高的段落，还能够确定是否有多个文档可能被作为引用来源。

据Meta称，该系统可创建两个文本片段的数学表示，来确定来自Sphere的文档是否能够支持维基百科文章中的某个信息片段，然后对比这些数据表示以确定是否相关性最高。

“我们设计了一系列工具来对比这些数学表示，以确定一段陈述是支持还是反驳另一段陈述，”Meta研究人员在今天发表的一篇博客文章中详细说明称。如果该系统找到了多个可以作为来源引用的文档，就会根据相关可能性对这些文档进行排名。

研究人员详细介绍说：“该模型使用细粒度的语言理解，根据相关可能性对这些引用来源和检索到的替代方案进行排名。在现实部署环境中，该模型将提供相关性最高的链接作为预期引用来源，供编辑们进行审批。”

除了这个系统之外，Meta还开源了Sphere数据库，以及让该数据库更易于搜索的索引。此外，Meta还将公布一个名为distributed-faiss的内部工具代码，该工具可以跨多个服务器而不是在单个设备上运行索引，从而简化处理过程。

Meta相信这个AI系统、Sphere数据集等其他一系列Meta工程师开发的组件，未来可用于支持多个应用场景。Meta详细说明称：“未来可能还会推出一系列可以实时验证文档的编辑，而这次推出的模型将成为这些编辑器的首批组件。除了提出引文之外，该系统还可以根据网络上相关文件提供的信息，对自动完成文本提供建议，以及校对更正。”

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

论文查个重就叫苦连天? Meta已用AI审查维基百科的引文了！

来源：至顶网软件与服务频道

2022

07/12

13:29

分享

点赞

稚晖君发布全球最小全身力控人形机器人，上纬启元开启个人机器人时代

2026年软件定价大洗牌：IT领导者必须知道的关键变化

Linux 在 2026 年将势不可挡，但一个开源传奇可能难以为继

CES 2026趋势展望：全球最大科技展五大热门话题预测

人工智能时代为何编程技能比以往更重要

AI颠覆云优先战略：混合计算成为唯一出路

谷歌发布JAX-Privacy 1.0：大规模差分隐私机器学习工具库

谷歌量子AI发布新型优化算法DQI：量子计算优化领域的重大突破

缓解电动汽车里程焦虑：简单AI模型如何预测充电桩可用性

Titans + MIRAS：让AI拥有长期记忆能力

Gemini为STOC 2026大会理论计算机科学家提供自动化反馈

夸克AI眼镜持续升级：首次OTA，支持89种语言翻译

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: