论文查个重就叫苦连天? Meta已用AI审查维基百科的引文了！

Meta此次发布的AI系统旨在通过对一部分论文引文审查工作实施自动化，来简化维基百科编辑们的工作。该系统可以扫描一篇文章并识别文章中是否存在有可疑引文的信息片段，此外还能够推荐相关性更高的来源，用这些来源替换有问题的引用。

Meta Platforms开发了一种人工智能（AI）系统，可以扫描维基百科的文章，分析文章引用来源，确定其中一些是否需要更改。

Meta今天详细介绍了这个AI系统，此外还根据开源许可发布了该系统的代码。

维基百科的编辑们通过检查检索信息的来源，来确保维基百科文章中某些信息是否准确，而检查文章所有引用来源是一个非常耗时的过程。维基百科有数百万页，其中一些页面包含多达数百条引文。

例如，一篇关于某款Apple产品的维基百科文章，可能会意外引用Apple网站上讨论另外一个产品的页面，而Meta的这个新IA系统可以发现该引用是错误的，还可以推荐文章应该引用Apple网站上的准确页面。

Meta利用来自维基百科的400万条信息文本片段对该系统进行训练，使其可以检测出错误的引用。此外，Meta还创建了一个名为Sphere的数据集，其中包含来自开放网络的1.34亿个文档。当系统在维基百科文章中发现引用有问题的时候，系统就会搜索Sphere数据集中的文档，找到相关性更高的来源。

该系统找到可替换有问题的引用的新来源，这个过程涉及到多个步骤。

由于Sphere数据集包含1.34亿份文档，因此搜索相关引用可能需要大量时间。Meta研究人员开发了一系列专业指数加快了这个过程。在数据管理过程中，索引是快捷方式的集合，可以更快速地找到特定信息。

Meta的AI系统使用Meta开发的索引加快搜索Sphere数据集以查找引用，这比其他方法速度更快。当系统找到可能被引用为来源的文档时，就会从文档中提取出相关性最高的段落，还能够确定是否有多个文档可能被作为引用来源。

据Meta称，该系统可创建两个文本片段的数学表示，来确定来自Sphere的文档是否能够支持维基百科文章中的某个信息片段，然后对比这些数据表示以确定是否相关性最高。

“我们设计了一系列工具来对比这些数学表示，以确定一段陈述是支持还是反驳另一段陈述，”Meta研究人员在今天发表的一篇博客文章中详细说明称。如果该系统找到了多个可以作为来源引用的文档，就会根据相关可能性对这些文档进行排名。

研究人员详细介绍说：“该模型使用细粒度的语言理解，根据相关可能性对这些引用来源和检索到的替代方案进行排名。在现实部署环境中，该模型将提供相关性最高的链接作为预期引用来源，供编辑们进行审批。”

除了这个系统之外，Meta还开源了Sphere数据库，以及让该数据库更易于搜索的索引。此外，Meta还将公布一个名为distributed-faiss的内部工具代码，该工具可以跨多个服务器而不是在单个设备上运行索引，从而简化处理过程。

Meta相信这个AI系统、Sphere数据集等其他一系列Meta工程师开发的组件，未来可用于支持多个应用场景。Meta详细说明称：“未来可能还会推出一系列可以实时验证文档的编辑，而这次推出的模型将成为这些编辑器的首批组件。除了提出引文之外，该系统还可以根据网络上相关文件提供的信息，对自动完成文本提供建议，以及校对更正。”

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

论文查个重就叫苦连天? Meta已用AI审查维基百科的引文了！

来源：至顶网软件与服务频道

2022

07/12

13:29

分享

点赞

IT部门面临的十大挑战与应对策略

CIO放弃散弹枪式做法，采用更具战略性的AI试点

CISO如何成为3090亿美元AI基础设施支出的守门人

PNG图像标准第三版发布，新增EXIF支持

Threads推出独立隐藏词汇管理功能并支持时限设置

论文有多水？这个AI系统一眼识破：KnoVo自动评估学术论文创新值

企业智能体扩展面临的隐形挑战与解决方案

Salesforce首席执行官：AI已承担公司近半数工作

谷歌推出AI虚拟试衣应用Doppl，让你可视化穿搭效果

超大规模运营商将在2030年前占据全球数据中心容量60%

AI初创工作室计划每年推出十万家公司

OpenDylan 2025.1版本发布：抛弃括号的Lisp语言获得重要更新

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: