Meta Platforms开发了一种人工智能(AI)系统,可以扫描维基百科的文章,分析文章引用来源,确定其中一些是否需要更改。
Meta今天详细介绍了这个AI系统,此外还根据开源许可发布了该系统的代码。
维基百科的编辑们通过检查检索信息的来源,来确保维基百科文章中某些信息是否准确,而检查文章所有引用来源是一个非常耗时的过程。维基百科有数百万页,其中一些页面包含多达数百条引文。
Meta此次发布的AI系统旨在通过对一部分论文引文审查工作实施自动化,来简化维基百科编辑们的工作。该系统可以扫描一篇文章并识别文章中是否存在有可疑引文的信息片段,此外还能够推荐相关性更高的来源,用这些来源替换有问题的引用。
例如,一篇关于某款Apple产品的维基百科文章,可能会意外引用Apple网站上讨论另外一个产品的页面,而Meta的这个新IA系统可以发现该引用是错误的,还可以推荐文章应该引用Apple网站上的准确页面。
Meta利用来自维基百科的400万条信息文本片段对该系统进行训练,使其可以检测出错误的引用。此外,Meta还创建了一个名为Sphere的数据集,其中包含来自开放网络的1.34亿个文档。当系统在维基百科文章中发现引用有问题的时候,系统就会搜索Sphere数据集中的文档,找到相关性更高的来源。
该系统找到可替换有问题的引用的新来源,这个过程涉及到多个步骤。
由于Sphere数据集包含1.34亿份文档,因此搜索相关引用可能需要大量时间。Meta研究人员开发了一系列专业指数加快了这个过程。在数据管理过程中,索引是快捷方式的集合,可以更快速地找到特定信息。
Meta的AI系统使用Meta开发的索引加快搜索Sphere数据集以查找引用,这比其他方法速度更快。当系统找到可能被引用为来源的文档时,就会从文档中提取出相关性最高的段落,还能够确定是否有多个文档可能被作为引用来源。
据Meta称,该系统可创建两个文本片段的数学表示,来确定来自Sphere的文档是否能够支持维基百科文章中的某个信息片段,然后对比这些数据表示以确定是否相关性最高。
“我们设计了一系列工具来对比这些数学表示,以确定一段陈述是支持还是反驳另一段陈述,”Meta研究人员在今天发表的一篇博客文章中详细说明称。如果该系统找到了多个可以作为来源引用的文档,就会根据相关可能性对这些文档进行排名。
研究人员详细介绍说:“该模型使用细粒度的语言理解,根据相关可能性对这些引用来源和检索到的替代方案进行排名。在现实部署环境中,该模型将提供相关性最高的链接作为预期引用来源,供编辑们进行审批。”
除了这个系统之外,Meta还开源了Sphere数据库,以及让该数据库更易于搜索的索引。此外,Meta还将公布一个名为distributed-faiss的内部工具代码,该工具可以跨多个服务器而不是在单个设备上运行索引,从而简化处理过程。
Meta相信这个AI系统、Sphere数据集等其他一系列Meta工程师开发的组件,未来可用于支持多个应用场景。Meta详细说明称:“未来可能还会推出一系列可以实时验证文档的编辑,而这次推出的模型将成为这些编辑器的首批组件。除了提出引文之外,该系统还可以根据网络上相关文件提供的信息,对自动完成文本提供建议,以及校对更正。”
好文章,需要你的鼓励
根据全球移动通信协会5G Americas的最新研究,5G网络在商用五年后达到了历史性里程碑。到2024年底,全球5G连接数将达22.5亿,增速是4G的四倍。预计到2029年,5G连接将增至83亿,占全球无线技术的59%。北美率先实现5G和4G LTE商用网络数量持平,5G覆盖率达77%。拉丁美洲5G连接数一年内翻倍至7600万。这些数据凸显了5G技术的快速普及,远超前几代无线技术。
在 AI 热潮下,许多 CEO 急于部署 AI 技术以提高效率和创新。然而,如果没有首先调整组织文化、人员和战略目标,仓促应用 AI 可能会加剧混乱。本文探讨了 CEO 在采用 AI 前需要考虑的关键问题,强调了理解组织需求、建立包容性文化以及负责任地使用 AI 的重要性。
前 Snap 高管 Alex Mashrabov 推出了新的生成式视频平台 Higgsfield AI,专注于 AI 视频中的电影级摄像机运动。该平台通过创新的控制引擎,让用户能够指导复杂的摄像机动作,如推镜头、快速变焦等。Higgsfield 不仅解决了视频风格问题,还着重解决了结构性挑战,如长序列中的角色和场景一致性。该平台已吸引了业内知名人士的关注,有望为创作者带来全新的视觉叙事方式。
Pure Storage 推出新型存储平台 FlashBlade//EXA,旨在解决 AI 工作负载中的元数据挑战。该平台基于 FlashBlade 基础架构,通过独立扩展数据和元数据来提高并发性能。它支持多模态 AI 模型,初始读取性能可达 10TB/秒。该平台兼容其他厂商的数据节点,同时利用 Pure Storage 自身技术,为企业级 AI 应用提供灵活、高性能的存储解决方案。