Facebook使用35亿张公共Instagram照片来训练AI

Facebook使用Instagram上数十亿公开的照片来训练人工智能（AI）对图像自行分类的算法，这些照片包含Instagram用户提供的17000个井号标签。

至顶网软件频道消息：Facebook使用Instagram上数十亿公开的照片来训练人工智能（AI）对图像自行分类的算法，这些照片包含Instagram用户提供的17000个井号标签。

训练计算机做人们通常做的事情——例如识别照片中的内容——通常需要为其提供大量数据。但这些数据必须由人类进行标记，而这是需要花费时间和成本的。Facebook开发了一种新技术，让员工不必坐下来对每张图片进行分类。

本周在美国加州圣何塞举行的Facebook F8大会上，Facebook首席技术官Mike Schroepfer表示：“在计算机视觉领域取得进步的最大限制因素——就和很多人工智能领域一样——就是我们几乎完全依赖于手动标记的、人为组织的数据集。这意味着，如果一个人没有花时间对图像中特定的事物做标记，即使是最先进的计算机视觉系统，也无法在运行时检测到该事物，因为系统在训练集中并没有看到这个事物。”

Schroepfer补充道：“我们已经开发了一些具有突破性的技术，可以以前所未有的规模对公开标签图像进行处理。我们已经使用一套公开的35亿张图像进行训练。”

根据Wired的说法，Instagram数据集比Google用来训练图像算法的巨大缓存还要大10倍。

Facebook应用机器学习部门工程总监Srinivas Narayanan补充说：“我们现在打造了世界上最好的计算机视觉系统，它在ImageNet上获得了84.5％的最高分数。ImageNet是一个广泛用于基准测试的数据集。”

Schroepfer说，Facebook已经在其平台上使用计算机视觉系统来发现需要删除的“坏内容”——可能包括裸体和与恐怖主义有关的内容。

来源：Forbes

0赞

好文章，需要你的鼓励

Facebook使用35亿张公共Instagram照片来训练AI

来源：Forbes

2018

05/10

10:10

分享

点赞

Glean年收入突破3亿美元，削减AI成本成核心卖点

蓝色起源"新格伦"火箭在佛罗里达测试中发生爆炸

智能体AI正在重塑企业架构与Token经济学

堪培拉理工学院如何借助技术革新重塑课堂教学体验

Gemma 4携手Arm：优化端侧AI，加速移动应用体验

制药公司与初创企业如何携手推动AI落地

《星球大战》导演盛赞生成式AI：电影制作的革命性工具

Salesforce借助Informatica布局企业级无头数据管理架构

几乎所有M5 MacBook Air配置现在都降价近200美元

大模型评测风向变了，Testin云测如何构建企业级AI质量标尺？

因民事养老金管理失误，英国政府拒绝向Capita授予5.63亿英镑合同

YouTube提升AI生成视频标签的显示效果

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: