至顶网软件频道消息:Facebook使用Instagram上数十亿公开的照片来训练人工智能(AI)对图像自行分类的算法,这些照片包含Instagram用户提供的17000个井号标签。
训练计算机做人们通常做的事情——例如识别照片中的内容——通常需要为其提供大量数据。但这些数据必须由人类进行标记,而这是需要花费时间和成本的。Facebook开发了一种新技术,让员工不必坐下来对每张图片进行分类。
本周在美国加州圣何塞举行的Facebook F8大会上,Facebook首席技术官Mike Schroepfer表示:“在计算机视觉领域取得进步的最大限制因素——就和很多人工智能领域一样——就是我们几乎完全依赖于手动标记的、人为组织的数据集。这意味着,如果一个人没有花时间对图像中特定的事物做标记,即使是最先进的计算机视觉系统,也无法在运行时检测到该事物,因为系统在训练集中并没有看到这个事物。”
Schroepfer补充道:“我们已经开发了一些具有突破性的技术,可以以前所未有的规模对公开标签图像进行处理。我们已经使用一套公开的35亿张图像进行训练。”
根据Wired的说法,Instagram数据集比Google用来训练图像算法的巨大缓存还要大10倍。
Facebook应用机器学习部门工程总监Srinivas Narayanan补充说:“我们现在打造了世界上最好的计算机视觉系统,它在ImageNet上获得了84.5%的最高分数。ImageNet是一个广泛用于基准测试的数据集。”
Schroepfer说,Facebook已经在其平台上使用计算机视觉系统来发现需要删除的“坏内容”——可能包括裸体和与恐怖主义有关的内容。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。