至顶网软件频道消息:Facebook使用Instagram上数十亿公开的照片来训练人工智能(AI)对图像自行分类的算法,这些照片包含Instagram用户提供的17000个井号标签。
训练计算机做人们通常做的事情——例如识别照片中的内容——通常需要为其提供大量数据。但这些数据必须由人类进行标记,而这是需要花费时间和成本的。Facebook开发了一种新技术,让员工不必坐下来对每张图片进行分类。
本周在美国加州圣何塞举行的Facebook F8大会上,Facebook首席技术官Mike Schroepfer表示:“在计算机视觉领域取得进步的最大限制因素——就和很多人工智能领域一样——就是我们几乎完全依赖于手动标记的、人为组织的数据集。这意味着,如果一个人没有花时间对图像中特定的事物做标记,即使是最先进的计算机视觉系统,也无法在运行时检测到该事物,因为系统在训练集中并没有看到这个事物。”
Schroepfer补充道:“我们已经开发了一些具有突破性的技术,可以以前所未有的规模对公开标签图像进行处理。我们已经使用一套公开的35亿张图像进行训练。”
根据Wired的说法,Instagram数据集比Google用来训练图像算法的巨大缓存还要大10倍。
Facebook应用机器学习部门工程总监Srinivas Narayanan补充说:“我们现在打造了世界上最好的计算机视觉系统,它在ImageNet上获得了84.5%的最高分数。ImageNet是一个广泛用于基准测试的数据集。”
Schroepfer说,Facebook已经在其平台上使用计算机视觉系统来发现需要删除的“坏内容”——可能包括裸体和与恐怖主义有关的内容。
好文章,需要你的鼓励
全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek
阿里巴巴团队推出DeepPHY,这是首个专门评估AI视觉语言模型物理推理能力的综合平台。通过六个不同难度的物理环境测试,研究发现即使最先进的AI模型在物理推理任务中表现也远低于人类,成功率普遍不足30%。更关键的是,AI模型虽能准确描述物理现象,却无法将描述性知识转化为有效控制行为,暴露了当前AI技术在动态物理环境中的根本缺陷。
GitHub CEO声称AI将承担所有编程工作,但现实中AI编程工具实际上降低了程序员的生产效率。回顾编程语言发展史,从Grace Hopper的高级语言到Java等技术,每次重大突破都曾因资源限制和固有思维遭到质疑,但最终都证明了抽象化的价值。当前AI编程工具面临命名误导、过度炒作和资源限制三重困扰,但随着技术进步,AI将有助于消除思想与结果之间的障碍。
AgiBot团队联合新加坡国立大学等机构开发出Genie Envisioner机器人操作统一平台,首次将视频生成技术应用于机器人控制。该系统通过100万个操作视频学习,让机器人能够预测行动结果并制定策略,在多个复杂任务上表现优异,仅需1小时数据即可适应新平台,为通用机器人智能开辟全新路径。