至顶网软件频道消息:Facebook使用Instagram上数十亿公开的照片来训练人工智能(AI)对图像自行分类的算法,这些照片包含Instagram用户提供的17000个井号标签。
训练计算机做人们通常做的事情——例如识别照片中的内容——通常需要为其提供大量数据。但这些数据必须由人类进行标记,而这是需要花费时间和成本的。Facebook开发了一种新技术,让员工不必坐下来对每张图片进行分类。
本周在美国加州圣何塞举行的Facebook F8大会上,Facebook首席技术官Mike Schroepfer表示:“在计算机视觉领域取得进步的最大限制因素——就和很多人工智能领域一样——就是我们几乎完全依赖于手动标记的、人为组织的数据集。这意味着,如果一个人没有花时间对图像中特定的事物做标记,即使是最先进的计算机视觉系统,也无法在运行时检测到该事物,因为系统在训练集中并没有看到这个事物。”
Schroepfer补充道:“我们已经开发了一些具有突破性的技术,可以以前所未有的规模对公开标签图像进行处理。我们已经使用一套公开的35亿张图像进行训练。”
根据Wired的说法,Instagram数据集比Google用来训练图像算法的巨大缓存还要大10倍。
Facebook应用机器学习部门工程总监Srinivas Narayanan补充说:“我们现在打造了世界上最好的计算机视觉系统,它在ImageNet上获得了84.5%的最高分数。ImageNet是一个广泛用于基准测试的数据集。”
Schroepfer说,Facebook已经在其平台上使用计算机视觉系统来发现需要删除的“坏内容”——可能包括裸体和与恐怖主义有关的内容。
好文章,需要你的鼓励
Nvidia 在最新的 CUDA 12.8 版本中宣布,Maxwell、Pascal 和 Volta 架构的支持将被冻结。这意味着一系列老旧显卡将逐步失去技术支持。虽然这些设备短期内仍可使用,但未来可能面临兼容性问题。此举将影响依赖这些旧型号的数据中心和科研机构。
随着AI的发展,高密度数据中心中高性能GPU的使用产生了大量热量。液冷成为唯一可行的散热方案,但其部署面临成本和风险concerns。通过分析液冷的必要性、经济效益和简化措施,数据中心团队可以为液冷技术的采用提供有力论据,从而保护高价值、高能耗的GPU机架。
微软推出基于 PostgreSQL 的开源文档数据库平台,并建议用户可以通过实施开源 FerretDB 解决方案来开始使用。这一举措展现了微软对开源世界的日益接受,旨在满足社区对 NoSQL 数据库的需求,同时提供完全开源、无商业许可费用的解决方案。
Commvault 与 CrowdStrike 达成战略合作,将 Falcon XDR 集成至 Commvault Cloud,以提升客户的网络威胁检测和响应能力。这一合作旨在加强数据保护、提高网络弹性,使企业能更快速地识别威胁、响应攻击,并有效降低网络安全风险。