2019年4月10日,阿克拉(Accra)万豪酒店里非洲第一个人工智能中心的一名工人站在谷歌人工智能中心(加纳)的横幅前。 (摄影:CRISTINA ALDEHUELA /法新社/Getty Images)
所谓的数据贴标者可以说是数字世界的建筑工人。非洲数据贴标者准备的信息是硅谷人工智能工作的重要组成部分。谷歌、微软、Salesforce和雅虎等公司用的是Samasource。而Samasource是一家美国公司,雇用肯尼亚一些最贫穷的科技工人来创建人工智能培训数据和图像信息。可以说,如果没有人类标签,人工智能就一无是处,那么,科技公司是否会继续拿捏好将成为全球经济中最具活力部分的离岸产业的尺度呢?
数据标签是机器学习的必要组成部分,这些公司显然有足够的动机使用世界上最低工资地区的工人。再加上2018年人工智能数据准备的市场已达5亿美元,据Cognilytic的资料,该市场预计到2023年底将达到12亿美元(https://www.cognilytica.com/2019/03/06/report-data-engineering-preparation-and-labeling-for-ai-2019/)。
Samasource公司给Kenyan AI数据贴标者(https://www.bbc.com/news/technology-46055595 )提供的“生活工资”为每天约9美元,CultureBanx(https://www.culturebanx .com / cbx-weekly-24/2019/5/26/google-amp-microsoft-banking-on-africas-ai-labeling-workforce)指出,Kenyan普通工人的工资为每天约3美元,但9美元对于大型科技公司而言仍然是小钱。这些公司要找美国数据标签专家在这个价位上做这种无聊、重复、永无止境的工作是很难的。这样的低工资工作不仅仅仅出现在非洲,东南亚也有。
微软的Mary Gary告诉记者,这些工人发挥的作用很重要,而经济学家们却没有办法解决市场定价的问题(https://www.axios.com/the-ai- sharecroppers-b316d333-ce00-47a1 -afd5-219d6138461e.html)。Gary表示, “我们一直把这种劳动定价为耐用货品,但它却是价值主张的集体智慧。”
大型科技公司提供这些代工的主要原因是,数据准备和工程任务消耗的时间占了大多数人工智能和机器学习项目的80%以上。时间就是金钱,这些公司自然不想付很多钱给重复贴标签的人。
就连英特尔的数据科学负责人Gary也指出,将这些职位外包是一种常见的做法,她表示,“常规的拥有适当数据科学领导地位的公司已经将数据科学家和数据工程师或数据贴标人之间区分开来,而且会经常聘请供应商进行数据注释工作。 ”
当人工智能按预期那样工作时,许多科技公司都会赞不绝口,但亮丽的外表必须有一个庞大的人工智能低工资劳动力基础支撑。这些低工资劳动力要上传图像,然后识别图里的人、动物、建筑物、汽车、其他标志甚至天空上的东西等等。在对数百万个图像执行了这种操作后,人工智能系统才可以开始在现实世界中识别这些对象。
人类不会很快从人工智能圈子里数据标记和人工智能质量控制这一块消失。而这些非洲工人正在帮助创建的技术要用在他们所居住的社区也还需要一段时间。这些劳动力中的许多人常常生活在贫困线以下,他们将继续为新型的、关乎人工智能数据支持的蓝领产业加油出力。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。