文/Martin Fleming和Seth Dobrin
在这个数据不断膨胀的时代,根据海量数据中的洞见更准确地预测未来的结果,实现工作的自动化,提出行动的建议,对于不同规模的组织和企业而言,都变得越来越重要。
数据科学家的重要性也由此日益凸显。《哈佛商业评论》(Harvard Business Review)曾在2012年将数据科学家评为21世纪最性感的职业。随着关注度和需求量的增加,特别是面对不断激增的数据量,市场对数据科学家的角色与职能的需求,在过去几年中变得供不应求。
事实上,由于缺乏合格的人才,美国各地的许多组织处在急缺数据科学家的境况。美国职业社交网站领英(LinkedIn)2018年8月发布的最新劳动力报告显示,目前美国有超过15.1万个数据科学家职位空缺,纽约、旧金山和洛杉矶等地更是出现了“严重”短缺。
正是在这种戏剧性的背景下,IBM凭借自身多年来在教育与创新的深度融合,以及在人工智能研发和通过人工智能帮助客户成功的专注投入,在数据科学认证和技能培训领域发布了两项重要声明。
首先,IBM与The Open Group今日宣布推出一项史无前例的数据科学家认证计划,旨在为不同规模的组织和个人提供能力实践评估和数据科学技能验证。The Open Group是一家制定开放的、厂商中立的技术标准并提供认证的国际机构。
如同世界各地的IT专业人员一样,对数据科学家而言,The Open Group 证书是一项全球公认值得信赖的通用认证,用以证明持证人掌握了足以胜任这个岗位的知识、技术和专业技能,可为数据科学能力与资质提供客观、可靠的评估。
IBM是全球首家为员工提供The Open Group 认证的企业,因此IBM的员工可直接在IBM内部获得该认证。该认证还具有全球通用性,可以作为一种新的职业模式。数据科学家可以通过项目工作获得三个级别的认证,也能通过IBM Open Badge计划获得一系列荣誉徽章。最终,他们要通过相关经验能力的概述文件获得数据科学家认证,这份概述文件要经过业界公认的专家们的评估。
The Open Group标准与认证副总裁Andrew Josey表示:“随着数据科学家认证的推出,我们在为个人和组织提供数据分析职业的行业性认证方面迈出了第一步,帮助企业识别顶尖人才,也确保个人获得展示自身价值的机会。数据科学家在企业里从事关键性工作,因此确保他们掌握合适的技能,并能运用恰当方法解决手头的业务难题,至关重要。”
同时,一直走在数据科学行业前沿的IBM公司还在今天启动了一个面向内部的“数据科学学徒”(Data Science Apprenticeship)计划。该计划是IBM“新领”(New Collar)工作计划的一部分,为期24个月,面向没有大学文凭的求职者,内容主要包括教育、指导和实践经验。在学徒期间,员工将努力达到The Open Group数据科学家一级认证的要求。这项新计划已被美国劳工部认定为专业学徒项目。
数据科学技能培训和认证方面的这些举措,对于IBM、新兴数据科学家领域乃至整个商业界而言,都不失为明智之举。这些努力不仅会激发新一代数据科学家的力量,还将为企业寻找和聘用数据科学家提供有意义的凭证。这也将有助于揭开招聘流程的神秘面纱,进一步提升数据科学领域的水平,为企业带来透明度和信心。
IBM将支持这一专业联盟作为自身的使命,并作为其实现人工智能转型的关键所在。我们认为,在帮助企业从依赖直觉和经验转变为真正的数据驱动型公司方面,数据科学家会扮演排头兵的角色。
好文章,需要你的鼓励
这项来自麻省理工和滑铁卢大学的研究质疑了在AI文本排序中"思考过程"的必要性。研究者比较了三种文章重排模型:直接判断的StandardRR、先推理再判断的ReasonRR,以及禁用推理功能的ReasonRR-NoReason。实验结果表明,不仅推理过程没有提高排序质量,有时甚至会降低效果。主要原因是推理导致模型倾向于极端判断,难以表达"部分相关"这种微妙关系。即使应用"自洽性"等改进技术,简单直接的判断方式仍然更为高效有效。研究为信息检索系统设计提供了新视角:有时,少即是多。
TAGS是一种创新的医学问答框架,结合了泛医和专医两种视角,通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发,无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制,解决了现有方法在复杂医学推理中的短板,为构建更可靠的医学AI系统提供了新思路。
这篇研究提出了时间抽象值学习(OTA)方法,解决离线目标条件强化学习中的长期规划问题。研究团队发现现有分层方法失败的关键在于高层策略无法生成合适子目标,原因是价值函数在长期规划中估计不准确。OTA通过"选项"概念实现时间抽象,有效缩短规划视野,使价值函数能提供更准确的优势信号。在复杂迷宫导航和视觉机器人操作任务中,OTA显著优于现有方法,证明了该方法在处理长期任务时的有效性。
这项研究探索了大语言模型内部可解释特征的形成过程,分析了它们在训练过程中(时间)、模型层级间(空间)和不同规模模型(尺度)的行为变化。研究团队使用稀疏自编码器技术,成功识别出特定语义概念在神经激活中出现的时间点和位置。研究结果显示,不同领域的知识概念在模型训练和规模扩展中存在明确的激活阈值,且在空间分析中发现了早期层特征会在后期层重新激活的现象,这挑战了对变换器模型表示动态的传统认知。