相信大家都有体会,如果一个组织想要通过数据和技术推动自身转型,那么单靠技术专家并不足以达成目标。其他“业余选手”或者说非专业人员,也必须参与到应用程序开发、数据解析和自动化工作流程当中。不少企业都在这种探索中做出了自己的尝试,而AT&T显然更擅长发掘全员能力,借集体之力应对数据科学与自动化议题。

这样的思路来自一个残酷的事实——任何组织都不具备充足的专业数据科学家和自动化专家,也就无法完成成功转型所需要的一切分析与AI工作。AT&T公司首席数据官Andy Markus表示,这家电信巨头正努力将AI与自动化嵌入其业务核心。在2022年初剥离了WarnerMedia之后,AT&T不再拥有娱乐业务属性、成为纯电信企业,并掌握着丰富的数据和有能力提取信息洞察的人才。也许集体探索并不适合每一家公司,但无疑非常适合AT&T。除了几百名专业数据科学家和自动化专家之外,AT&T麾下还拥有更多普通开发人员。
数据科学的大众化普及
AT&T向来有着以数据为中心的企业文化,公司一直努力促进员工使用机器学习模型开展数据分析。AT&T的数据科学、AI与自动化主管Mark Austin在采访中表示,公司目标是支持机器学习管线中的各个方面,包括寻找合适数据、获取数据、对数据开展工程设计以建立所需功能、创建模型、将模型部署至生产环境、随时间推移监控模型性能,并有效实施模型管理。与大多数企业一样,前三项内容基
本就要占去开发人员80%的工作时间,而AT&T正努力降低这一百分比。
为此,AT&T与AI云平台服务商H2O.ai合作,为常用源数据与派生数据建立起特征“商店”,借此减少极为耗时的数据整理需求。数据科学专家和业余选手们都对它的效果赞不绝口。特征商店上线不到一年,已经向专业和业余数据用户们开放了超26000种特征。此外,数据科学模型往往还匹配Pinnacle项目,即一种类似于Kaggle的内部竞赛众包方案。Austin解释称,这种竞赛机制往往能让模型性能平均提升近30%。该流程不仅涉及一系列众包autoML解决方案,同时也结合了AT&T数百名数据科学家与工程师的创新算法与集成。
自动化的大众化普及
AT&T早在2015年起,就开始通过机器人流程自动化技术推动业务自动化。从那时起,公司已经将3000多个机器人投入生产环境。经过首年实验,AT&T建立起首个自动化卓越中心(ACoE),目前在该中心内部署了20名全职员工和多位承包商。但如果没有普通员工的积极参与,该公司的自动化探索绝不可能迅速扩大规模。Austin悉心跟进每个项目,并惊喜地发现高达92%的机器人流程自动化实施出现在卓越中心以外。
随着时间推移,流程自动化为AT&T创造了巨大价值。Austin表示,机器人实施方案间的灵活组合每年省下约1700万分钟的手动操作,产生了数亿美元的年均收益,实现了高达20倍的投入回报比。
分析与AI也是Austin的分管项目,他也热切期待将机器学习与AI功能整合到机器人流程自动化中的机会。他的团队已经建立起多个机器人流程自动化实现,涵盖自然语言处理、光学字符识别(OCR)和基于机器学习的决策制定等。喜欢把“智能自动化”挂在嘴边的企业不少,但AT&T是少数能真正实现这个目标的公司之一。
培养员工技术能力
AT&T已经意识到,数据科学与自动化开发的集体探索离不开必要的技术能力与资源支持。在数据科学方面,该公司开发出广泛的技术基础设施,帮助专业和业余参与者们加入自动化机器学习的研究队伍。其中包含以下功能:
• 同时使用多达七种不同autoML工具,并在各工具间开展竞赛以观察哪个选项能创建出质量最高的模型;
• 部分autoML工具能够直接参与入选模型的生产部署;
• 可通过机器学习对各类可复用数据集进行分析;
• 提供一款直观的语义搜索工具,例如返回所有“与流失相关的特征”;
• 提供机器学习与运营工具“Watchtower for MLOps+”,其不仅能监控数据和AI(传统上被称为MLOps),同时也能跟踪整个业务管线中的全部活动集合(应用程序、API调用等)。
在技术自动化方面,AT&T采用的是微软Power Automate作为工具基准,大大降低了全民参与的门槛。这款工具可以同Microsoft Office工具、PowerBI甚至是Azure机器学习模型相集成。AT&T还维护有“Bot Marketplace”机器人市场,普通员工可以从中选择已开发完成的自动化解决方案,必要时还能从自动化卓越中心处获取配置指导。每个月,市场上都会新增约75种可复用的自动化组件。
培养人的能力
AT&T也在积极推动社区建设,关注数据科学与自动化集体探索的人力基础。在数据科学方面,公司建立起“AI大众化论坛”,每周组织一次线上演示,并就特定问题分享解决思路、向与会者公布已经开发的功能。这项活动每周吸引到约200名员工,其中大部分并非专业数据科学家,很多人甚至根本不懂编码。AT&T还整理出一套涵盖数据科学各个方面的线上培训材料,共有575门课程可供选择,同时面向各种供应商工具提供官方认证。
自动化社区的建设工作,主要是为想要参与的员工们提供40小时的培训课程。此外,自动化卓越中心每年举办一次“自动化峰会”,供公司内部团队展示和分享自己的自动化项目。
目前,部分企业和专业AI开发者仍对普通参与者在模型构建和自动化解决方案中的作用持怀疑态度。但AT&T用实际行动证明,只要为普通员工提供正确的工具和资源,就一定能建立起可行性、创造经济价值。面对供不应求的数据科学与自动化劳动力市场,AT&T证明精心规划的引导策略完全可以培养替代人才来弥补这一缺口。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。