相信大家都有体会,如果一个组织想要通过数据和技术推动自身转型,那么单靠技术专家并不足以达成目标。其他“业余选手”或者说非专业人员,也必须参与到应用程序开发、数据解析和自动化工作流程当中。不少企业都在这种探索中做出了自己的尝试,而AT&T显然更擅长发掘全员能力,借集体之力应对数据科学与自动化议题。
这样的思路来自一个残酷的事实——任何组织都不具备充足的专业数据科学家和自动化专家,也就无法完成成功转型所需要的一切分析与AI工作。AT&T公司首席数据官Andy Markus表示,这家电信巨头正努力将AI与自动化嵌入其业务核心。在2022年初剥离了WarnerMedia之后,AT&T不再拥有娱乐业务属性、成为纯电信企业,并掌握着丰富的数据和有能力提取信息洞察的人才。也许集体探索并不适合每一家公司,但无疑非常适合AT&T。除了几百名专业数据科学家和自动化专家之外,AT&T麾下还拥有更多普通开发人员。
数据科学的大众化普及
AT&T向来有着以数据为中心的企业文化,公司一直努力促进员工使用机器学习模型开展数据分析。AT&T的数据科学、AI与自动化主管Mark Austin在采访中表示,公司目标是支持机器学习管线中的各个方面,包括寻找合适数据、获取数据、对数据开展工程设计以建立所需功能、创建模型、将模型部署至生产环境、随时间推移监控模型性能,并有效实施模型管理。与大多数企业一样,前三项内容基
本就要占去开发人员80%的工作时间,而AT&T正努力降低这一百分比。
为此,AT&T与AI云平台服务商H2O.ai合作,为常用源数据与派生数据建立起特征“商店”,借此减少极为耗时的数据整理需求。数据科学专家和业余选手们都对它的效果赞不绝口。特征商店上线不到一年,已经向专业和业余数据用户们开放了超26000种特征。此外,数据科学模型往往还匹配Pinnacle项目,即一种类似于Kaggle的内部竞赛众包方案。Austin解释称,这种竞赛机制往往能让模型性能平均提升近30%。该流程不仅涉及一系列众包autoML解决方案,同时也结合了AT&T数百名数据科学家与工程师的创新算法与集成。
自动化的大众化普及
AT&T早在2015年起,就开始通过机器人流程自动化技术推动业务自动化。从那时起,公司已经将3000多个机器人投入生产环境。经过首年实验,AT&T建立起首个自动化卓越中心(ACoE),目前在该中心内部署了20名全职员工和多位承包商。但如果没有普通员工的积极参与,该公司的自动化探索绝不可能迅速扩大规模。Austin悉心跟进每个项目,并惊喜地发现高达92%的机器人流程自动化实施出现在卓越中心以外。
随着时间推移,流程自动化为AT&T创造了巨大价值。Austin表示,机器人实施方案间的灵活组合每年省下约1700万分钟的手动操作,产生了数亿美元的年均收益,实现了高达20倍的投入回报比。
分析与AI也是Austin的分管项目,他也热切期待将机器学习与AI功能整合到机器人流程自动化中的机会。他的团队已经建立起多个机器人流程自动化实现,涵盖自然语言处理、光学字符识别(OCR)和基于机器学习的决策制定等。喜欢把“智能自动化”挂在嘴边的企业不少,但AT&T是少数能真正实现这个目标的公司之一。
培养员工技术能力
AT&T已经意识到,数据科学与自动化开发的集体探索离不开必要的技术能力与资源支持。在数据科学方面,该公司开发出广泛的技术基础设施,帮助专业和业余参与者们加入自动化机器学习的研究队伍。其中包含以下功能:
• 同时使用多达七种不同autoML工具,并在各工具间开展竞赛以观察哪个选项能创建出质量最高的模型;
• 部分autoML工具能够直接参与入选模型的生产部署;
• 可通过机器学习对各类可复用数据集进行分析;
• 提供一款直观的语义搜索工具,例如返回所有“与流失相关的特征”;
• 提供机器学习与运营工具“Watchtower for MLOps+”,其不仅能监控数据和AI(传统上被称为MLOps),同时也能跟踪整个业务管线中的全部活动集合(应用程序、API调用等)。
在技术自动化方面,AT&T采用的是微软Power Automate作为工具基准,大大降低了全民参与的门槛。这款工具可以同Microsoft Office工具、PowerBI甚至是Azure机器学习模型相集成。AT&T还维护有“Bot Marketplace”机器人市场,普通员工可以从中选择已开发完成的自动化解决方案,必要时还能从自动化卓越中心处获取配置指导。每个月,市场上都会新增约75种可复用的自动化组件。
培养人的能力
AT&T也在积极推动社区建设,关注数据科学与自动化集体探索的人力基础。在数据科学方面,公司建立起“AI大众化论坛”,每周组织一次线上演示,并就特定问题分享解决思路、向与会者公布已经开发的功能。这项活动每周吸引到约200名员工,其中大部分并非专业数据科学家,很多人甚至根本不懂编码。AT&T还整理出一套涵盖数据科学各个方面的线上培训材料,共有575门课程可供选择,同时面向各种供应商工具提供官方认证。
自动化社区的建设工作,主要是为想要参与的员工们提供40小时的培训课程。此外,自动化卓越中心每年举办一次“自动化峰会”,供公司内部团队展示和分享自己的自动化项目。
目前,部分企业和专业AI开发者仍对普通参与者在模型构建和自动化解决方案中的作用持怀疑态度。但AT&T用实际行动证明,只要为普通员工提供正确的工具和资源,就一定能建立起可行性、创造经济价值。面对供不应求的数据科学与自动化劳动力市场,AT&T证明精心规划的引导策略完全可以培养替代人才来弥补这一缺口。
好文章,需要你的鼓励
英特尔CEO陈立武警告,除非有"重要外部客户"保证利润,否则可能停止14A半导体制程投资。他表示,英特尔18A前的制程可仅靠自有产品获得合理回报,但14A制程的资本成本增加,需要外部客户才能实现可接受回报。如果实施这一决定,可能意味着英特尔无法继续遵循摩尔定律,这对半导体行业将产生深远影响。
斯坦福大学NLP研究小组发布了全新的2024版GloVe词向量,这是对2014年原版的重大升级。新版本使用维基百科、Gigaword新闻数据和Dolma语料库进行训练,新增超过70万词汇,涵盖疫情、科技、网络文化等现代概念。测试显示新版本在处理当代文本、非西方人名地名和社交媒体内容方面表现显著优于旧版本,为自然语言处理应用提供了更准确的语言理解工具。
Dispo社交网络和约会应用Teaser AI联合创始人Daniel Liss创立了钢铁制造公司Nemo Industries。该公司计划利用AI技术优化生铁生产,并自建熔炉设施。Liss认为从创立之初就使用AI的公司将比竞争对手拥有20%-30%的利润优势。公司此前已融资2820万美元,目前正与现有投资者洽谈1亿美元A轮融资,并获得两个南方州超过10亿美元的激励措施承诺。
TeleAI团队发布TeleChat2、TeleChat2.5和T1三款大语言模型的技术报告,详述了从10万亿tokens预训练到强化学习优化的完整开发过程。T1-115B在数学推理上超越OpenAI o1-mini,展现了国产AI模型的技术突破。研究采用4D并行训练策略,在8000个华为昇腾NPU上完成训练,并全面开源以促进AI技术发展。