数据和分析正在显露出潜力,各种组织每天都利用数据和分析完成各种工作,包括衡量ESG影响、创造新的收入来源等等,因此,不具备强大数据能力的公司备受压力,许多公司都需要制定数据战略。
通常他们的要求都很迫切,但他们却往往不太愿意挑明。他们甚至很难表达清楚自己的目标,或是不知道从何开始。变量似乎无限地多:数据的方方面面——安全、科学、存储、挖掘、管理、定义、删除、整合、可访问性、架构、收集、治理以及永远若即若离的数据文化。而就所有这些技术上的复杂性而言,他们感受的迫切性更多的是一种心态症状。他们认为,在制定第一个正式的数据战略时,他们必须在一开始就得到所有的答案,所有的相关人员、流程和技术必须整整有条地摆在面前。
我们不鼓励这种想法。数据的灵活使用就像转动一个大飞轮:一开始需要巨大的动力轮子才能动起来,但飞轮的动量在很大程度上是可以自我维持的。因此,轮子被逐步施力时会越转越快,到最后只要轻轻用指尖一碰就足以维持极快的速度。飞轮达到这个速度时,所需的支持人员、流程和技术就自然而然解决了。
我们在这篇文章中提出四个步骤,可以加速飞轮转动。我们将以ChampionX公司首席信息官Alina Parast的故事为引子讨论每一步,同时会讨论她是如何帮助ChampionX公司(一家为上游和中游石油和天然气行业提供解决方案的公司)转型为一个数据驱动的强大商家。
当ChampionX上市时,公司的跨职能团队(包括供应链、数字IT和商业专家)的用词倾向于解决现实世界问题及避免用或少用一些涉及“转型”和“数据驱动文化”等流行词。而另一方面,ChampionX并不是无的放矢地乱选问题,而是选择了正确的问题——这是让飞轮旋转起来的第一步,也是最关键的一步。
当时,ChampionX公司化学技术业务中成本最高的活动之一是监测和维护客户站点,其中的许多站点位于美国的偏远地区。Alina表示,“这不仅仅是个劳动力和燃料问题。我们必须花很多钱维护往返于这些站点的车辆,还要弄清楚车辆使用的路线。当时的谷歌地图以及现在的谷歌地图都无法为现场技术人员导航。” 她表示,这些成本是“让客户有一个满满的油箱而不是一个空空的油箱”(ChampionX指导原则之一)的代价,也是ChampionX改善客户生活的价值主张的核心。她表示,“因此,我们就在想,‘我们如何才能达到这个目的呢?’”
ChampionX团队选择解决的问题:降低工地旅行的成本。这个问题可能看起来很平常,但却具有所有能让飞轮转动起来的正确成分。首先,这是个很紧迫的问题,因为工地旅行成本是ChampionX公司最重要的开支之一。第二,这个问题很简单(即使其解决方案并不简单),很容易解释:去这些地方要花很多钱。第三,是个实实在在的问题,涉及到现实世界的物体,卡车、水井、设备及大家可以看到、听到或感觉到的东西。同样重要的是,ChampionX团队可以说出他们的努力会带动哪些具体的财务项目。最后,这个问题是整个企业的共同问题。Alina作为跨职能领导团队的一部分,并没有把自己局限在解决表面上与CIO有关的问题上。她明白:只要是个她和她的组织可以帮助解决的问题,那就是一个与CIO有关的问题。
IT高管经常会说,人员、流程和技术是IT战略的基石,但他们有时会忘记整个战略的核心:解决真正的业务问题。开始的时候要把你所关心的问题放在一边,比如将雇用谁、使用什么工具、员工将如何一起工作——这些事情到时候就变得显而易见了。首先,你要将一众领导们请到一个房间里。不要演示幻灯片、电子表格和路线图之类的。而是真诚地询问领导。我们要解决的是什么问题?答案不会像你期望的那么简单,但这样的对话会是非常宝贵的。
一旦确定了值得解决的问题后,下一步就是捕获所需要的数据来解决这个问题。如果要解决的问题已经定义得很好了,你就会知道所需要的数据是什么,这一点很关键。定义了要解决的问题可以缩小需捕获的各种数据的范围,同样,先要弄清楚需要什么样的数据、可以从哪里得到这些数据以及如何管理数据,如此就可以缩小可能构成数据环境的各种人员、流程和技术的范畴。
我们来看一下Alina和ChampionX是如何做到这一点的。ChampionX团队一旦知道了问题所在——现场访问的成本很高,他们很快就定下了合理的解决方案,也就是减少所需的现场访问次数。大多数去现场访问都是例行公事,而不是要去解决一个实际问题,所以如果ChampionX能够远程收集现场的情况,他们就可以节省大量的时间、燃料和金钱。这种洞察力可以告诉他们需要的数据是什么,反过来又可以让ChampionX公司的IT和商业数字团队清楚地知道他们需要什么样的人以及需要用什么工具来捕获这些数据。例如,他们需要物联网传感器,以便从现场提取相关的数据。他们需要一个地方用于存储这些数据——他们缺乏相关的基础设施,因而不能管理从传感器上传来的TB级数据以及相关的客户数据(存储在企业平台的数据,例如ERP、运输和供需计划等平台)。因此,他们建了一个数据湖。
这些举措中的每一项都是重要的工作,而且需要持续地做,包括建立安全的云基础设施、数据湖的设计、传感器、存储以及必要的培训等等。而ChampionX团队则不仅解决了现场访问的问题,他们还为公司的数据环境和后续数据驱动计划提供了一个基础。例如,数据湖现在为其他业务部门不断增长的数据量和数据种类提供了一个据点,这反过来又可以产生有价值的见解(在下一节里将有更多的介绍)。
知道了所要捕获的数据为开始选择人员、工具和流程提供了必要的背景。但无论你选择了什么,结果都是不可预知,因此,也就很难将数据环境中的某个组成部分与所有其他组成部分的联系描绘出来然后从中选择一个工具包,这样做既费力而且是无益的。要做的是弄清楚眼前的问题和数据究竟需要什么。其原因是,你需要根据你的组织中一些真实而重要的东西做出选择,你的选择很可能最终要为公司里其他真实而重要的东西提供服务。但在这种情况下,你将能够指定你所需要的东西的名称、成本和顺序,这些细节将令你的数据战略成为现实,并可以令你的飞轮更快地转动起来。
开始捕捉数据后,你的飞轮转得更快了,新的机会和数据会显露出来。ChampionX的团队在安装了物联网传感器对客户现场进行远程监控后不久,他们很快就意识到同样的数据可以用到其他地方。ChampionX公司现在拥有大量的地形数据,其他公司都没有大量的地形数据,ChampionX利用这些数据推动公司的顶线和底线数据。ChampionX公司优化了车辆去工地的路线,解决了没有谷歌地图的问题,推动了底线数据。另一方面,数据成了新的收入来源,可以货币化,进而推动了顶线的提升。
ChampionX的数据湖也有了新的用途。公司的其他业务计划开始在数据湖里存储数据,这可以促使跨职能团队将各种信息综合起来进行思考,可以思考如何使各个部分合在一起大于部分之和。其中一种类型是客户、订单和供应链数据(客户经常要求ChampionX公司提取这些数据并与现场数据合并进行影响分析)、相关报告以及他们的客户所受到的供应链网络中断的影响。在过去,合并这些数据需要数周的时间,主要是因为这两种数据一直都生活在不同的生态系统中。现在,同样的分析只需要几个小时。
从这里我们可以得到两个启示。首先,如果你的数据飞轮在开始时转动得慢一点也没有关系,不妨先让它转起来。先吸引一些新的机会或数据类型,让你有机会将看起来不相干的事物联系起来。对类似模式的识别将极大地加速飞轮的转动,而且对形成适当的复杂数据环境有激励作用。
第二个启示与前两个步骤相似:在追求不同的机会时做出明智的选择。并不是每一个有意思的洞察都是有用的。要去追求那些最有价值和真实的机会,去追求人们可以看到的、可以测量的和感觉到的机会。当然,我们同时仍然需要进行一些乏味平庸的、经常性的组织活动(如提交影响报告)。如果你能解决这些问题,你就可以证明数据成为组织变革力量是可行的,丰富的数据文化就会开始出现,进而将推到飞轮的高速转动。
我们所探索的ChampionX故事只是一本书的一个章节。ChampionX公司收集了更多数据后,公司的员工也获得了新的见解,Alina和她的业务伙伴所处理的问题的范围和复杂性都在增加,ChampionX的飞轮转得更快了,已经能够为公司的整个供应链中的数据优先解决方案提供动力了。
而大多数问题在某种程度上都可以追溯到一个简单的问题,也就是公司如何才能减少现场访问的费用。ChampionX的团队并没有简单地从涉及供应链的问题急于跳到涉及市场、人力资源或财务的问题上。ChampionX团队做的是从最初的问题一步一步地有逻辑地向外扩展。正因为如此,他们的人员、流程和技术在成熟度方面离解决下一个挑战只有一线之隔,而下一个挑战也总是建立在前一个挑战的基础之上。
飞轮转得快了以后,可供选择的问题也就更多了。要优先考虑那些不仅可行、有价值而且在主题上与已经解决的问题是一致的问题。这样,你就能够利用已经建立的势头。你的数据环境也已经包括了许多所需的人员和工具。你不会觉得你又在重新开始,不会觉得又必须去向你的利益相关者去论证一个从头开始的案例。
构建一个数据战略就像转飞轮。飞轮是循环的、迭代的、渐进的、无休止的。并不存在什么可以归类“数据驱动公司”的特殊界限,你的组织并不是过了某个界限就是“数据驱动”组织了。同样,不能将数据战略视为二元的东西,这样想是没有用的,不能将数据战略看做一座正在建设中的建筑,到了某一天就完成了。最佳的做法是,专心一致地利用你的数据解决那些紧急的、简单的、有形的和有价值的问题。召集你需要的人员、流程和技术解决这些问题。然后,进入下一个问题,然后再进入下一个问题,然后再进入下一个问题,在这个过程中,一个充满活力的数据生态系统里将呈现各种元素。靠你的意志是不能令数据战略出现的。你必须聚焦飞轮才能逐步令数据战略出现。数据战略出现时,你和其他所有人都会知道的。
好文章,需要你的鼓励
DeepSeek 发布了新的大语言模型系列 R1,专为推理任务优化。该系列包括两个主要模型 R1 和 R1-Zero,采用混合专家架构,拥有 6710 亿参数。R1 在多项推理基准测试中超越了 OpenAI 的 o1 模型,而 R1-Zero 则代表了机器学习研究的重大进展。DeepSeek 已在 Hugging Face 上开源了这些模型的源代码。
国家机器人研究中心与 Freshwave 公司合作,利用私有 5G 网络测试农业机器人。这项合作旨在提升农业生产力,预计到 2026 年农业科技产业规模将达到 156 亿英镑。私有 5G 网络将为农业机器人提供高速、低延迟的连接,实现实时数据分析和精准农业操作,有望彻底改变农业生产方式。
Cognizant 推出了神经 AI 多代理加速器和服务套件,旨在帮助企业快速开发和部署 AI 代理。该技术通过预构建的代理网络模板和无代码框架,实现了跨职能的可扩展性和自主决策能力。这一创新有望推动 AI 代理在企业工作流程中的广泛应用,促进人机协作,提升业务效率和适应性。
西部数据公司财务总监Wissam Jabre将于2月28日辞职,恰逢公司分拆为硬盘和固态硬盘两个独立业务。公司正在寻找新的财务总监。尽管面临闪存业务定价环境更具挑战性,公司第二财季收入预计仍将达到43亿美元,同比增长42%。分析师认为硬盘业务表现强劲,可能抵消了闪存业务的部分疲软。