面对激烈的市场竞争,企业意识到必须在业务与IT之间建立一条通畅的“纽带”。作为制定企业发展规划与战略路线的两大支柱,IT部门应当成为业务部门的重要合作伙伴与助力。
IT部门的诞生与早期的大型机同步,当时其基本作用仅限于“速度与馈送”。但在之后的发展过程中,开明的CIO们开始与业务负责人主动合作,着力思考运营指标对下游业务的实际影响。这种将生态系统可观察性及运营指标、同业务成果关联起来的能力,不仅代表着明确的竞争优势,同时也是企业实现转型与快速创新的必要条件。
但说起来简单,我们该如何一步步迈向这个终极目标?
目前衡量IT绩效的方法主要分两种:效率与效能。效率衡量的是IT性能,通常以速度、可用性与吞吐量为指标。另一方面,效能表达的则是IT部门对于业务产出的影响能力。很明显,业务部门更熟悉效能这类指标,具体涵盖可用性、客户满意度、客户转化率与财务指标等等。谁能达成这些目标,谁就能维持高于市场平均水平的增长率、为股东提供价值并为客户提供助力。
传奇大师Peter Drucker在畅销书《卓有成效的管理者》当中,解释了效率与效能之间的区别。虽然他的结论诞生于1966年,但仍然经受住了时间的考验。Drucker认为,二者可以分别理解为“把事做对”和“做对的事”。以CIO职能为例,把事做对最重要,而做对的事代表设定正确的目标以推动业务发展,属于达成目标的一种前提性思考。
事实证明,IT价值往往在预算与人员配备方面有所体现。在解释价值的过程中,CIO其实是在证明自己如何理解系统、服务/应用乃至客户群体对业务成果所产生的直接影响——例如客户转化、净推荐值(NPS)所量化的客户忠诚度,以及最终收入与盈利能力。他们可以在服务与客户的背景之下,证明IT支出的合理性。以此为前提,我们快速梳理一下哪些指标无法证明IT价值,而哪些能够准确体现IT的回报。
IT管理中经常会用到正常运行时间与服务水平协议(SLA)等指标,但这些显然与高管层无关。相反,更具意义的IT指标应该指向创新与扩展能力,例如新服务发布时间(TTNS)等指标。另一个重要指标,则是证明IT方案应对变更的能力。如今,敏捷企业已经将数字化服务纳入日常运营当中。过度频繁的变更与创新往往导致服务故障,并严重影响客户体验。一旦受到影响,客户很可能削减采购数额甚至考虑转向新的服务商。面对这类问题,IT需要在故障响应速度与创新发布速度之间取得平衡点。理想情况下,IT部门应该在客户受到实际影响之前检测并响应故障。虽然IT无法彻底消灭故障,但往往能够率先识别到问题的存在、并运用知识预防潜在的严重后果。
为了提升这种效能,现代CIO开始采用AIOps。AIOps是指将人工智能与IT运营整合起来,具体涵盖大数据分析、机器学习(ML)以及其他各类人工智能(AI)技术,借此自动识别并解决常见的IT问题。举例来说,IT人员可以使用AIOps衡量变更操作引发意外事件的频率,并将事件与特定客户群体关联起来。IT团队还可以进行假设性分析,甚至在客户遭遇实际故障前自动完成响应。通过这种前瞻性的识别与应对能力,AIOps即可防范后续发生类似故障、改善IT指标。这种主动管理能力不仅可以改善客户体验,同时也可通过NPS进行效果量化。最终,运营成本将由此降低、客户更乐于接受新服务,同时也保证技术措施更易被高层管理人员所理解及接纳。
效率与效能,可以说是CIO职能定位的核心。要想与业务部门开展良好合作,CIO必须立足特定时间段判断哪些内容对业务更为重要,而后据此注入资源以确保IT体系拥有必要的技术与人才。只有将IT与业务部门的优先级事务统一起来,双方才能真正建立合作关系、保证CIO“做对的事”。结合实践,我们发现以下三个步骤可以作为企业探索AIOps的理想起点:
• 打好第一仗:清点您的系统与流程,找到其中重复、笨拙且效率低下的系统流程。消除及简化这类流程,可帮助您提高业务效率。
• 关注正确数据:很多数据与业务并没有什么关联。因此,请保证只记录最具价值的用例以及最值得解决的问题,而后判断解决过程需要哪些数据。这项实践的意义,在于引导我们将精力集中在正确的数据身上。
• 绘制生态系统图:明确整个企业生态系统中的各跨职能团队。通过这份系统图,我们可以明确谁需要参与协作,而后据此汇总数据以训练模型。
希望这三项提示,能帮助大家成功迈出AIOps探索之旅的第一步。
好文章,需要你的鼓励
谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
英国宽带服务商Olilo正式推出多千兆宽带服务,专门面向技术人员、工程师、系统管理员和家庭实验室爱好者。该公司自建Layer 2网络基础设施,提供对称多千兆宽带,支持静态IPv4地址和原生IPv6。Olilo与伦敦三大互联网交换中心建立对等连接,在英国对等网络中排名第24位。服务经过150多名技术用户的付费封闭测试,并通过Discord社区持续收集用户反馈优化服务。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。