三招为AIOps落地开个好头 原创

清点系统与流程,关注正确数据,绘制生态系统图,这三招能帮助企业成功迈出AIOps探索之旅的第一步。

面对激烈的市场竞争,企业意识到必须在业务与IT之间建立一条通畅的“纽带”。作为制定企业发展规划与战略路线的两大支柱,IT部门应当成为业务部门的重要合作伙伴与助力。

IT部门的诞生与早期的大型机同步,当时其基本作用仅限于“速度与馈送”。但在之后的发展过程中,开明的CIO们开始与业务负责人主动合作,着力思考运营指标对下游业务的实际影响。这种将生态系统可观察性及运营指标、同业务成果关联起来的能力,不仅代表着明确的竞争优势,同时也是企业实现转型与快速创新的必要条件。

但说起来简单,我们该如何一步步迈向这个终极目标?

目前衡量IT绩效的方法主要分两种:效率与效能。效率衡量的是IT性能,通常以速度、可用性与吞吐量为指标。另一方面,效能表达的则是IT部门对于业务产出的影响能力。很明显,业务部门更熟悉效能这类指标,具体涵盖可用性、客户满意度、客户转化率与财务指标等等。谁能达成这些目标,谁就能维持高于市场平均水平的增长率、为股东提供价值并为客户提供助力。

传奇大师Peter Drucker在畅销书《卓有成效的管理者》当中,解释了效率与效能之间的区别。虽然他的结论诞生于1966年,但仍然经受住了时间的考验。Drucker认为,二者可以分别理解为“把事做对”和“做对的事”。以CIO职能为例,把事做对最重要,而做对的事代表设定正确的目标以推动业务发展,属于达成目标的一种前提性思考。

事实证明,IT价值往往在预算与人员配备方面有所体现。在解释价值的过程中,CIO其实是在证明自己如何理解系统、服务/应用乃至客户群体对业务成果所产生的直接影响——例如客户转化、净推荐值(NPS)所量化的客户忠诚度,以及最终收入与盈利能力。他们可以在服务与客户的背景之下,证明IT支出的合理性。以此为前提,我们快速梳理一下哪些指标无法证明IT价值,而哪些能够准确体现IT的回报。

IT管理中经常会用到正常运行时间与服务水平协议(SLA)等指标,但这些显然与高管层无关。相反,更具意义的IT指标应该指向创新与扩展能力,例如新服务发布时间(TTNS)等指标。另一个重要指标,则是证明IT方案应对变更的能力。如今,敏捷企业已经将数字化服务纳入日常运营当中。过度频繁的变更与创新往往导致服务故障,并严重影响客户体验。一旦受到影响,客户很可能削减采购数额甚至考虑转向新的服务商。面对这类问题,IT需要在故障响应速度与创新发布速度之间取得平衡点。理想情况下,IT部门应该在客户受到实际影响之前检测并响应故障。虽然IT无法彻底消灭故障,但往往能够率先识别到问题的存在、并运用知识预防潜在的严重后果。

为了提升这种效能,现代CIO开始采用AIOps。AIOps是指将人工智能与IT运营整合起来,具体涵盖大数据分析、机器学习(ML)以及其他各类人工智能(AI)技术,借此自动识别并解决常见的IT问题。举例来说,IT人员可以使用AIOps衡量变更操作引发意外事件的频率,并将事件与特定客户群体关联起来。IT团队还可以进行假设性分析,甚至在客户遭遇实际故障前自动完成响应。通过这种前瞻性的识别与应对能力,AIOps即可防范后续发生类似故障、改善IT指标。这种主动管理能力不仅可以改善客户体验,同时也可通过NPS进行效果量化。最终,运营成本将由此降低、客户更乐于接受新服务,同时也保证技术措施更易被高层管理人员所理解及接纳。

效率与效能,可以说是CIO职能定位的核心。要想与业务部门开展良好合作,CIO必须立足特定时间段判断哪些内容对业务更为重要,而后据此注入资源以确保IT体系拥有必要的技术与人才。只有将IT与业务部门的优先级事务统一起来,双方才能真正建立合作关系、保证CIO“做对的事”。结合实践,我们发现以下三个步骤可以作为企业探索AIOps的理想起点:

• 打好第一仗:清点您的系统与流程,找到其中重复、笨拙且效率低下的系统流程。消除及简化这类流程,可帮助您提高业务效率。

• 关注正确数据:很多数据与业务并没有什么关联。因此,请保证只记录最具价值的用例以及最值得解决的问题,而后判断解决过程需要哪些数据。这项实践的意义,在于引导我们将精力集中在正确的数据身上。

• 绘制生态系统图:明确整个企业生态系统中的各跨职能团队。通过这份系统图,我们可以明确谁需要参与协作,而后据此汇总数据以训练模型。

希望这三项提示,能帮助大家成功迈出AIOps探索之旅的第一步。

来源:至顶网软件与服务频道

0赞

好文章,需要你的鼓励

2021

03/08

10:40

分享

点赞

邮件订阅
白皮书