面对激烈的市场竞争,企业意识到必须在业务与IT之间建立一条通畅的“纽带”。作为制定企业发展规划与战略路线的两大支柱,IT部门应当成为业务部门的重要合作伙伴与助力。
IT部门的诞生与早期的大型机同步,当时其基本作用仅限于“速度与馈送”。但在之后的发展过程中,开明的CIO们开始与业务负责人主动合作,着力思考运营指标对下游业务的实际影响。这种将生态系统可观察性及运营指标、同业务成果关联起来的能力,不仅代表着明确的竞争优势,同时也是企业实现转型与快速创新的必要条件。
但说起来简单,我们该如何一步步迈向这个终极目标?
目前衡量IT绩效的方法主要分两种:效率与效能。效率衡量的是IT性能,通常以速度、可用性与吞吐量为指标。另一方面,效能表达的则是IT部门对于业务产出的影响能力。很明显,业务部门更熟悉效能这类指标,具体涵盖可用性、客户满意度、客户转化率与财务指标等等。谁能达成这些目标,谁就能维持高于市场平均水平的增长率、为股东提供价值并为客户提供助力。
传奇大师Peter Drucker在畅销书《卓有成效的管理者》当中,解释了效率与效能之间的区别。虽然他的结论诞生于1966年,但仍然经受住了时间的考验。Drucker认为,二者可以分别理解为“把事做对”和“做对的事”。以CIO职能为例,把事做对最重要,而做对的事代表设定正确的目标以推动业务发展,属于达成目标的一种前提性思考。
事实证明,IT价值往往在预算与人员配备方面有所体现。在解释价值的过程中,CIO其实是在证明自己如何理解系统、服务/应用乃至客户群体对业务成果所产生的直接影响——例如客户转化、净推荐值(NPS)所量化的客户忠诚度,以及最终收入与盈利能力。他们可以在服务与客户的背景之下,证明IT支出的合理性。以此为前提,我们快速梳理一下哪些指标无法证明IT价值,而哪些能够准确体现IT的回报。
IT管理中经常会用到正常运行时间与服务水平协议(SLA)等指标,但这些显然与高管层无关。相反,更具意义的IT指标应该指向创新与扩展能力,例如新服务发布时间(TTNS)等指标。另一个重要指标,则是证明IT方案应对变更的能力。如今,敏捷企业已经将数字化服务纳入日常运营当中。过度频繁的变更与创新往往导致服务故障,并严重影响客户体验。一旦受到影响,客户很可能削减采购数额甚至考虑转向新的服务商。面对这类问题,IT需要在故障响应速度与创新发布速度之间取得平衡点。理想情况下,IT部门应该在客户受到实际影响之前检测并响应故障。虽然IT无法彻底消灭故障,但往往能够率先识别到问题的存在、并运用知识预防潜在的严重后果。
为了提升这种效能,现代CIO开始采用AIOps。AIOps是指将人工智能与IT运营整合起来,具体涵盖大数据分析、机器学习(ML)以及其他各类人工智能(AI)技术,借此自动识别并解决常见的IT问题。举例来说,IT人员可以使用AIOps衡量变更操作引发意外事件的频率,并将事件与特定客户群体关联起来。IT团队还可以进行假设性分析,甚至在客户遭遇实际故障前自动完成响应。通过这种前瞻性的识别与应对能力,AIOps即可防范后续发生类似故障、改善IT指标。这种主动管理能力不仅可以改善客户体验,同时也可通过NPS进行效果量化。最终,运营成本将由此降低、客户更乐于接受新服务,同时也保证技术措施更易被高层管理人员所理解及接纳。
效率与效能,可以说是CIO职能定位的核心。要想与业务部门开展良好合作,CIO必须立足特定时间段判断哪些内容对业务更为重要,而后据此注入资源以确保IT体系拥有必要的技术与人才。只有将IT与业务部门的优先级事务统一起来,双方才能真正建立合作关系、保证CIO“做对的事”。结合实践,我们发现以下三个步骤可以作为企业探索AIOps的理想起点:
• 打好第一仗:清点您的系统与流程,找到其中重复、笨拙且效率低下的系统流程。消除及简化这类流程,可帮助您提高业务效率。
• 关注正确数据:很多数据与业务并没有什么关联。因此,请保证只记录最具价值的用例以及最值得解决的问题,而后判断解决过程需要哪些数据。这项实践的意义,在于引导我们将精力集中在正确的数据身上。
• 绘制生态系统图:明确整个企业生态系统中的各跨职能团队。通过这份系统图,我们可以明确谁需要参与协作,而后据此汇总数据以训练模型。
希望这三项提示,能帮助大家成功迈出AIOps探索之旅的第一步。
好文章,需要你的鼓励
中科院团队首次开发出1比特视觉-语言-动作模型BitVLA,实现机器人智能操作的革命性突破。该模型将每个参数限制为{-1,0,1}三值表示,通过创新的蒸馏感知训练策略,在仅使用29.8%内存的情况下达到与先进模型相当的性能。在LIBERO机器人基准测试中表现优异,为智能机器人在资源受限设备上的部署开辟了新路径,让家用机器人成为可能。
新加坡科技大学研究团队发现小型AI语言模型存在"长思维链退化"现象:当用少量复杂推理样本训练时,模型性能反而大幅下降。研究显示用8000个样本训练的小模型准确率可降75%,但大规模训练(12万+样本)配合强化学习能实现显著提升。研究首次系统阐释了错误累积机制,为小型AI模型训练策略提供重要指导,颠覆了"少量高质量数据即可改善小模型"的传统认知。
这项来自南洋理工大学和商汤科技的开创性研究,首次系统性地为GUI自动化AI赋予了人类般的自我反思和错误纠正能力。通过创新的三阶段训练框架和自动化数据生成技术,成功让AI学会了识别错误、撤销操作和从失败中学习,在复杂任务上的成功率提升了138%。这一突破不仅推动了GUI自动化技术的发展,更为构建真正智能的AI系统提供了新的范式。
斯坦福大学等机构研究团队创建了MIRIAD医学问答数据库,包含582万对基于权威医学文献的结构化问答。该系统通过多层质量控制确保准确性,在医学AI问答任务中将准确率提升6.7%,在检测医学错误信息方面提升22.5%-37%。研究还开发了交互式可视化平台MIRIAD-Atlas,让用户能够直观探索医学知识结构,为医学AI的安全可靠部署提供了重要资源。