古语说“君子谋时而动,顺势而为”,如今在IT行业“开源”就是大势。在今年发布的《十四五规划纲要和2035年远景规划》中明确指出:支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。在国家政策的指引下,开源环境必将进一步改善,开源将走入更多传统企业之中。在此背景下,技术供应商们也纷纷拥抱开源,基于开源来打造自己的产品和服务模式。云智慧正是其中之一,不久前,云智慧发布AIOps社区,宣布要打造开源的AIOps社区,用AIOps持续为业务赋能。
让AI为IT运维赋能
近些年来,AI在各行各业得到广泛应用,推动了各行业的智能化,大幅提升了管理水平和决策水平,其中也包括IT行业自己。而将AI应用于IT运维,也就是AIOps,就是AI在IT行业里面的应用热点。这背后原因不难理解:一方面,随着IT系统与业务日益密切,特别是不少企业IT即业务(比如银行),IT与业务已经分不开,IT的重要性不言而喻;另一方面,IT系统越来越复杂,其管理难度越来越高。如何高效运维成为IT部门乃至CIO必须面对的问题,特别是那些大型数据中心这一问题尤为突出。AI技术被认为是解决这个问题的一个有效办法并得到迅速普及。
Gartner在对2018年的技术预测报告《Predicts 2018: IT Operations》中提到,未来5年随着数字化程度的提高,75%的企业可能会遭遇IT故障造成的业务中断,越来越多的大型企业将使用人工智能进行IT运营(AIOps),以支持和部分取代传统的ITOM。根据Forrester公司的预测,随着各行业对于自动化与数字化转型的探索,AIOps在2021年年内的采用率有望增长约50%。
而AIOps要顺利落地,特别是在技术实力相对不足的传统企业落地面临不小的挑战。云智慧研发部总经理高驰涛介绍说,AIOps的落地涉及三个方面,最基础的是各种监控和管理工具,在此之上是数据标准化和数据的分析和处理,最上面是各种业务功能,如仪表盘、工作台,任何一个方面出现问题都会影响最后的效果。比如,没有好的监控工具都得不到需要的数据,没有中间层的数据分析和处理就无法获得到洞察。而此次云智慧发布的AIOps社区就是希望以开源的形式联合各方力量推动AIOps的顺利落地,让更多企业从AIOps中受益。
“在AIOps领域快速发展的背景下,IT工具、平台能力、和解决方案、AI场景及可用数据集的迫切需求在各行业迸发。云智慧基于在AIOps领域十余年的积累和深耕,愿竖起一面开源旗帜,为各行业客户、用户、研究者和开发者们构建活跃的用户及开发者社区,共同贡献和解决行业难题,促进该领域技术发展。”高驰涛在发布会上表示。
算力、算法和数据一个不能少
众所周知,AI应用中算力、算法和数据一个不能少,云智慧通过AIOps社区对外开放的也正是AI的这三个要素,而不是最常见的开发源代码。这也是云智慧考虑到目前AIOps应用的复杂性而做出的选择,其目的也是为了尽快让用户能尽快享受到AIOps的价值,并能充分挖掘其潜能。
本次发布会上,云智慧向AIOps社区开放了三个内容,即摩尔平台、Hours和GAIA,分别对应算力、算法和数据,开发人员可以利用摩尔平台提供的算力、利用Hour提供基础算法服务基于GAIA数据集来开展自己的AIOps应用探索。
其中,摩尔平台是一个云服务管理平台,它为开发者提供资源分配、环境管理、编码、部署,并支持开源服务、组件、算犯法的无缝接入、个性化服务需求以流程化的方式完成衔接,使开发者专注于业务需求的定制,大大提高开发者的工作效率。
GAIA(Generic AIOps Atlas)数据集是一个用于分析异常检测、日志分析、故障定位等运维问题的全量数据集。其中的数据主要来自云智慧的业务模拟系统,也包括来自云智慧的一些合作伙伴脱敏后的指标和日志数据。这是AIOps领域数次发布具有详细系统监控信息的开放数据集。
Hours算法服务是一套基于云智慧AIOps核心能力的算法技术栈。其对算法进行了抽象化和统一化,并形成了处理单元、算法、应用、数据、数据集、接口、工具等概念。Hours是一套算法使用框架,同时Hours也是一套开发框架,在Hours基础上进行算法开发,算法研究员无需考虑数据怎么读取,数据怎么预处理、怎么进行网站API接口封装,进行可视化等细节,只需要专注于研究好用的算法。
高驰涛透露,后面还会有更多的产品和功能对外开放,包括一个数据可视化效率工具和更多内源组件,包括APM SmartAgent、Log CDC、告警中心等。
AIOps社区的价值:实现增长
云智慧发布的AIOps社区将由三类人员组成,分别是AIOps用户社区、AIOps内源社区和AIOps外源社区,分别对应不同开放等级,享受不同的权力。
AIOps用户社区由内部用户、合作用户和外部用户组成。公司内各部门同事均是内部用户。第一波初始用户由智能运维服务享用企业中的关键用户组成。内部用户、合作用户与外部用户同等待遇。
AIOps内源社区由AIOps系统设计者及开发者及部分资深用户组成,技术产品及核心技术尽最大可能开放,接受设计及开发者建议及贡献、接受内源用户槽点并分类整理、正向反馈。
AIOps外源社区联结外部开源社区、营造AIOps领域品牌通过赛事&任务&设计策略、吸纳优秀研究者&开发者贡献、营造AIOps领域开发及测试资源池部分深度外源社区用户将转化为内源社区用户。
高驰涛介绍,云智慧对于AIOps社区有四个希望,总结为“能力提上去、声音拿进来、领域破边界、基础走出去”。具体而言,“能力提上去”就是对客户需求的理解能力、解决问题的能力、持续服务能力以及交付能力得到提升;“声音拿进来”就是能听取到更多用户的诉求,并找到更多关键用户;“领域破边界”指的是破除各种不同AIOps体系的边界,通过复用和知识分享推动协作和集中攻关;“基础走出去”就是形成技术品牌,走到用户面前,并且以比较低的成本,从而帮助用户实现精细化运营的目标。
最终,云智慧希望AIOps社区实现价值增长。高驰涛强调说,这里的价值不止是云智慧,而是希望相关各方都有实现价值提升。比如,对领域而言能够实现核心资源的再次分配,推动行业的进步;对于市场而言,可以发现更多潜在需求;对用户而言,能够得到更多有温暖的服务,而且是在没有营销压力下的服务;对研发而言,是能够在社区实现与用户面对面,多了发现问题的眼睛,同时也多了解决问题的渠道。
“我们希望,让开源成为习惯,让AI成为挚友,让摩尔成为基石,利用AIOps持续为业务赋能。” 高驰涛总结说。
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。
主动型 AI 是人工智能的下一次进化,它不仅能生成内容,还能自主决策和追求目标。这种 AI 可以设定自己的目标,制定策略并根据情况调整方法,实现真正的自主性。它将彻底改变机器与世界的互动方式,为人机协作开启新的可能性,但也带来了透明度和伦理等挑战。