双态IT驱动运维向智能化演进 原创

当企业同时运行有敏态业务和稳态业务(即双态IT)之后,两种完全不同的开发和交付模式并存,让IT运维工作已经很困难,再加上虚拟化、容器化的普及,使得IT运维从方法论到技术层面都面临全新的机遇和挑战,驱使IT运维管理不断升级。

至顶网软件与服务频道消息:IT运维是企业IT建设的一个不可或缺的部分。可以说,从有IT的那一天运维就与之相伴,并随着IT技术的进步不断进步。今天,当IT系统越来越复杂,运维工作也变得挑战重重。特别是当企业同时运行有敏态业务和稳态业务(即双态IT)之后,两种完全不同的开发和交付模式并存,让IT运维工作已经很困难,再加上虚拟化、容器化的普及,使得IT运维从方法论到技术层面都面临全新的机遇和挑战,驱使IT运维管理不断升级。

IT运维面临挑战

当下IT运维面临的挑战越来越大,这是IT运维人员的一个共同感受。“运维面临挑战从IT那天开始就一直在,只是现在越来越大,主要基于下面这些原因。” 新华三集团技术服务部服务产品部总监李劲松分析说。

双态IT驱动运维向智能化演进 

新华三集团技术服务部服务产品部总监李劲松

一个原因是设备的单机性能提升。无论是存储设备、计算设备还是网络设备都是如此,更高的性能带来了更多应用,同时IT架构也更复杂,这些让IT运维复杂性不断攀升。另一个原因是新技术的应用,特别是虚拟化、云计算、容器、微服务等技术的应用让应用程序从物理环境转移到虚拟机或容器环境之中。在物理设备上,如果出了问题很容易对应到故障点,而在虚拟化环境中,应用与物理设备之间并没有确定的对应逻辑关系,这就导致整个运维复杂性大大增加。

上述两个变化会带来以下5个方面的影响:

第一,运维主管必须面对所有的IT元素,不仅仅是计算、存储等硬件,还有中间件的虚拟化以及其上的应用,需要进行全栈式的管理。

第二,运维与业务融合,运维不仅仅是底层基础设施的维护(如系统升级、安全管控),还要与应用层面进行融合。

第三,海量的运维数据。一个大型的数据中心一天的日志量可以达到TB,一年可能到PB。这些数据如何进行分析是一个难题。

第四,运维知识要传承。通常一个运维团队里有一两个核心人员对整个架构很了解,大部分的故障他们能够很快解决,但并非每个成员都具有这样的能力。在运维日益复杂的背景下,如何让这些运维知识沉淀下来,让更多人也能解决复杂的IT问题,是一个挑战。

第五,IT运维模式需要改变。现在流行的IT运维模式是会采购多家厂商的维保或者外包一些专业的服务,但普遍没有一个统筹者,谁来统筹以确保问题快速得到解决是个问题。

智能化前先数字化

面对日趋复杂的IT运维形势,如何应对?在李劲松看来,首先要建立一个统一的IT运维平台,以进行IT系统运行数据的收集和整合;其次是加大监测频度,从分钟级走向秒级甚至更精细;再其次是要对数据进行智能分析,最终走向智能化运维。

“要进行全栈式管理至少要一个标准的、统一的运维平台。这个平台要负责所有的IT元素,这个平台还要有一些标准的接口,从而具有快速的扩展能力。有些业务的硬件扩展需求或者新应用上线的需求要快速响应,运维平台必须要能支撑。” 李劲松表示。

这个运维平台收集的信息将是下一步进行大数据分析的数据基础,但在此之前还有些工作要做。这些数据来自不同层级,包括计算、存储、上层应用、中间件的日志,之间并没有关联起来。在进行分析之前,要借助CMDB(资源配置管理)建立起它们的逻辑关系。比如这个应用跑在哪个虚机、哪个服务器上,该服务器的网络是哪一台交换机?这台交换机是被哪个Controller(控制器)控制,逻辑关系一定要清楚。

“这是排障的基础,因为故障表象往往在上层应用中体现,你如果不知道下面涉及哪些设备,就没有办法排障。智能化运营第一步是先把所有的逻辑搞清楚。”李劲松说。

新华三集团金融事业部技术部总监闫军进一步补充说道,“先要做平台数字化,然后做才能做智能化。”智能化运维需要以数据化为前提,数据一是要拿得准,第二还要了解它的相关性,要把数据都打通,否则是不准确的。

双态IT驱动运维向智能化演进 

新华三集团金融事业部技术部总监闫军

另外,李劲松认为建立起一个规范的运维流程,并通过一个程序或者APP把它固化下来也很有必要。比如,针对常见故障场景找出解决办法,并固化到程序中,这样即使是新手也可以按照这个流程操作,快速解决问题。 

新华三启动“三个一”技术服务战略

在IT运维服务市场,新华三集团已经摸爬滚打多年。李劲松介绍,新华三最早是IT设备厂商,早期的技术服务主要是针对自己的产品提供原厂级别的维保和技术支持。后来,新华三看到市场对运维业务的需求以及自身在运维领域得天独厚的优势。

“运维的门槛在门内,也就是说大家都可以做,但要做好,门槛很高。对于新华三集团而言,我们几乎拥有全栈的IT产品和全面的IT技术,不仅有网络、计算、存储、安全等设备,云计算、大数据、AI也都有涉猎。这些我们都了解,这是其他绝大多数做运维的厂商所没有的。”李劲松说。

从早期的设备维保切入到今天提供全面的IT运维服务,新华三集团很快就成为这个市场的领导厂商,而其统一IT运维平台U-Center的演进也很好地反映了这个过程。

李劲松说,U-Center 1.0只是包含一些基本的要素,比如监控、CMDB、APM应用管理等。而去年U-Center 2.0的推出则标志着新华三集团对于运维的理解上升到了新的层次,U-Center 2.0统一运维平台通过AI赋能、全域融合、应用视角和敏捷交付四大核心理念,为当下的运维自动化、智能化演进提供了用户导向、定制化、可扩展、全场景、一体化的平台能力。

尤为值得一提的是,U-Center 2.0能够依靠数据治理和智能分析,满足日益复杂的IT基础设施对高效运维的需求,同时基于微服务底盘,聚合云、网、端、安全等多技术域运维服务,满足客户全域运维场景需求。此外,U-Center以应用为核心的监控手段,实现IT监控、自动化与IT流程的紧密结合,以事件驱动架构实现端到端敏捷服务交付,保证了客户数字化转型的服务质量和效率。

如今,新华三集团又进一步丰富和完善了其IT技术服务的理念,推出了“1+1+1”的服务战略。具体包括:

一个统一运维平台——U-Center2.0,能满足企业在数字化转型中日益复杂IT基础架构高效运维要求。

一个“服务数字中枢”。新华三在网运行的设备超过5000万台,“服务数字中枢”能把设备运行所产生的海量运维数据基于场景化AI赋能后,为ICT基础架构提供更智能的运维服务,是运维服务后继发展的重要战略方向。

一朵运维云。早在2016年新华三就推出了名为“安仔”的智能运维云服务,这是国内首款厂商级运维SaaS服务,能够通过远程运维模式更加灵活地管理客户的网络设备、服务器设备,处理相关问题和日常运维事宜,实现ICT全面托管服务。

“对于新华三集团而言,1+1+1不是简单的相加,而是一种通过融合产生价值共振的过程。未来,新华三要释放1+1+1大于3的价值,释放海量在网设备的运行数据价值,在云端构建运维数字中枢,然后再反哺U-Center运维平台在特定场景下的智能水平,而通过智能运维云,直接给客户ICT基础架构运行维护带来极简、无忧的运维服务体验。”李劲松总结说。

来源:至顶网软件与服务频道

0赞

好文章,需要你的鼓励

2020

02/05

16:21

分享

点赞

邮件订阅
白皮书