运维服务部开展对智能运维的研究
  时间:2019-09-05  点击量:   
【字体:

网信科技公司运维服务部从公司成立以来一直在关注和提高部门的运维服务水平,部门通过应用新的技术和方法努力使运维服务向更高效、更敏捷、更安全和更智能目标前行。部门先后完成了股份公司数据级灾备新系统实施落地和验收工作,同时在咨询公司的帮助下通过对ISO20000/ISO27001培训和认证,提高了部门的服务管理水平,提出了运维知识库设计规划、DevOps在网信科技公司的工作模型和建设之路、信息安全的规划建设思路等一些工作。

随着股份公司信息化建设和网信科技的业务加速,部门需要管理越来越多IT基础设施和信息系统以及随之而来的运维数据,部门需要通过对智能运维、IT运维管理(ITOM)、IT服务管理系统(ITSM)、云计算服务和管理及相关技术学习和研究来更高效去解决问题。其中一个重点研究是智能运维。传统运维管理是依赖流程——故障、告警、处理,依靠工单系统把这些串起来,主要关注点是告警、配置和性能。

在传统运维阶段,智能化手段不多,运维安全主要依靠运维团队的经验和技能,管理的可持续性则依赖流程制度,和不断完善培训体系,随着流程制度的不断完善,运维效率会有所降低,但随着运维团队对流程制度熟练应用后,效率会有所恢复,在传统运维阶段,存在几个潜在的误区:一是对运维团队或者个人的过度依赖,往往导致熟练流程建设及经验积累;二是对流程的僵化使用,最终会导致运维团队对流程失去耐性,而导致实际运维操作完全偏离流程本身,因为运维团队需要讲流程跟实际情况结合,在不影响流程节点结果输出的情况下匹配实际情况,做到这一点需要运维团队具备丰富的运维经验。

智能运维会通过数字化、智能化手段不断的固化和简化流程,“云化”运维专家,自动化手段取代人力等,大幅提升运维效率,运维安全不受影响甚至更安全,智能运维不仅能解决当前运维人力短缺的困境,还能通过对流程、经验和技能的不断固化、优化来彻底摆脱运维对人和团队的依赖;智能运维是基于数据和智能化分析结果进行运维管理,重点关注点是问题、分析和预测;智能运化维一般有四大场景:统一监控、根因分析、动态基线、故障预测。

我们的研究先从某个运维问题总结出来的场景入手,去总结和规划落地的时候现在和未来到底有几个、甚至几十个场景的整体需求。目前准备研究的内容包括:智能运维发展的现状和趋势;智能运维体系建设方法论;中铁建网信科技ITIM落地场景(ITIM指面向IT基础设施的监控);中铁建网信科技智能运维落地规划和落地场景。

通过智能运维的研究、实践和落地,结合与DevOps的实践,部门可以跨越从手工运维到数据驱动运维之路,使网信科技公司运维服务更高效、更敏捷、更安全和更智能目标发展。


Produced By 大汉网络 大汉版通发布系统