案例解读丨中国某保险公司IT运维管理平台建设(架构篇)

2022-04-28 04:25

作者:乐维

摘要:

目前该保险公司IT自动化管理程度低,运维工作没有规范化、标准化、流程化,缺乏统一的IT综合运维管理平台,维护人员疲于被动应对多套管理系统,多种形式的告警,并且网络规模的不断扩大,网络设备数量和各种应用软件

前言

1949年中华人民共和国成立,新中国拉开了高速发展的帷幕,响应祖国开辟新征程、迈向新未来的号召,该保险公司宣布成立,标志着中国保险事业掀开了新的一页。自此,该保险公司秉持与人民冷暖相知、朝夕相伴,走出了一条具有特色的发展之路,至今已累计为3.3亿保险消费者送去温暖,成为推动中国寿险市场发展的一支重要力量。该保险公司始终秉承企业使命、不忘初心、砥砺前行,积极参与国家健康养老产业、基础设施和民生工程建设,主动承担社会责任,助力脱贫攻坚、开展抗灾救灾、爱心捐助和捐建“希望工程图书室”等活动,为决胜全面建成小康社会、决战脱贫攻坚做出了重要贡献。

项目背景

在保险行业激烈的竞争中,该保险公司不断拓展自己的新业务范围,同时也充分意识到业务服务的高可靠性才是提高对整体服务满意度和忠诚度的核心竞争力。

    目前该保险公司IT自动化管理程度低,运维工作没有规范化、标准化、流程化,缺乏统一的IT综合运维管理平台,维护人员疲于被动应对多套管理系统,多种形式的告警,并且网络规模的不断扩大,网络设备数量和各种应用软件系统的逐渐增多,软件和硬件设备出现的情况也越来越多。不仅大大降低了已有网络资源的利用效率和维护工作,也造成了IT管理严重脱节于企业业务的整体管理,新业务的扩展不断引起IT建设和维护成本的飞涨。

项目诉求

乏一个统一集中平台架构,支持已有监控纳入,同时可支持其他功能模块部署,以及各功能模块间有效关联,做到全局统一,并支持后续不断丰富功能模块接入。

缺乏资产管理配置库,有效将已有资产集中纳管,让资产管理从此脱离原始表格,进入软件配置化管理,同时关联机构组织、人员角色,集中维护、统一管理,使得不同部门、不同人员可以查看自己资产以及资产关联的监控状况

缺乏可配置化工单管理功能,已有工单流程固定,不能联动监控、告警以及其它功能模块,且不支持自定义流程建模、表单设定,随着运维事件越来越细化、越来越标准化、越来越规范化,需要一个灵活、可配置、自定义的流程作业配置功能。

缺乏自动化运维作业功能,日常运维工作细致繁琐,简单重复性事务较多且不能出现差错,运维人员日常精力由于重复性繁琐事务被占据太多,需要一个自动化运维作业功能,解决日常重复性繁琐的事务,将运维人员从低效、繁琐的事务中抽离出来,进行技术的提升及创新事务的开拓。

缺乏运维作业有效窜连起来,实现自动化功能,做到快速巡检、快速报告、快速规范化流转。解决基础作业处理繁琐,故障分析处理缺乏有效判断,拉动人力资源过多等弊端,需要一个规范化、灵活化、自动化运行平台,有效将多个功能窜连起来。

项目目标

  以一期基础监控平台为基础,在平台架构上升级,建立IT综合管理平台,有效将已有监控、新增CMDB、自动化运维、流程作业等功能纳入考虑。搭建一个支持多功能插入、可横向扩展的完整架构,实现纵向对系统管理员、部门领导、企业领导等决策层的多层次监控展现。保障目前各功能模块有效整合,同时为未来其他功能模块即插即用,为后续智能化打下夯实基础。

乐维解决方案

平台架构解决方案

基于乐维对开源深入探知的底蕴,以及客户期望达到的多功能融合及可扩展化平台需求。乐维提出了分布式架构解决方案:

底层采用分布式采集,利用开源强大的采集功能,将数据中心从基础硬件、系统及应用,以及机房动环对接,

不同数据分别采集,集中推送。

采集的数据分别利用,原始推送至数据仓库,集中存储,一部分推送至上层平台,集中展示,并提供其他功能调用。

所有环节均支持横向扩展,保障后续延申。

架构设计完整图

乐维运维通过一个平台,统一框架,数据集中展示,能够给用户信创系统环境终端提供高性能、高稳定性、高可靠性、高安全性的一体化监控运维容信创硬件平台,适配信创操

数据仓库及缓冲层

缓冲层采用队列缓冲配置,设置管理节点及缓冲节点,有效将底层server 推送上来的原始数据通过队列缓冲,保障了底层数据库的推送事务关闭,保障底层server 数据库性能,缓冲层根据实际推送数据的体量,进行压力测试,后续可根据数据增量进行横向扩展,保障性能。

数据仓库按照当前数据量,支持1~2个月为一个仓库,横向扩展,所有数据仓库集中汇总,对于大数据量分裤查询提供性能优化

集中数据处理

数据集中存储主要提供上层功能模块调用,如监控中心、告警中心,采用redis内存数据库快速缓存配置,保障上层功能读取快速调用。

 

功能模块分布式

上层各功能模块支持单独部署,可根据功能模块重要性、性能要求进行分布式部署,相互不影响又相互关联。

上层统一展示

统一监控平台集中入口,可查看、使用、配置多项功能支持,另根据定制化大屏特定展示,满足实际使用中不同视角的数据呈现。

方案价值

基于基础监控,延续开源丰富的采集方式及接口,拓展数据采集功能,将开源经典模式单server+多proxy 直接升华为分布式采集

以监控为中心,主要呈现监控功能,附带资产管理及自动化支持。升华为以CMDB为核心,配合监控,联合自动化、流程等功能,集中展示。

依赖历史,综合全局,统一监控平台整体架构设计,不仅友好的延续了一期基础平台的贡献,包容了二期所有功能模块的开发部署,很好的完成了集中式多功能平台的框架建设,为后续功能扩展提供了良好的框架,做到即插即用。更是为后续智能化信息化建设打下了良好的基础。