【搜狐网】运维监控软件:显性化+移动互联,乐维监控智慧之路
5914显性化和移动互联满足智慧化监控系统的需求,乐维走的正是这条道路
View detailsSearch the whole station
客户简介:案例客户是一家在A股上市的大型家居企业,专注于客餐厅、卧室及全屋定制家居产品的研究、开发、生产和销售,旗下拥有多个系列自有品牌,并与美国、意大利家居品牌开展战略合作,业务覆盖全球120余个国家和地区,运营6000多家品牌专卖店。
痛点分析:
客户企业现有的IT资源规模接近1300个,除了传统的操作系统、网络设备、服务器、数据库、存储等资源外,还引入了云平台、容器、虚拟化平台、链路等,原有的运维体系对信息化系统的支撑逐渐地力不从心,不能适应对现有信息化系统的维护要求,主要表现为:
针对客户企业运维痛点与具体需求,乐维为其量身定制了一套综合运维监控解决方案,打造智能化监控平台。平台系统集成了统一监控、集中告警、报表管理、权限管理、业务服务管理、运维驾驶舱等功能模块,提供一站式运维监控全新体验。
统一监控:
统一监控是整个解决方案的核心。方案对客户原有的监控体系进行整合重构,将原本分散的系统并入统一的监控平台。
根据客户内部网络环境,方案采用分布式实施,在不影响业务系统正常运转的条件下,分别对客户IT资源进行一站式监控,并对各IT基础架构的指标逐一分析、管理,保障业务高效稳定的运行。
乐维监控自身支持数十种协议,监控能力覆盖市面上绝大多数厂商与品牌的IT资源,借助自动发现与纳管能力,快速完成纳管了近1300个监控对象,包括操作系统、网络设备、服务器、数据库、web、中间件、存储、虚拟化平台、链路、云平台、容器等。
与此同时,乐维监控还提供全局视角的运维驾驶舱。作为乐维监控可视化体系的一部分,运维驾驶舱能够集中展示被监控资源种类、数量、告警总览、各种TOPN数据等指标,特别适合运维管理人员对企业信息化系统的整体运行状态进行把控。
在引进乐维监控之前,客户已建成两套主要的告警管理系统,分别是资源厂商自带的告警系统及基于zabbix的告警平台,另有一些零散的告警信息。
引进乐维监控后,乐维监控告警中心模块将原先的zabbix的告警信息和客户系统中的告警信息系统集成在一起,并对其他零散的告警信息进行直接纳管,从而实现一个平台纳管三个系统,统一展示、提高效率。
报表管理:
引进乐维监控之前,客户企业积累了大量的运维数据,但由于运维体系的分散,囿于数据孤岛的存在,缺乏相应的数据分析工具,这些运维数据价值并未得到有效的挖掘和利用。
为此,乐维监控配备了报表管理功能模块,提供实时报表、TOPN报表、流量报表、日报周报、自定义报表、巡检报表等工具,用于追踪和判别被监控资源的实时概况与变化趋势,为运维决策提供支撑。
如下图,对于客户特别关注的出口上网流量情况,运维人员可通过实时报表查看当前正在消耗出口上网流量的业务资源,更进一步地还可以查看端口入/出带宽利用率、端口发送速率等信息,通过这三个指标来快速判断某一时间的业务情况。
权限管理:
客户企业由于先前缺乏基础的统一的监控管理体系,无法对资源权限管理进行统一配置,运维人员权责不明晰,不仅导致了资源管理混乱,在很大程度影响了故障响应速度与维护效率的提高,进而影响了业务系统的正常运转。
基于统一监控,乐维监控打造了统一的权限管理机制,统一分配,集中下发,支持按角色、按用户分配管理权限,权责明晰,互不冲突。
乐维监控对客户环境业务系统纳管的700+主机进行了权限划分,每一位运维人员都只能看到自己负责的系统、告警、告警通知以及对应的功能,做到数据权限与功能权限统一管控。
业务服务管理:
业务系统多而杂,运维系统与业务系统脱节是大型企业普遍的运维痛点与难点,反映到运维实践的主要表现是运维人员只能看到孤立的节点故障,不能对故障的原因/影响有比较直观的感知,容易造成“头痛医头,脚痛医脚”,有时并不能抓到问题本质,导致重复运维,影响效率提高。
针对客户环境业务系统较多的情况,乐维监控从业务视角出发,提供了多种业务服务管理能力,包括业务树、业务拓扑、业务大屏等。
对于组织架构复杂的大型企业集团,业务树可识别和区分不同层级组织所管理的业务资源,对运维管理人员而言,借助业务树可判断各层级运维效率情况。
智能业务拓扑通过扫描IP自动发现业务资源并生成业务拓扑,可直观查看业务系统类型、包含设备等信息。运维人员可根据拓扑图区分和关注对重要业务资源节点,判断故障节点对业务系统的影响范围。
业务大屏也是乐维监控可视化体系的一部分,用于展示全部业务系统概况,通过颜色区分,业务系统健康状态一目了然。
经过一年的建设,综合运维监控平台于2023年中完成一期建设并通过验收。借助该平台,客户企业的响应速度和整体运维保障能力得以大幅度提升,提高了信息化服务整体质量,信息化整体稳定性和响应及时性得到较大改善。
监控系统给客户的运维带来的价值表现为:
1. 实时监控,告警及时。对常规资源使用情况、机房环境、设备部件等进行及时告警,提高了运维响应速度;
2. 决策支撑,前置运维工作。借助报表系统预判资源与性能消耗,提前布局,避免可能产生的异常。如借助系统巡检报表感知系统容量即将消耗殆尽时,可提前进行扩容;
3. 从系统运维到业务运营。借助智能业务拓扑、业务树等能力更直观感知业务系统结构与健康概况,为业务系统提供更系统、更全面的保障;
4. 整体提升运维管理能力。通过统一的权限管理解决先前权责不明晰、管理混乱问题;通过运维驾驶舱、报表系统等为运维决策提供支撑。
乐维社区已经开放乐维监控免费版和乐维MCM(cmdb+监控)免费版,欢迎下载使用!