zabbix实践探索:乐维监控踩过的坑与优化方向
4144zabbix的实践探索:从直接修改zabbix源代码到用户交互层面的改良。
View detailsSearch the whole station
项目背景
随着计算机技术和互联网、物联网的发展以及信息化的普及与应用,我国智慧城市建设脚步加快,随之带来IT管理复杂度增加,IT运维智能化需求迫切。传统的局部、粗放、碎片化的IT运维管理模式已经无法满足信息化应用场景的实际需要,IT运维必须向自动化、全面化、流程化、便捷模式转变。构建一站式监控平台,降低集成系统运维风险和提高故障响应和处理效率则成为物联网应用基础架构升级、自动化转型的战略刚需。
相对其他行业来说,物联网智慧城市应用因为信息资源整合程度高,系统数据安全级别高,权限管理重叠交叉,海量数据收集,数据清洗处理难度大,算法复杂等原因,对技术的可靠性、稳定性,成熟性和风险处理能力有着更高的要求。
客户简介
作为未来城市的发展方向,提升城市综合承载力和市民生活品质的重要支撑,智慧城市建设正被国内越来越多的城市所重视。广州市作为中国第三大城市,拥有毗邻中国港澳的独特地缘区位优势,更有“千年商都”形成的商贸优势,以及敢为人先、海纳百川的人文优势。改革开放以来,广州经济社会发展迅猛。当前,广州市已进入工业化中后期和城市化成熟阶段,经济发展将从依靠要素投入为主向创新驱动转变,广州迫切需要通过信息化手段提高城市运行效率,创新社会管理服务,促进产业转型升级,实现绿色、智能、可持续发展。
为顺应世界新一代信息技术革命和新型城市发展趋势,广州市委市政府提出了“智慧广州”的战略决策。广州市科技和信息化局副局长吴奇泽在接受《中国经济和信息化》记者专访时表示,智慧城市建设已经上升至引领城市发展的核心战略,目前广州市的智慧城市建设才刚刚起步,智慧城市建设是一个长期而艰巨的工程,还需不断深化和努力。而未来广州智慧城市的建设目标是,至2015年,初步形成智慧城市运行体系,实现信息网络广泛覆盖、智能技术高度集中、智能经济高端发展、智能服务高效便民,成为中国智慧城市建设先行示范市。
本项目作为智慧广州子项目是由电信出品、面向广大市民开发的一款智慧城市便民系统。为广大市民提供关于该新区的政务、生活、交通、旅游、医疗、社保、教育、民生等提供便民信息服务。
项目背景
该智慧新区信息化建设蓬勃开展,IT规模逐年扩大,相应的故障次数也逐年增加。而在采用有效的管理方式之前,管理相关部门仍然采用传统的、分散、不统一的手工管理方式,由于缺乏相应监控管理手段,以至于发生问题时,没有及时故障通知管理人员,且单凭人力去定位故障原因及排错,增加了处理故障难度。且无专业团队对现有IT系统软硬件进行统一管理维护,建设、运行、支撑职责不分。系统配套的管理手段的创建已经落后于相关建设的步伐,这样就造成了管理模式跟不上系统建设的工作矛盾。
解决方案
乐维监控结合该智慧新区发展的现状及发展需求,在进行需求的前期调研和现场调研后,针对性的制定设计了一套完整的实施方案,分别对主机、网络、存储、数据库、中间件、应用、硬件、虚拟化、摄像头及其他数据感知设备等实现一站式监控,针对各IT基础架构的指标逐一分析、管理,保障业务高效稳定的运行。帮助其构建一个安全、实用、可持续发展的智能监控管理平台。
通过改造,对该智慧新区所有软硬件设备进行管理,通过灵活的告警设备,精确的告警检测,实现用户有效快速故障定位,接口定制化接入,故障分析和协助处理,最终实现令客户满意的IT运维管理要求:
1.基础监控平台需完成生产系统服务器、操作系统、数据库、中间件、存储、网络设备等的实时监控,确保能够在故障发生时提供及时的告警和操作;
2.在完成对各项基础监控项的同时,需定制开发针对智慧新区的特殊要求,监控项之间能配置关联关系,并能够生成性能分析和故障报告;
3.基础监控平台需将告警信息接入统一展示界面(与现有系统接入方式保持一致)。需具备智能巡检功能,设置巡检周期,自动生成巡检报表,对重点关注指标进行检查并汇总发至指定人员邮箱,以供分析决策。
4.对摄像头及采集感知系统进行监控,通过采集感知系统的工作记录、使用记录,指导对其正确维护和保养,保障设备稳定、可靠、节能运行,延长设备的生命周期,降低设备的故障率,保障业务系统的正常运行。
5.需有比较美观的展示界面和人性化的UI,能清晰方便的反映出企业纳控的IT资产运行状态及相关信息;
实施过程
针对该智慧新区系统所面临的问题,乐维监控基于开源zabbix深度二次开发,利用开源技术及自身产品的高可用、可伸缩、易维护等特性,对系统的IT资产进行了梳理纳控,建设优化的处理。
产品架构
1、对象统一纳控,集中管理
主机监控:Windows、Linux、AIX
网络设备监控:思科、华为、惠普、H3C、戴尔、瞻博、因特尔、迈普、山石、深信服
虚拟化监控:VMware、Citrix、Hyper-V
数据库监控:Mysql、ORACLE、DB2、MongoDB
中间件监控:Apache、Tomcat、WebLogic、IIS、NGINX
存储监控:IBM、华为、惠普、戴尔、联想、EMC
安全设备监控:摄像头,感应器
2、标签化管理,对象分组,权限配置,为数据安全保驾护航
3、秒级智能告警平台,内置知识库,使运维有迹可循
告警信息包括:可用性告警、性能阀值告警、监控指标阀值告警。
4、智能运维巡检报表,定时邮件、微信、短信发送
5、终端UI界面全新升级,灵活切换主题皮肤
乐维结合客户VI,对界面整体改良升级,为实现管理层通过查看TV展示端,随时查看三大核心业务系统,及下层的IT基础架构的健康和性能情况,从而快速掌握IT系统的异常情况,其中包括F360、OMS等核心业务系统,乐维监控采取有效的大屏监控系统。
客户收益
1. 通过IT资产全面梳理、实时预警等新型智能运维手段,运维效率大幅提升,解决了繁多IT基础运维的难度和工作量,减轻运维人员压力,系统运维成本降低超过60%;
2. 核心业务最长连续190天无重大故障,保证业务稳定。因乐维监控的保障,运维人员得到了各级领导高度赞赏;
3. 精确的故障管理改变了传统人工运维时出现的滞后、漏报、误报等不良现象;丰富的报表及历史数据为决策提供了有效的依据;
4. 对摄像头工作、使用情况进行记录并指导维护保养,设备故障率降低,维护成本降低。
【青岛ITIL Meetup】大咖云集,解锁运维管理新境界!探索数字化转型新思想!
View detailsZabbix在观看次数和与其他产品对比上都获得了最多的关注被IT Central Station评为最佳网络监控软件
View details