Q:队列平均在1700左右这正常吗?
A:你要分析下队列的时间有多久、有哪些监控主机队列比较多的,然后排查下原因
Q:我把客户机上的agent服务停止了,配置的是主动模式,zabbix服务器为什么没有告警呀? A:你先看下触发器是怎么配置的 Q:想问下当客户机断网了,或者agent服务没启动,再或者客户机关机了,突然提醒我,我该怎么配置监控项? A:单独配置一个监控项做关机、断网的判断并不是很准确,建议结合其他监控项一起判断。例如:可以结合agent的ping、uptime、端口等一起判断 Q:是这两个对吧? A:是的,建议把这2个监控项改为被动方式的会比较好 Q:被监控端和服务器都在外网,被动也可以? A:agent端口互通就可以 Q:如果agent真的是每秒钟发送数据给服务器,那这样请求也太频繁了,以后客户机多了,服务器会不会承受不了?怎么设置agent数据发送的时间间隔?比如:我想每隔5s钟发送一次,而且agent发送频率太高,也会占用客户机的资源吧 A:一般来说,通常是设置60s,根据实际情况定;如果网络带宽、服务器配置很好的话可以设置30s以内 Q:是修改agent配置文件的这个吗? A:是监控项的更新间隔
3
Q:我把agent服务停,这两个监控项也没有什么变化,这样触发器也不起作用对吧? A:是的,采集时间没更新,正常应该是更新间隔的时间,应该是没数据的才对 Q:那我该如何修改触发器,在这种情况下,就推送告警?
4
A:我们一般是改成在多少时间内是没有数据的;这里是5分钟agent,ping这个键值是表示没有接收到数据的意思
5
Q:这个是系统自带的,我没修改过
6
A:可能是没有给这个宏配置timeout的时间
Q:我这有个snmptrap存储的,在zabbix web已经能看到数据了,但是这个监控项和触发器怎么写,能给个模板吗 A:你这些数据是怎么来的? Q:在zabbix上配置了个snmptrap的模板,创建一个主机链接模板,在存储端发送一个告警,zabbix就能看到了 A:snmptrap告警挺多的,必须要根据trap oid配置不同的监控项,才能配置针对具体是什么trap告警
Q:像这种日志关键字报警动作为什么执行不了呢,有时候可以,有时候不行的
7
A:你可以对比下报警和不报警是不是哪里没写好? Q:是同一个触发器,有时候可以正常报警,有时候无法执行报警,动作就是把这个触发器放进去发邮件,没啥了
8
A:不告警的动作日志那边有提示记录吗? Q:没有,我重启过server,agent,重建过监控项,触发器,动作,这个日志报警都是这样 A:感觉格式写的不对劲,可以参考下官网关于logrt的说明调整下;
Q:请教一个触发器的问题,如果我在3分钟之内得到3次为1的值就触发报警,是用count去做还是其他的,有示例看看吗? A:可以试下avg或者last,如下图的配置
9
10
|