[社群QA] Zabbix“专家坐诊”第89期问答汇总

[复制链接]
乐维 发表于 2020-12-17 15:41:44 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
Q:今早发现一个奇案,从监控数据的图形来看某个服务超过阈值是发生在四点左右,但是触发器却在二点和三点分别报警一次,在四点没有报警,看了下agent的等级3 的日志没有发现特别奇怪的地方,请问这种事情怎么排查
A:有没有去查看过主机的系统时间?
Q:查看过 是准确的,现在发现是用另外一台电脑同样查询是正常的A:你用的是什么方式去监控?

Q:你好,请问为啥每次日志提示这个之后,zabbix_agent2就自己退出了
1.jpg
A:有试过去telnet端口吗?
Q:都正常...是zabbix-agent2有什么bug吗
A1:这个我也用的agent2,也有类似的情况,不是网络问题,tcpdump抓包试试

Q:系统已添加过的主机,突然一天就在系统中没有了,有办法恢复吗?用server端日志能排查出原因吗?
A:突然没了?有没有去查过操作的审计日志,有没有可能是手动删掉的?或者去查数据库的日志看看。

Q:zabbix 更新模板后用不用重新主机绑定模板
A:不用的,更新后的模板是会在模板设定的刷新时间同步到机器上。
Q:噢噢  3Q~

Q:请教一下两个表达式的值比较,怎么在其中一个加上单位呢?
2.png
A:触发器是加不了单位的,触发器表达式的值是来源于监控项,监控项很多时候是不带单位的,只是获取数值,单位是在监控项配置的时候补充。
3.png
Q:嗯嗯,解决了,ISP带宽是在接口描述获取的,默认是M,改成bps  *1000000就好了, 不用加单位,谢谢

Q:zabbix系统自带的交换机端口模板 我想加一下 比如端口持续掉线5分钟 则报警,但是现在 我不知道用哪个参数,这是自带端口模板的表达式
4.png
A:如果掉线,这个监控項的返回值是什么?
Q:2,1的up状态,2是down
A:用count来做触发器,count(#5,2,eq)=5
Q:前面的5和后面的5 分别是什么意思?
A:最新的五个值等于2的个数,如果等于5个,就告警
Q:那如果这样报警了 一直未恢复 是会报1个警告 还是一直会触发下去?
A:如果不设置恢复表达式,就只有一个告警,永远不会恢复,只能手动确认这个告警。
Q:那恢复表达式 其实还是原来这样就可以了
5.png
A:可以

讲座89.png




上一篇:SUSE 安装后需要做的配置及相关命令
下一篇:开源工具构建的千亿级企业运维管理平台实践(1)---企业...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注0

粉丝0

帖子327

发布主题
最新发布

乐维社区

微信公众号

版权所有 © 2016-2021 九一乐维丨粤ICP备17007026号