1、Zabbix報警 icmp pinger processes more than 75% busy
2、zabbix unreachable poller processes more than 75 busy
unreachable poller processes 一直在處於busy的狀態,那這個具體代表什么意思呢,查看官方文檔zabbix internal process、unreachable poller - poller for unreachable devices 用於輪詢不可到達到的設備。
可能情況:
1.通過Zabbix agent采集數據的設備處於moniting的狀態但是此時機器死機或其他原因導致zabbix agent死掉server獲取不到數據,此時unreachable poller就會升高。
2.通過Zabbix agent采集數據的設備處於moniting的狀態但是server向agent獲取數據時時間過長,經常超過server設置的timeout時間,此時unreachable poller就會升高。
3.支撐Zabbix的MySQL卡住了,Zabbix服務器的IO卡住了都有可能,Zabbix進程分配到內存不足都有可能。
一個簡單的方法是增加Zabbix Server啟動時初始化的進程數量,這樣直接增加了輪詢的負載量,從比例上來講忙的情況就少了
3、Zabbix alerter processes more than 75% busy
收到幾百條zabbix告警信息:
Zabbix alerter processes more than 75% busy
可能原因:
zabbix的數據庫問題
zabbix服務器的IO負載
zabbix進程分配到內存不足
網絡延時或者不通
處理方法:
4、zabbix-server服務掛了,啟動后又自動停機了,並且日志中很多下面這個錯誤
報警提示
Zabbix value cache working in low memory mode
Less than 25% free in the configuration cache
5、zabbix-server日志報錯,提示connection to database 'zabbix' failed: [1040] Too many connections錯誤,mariadb正常。想到應該是mysql最大連接數問題。
修改mysql最大連接數的鏈接:
http://blog.51cto.com/net881004/2089198
6、報警提示More than 100 items having missing data for more than 10 minutes和Zabbix poller processes more than 75% busy錯誤。
修改配置文件增大線程數和緩存
7、server日志很多first network error, wait for 15 seconds報錯
server配置文件Timeout時間改大點,我改成了30s。
8、zabbix告警“Zabbix poller processes more than 75% busy”(網友)
告警原因:
1.某個進程卡住了,
2.僵屍進程出錯,太多,導致慢了
3.網絡延遲(可忽略)
4.zabbix消耗的內存多了
告警危害:
普通告警,暫無危害(但是最好處理)
處理方法:
一:簡單,粗暴(重啟zabbix-server可結合定時任務使用)
service zabbix-server restart
crontab -e 調出Cron編輯器中增加一個計划:
@daily service zabbix-server restart > /dev/null 2>&1
二:編輯Zabbix Server的配置文件/etc/zabbix/zabbix_server.conf,找到配置StartPollers的段落:
### Option: StartPollers
# Number of pre-forked instances of pollers.
#
# Mandatory: no
# Range: 0-1000
# Default:
# StartPollers=5
取消StartPollers=一行的注釋或者直接在后面增加:
StartPollers=10
將StartPollers改成多少取決於服務器的性能和監控的數量,將StartPollers設置成12之后就再沒有遇到過警報。如果內存足夠的話可以設置更高。