今天中午發現zabbix陸續出現Zabbix agent on [HOSTNAME] is unreachable for 5 minutes問題,開始是只是寥寥幾台,沒太在意,吃了頓飯回來發現一大堆,而且持續很久,越3個小時( ⊙ o ⊙ )!觀察后發現全是新加坡地區機器,查看繪圖發現沒圖,而且latest data也沒有,最后一次獲取數據還在大概3h前,然后上機器用zabbix_get、zabbix_agent去測試,數據可以取到,然后度娘、狗狗一大堆沒用的o(╯□╰)o,后來仔細分析只是新加坡的zabbix proxy代理節點監控的一批機器出現問題,導致美東的主zabbix server頁面出現報警,其他地區都是正常的,配置什么的也沒人修改,排除人為因素,想想應該是服務器性能吧?!然后看各種性能參數都很正常,沒啥異常,然后抱着試試心態去仔細閱讀每個配置文件選項分析,后來分許是因為從代理采集到的數據同步到server出現問題,然后調整配置選項DataSenderFrequency=300修改成1s同步一次,然后觀察,畫圖在蹭蹭蹭的瘋長,數據在迅速的同步着,同步完后,報警都消失了,
總結:該問題是由於zabbix Proxy推送數據到zabbix server由於某些原因導致(PS:啥原因,我沒有深究,考慮肯能是網絡問題導致,畢竟由於地理原因導致這種問題時常發生,只是以前出現時間挺短)出現嚴重延遲,導致大片數據采集不到,進而畫圖一大片空白,調整推送時間間隔,完成同步就可以解決。
PS:最后不要忘了把調整過的數據推送間隔改回來,除非你的服務器硬件強悍。(*^__^*) 嘻嘻……☺