問題:一直在困惑如果一台服務器的網絡發生故障或者斷開時,怎么第一時間發現並去排查。
思路:利用zabbix平台監控服務器,監控ping這一項,設置一個報警,並使用腳本去提醒與通知,可使用郵件報警/短信報警/釘釘報警/微信報警等。
相關鏈接:
腳本使用釘釘報警:https://www.cnblogs.com/subsea/p/13532736.html
zabbix常用監控項:https://www.cnblogs.com/tyindon/p/10419535.html
一、環境准備
zabbix搭建:centos7.6
zabbix版本:4.0
監控測試的主機:windows10
告警的接收:釘釘
二、添加一台主機,用zabbix監控並測試
1.下載安裝包,在測試主機上安裝(windwos系統)

雙擊安裝,輸入“hostname”;“客戶端的ip”;“zabbix的ip”

2.在zabbix添加主機,並使用一個模板監控
登錄zabbix管理界面,選擇“配置”-“主機-”“創建主機”
填入主機的基本信息;並在”模板“-添加”Template OS Windows“模板


三、添加ping報警到模板里面
登錄zabbix平台,單擊“配置”-“模板”-“Template OS Windows” (這里由於是監控windows主機,而且我使用了這個自帶的模板作為監控。如果你沒用或者用的其他模板,請換你的模板)

選擇”觸發器“-創建”觸發器“
問題表達式插入:{Template OS Windows:agent.ping.nodata(3m)}=1
解釋:如果在3分鍾監控ping都不返回數據,提示報警
恢復表達式插入:{Template App Zabbix Agent:agent.ping.last(3m)}=1
解釋:如果在3分鍾監控ping都能得到數據,提示問題已恢復


四、配置腳本設置釘釘自動發送報警
這里我已經配置好了,參考鏈接:https://www.cnblogs.com/subsea/p/13532736.html
五、關掉客戶機做測試


