當生產環境中需要監控海量的機器的時候,特別是像58、趕集這類同城性質的大網站,或者京東、阿里雲這樣的造節電商,每次活動、大促都需要添加很多機器來應對海量用戶流量,每天都有可能上架新的機器、或者添加新的容器。那么機器及容器的運行情況都是通過監控來獲取運行狀態的。然而每次如果通過繁瑣的運維流程去人工添加機器監控是非常麻煩且低效的,為了能夠避免公司內部人員的溝通成本、提升公司運維的工作效率,zabbix可以通過自動發現來完成自動發現需要監控的機器,並自動把機器加入到公司監控網,實現自動監控報警服務。
一、部署自動發現
登陸web監控界面,如上圖:點擊 配置-->主機,查看當前監控主機中只有zabbix server自己一台機器。一會我們配置自動發現,驗證的方法就是這個頁面除了本機以外,自動新添加了機器agent.ayitula.com(192.168.10.41)這台機器,並實現監控。
點擊 配置--->自動發現
你會發現該頁面中已經有一個自動發現規則了,但是是禁用的,默認是對192.168.0.1-254這個網段做自動發現的,(具體為啥是這個網段呢,可能開發自己用的就是這個網段,或者為了方便大家,開發覺得很多人喜歡用這個網段吧)這個可能不適合你的網段,你可以通過以下兩種方式自己創建自動發現規則:
1)修改他默認的規則,把里面的網段改成自己的網段 2)自己創建一個自動發現規則,本文中我選擇的就是這種方式。
點擊右上角的 創建發現規則,看下圖
如上圖所示,填寫的時候,自己好好參考一下我的說明,這里要說的還是以下幾點
名稱這塊: 別到最后你都不知道你起了的名稱是何意義。
更新間隔: 我為了試驗效果,快點完成發現,所以我選的5s,現實生成環境你敢這么搞,你的服務器就會死的快一些。因為監控服務器會創建一些進程去發現機器,會產生大量進程,建議這塊選1小時以上。
IP范圍: 為了減少發現服務器創建大量的進程,我就選了11個IP。
好了,添加完成后你能看到你添加的發現規則,並且是 已啟用 狀態,建議你添加完確認一下
自動發現只能發現主機,不能實現自動添加主機並實現監控,如果你想讓發現的主機自動添加到監控列表,那么你還需要去配置菜單中的動作選項,具體操作繼續看圖。
注意圖片中的標記10,一定要選自動發現,然后在點創建動作。你會發現,頁面中系統也為你提供了一個動作,和自動發現一樣你可以改這個模板,也可以自己創建,我依然選擇自己創建了。
注意條件選擇是邏輯與的關系,及所有條件都滿足才成立。也就是認為該機器是滿足自動添加條件的。如何添加還需要點擊標記15中的操作
添加添加后你就能看到,除了自帶的以外,多了一個你自己添加的動作,還是注意,要是已啟用狀態。稍等一兩分鍾,去查看一下吧,是否實現了我們開頭提到的監控效果。建議你重啟一下agent!
# systemctl restart zabbix-agent