zabbix 基礎概念及工作原理整理
什么是 zabbix?
Zabbix 能監控各種網絡參數,保證服務器系統的安全運營;並提供靈活的通知機制以讓系統管理員快速定位、解決存在的各種問題。是一個基於 Web 界面的提供分布式系統監視以及網絡監視功能的企業級的開源解決方案。
主要有以下幾個功能組件組成:
參考官檔:https://www.zabbix.com/documentation/4.0/zh/manual/introduction/overview
Server
Zabbix server 是 Zabbix軟件的核心組件,agent 向其報告可用性、系統完整性信息和統計信息。server也是存儲所有配置信息、統計信息和操作信息的核心存儲庫。
數據庫
所有配置信息以及 Zabbix 采集到的數據都被存儲在數據庫中。
Web 界面
該界面是 Zabbix server 的一部分,通常(但不一定)和 Zabbix server 運行在同一台物理機器上。
Proxy
Zabbix proxy 可以代替 Zabbix server采集性能和可用性數據。Zabbix proxy在Zabbix的部署是可選部分;但是proxy的部署可以很好的分擔單個Zabbix server的負載。
Agent
Zabbix agents 部署在被監控目標上,用於主動監控本地資源和應用程序,並將收集的數據發送給 Zabbix server。
監控功能
主機的性能監控、網絡設備性能監控、數據庫性能監控、多種告警方式、詳細的報表圖表繪制;
監控主機 zabbix 有專用的 agent,可以監控Linux、Windows、FreeBSD等。
監控網絡設備 zabbix 通過SNMP,SSH等
可監控對象:
- 設備:服務器、路由器、交換機等
- 軟件:OS、網絡、應用程序等
- 主機性能指標監控
- 故障監控:宕機,服務器不可用,主機不可達
zabbix 工作原理
一個監控系統運行的大概流程是這樣的:
zabbix agent 需要安裝到被監控的主機上,它負責定期收集各項數據,並發送到 zabbix server 端,zabbix server 將數據存儲到數據庫中,zabbix web 根據數據在前端進行展示和繪圖。這里 agent 收集數據分為主動和被動兩種模式:
主動:agent 請求server 獲取主動的監控項列表,並主動將監控項內需要檢測的數據提交給server / proxy
被動:server 向 agent 請求獲取監控項的數據,agent 返回數據。
zabbix 工作進程
參考官檔:https://www.zabbix.com/documentation/4.0/zh/manual/concepts
默認情況下 zabbix 包含6個進程:zabbix_agentd、zabbix_get、zabbix_proxy、zabbix_sender、zabbix_server,另外一個zabbix_java_gateway是可選的,這個需要單獨安裝。
zabbix_agentd
客戶端守護進程,此進程收集客戶端數據,例如cpu負載、內存、硬盤使用情況等。
zabbix_get
zabbix 工具,單獨使用的命令,通常在 server 或者 proxy 端執行獲取遠程客戶端信息的命令。通常用於排錯。例如在 server 端獲取不到客戶端的內存數據,可以使用 zabbix_get 獲取客戶端的內容的方式來做故障排查。
zabbix_sender
zabbix 工具,用於發送數據給 server 或者 proxy,通常用於耗時比較長的檢查。很多檢查非常耗時間,導致 zabbix 超時。於是在腳本執行完畢之后,使用 sender 主動提價數據。
zabbix_server
zabbix 服務端守護進程。zabbix_agentd、zabbix_get、zabbix_sender、zabbix_proxy、zabbix_java_gateway的數據最終都是提交到server(說明:當然不是數據都是主動提交給zabbix_server,也有的是 server 主動去取數據)
zabbix_proxy
zabbix 代理守護進程。功能類似server,唯一不同的是它只是一個中轉站,它需要把收集到的數據提交/被提交到 server 里。
zabbix_java_gateway
zabbix2.0之后引入的一個功能。顧名思義:Java網絡,類似agentd,但是只用於 Java 方面。需要特別注意的是,它只能主動去獲取數據,而不能被動獲取數據。它的數據最終會給到 server 或者proxy。
zabbix 常用術語解釋
參考官檔:https://www.zabbix.com/documentation/4.0/zh/manual/definitions
1)主機(host):要監控的網絡設備,可由IP或DNS名稱指定;
2)主機組(host group):主機的邏輯容器,可以包含主機和模板,但同一個組織內的主機和模板不能互相鏈接;主機組通常在給用戶或用戶組指派監控權限時使用;
3)監控項(item):一個特定監控指標的相關的數據;這些數據來自於被監控對象;item是zabbix進行數據收集的核心,相對某個監控對象,每個item都由"key"標識;
4)觸發器(trigger):一個表達式,用於評估某監控對象的特定item內接收到的數據是否在合理范圍內,也就是閾值;接收的數據量大於閾值時,觸發器狀態將從"OK"轉變為"Problem",當數據再次恢復到合理范圍,又轉變為"OK";
5)事件(event):觸發一個值得關注的事情,比如觸發器狀態轉變,新的agent或重新上線的agent的自動注冊等;
6)動作(action):指對於特定事件事先定義的處理方法,如發送通知,何時執行操作;
7)報警升級(escalation):發送警報或者執行遠程命令的自定義方案,如每隔5分鍾發送一次警報,共發送5次等;
8)媒介(media):發送通知的手段或者通道,如Email、Jabber或者SMS等;
9)通知(notification):通過選定的媒介向用戶發送的有關某事件的信息;
10)遠程命令(remote command):預定義的命令,可在被監控主機處於某特定條件下時自動執行;
11)模板(template):用於快速定義被監控主機的預設條目集合,通常包含了item、trigger、graph、screen、application以及low-level discovery rule;模板可以直接鏈接至某個主機;
12)應用(application):一組item的集合;
13)web場景(web scennario):用於檢測web站點可用性的一個活多個HTTP請求;
14)前端(frontend):Zabbix的web接口;
zabbix 監控架構
在實際監控架構中,zabbix根據網絡環境、監控規模等 分了三種架構:server-client、master-node-client、server-proxy-client 三種。
1、server-client 架構
zabbix的最簡單的架構,監控服務器和被監控機之間不經過任何代理,直接由 zabbix server 和 zabbix agentd之間進行數據交互。適用於網絡比較簡單,設備比較少的監控環境。
2、server-proxy-client 架構
其中 proxy 是server、client 之間溝通的一個橋梁,proxy 本身沒有前端,而且其本身並不存放數據,只是將 agentd 發來的數據暫時存放,而后再提交給server,該架構經常是和 master-node-client 架構做比較的架構,一般適用於跨機房、跨網絡的中型網絡架構的監控。
3、master-node-client 架構
該架構是 zabbix 最復雜的監控架構,適用於跨網絡、跨機房、設備較多的大環境。每個node 同時也是一個 server 端,node下面可以接 proxy,也可以直接接client。node有自己的配置文件和數據庫,其要做的是將配置信息和監控數據向 master 同步,master 的故障或損壞不影響 node 其下的架構的完整性。