ZABBIX 使用
Written by: Jane.Hoo
1.zabbix監控概念介紹
項目(iterm)定義收集被監控的數據項,如收集被監控機內存使用情況
應用集(application)一些項目的匯總,目錄與文件的關系
觸發器(trigger)通過項目獲得的數據或通過計算來判斷主機狀態的定義
圖形(graph)通過項目獲得數據,以圖形方式展示
模板(template)可將項目,集合,觸發器,圖形匯總為一個模板,直接連接到一類主機,實現批量定義
主機(host)被監控對象,服務器或其他網絡設備
主機組(host group)一類主機可以定義到一個主機組
動作(action)觸發器,自動發現或自動注冊狀態改變觸發的動作
自動發現(discovery)通過定義自動發現條件,配合動作批量加監控主機
維護(maintenace)定義主機什么時候處於維護狀態
拓撲圖(map)可以繪畫出主機的拓撲
屏幕(screen)多種類型顯示到一個screen里
IT服務(IT service)有時一台主機宕掉可能不會影響服務,IT服務定義服務容忍額限度
儀表盤(dashboard)監控的整體狀態顯示
總覽(overview)顯示所有的機器的數據或者觸發器狀態
web:通過定義場景監控web服務器
最新數據(last data)可查看主機項目獲得的最新數據
事件(event)觸發器狀態改變的記錄
報表(reports)創建事件報表
資產記錄(Inventory)可以記錄相關服務器的硬件信息等
告警類型(media types)定義相關告警方式
2.configuration
2.1 Host groups
Host groups、主機組,是主機的一個集合,定義主機組所包含的模板及主機列表。
注意點:1、建主機鏈接到主機組后,可以繼承主機組所包含的所有模板;
2、一個主機可以隸屬於多個主機組;
3、組名必須唯一,不得與其它組名重復;
4、新建的組允許不包含任何模板和主機;
5、zabbix內置的主機組不允許刪除;
6、建議根據應用模塊划分主機組;
2.2 Templates
Templates 模板,一系列監控項、觸發器、圖、場景的集合
注意點:
1、 模板定義的時候可以定義此模板應用到哪些主機主和模板;模板修改后,對應的主機監控項目也會改變;
2、 模板定義時可以嵌套模板,嵌套模板是一個繼承的關系,會繼承被嵌套模板的所有子項;
3、 如果模板間有相互沖突的項目(使相同鍵值的項目),做相互關聯或一同應用到同一主機的時候,報錯。
4、 模板可以克隆,只需修改模板名稱就可以在其基礎上做修改,很快地完成一個新模板;完全克隆,比clone多一點東西,例如screen;
5、 Delete:刪除模板,如果主機有嵌套當前模板,那么item依舊保留在主機上,主機不受影響;
6、 Delete and clear:刪除模板,如果主機有嵌套當前模板,那么item也會被刪除掉;
7、 模板可以外部導入也可以內部新建;
2.3 Hosts
Hosts是zabbix監控的基本載體,所有監控項目都是基於hosts的。
注意點:1、主機可以外部導入也可以內部新建;
2、主機名(hostname)不允許重復,由字母、下划線、數字,標點符號組成,必須和客戶端配置文件中的hostname保持一致;
3、unlink:取消和模板的關聯,但是已有的監控項目不會刪除;
4、unlink and clear: 取消和模板的關聯並刪除已有的監控項目;
5、hostname必須與客戶端配置文件內的hostname一致。
但也可以通過在服務器端的/etc/hosts文件里添加對應的ip 主機名配置,實現即使和客戶端hostname不一致也不影響監控,但此時hostname必須和服務器端/etc/hosts中的hostname保持一致。
2.3.1 Items
Items可以在單台機器上添加,也可以在templates上面添加,然后再通過模板連接到主機上。定義Items需要先定義key。
在zabbix agentd端查看配置文件zabbix_agentd.conf查看記錄,如:
include=/usr/local/zabbix/etc/zabbix_agentd.conf.d/
修改對應目錄下的參數定義文件:
----------------------------------------------------------------------------
| key的格式為:UserParameter=,
| key的組成:數字、字母、下划線
| 傳遞參數UserParameter=wc[*],grep -c "$2" $1
| zabbix_get -s 127.0.0.1 -k wc[/etc/passwd,root]
----------------------------------------------------------------------------
UserParameter=count.line.passwd,wc -l /etc/passwd|awk '{print $1}'
修改配置文件后,需要重啟客戶端:
service zabbix_agentd restart
key創建成功后,通過如下命令來檢測:
zabbix_get -s 127.0.0.1 -k count.line.passwd
注意:1、可以定義該值得更新頻率(upate interval)、歷史數據保留天數,整體變化趨勢保留時間段;
2、定義完成后,點擊status啟動/禁用該監控項;
2.3.2 Triggers
Triggers是觸發器,當Items采集值滿足trigger觸發條件時,就會產生actions。每一個trigger必須對應一個trigger,但一個item可以對應多個trigger。通過設置多個trigger,實現觸發條件不同,達到不同級別的告警。
Expression:選擇對應的item、觸發方式及觸發值
---------------------------------------------------------------------------
| last value 最近一次采集
| maximal value for period of time:一段時間內的最大值
| sum(600) 600秒內所有值的和
| sum(#5) 最近5秒值得和 //可以用#表示一個變量有不同的意思
| last(#5) 返回第5個值
|avg,count,last,minand max 支持在某個時間段之前的。avg(1h,1d),
| 表示1小時之前的1天的平均值
| 觸發器表達式中支持單位符號,5m(分鍾)代替300s(秒)
----------------------------------------------------------------------------
severity:告警級別
注意:1、引用自template的trigger觸發值是不能單獨修改的,必須在template中修改,或是復制一個同樣的trigger再修改,然后禁用掉之前的。
2.3.3 Graphs
新建圖表選項的各項參數說明:
Items屬性展示:
在創建圖表的過程中,我們可以隨時預覽修改的配置圖表,點擊標簽preview即可。備注:如果是template預覽時沒有意義的,畢竟沒有任何數據。關於觸發器限制:如果圖表的高度小於120像素,那么圖標上將不會展示觸發器相關信息。
2.4 web
web monitoring 是用來監控web程序的,可以監控到web程序的下載速度、返回碼及響應時間,還支持一組連續的web動作作為一個整體來監控。
scenaria:必須選擇host后才能創建,zabbix的所有items都必須創建在hosts上
Application:選擇這個scenario所在的application組
Name: scenario(方案)的名字
status: 默認為active
variables: 變量定義,這里定義的變量可以在后續的steps中使用
steps: web程序的各個步驟,選擇add新增一個Login的step,來模擬用戶登錄
URL:監控的web頁面
POST:傳遞給頁面的參數,多個參數用&相連
Timeout:超時時間
Required:頁面中能匹配到字符,匹配不到即認為錯誤
Status codes:頁面返回碼
定義完成后,就可以在web頁面看到監控的狀態和圖示,可以給對應的scenaria建立對應的觸發器
2.4 Actions
action是告警動作,當觸發器條件被滿足時,就會執行指定的action
action支持如下事件:觸發器事件、發現事件、自動注冊時間、內部事件
action的conditions配置:
----------------------------------------------------------------------------------------
| Type of calculation:各種條件之間的關系
| condition:機器不在維護狀態
| 觸發器狀態為problems
| new condition:可以定位到某個、某些或全部觸發器
----------------------------------------------------------------------------------------
action的operations配置:
2.5 Medias
一般使用scripts媒介,可以實現郵件、微信、短信告警方式
2.6 Users
創建用戶時可以根據用戶的不同作用划分到不同的組,media中天入告警接受地址及告警接受時間等信息。
user: 用戶姓名、所屬組別、密碼、語言集、每頁顯示行數及首頁設置
media:一個用戶可以有多個媒介,接收地址,接收時間段,狀態
permissions: 對應主機組、主機、模板的讀寫權限
2.6 Screens
將多種信息放在一起展示,便於集中展示某個host的多個信息,或者比較多個host的同一種信息。這些信息可以是graphs、maps、server infos等等,幾乎涵蓋zabbix所有的監控信息。
選擇建立幾行幾列的screens
點擊change,添加響應信息,設置對齊方式
2.7 Maps
添加關於主機的拓撲圖,configuration-maps,在右上角可以create maps或者import map
創建圖中的+-可以增加主機,link說明主機的連接 情況。
2.8 Discovery
通過zabbix的discovery功能自動添加主機並附加相應模版到制定的主機組內
http://blog.chinaunix.net/uid-26204366-id-4318443.html
本文轉載自:http://blog.itpub.net/30109892/viewspace-1815185/