zabbix使用之常用功能使用心得


ZABBIX 使用

Written by: Jane.Hoo

1.zabbix監控概念介紹

項目(iterm)定義收集被監控的數據項,如收集被監控機內存使用情況

應用集(application)一些項目的匯總,目錄與文件的關系

觸發器(trigger)通過項目獲得的數據或通過計算來判斷主機狀態的定義

圖形(graph)通過項目獲得數據,以圖形方式展示

模板(template)可將項目,集合,觸發器,圖形匯總為一個模板,直接連接到一類主機,實現批量定義

主機(host)被監控對象,服務器或其他網絡設備

主機組(host group)一類主機可以定義到一個主機組

動作(action)觸發器,自動發現或自動注冊狀態改變觸發的動作

自動發現(discovery)通過定義自動發現條件,配合動作批量加監控主機

維護(maintenace)定義主機什么時候處於維護狀態

拓撲圖(map)可以繪畫出主機的拓撲

屏幕(screen)多種類型顯示到一個screen里

IT服務(IT service)有時一台主機宕掉可能不會影響服務,IT服務定義服務容忍額限度

儀表盤(dashboard)監控的整體狀態顯示

總覽(overview)顯示所有的機器的數據或者觸發器狀態

web:通過定義場景監控web服務器

最新數據(last data)可查看主機項目獲得的最新數據

事件(event)觸發器狀態改變的記錄

報表(reports)創建事件報表

資產記錄(Inventory)可以記錄相關服務器的硬件信息等

告警類型(media types)定義相關告警方式

2.configuration

 2.1 Host groups         

Host groups、主機組,是主機的一個集合,定義主機組所包含的模板及主機列表。

注意點:1、建主機鏈接到主機組后,可以繼承主機組所包含的所有模板;

            2、一個主機可以隸屬於多個主機組;

            3、組名必須唯一,不得與其它組名重復;

            4、新建的組允許不包含任何模板和主機;

            5、zabbix內置的主機組不允許刪除;

            6、建議根據應用模塊划分主機組;

2.2 Templates

Templates 模板,一系列監控項、觸發器、圖、場景的集合

注意點:

1、  模板定義的時候可以定義此模板應用到哪些主機主和模板;模板修改后,對應的主機監控項目也會改變;

2、  模板定義時可以嵌套模板,嵌套模板是一個繼承的關系,會繼承被嵌套模板的所有子項;

3、   如果模板間有相互沖突的項目(使相同鍵值的項目),做相互關聯或一同應用到同一主機的時候,報錯。

4、  模板可以克隆,只需修改模板名稱就可以在其基礎上做修改,很快地完成一個新模板;完全克隆,比clone多一點東西,例如screen;

5、  Delete:刪除模板,如果主機有嵌套當前模板,那么item依舊保留在主機上,主機不受影響;

6、  Delete and clear:刪除模板,如果主機有嵌套當前模板,那么item也會被刪除掉;

7、  模板可以外部導入也可以內部新建; 

2.3 Hosts

Hosts是zabbix監控的基本載體,所有監控項目都是基於hosts的。

注意點:1、主機可以外部導入也可以內部新建;

            2、主機名(hostname)不允許重復,由字母、下划線、數字,標點符號組成,必須和客戶端配置文件中的hostname保持一致;

            3、unlink:取消和模板的關聯,但是已有的監控項目不會刪除;

            4、unlink and clear: 取消和模板的關聯並刪除已有的監控項目;

            5、hostname必須與客戶端配置文件內的hostname一致。
            但也可以通過在服務器端的/etc/hosts文件里添加對應的ip 主機名配置,實現即使和客戶端hostname不一致也不影響監控,但此時hostname必須和服務器端/etc/hosts中的hostname保持一致。

2.3.1 Items

Items可以在單台機器上添加,也可以在templates上面添加,然后再通過模板連接到主機上。定義Items需要先定義key。

在zabbix agentd端查看配置文件zabbix_agentd.conf查看記錄,如:

include=/usr/local/zabbix/etc/zabbix_agentd.conf.d/

修改對應目錄下的參數定義文件:

----------------------------------------------------------------------------

|   key的格式為:UserParameter=,

|   key的組成:數字、字母、下划線

|   傳遞參數UserParameter=wc[*],grep -c "$2" $1

|     zabbix_get -s 127.0.0.1 -k wc[/etc/passwd,root]

----------------------------------------------------------------------------

UserParameter=count.line.passwd,wc -l /etc/passwd|awk '{print $1}'

修改配置文件后,需要重啟客戶端:

service zabbix_agentd restart

key創建成功后,通過如下命令來檢測:

zabbix_get -s 127.0.0.1 -k count.line.passwd

注意:1、可以定義該值得更新頻率(upate interval)、歷史數據保留天數,整體變化趨勢保留時間段;

          2、定義完成后,點擊status啟動/禁用該監控項;         

2.3.2 Triggers

Triggers是觸發器,當Items采集值滿足trigger觸發條件時,就會產生actions。每一個trigger必須對應一個trigger,但一個item可以對應多個trigger。通過設置多個trigger,實現觸發條件不同,達到不同級別的告警。

         Expression:選擇對應的item、觸發方式及觸發值

                     ---------------------------------------------------------------------------

                     |   last value 最近一次采集

                     |   maximal value for period of time:一段時間內的最大值

                     | sum(600) 600秒內所有值的和

                     | sum(#5)  最近5秒值得和  //可以用#表示一個變量有不同的意思

                     | last(#5)  返回第5個值

                     |avg,count,last,minand max 支持在某個時間段之前的。avg(1h,1d),

                     | 表示1小時之前的1天的平均值

                     | 觸發器表達式中支持單位符號,5m(分鍾)代替300s(秒)

                ----------------------------------------------------------------------------

         severity:告警級別

         注意:1、引用自template的trigger觸發值是不能單獨修改的,必須在template中修改,或是復制一個同樣的trigger再修改,然后禁用掉之前的。

2.3.3 Graphs

新建圖表選項的各項參數說明:

Items屬性展示:          

在創建圖表的過程中,我們可以隨時預覽修改的配置圖表,點擊標簽preview即可。備注:如果是template預覽時沒有意義的,畢竟沒有任何數據。關於觸發器限制:如果圖表的高度小於120像素,那么圖標上將不會展示觸發器相關信息。

2.4 web

web monitoring 是用來監控web程序的,可以監控到web程序的下載速度、返回碼及響應時間,還支持一組連續的web動作作為一個整體來監控。

scenaria:必須選擇host后才能創建,zabbix的所有items都必須創建在hosts上

Application:選擇這個scenario所在的application組

Name:   scenario(方案)的名字

status:   默認為active

variables: 變量定義,這里定義的變量可以在后續的steps中使用

steps: web程序的各個步驟,選擇add新增一個Login的step,來模擬用戶登錄

         URL:監控的web頁面

         POST:傳遞給頁面的參數,多個參數用&相連

         Timeout:超時時間

         Required:頁面中能匹配到字符,匹配不到即認為錯誤

         Status codes:頁面返回碼

定義完成后,就可以在web頁面看到監控的狀態和圖示,可以給對應的scenaria建立對應的觸發器

2.4 Actions

action是告警動作,當觸發器條件被滿足時,就會執行指定的action

action支持如下事件:觸發器事件、發現事件、自動注冊時間、內部事件

action的conditions配置:

   ----------------------------------------------------------------------------------------

   |       Type of calculation:各種條件之間的關系

   |        condition:機器不在維護狀態

   |                   觸發器狀態為problems

   |   new condition:可以定位到某個、某些或全部觸發器

   ----------------------------------------------------------------------------------------

action的operations配置:        

2.5 Medias

    一般使用scripts媒介,可以實現郵件、微信、短信告警方式

2.6 Users

         創建用戶時可以根據用戶的不同作用划分到不同的組,media中天入告警接受地址及告警接受時間等信息。

user:  用戶姓名、所屬組別、密碼、語言集、每頁顯示行數及首頁設置

media:一個用戶可以有多個媒介,接收地址,接收時間段,狀態

permissions: 對應主機組、主機、模板的讀寫權限 

2.6 Screens

將多種信息放在一起展示,便於集中展示某個host的多個信息,或者比較多個host的同一種信息。這些信息可以是graphs、maps、server infos等等,幾乎涵蓋zabbix所有的監控信息。

         選擇建立幾行幾列的screens

         點擊change,添加響應信息,設置對齊方式

2.7 Maps

添加關於主機的拓撲圖,configuration-maps,在右上角可以create maps或者import map

創建圖中的+-可以增加主機,link說明主機的連接 情況。

2.8 Discovery

通過zabbix的discovery功能自動添加主機並附加相應模版到制定的主機組內

http://blog.chinaunix.net/uid-26204366-id-4318443.html

 

本文轉載自:http://blog.itpub.net/30109892/viewspace-1815185/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM