zabbix3.4監控Windows-CPU使用率磁盤IO磁盤監控閾值郵件報警詳細配置


  • Windows安裝zabbix-agent
  • 監控Windows-CPU使用率
  • 監控Windows-磁盤IO性能監控
  • 監控Windows/Linux-磁盤觸發器閾值更改
  • 監控Windows-網卡自動發現規則
  • 配置服務端郵件報警功能
 

1、Windows服務器需要先安裝zabbix-agent代理

Zabbix-agent3.4版本:https://www.zabbix.com/downloads/3.4.6/zabbix_agents_3.4.6.win.zip
Zabbix手冊安裝方法:https://www.zabbix.com/documentation/3.4/zh/manual/concepts/agent

概況

Zabbix agent部署在監控的目標上,主動監測本地的資源和應用(硬件驅動,內存,處理器統計等)。

Zabbix agent收集本地的操作信息並將數據報告給Zabbix server用於進一步處理。一旦出現異常 (比如硬盤空間已滿或者有崩潰的服務進程), Zabbix server會主動警告管理員指定機器上的異常。

Zabbix agents的極端高效緣於它可以利用本地系統調用來完成統計數據的收集。

被動(passive)和主動(active)檢查

Zabbix agents可以執行被動和主動兩種檢查方式。

Windows上的Zabbix agent是以Windows服務的形式運行的。

您可以在主機上運行Zabbix agent的單個實例或多個實例。

單個實例可以使用默認配置文件或命令行中指定的配置文件。

在多個實例的情況下,每個agent實例必須有自己獨立的配置文件(其中一個實例可以使用默認配置文件)。

以下命令參數可以在Zabbix agent中使用:

參數 描述n
UNIX 和 Windows agent
-c --config <config-file> 配置文件的絕對路徑。
您可以使用此選項來制定配置文件,而不是使用默認文件。\\在UNIX中, 默認文件是/usr/local/etc/zabbix_agentd.conf 要么通過 compile-time 變量 --sysconfdir 或者 --prefix來設置
在Windows中,默認文件是 c:\zabbix_agentd.conf
-p --print 顯示已知監控項並推出
Note: 為了同時返回用戶參數user parameter 您必須制定配置文件 (如果不是在指定位置的話).
-t --test <item key> 測試指定監控項並退出。
Note:為了同時返回用戶參數 user parameter 您必須制定配置文件 (如果不是在指定位置的話).
-h --help 顯示幫助信息
-V --version 顯示版本號
僅UNIX agent
-R --runtime-control <option> 執行管理功能。參見 運行時控制. runtime control.
僅Windows agent
-m --multiple-agents 使用多agent實例 (使用 -i,-d,-s,-x )。
T為了區分實例的服務名稱,每項服務名都會包涵來自配置文件里的主機名值。
僅Windows agent (功能)
-i --install 以服務的形式安裝Zabbix Windows agent
-d --uninstall 卸載Zabbix indows agent服務
-s --start 開始Zabbix Windows agent服務
-x --stop 停止bbix Windows agent 服務

將上面下載的zabbix_agents_3.4.6.win.zip文件解壓放到c盤里面

然后需要修改conf里面的zabbix_agentd.win.conf這個是配置文件

需要修改的配置選項:
LogFile=C:\zabbix_agents_3.4.6.win\log\zabbix_agentd.log ##這個是日志存放的地址
Server=192.168.10.10 ##這個是zabbix服務端的地址
ServerActive=192.168.10.10:10050 ##10050是zabbix-server和zabbix-agent通信的端口
Hostname=192.168.10.11 ##這個填寫需要監控的Windows服務器IP

管理員權限運行cmd,如下圖顯示installed successfully代表成功了,再去服務里面啟動zabbix-agent

##下面這一串命令是把agentd服務啟動
C:\zabbix_agents_3.4.6.win\bin\win64\zabbix_agentd -i -m -c C:\zabbix_agents_3.4.6.win\conf\zabbix_agentd.win.conf

 

2、監控Windows-CPU使用率

在zabbix中,默認的模板不帶CPU使用率的監控,為減少重復工作率,在template模板下創建一個模板
然后下次新增監控的主機服務器直接關聯相關的模板即可!
在配置---->模板---->創建模板
模板名稱:Template Windows CPU usage
 

 

創建完模板就開始創建監控項
名稱:CPU usage%
鍵值:perf_counter[\Processor(_Total)\% Processor Time]
信息類型:浮點數
單位:%

 

創建完監控項以后新建觸發器,可以在表達式構造器測試這個觸發器是否有用

名稱:cpu used  is more than 80%

嚴重性:一般嚴重

表達式:{Template Windows CPU usage:perf_counter[\Processor(_Total)\% Processor Time].avg(5m)}>80

創建完觸發器再添加一個圖形查看cpu使用率圖表

名稱:CPU使用率

監控項:Template Windows CPU usage: CPU使用率

添加成功以后可以查看CPU圖形表了,有數據代表成功監控了!

 

3、監控Windows-磁盤IO性能監控

▼注意:這個IO模版是收集整個服務器所有物理硬盤的IO數據的
比如:服務器有一個固態硬盤,一個機械硬盤,他是固態硬盤和機械硬盤數據加起來顯示出來
監控數據庫服務器的時候,最好分別對待固態硬盤和機械硬盤,使用不同的觸發器閥值
因為是機器上所有硬盤加起來的,要針對固態硬盤和機械硬盤區分開觸發器就非常困難了

WIN下的IO性能監控,是通過調用性能計數器中的參數來獲取

目前已經統計成模板,可直接使用,模板包括了圖形和上圖所示的監控項

模板下載地址:https://files.cnblogs.com/files/Sungeek/Windows%E7%9B%91%E6%8E%A7%E7%A3%81%E7%9B%98IO.xml

 4、監控Windows-磁盤觸發器閾值更改

選擇配置--->模板--->(Template OS Linux/Template OS Windows)

我這邊是監控Windows所以修改Windows的模板,如果是監控Linux可以修改Linux的模板

默認是1小時更新一次,修改成600秒,就是10分鍾更新一次,10分鍾后就能看到網卡和磁盤的監控值了!

 

選擇配置--->模板--->(Template OS Linux/Template OS Windows)--->Mounted filesystem discovery--->觸發器類型

我這邊是已經修改好的了,沒有修改的或者沒有這一觸發項的,可以點擊右上角(創建觸發器原型)

名稱:Free disk space is less than 50GB on volume {#FSNAME}

表達式:{Template OS Windows:vfs.fs.size[{#FSNAME},free].last(0)}<50000000000

選擇配置--->模板--->(Template OS Linux/Template OS Windows)--->Mounted filesystem discovery--->監控項類型

我這邊是已經修改好的了,沒有修改的或者沒有這一監控項的,可以點擊右上角(創建監控項原型)

名稱:Free disk space on $1

表達式:vfs.fs.size[{#FSNAME},free]

單位:B

更新間隔:1m或者60s都可以

 

5、監控Windows-網卡自動發現規則

問題描述:這個一般是默認的windows模板里面包含自動發現服務器網卡的,但是會自動發現很多其他的網卡什么之類的圖形東東

解決辦法:你直接刪除對應的圖形是沒用的,因為自動發現規則會再次自動發現,所以需要把規則改一下

1.自動發現規則里面---->Windows service discovery(這個可以禁用掉)

2.管理--->一般--->正則表達式--->Network interfaces for discovery(加入下圖的參數,這樣就設定不會自動發現以這些參數網卡了)

 

1    »    Microsoft    [結果為假]
2    »    Teredo    [結果為假]
3    »    Qos    [結果為假]
4    »    WFP    [結果為假]
5    »    RAS    [結果為假]
6    »    WAN    [結果為假]
7    »    ^Nu[0-9.]*$    [結果為假]
8    »    ^[Ss]ystem$    [結果為假]
9    »    ^[Ll]o[0-9.]*$    [結果為假]
10    »    ^NULL[0-9.]*$    [結果為假]
11    »    ^(In)?[Ll]oop[Bb]ack[0-9._]*$    [結果為假]
12    »    ^Software Loopback Interface    [結果為假]
13    »    Network traffic on Broadcom NetXtreme Gigabit Ethernet    [結果為假]

 

 

6、配置服務端郵件報警功能

我這邊用到的是騰訊企業郵箱

如下圖所示,管理--->報警媒介類型--->Email

要注意的是用戶名稱這里要寫你的企業郵箱賬號,密碼填寫密碼

一開始我以為是發郵件的名稱,搞得沒法發郵件,可以使用QQ郵箱

SMTP服務器:smtp.exmail.qq.com

端口:465

SMTP電郵:XXXX@qq.com

用戶名稱:XXXX@qq.com

配置--->動作--->觸發器

創建一個觸發器來發郵件報警

操作:

默認標題:故障{TRIGGER.STATUS},服務器:{HOSTNAME1}發生: {TRIGGER.NAME}故障!

消息內容:

告警主機:{HOSTNAME1}
告警時間:{EVENT.DATE}{EVENT.TIME}
告警等級:{TRIGGER.NAME}
告警項目:{TRIGGER.KEY1}
問題詳情:{ITEM.NAME}:{ITEM.VALUE}
當前狀態:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{ENET.ID}

 

恢復操作:

默認標題:恢復{TRIGGER.STATUS}, 服務器:{HOSTNAME1}: {TRIGGER.NAME}已恢復!

消息內容:

告警主機:{HOSTNAME1}
告警時間:{EVENT.DATE}{EVENT.TIME}
告警等級:{TRIGGER.NAME}
告警項目:{TRIGGER.KEY1}
問題詳情:{ITEM.NAME}:{ITEM.VALUE}
當前狀態:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{ENET.ID}

 

確認操作:

默認標題:已確認: {TRIGGER.NAME}

消息內容:

{USER.FULLNAME} 已經確認的問題 {ACK.DATE} {ACK.TIME} 以下消息:
{ACK.MESSAGE}

目前的問題狀態是{EVENT.STATUS}

最后配置報警媒介,也就是觸發報警條件,要下發郵件通知道哪個郵箱里面

點擊那個小頭像,然后進入到用戶基本資料,選擇報警媒介進行設置

可以自己選擇嚴重性級別,設置完啟用了以后,報警功能就設置完成了!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM