zabbix如何監控Nvidia顯卡的各項指標?


如何實現zabbix監控windows機器的N卡GPU指標呢?
Nvidia卡在安裝驅動程序的時候,已經自帶安裝了一個命令行工具來獲取顯卡的各個性能指標值

在windows機器上,我們可以把該路徑加入環境變量中,在cmd命令行中輸入nvidia-smi.exe,即可看到當前顯卡的運行狀態

當然,我們還可以根據該工具,返回我們特定想要的某些性能指標,比如:

第1張顯卡已經使用的顯存大小,單位是MiB

-i 0 表示第一張顯卡
--query-gpu=memory.used 表示查詢顯存使用值
--format=csv,noheader,nounits 表示csv方式格式化輸出,去掉首行,去掉單位

當然,我們還可以獲取其他的值,比如顯存總大小

如何將這些值反饋給zabbix並進行實時監控及曲線繪圖呢
1、編寫獲取性能指標的bat腳本,腳本內容詳見下圖

記住紅框1中的腳本名稱及路徑
根據自己需求,修改紅框2中需要監控的GPU性能指標項
【如果不知道有哪些性能指標監控項,可以在cmd命令行中輸入 nvidia-smi.exe --help-query-gpu 來進行查看,也可以查看官方自帶的pdf介紹文檔】

2、修改zabbix客戶端配置,添加下圖中內容


其中紅框中 UserParameter=[第一項],[第二項]
【第一項】為鍵名,之后在zabbix平台中添加【監控項】會使用該值
【第二項】為鍵值,zabbix客戶端會去運行該路徑下的腳本,將返回的結果傳給服務端,務必保證路徑、bat腳本名與上一步創建的腳本一致

修改完配置后,重啟zabbix-agent服務

3、再zabbix監控平台添加監控項
這一步和之前文章介紹的添加監控項步驟類似
如果是直接使用獲取的監控數值,則新建類型為【zabbix客戶端】的監控項,如下圖

如果是要使用獲取的監控數值,再進行計算,比如:計算GPU使用率,則新建類型為【可計算的】的監控項,如下圖

4、最后,就是根據監控項,添加儀表盤,生成對應的圖表曲線


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM