之前在 nagios 上建立了 esxi 監控,指標少、配置麻煩、視覺效果差。最近我把 esxi 監控遷移到了 influxdb+grafana 平台上,無論是監控指標、可操作性還是視覺效果都有了很大提升。下面概括一下我的配置過程:
一、安裝 influxdb 和 grafana
具體請參考 influxdb 和 grafana 的文檔。
安裝后在 influxdb 中創建新數據庫,可以命名為:vsphere,然后將該數據庫加入到 grafana數據源中。


二、安裝 telegraf:1.3.4-vsphere2
有一位開源開發者 fork 了 telegraf_v1.3.4,加入了 esxi 監控插件,使用這個版本,可以很方便的獲取 esxi 監控數據,包括 host信息,vm信息,datastore信息:
https://github.com/mkuzmin/telegraf
相信這個esxi 插件以后會被 telegraf 官方社區收錄。
安裝、配置上述鏈接中的telegraf,確保將數據寫入 influxdb。參考配置:
[[inputs.vsphere]]
server = "192.168.1.4"
username = "root"
password = "******"
insecure = true
hosts = ["*"]
datastores = ["*"]
virtual_machines = ["*"]
三、創建 grafana dashboard
基於 telegraf 抓取到的 host, datastore, vm 數據,靈活運用 grafana dashboard 的各種圖表類型,創建自己的 esxi 監控儀表盤。可以參考 grafana dashboard 網站上的模板:
https://grafana.com/dashboards
https://grafana.com/dashboards/1443
下面是我創建的 esxi 監控儀表盤:


四、創建報警
由於目前 grafana 不能在 template 類型(含有參數)的 dashboard上創建報警,因此需要再建立一個普通類型的 dashboard,專門放報警圖表。

