grafana多主機監控告警配置
-
環境
- grafana:Version 7.3.1
- data source:clickhouse 20.4.5.36
- plugins:Vertamedia-clickhouse-grafana
-
創建告警渠道(使用webhook短信告警)
選擇Alerting-->Notification channels
選擇New channel
填寫詳細信息,報警類型選擇webhook
根據需求進行配置,配置完成后點擊
Test
進行測試測試成功時提示如下:
同時在調用的告警接口中能夠正常接收測試告警信息:
-
為Graph panel添加告警規則
例:創建cpu資源監控,sql如下
SELECT $timeSeries as t, avg(100-value), ip FROM monitor.metrics WHERE $timeFilter AND name = 'cpu_usage_idle' GROUP BY t,ip ORDER BY t #庫名和表名不能使用變量否則無法獲取告警的具體信息
告警配置如下:
name #告警名稱 Evaluate every #檢測的頻率 For #pending狀態持續時間 Conditions #報警觸發條件,支持多條件and,or邏輯運算 max ()#取值運算 query (A, 5m, now) #從當前時間取前五分鍾查詢A的值 IS ABOVE 2 #運算的結果高於2 If no data or all values are null #當沒有數據或為空時設置狀態為 If execution error or timeout #超時或其他錯誤時設置狀態為 Send to #所使用的報警渠道(渠道配置為default是默認選擇) Message #報警信息
-
告警測試
點擊
Test rule
進行測試保存配置
查看報警API數據,能夠獲取到所有觸發告警條件的主機ip信息
-
添加多個告警配置