打開 PMM Server 頁面,如圖所示點進Alerting --> Notification channels

輸入釘釘的信息,並且 Save Test

測試結果,沒問題了

如何使用 granafa 做告警呢?隨便點開一個監控項,我這里以 galera cluster size 為例。

點擊 Alert 如圖所示

重點在於 Conditions ,這里我設置的表達式是
avg() query(C,5m,now) 3 - 3
avg() 含義:面板時間段內的平均值
大概意思就是 5分鍾內的平均值要處於 3-3 這個范圍。否則發出告警。
這是告警的備注

效果如圖:

常見報錯
添加 Alert 時提示 template variables are not supported in alert queries
官方回復:
https://github.com/grafana/grafana/issues/9334
Template variables are not supported in alerting.
Template variables should be used for discovery and drill down. Not controlling alert rules
處理方法:
復制這個 Dashboard 的 json,將里面的變量都改為常量。

如下例子:
原來的
"expr": "max_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"$host\"}[$interval]) or\nmax_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"$host\"}[5m])",
改為
"expr": "max_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"pxc1\"}[1m])
or\nmax_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"pxc1\"}[5m])",
再重新添加告警即可。
