Prometheus 編寫告警規則案例
注:確保alertmanager配置完畢!
1、創建編輯文件:vim /usr/local/prometheus/rules/node.yml
# groups:組告警 groups: # name:組名。報警規則組名稱 - name: general.rules # rules:定義角色 rules: # alert:告警名稱。 任何實例5分鍾內無法訪問發出告警 - alert: NodeFilesystemUsage # expr:表達式。 獲取磁盤使用率 大於百分之80 觸發 expr: 100 - (node_filesystem_free_bytes{mountpoint="/",fstype=~"ext4|xfs"} / node_filesystem_size_bytes{fstype=~"ext4|xfs"} * 100) > 80 # for:持續時間。 表示持續一分鍾獲取不到信息,則觸發報警。0表示不使用持續時間 for: 1m # labels:定義當前告警規則級別 labels: # severity: 指定告警級別。 severity: warning # annotations: 注釋 告警通知 annotations: # 調用標簽具體指附加通知信息 summary: "Instance {{ $labels.instance }} :{{ $labels.mountpoint }} 分區使用率過高" # 自定義摘要 description: "{{ $labels.instance }} : {{ $labels.job }} :{{ $labels.mountpoint }} 這個分區使用大於百分之80% (當前值:{{ $value }})" # 自定義具體描述
2、檢查並重新加載配置文件
./promtool check config prometheus.yml
kill -hup 11853
3、控制台查看配置
4、調整閥值測試報警 調整到1%。 把配置文件的80改成1就行 - -。 然后記得再重新加載配置。
注:可以配置多個監控需要配置配置文件配置多個 -alert:。