一 等級告警
告警升級可以對告警結果按自定義的時間段進行進行消息發送,並執行命令,形成一個梯度的告警處理。
二 按時間自定義告警梯度
2.1 添加時間發生的時間戳和發送時間
2.2 設置三個等級梯度
第一梯度,1、2步,發送給admin用戶,時間間隔為60s,發送兩次,直到故障恢復。
第二梯度,3、5步,發送給老板Boss,時間間隔為60s,發送3次,直到故障恢復。
第三梯度,6、7步,發送給admin和老板,時間間隔為120s,發送兩次,直到故障恢復。
注意:可定義更復雜的梯度提醒,如下圖——
- 用戶MySQL Administration每隔半小時發送一次告警;
- 用戶Database manager在事件發生后的兩小時發送告警信息;
- 在2小時30分鍾,執行遠程重啟MySQL命令;
- 在3小時候,機執行遠程命令后並未解決問題,發送告警小西給用戶Guests;
- 在4小時候,通過IPMI對機器執行遠程重啟命令。
三 告警故障排查思路
- 告警腳本權限、告警賬戶是否配置正確;
- 用戶對方發送告警信息的機器是否具有可讀寫權限;
- 告警信息的接收方是否解決接受告警信息,是否被屏蔽;
- 告警配置是否正確,是否達到觸發器設置的閥值,Action中的條件是否正確,是否在維護狀態。


