簡介: Alert Manager是開源監控系統Prometheus中用於處理告警信息的服務,通過將日志服務開放告警配置為Alert Manager中的一個Receiver,可以將Alert Manager產生的告警消息發送到日志服務。
SLS告警管理
AlertManager作為Prometheus生態系統的一員,提供了包括靜默、抑制、通知在內的多種告警管理服務。同時AlertManager在實際使用中還存在着或多或少的不足,例如通知渠道過少,規則配置過程繁瑣。
阿里雲日志服務為了解決告警的通知、管理等問題,推出了日志服務告警中心,為客戶提供了一站式的告警解決方案。下圖中的功能對比給出了SLS告警和AlertManager+Prometheus生態的功能對比,可以看出SLS告警提供了企業級的服務,能夠極大的方便用戶的工作。
SLS開放告警
SLS告警提供的開放告警功能,能夠很方便的將三方系統的告警消息接入到SLS告警中心,而且不需要對現有系統做任何改造。AlertManager接入SLS告警后的告警消息流如下圖所示:
SLS告警配置
1. 創建行動策略
行動策略將決定了SLS在接收Alert Manager告警消息后,以何種方式及何種渠道通知您。為此,您需要首先打開告警中心,點擊告警管理,在下拉菜單中選擇行動策略:
2. 創建開放告警服務
首先打開告警中心,點擊告警管理,在下拉菜單中選擇開放告警:
3. 創建開放告警應用
選擇上一步驟中創建的服務,在操作欄中點擊該服務的應用按鈕:
4. 獲取開放告警應用接口
現在,您在第二步創建的開放告警服務中已經存在一個新的告警應用了。點擊該應用操作欄的接口按鈕,獲取接口信息:
- 域名部分:SLS的接入地址,和地域相關,每個地域都有各自不同的接入地址;
- 子路徑部分:包括用於發送消息的Access Key Id和開放告警應用Id。需要注意的是,用戶需要將子路徑部分中的{ACCESS_KEY_ID}替換為具體阿里雲RAM賬戶的Access Key Id,並且將權限策略AliyunLogOpenEventWrite賦予該賬戶。
Alert Manager接入配置
在Alert Manager配置文件中,您首先需要創建一個告警消息的接收者。為此,您需要在receivers配置項下添加一個Webhook接收者,在url字段中填寫上一步驟中獲取的接口地址。然后,您需要在route配置項下添加前面創建的接收者。典型的配置文件如下圖所示:
route:
receiver: '{RECIEVER_NAME}'
...
...
receivers:
- name: '{RECIEVER_NAME}'
webhook_configs:
- url: 'http://{ALIYUN_SLS_ENDPOINT}/event/webhook/RAMAK_{ACCESS_KEY_ID}/{WEBHOOK_APP_ID}'
- name: ...
其中{RECIVER_NAME}為用戶為接收者自定義的名稱。
效果展示
告警消息查看
在告警中心的事務視圖界面,可以查看接收到的告警消息列表,以及該告警消息的詳情。
告警接入概覽
在開放告警大盤,可以查看告警消息過濾、發送情況。
告警通知概覽
告警大盤展示了所有告警消息的概覽視圖,可以查看通過不同通知渠道發送的消息量。
本文為阿里雲原創內容,未經允許不得轉載。