Open-Falcon概述與架構解析
· 監控系統概述
1.是整個運維環節,乃至整個產品生命周期中最重要的一環,事前及時預警發現故障,時候提供准確的數據追查定位問題,分析業務指標等。
2.本質是數據收集並處理(報警,繪圖,數據挖掘)的系統
3.常見的監控系統相關產品:Zabbix/Nagios/Cacti
· 與zabbix對比
- 以下說明是對Open-Falcon所支持項
1.模板支持繼承的同事支持覆蓋策略項
2.數據采集面配置,節省人力成本
3.較為強大的數據模型
4.tag化描述告警策略each(metric=qps project=falcon module=judge)> 100
5.水平擴展,多IDC支持
· Open-Falocn特點
1.數據采集面配置:無需預定義,agent自動發現,支持plugin,支持主動push
2.容量水平擴展,生產環境每秒20多萬次數據收集,告警,存儲,繪圖
3.告警策略易於管理:支持策略模板,模板集成和覆蓋,報警接收人為用戶組
4.報警事件自動化處理:觸發閾值之后支持callback,便於嵌入自動化邏輯
5.人性化告警設置:支持最大告警次數,告警級別,告警恢復通知,告警暫停,不同時段不同閾值,支持維護周期,支持報警合並
6.歷史數據高效查詢:秒級返回上百個指標一年的歷史數據
7.架構設計高可用:整個系統無核心單點,易運維,易部署
· Open-Falcon架構