概述 一、 介紹 監控系統是整個運維環節,乃至整個產品生命周期中最重要的一環,事前及時預警發現故障,事后提供翔實的數據用於追查定位問題。監控系統作為一個成熟的運維產品,業界有 ...
前言 監控系統是整個業務系統中至關重要的一環,它就像眼睛一樣,時刻監測機房 網絡 服務器 應用等運行情況,並且在出現問題時能夠及時做出相應處理。 美團點評剛開始使用的是Zabbix監控系統,幾經優化,在當時能夠達到 W 機器, W 監控項的量。隨着各業務線的發展,監控項越來越多,Zabbix的問題也越來越突出,當時針對Zabbix的吐槽問題有: 不支持擴展,本身是一個單點,當機器規模超過萬台的時候 ...
2017-02-28 08:56 0 5935 推薦指數:
概述 一、 介紹 監控系統是整個運維環節,乃至整個產品生命周期中最重要的一環,事前及時預警發現故障,事后提供翔實的數據用於追查定位問題。監控系統作為一個成熟的運維產品,業界有 ...
功能 judge 模塊主要從transfer中接收數據,並從HBS中獲取報警策略,然后進行閾值報警判斷 從HBS獲取報警策略 接收transfer 上報的數據,並存儲最新幾個點 ...
功能 存儲agent push的數據 為query 提供查詢數據接口 參考RRDtool的理念,在數據每次存入的時候,會自動進行采樣、歸檔。在默認的歸檔策略,一分鍾push一 ...
功能 負責數據轉發,接受agent上報的數據,然后使用一致性hash規則對數據進行分片,最后將分片后的數據分別轉發至judge,graph 對接收到的數據進行合法性校驗、規整 ...
Open-falcon報警通知 一、 報警方式 1. 郵件報警 a. 使用mail-provider 安裝mail-provider 配置 到此會以郵件的方式警告組成員的郵箱 b. 第三方平台(onealert ...
openfalcon 規划 拓撲圖 transfer 配置文件 judge配置文件 gra ...
功能 采集數據,解析數據,上報數據至transfer 基本涵蓋了系統層面監控指標,直接將數據轉換為metricValue形式,上報至transfer 支持插件采集,代碼插件放可受g ...
功能 query組件,提供統一的繪圖數據查詢入口。query組件接收查詢請求,根據一致性哈希算法去相應的graph實例查詢不同metric的數據,然后匯總拿到的數據,最后統一返回給用戶。 配置文件 ...