Linux開源監控平台歸總


Linux開源監控平台歸總

Cacti

偏向於基礎監控。成圖非常漂亮,需要php環境支持,並且需要mysql作為數據存儲

Cacti是一個性能廣泛的圖表和趨勢分析工具,可以用來跟蹤並幾乎可以繪制出任何可監測指標,描繪出圖表。從硬盤的利用率到風扇的轉速,在一個電腦管理系統中,只要是可以被監測的指標,Cacti都可以監測,並快速的轉換成可視化的圖表。

Nagio

不用存儲歷史數據,注重服務或者監控項的狀態

Nagios是一款開源的免費網絡監視工具,能有效監控WindowsLinux和Unix的主機狀態,交換機路由器等網絡設置,打印機等。在系統或服務狀態異常時發出郵件或短信報警第一時間通知網站運維人員,在狀態恢復后發出正常的郵件或短信通知。;
Nagios 可以監控的功能有:

  • 監控網絡服務(SMTP、POP3、HTTP、NNTP、PING等);
  • 監控主機資源(處理器負荷、磁盤利用率等);
  • 簡單地插件設計使得用戶可以方便地擴展自己服務的檢測方法;
  • 並行服務檢查機制;
  • 具備定義網絡分層結構的能力,用"parent"主機定義來表達網絡主機間的關系,這種關系可被用來發現和明晰主機宕機或不可達狀態;
  • 當服務或主機問題產生與解決時將告警發送給聯系人(通過EMail、短信、用戶定義方式);
  • 可以定義一些處理程序,使之能夠在服務或者主機發生故障時起到預防作用;
  • 自動的日志滾動功能;
  • 可以支持並實現對主機的冗余監控;
  • 可選的WEB界面用於查看當前的網絡狀態、通知和故障歷史、日志文件等;

Icinga

Icinga 是一個正在重建的Nagios的分支,它提供了一個全面的監控和警報的框架,致力於設計一個像Nagios一樣的開放和可擴展性的平台。但是和Nagios擁有不一樣的Web界面。Icinga 1 和 Nagios非常的相近,不過Icinga 2就重寫了。兩個版本都能很好的兼容,而且,Nagios用戶可以很輕松的轉到Icinga 1平台。

NeDi

NeDi可能不如其他的工具一樣聞名全世界,但它確是一個跟蹤網絡接入的一個強大的解決方案。它可以很流暢的運行網絡基礎設施和設備目錄,保持對任何事件的跟蹤。並且可以提供任意設備的當前地點,也包括歷史地點。

NeDi可以被用於定位被偷的,或者是丟失掉的設備,只要設備出現在網絡上。它甚至可以在地圖上顯示所有已發現的節點。並且很清晰的告訴人們網絡是怎么互聯的到物理設備端口的。

 

Observium

Observium 綜合了系統和網路監控,在性能趨勢監測上有很好的表現,它支持靜態和動態發現來確認服務器和網絡設備,利用多種監測方法,可以監測任何可用的指標。Web界面非常的整潔,易用。

Observium也可以在地圖上顯示任何被監測節點的實際地點。需要注意的是面板上關於活躍設備和警報的計數。

 

Zabbix

需要php環境支持,並且需要mysql作為數據存儲,基本上可以滿足大部分需求,目前大部分公司在用

zabbix是一個基於WEB界面的提供分布式系統監視以及網絡監視功能的企業級的開源解決方案。zabbix能監視各種網絡參數,保證服務器系統的安全運營;並提供柔軟的通知機制以讓系統管理員快速定位/解決存在的各種問題。zabbix由2部分構成,zabbix server與可選組件zabbix agent。zabbix server可以通過SNMP,zabbix agent,ping,端口監視等方法提供對遠程服務器/網絡狀態的監視,數據收集等功能,它可以運行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平台上。

Ntop

Ntop是一種監控網絡流量工具,用ntop顯示網絡的使用情況比其他一些網絡管理軟件更加直觀、詳細。Ntop甚至可以列出每個節點計算機的網絡帶寬利用率。他是一個靈活的、功能齊全的,用來監控和解決局域網問題的工具;尤其當ntop與nprobe配合使用,其功能更加顯著。它同時提供命令行輸入和web頁面,可應用於嵌入式web服務
Ntop主要提供以下一些功能:

  • 自動從網絡中識別有用的信息;
  • 將截獲的數據包轉換成易於識別的格式;
  • 對網絡環境中通信失敗的情況進行分析;
  • 探測網絡通信的時間和過程

 

Smokeping

偏向於基礎監控,成圖非常漂亮

Smokeping 是rrdtool 的作者Tobi Oetiker 的作品,是用Perl 寫的,主要是監視網絡性能,包括常規的ping,用echoping監控www 服務器性能,監視dns 查詢性能,監視ssh 性能等。底層也是rrdtool做支持,特點是畫的圖非常漂亮,網絡丟包和延遲用顏色和陰影來表示。在企業中運用較少。

Open-falcon

由於是國人開發有一套較為完善的中文文檔

 

小米公司開發,開源后受到諸多大公司和運維工程師的追捧,適合大企業,滴滴、360、新浪微博、京東等大公司在使用這款監控軟件

特點:

數據采集免配置:agent自發現、支持Plugin、主動推送模式

容量水平擴展:生產環境每秒50萬次數據收集、告警、存儲、繪圖,可持續水平擴展。

告警策略自發現:Web界面、支持策略模板、模板繼承和覆蓋、多種告警方式、支持回調動作。

告警設置人性化:支持最大告警次數、告警級別設置、告警恢復通知、告警暫停、不同時段不同閾值、支持維護周期,支持告警合並。

歷史數據高效查詢:秒級返回上百個指標一年的歷史數據。

Dashboard人性化:多維度的數據展示,用戶自定義Dashboard等功能。

架構設計高可用:整個系統無核心單點,易運維,易部署

Overwatch

功能強大 但是由於是新開源的項目  目前網絡上相關資料較少

Overwatch分布式系統監控平台可以對所有后台系統間的RPC通信進行實時的監控。圖形化的展現使得工程師不用去解讀大量的、復雜的數據報表。僅通過一張有向圖,工程師便可以快速理解並掌握當前系統的整體狀況,幫助工程師快速定位並修復系統異常。

Overwatch有着極大的擴展的潛力,通過對客戶端收集程序的加強,我們還可以實現以下功能:

  • 對於數據源、中間件的監控(如MySQL、Redis、消息隊列),在有向圖中加入基礎組件,全面監控所有系統間的依賴以及調用情況。
  • 支持更多RPC協議 (如Thrift、gRPC)
  • 更多的metric,實現精確到API的監控和展現

 

 

最后附上市場主流監控平台  2017年的一個比較圖表

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM