隨着雲計算和互聯網的高速發展,大量應用需要橫跨不同網絡終端,並廣泛接入第三方服務(如支付、登錄、導航等),IT系統架構越來越復雜。快速迭代的產品需求和良好的用戶體驗,需要IT運維管理者時刻保障核心業務穩定可用,而企業運維中的痛點和難點也急需解決。
1、面向業務的運維,不但關心單點IT資源的運行狀態,更關心整個業務系統的健康狀態
2、如果企業使用了大量的API和模塊化應用,那么關注每個接口的性能變化情況和指標
3、對於運維主管及企業管理層來說,特別需要上牆的監控大屏
4、運維需要每周、每月查看報告趨勢分析,但傳統運維工具數據導出困難
5、需要第一時間轉雀和快速發現故障節點,減少業務中斷帶來的損失
雲智慧對業內主流的開源運維監控系統和商業運維監控系統進行對比,分析各種產品的定位、目標用戶和功能特點,希望幫助廣大運維、開發和創業者找到最適合自己的運維工具。
Zabbix
Zabbix是一個基於WEB界面的提供分布式系統監控以及網絡監控功能的企業級開源運維平台,也是目前國內互聯網用戶中使用最廣的監控軟件,雲智慧遇到的85%以上用戶在使用Zabbix做監控解決方案。
入門容易、上手簡單、功能強大並且開源免費是雲智慧對Zabbix的最直觀評價。Zabbix易於管理和配置,能生成比較漂亮的數據圖,其自動發 現功能大大減輕日常管理的工作量,豐富的數據采集方式和API接口可以讓用戶靈活進行數據采集,而分布式系統架構可以支持監控更多的設備。理論上,通過 Zabbix提供的插件式架構,可以滿足企業的任何需求。
1. 支持多平台的企業級分布式開源監控軟件
2. 安裝部署簡單,多種數據采集插件靈活集成
3. 功能強大,可實現復雜多條件告警,
4. 自帶畫圖功能,得到的數據可以繪成圖形
5. 提供多種API接口,支持調用腳本
6. 出現問題時可自動遠程執行命令(需對agent設置執行權限)
缺點:
1. 項目批量修改不方便
2. 社區雖然成熟,但是中文資料相對較少,服務支持有限;
3. 入門容易,能實現基礎的監控,但是深層次需求需要非常熟悉Zabbix並進行大量的二次定制開發,難度較大;
4. 系統級別報警設置相對比較多,如果不篩選的話報警郵件會很多;並且自定義的項目報警需要自己設置,過程比較繁瑣;
5. 缺少數據匯總功能,如無法查看一組服務器平均值,需進行二次開發;
6. 數據報表需要特殊二次開發定義;
Nagios
Nagios是一款開源的企業級監控系統,能夠實現對系統CPU、磁盤、網絡等方面參數的基本系統監控,以及 SMTP,POP3,HTTP,NNTP等各種基本的服務類型。另外通過安裝插件和編寫監控腳本,用戶可以實現應用監控,並針對大量的監控主機和多個對象 部署層次化監控架構。
Nagios最大的特點是其強大的管理中心,盡管其功能是監控服務和主機的,但Nagios自身並不包括這部分功能代碼,所有的監控、告警功能都是由相關插件完成的。
優點:
1. 出錯的服務器、應用和設備會自動重啟,自動日志滾動
2. 配置靈活,可以自定義shell腳本,通過分布式監控模式
3. 支持以冗余方式進行主機監控,報警設置多樣
4. 命令重新加載配置文件無需打擾Nagios的運行
阿里雲監控
阿里雲監控是一款免費網站監控產品,可監控站點和服務器,並提供多種告警方式:短信,旺旺,郵件。
用戶群:阿里雲用戶
優點:
與阿里雲服務捆綁緊密,允許用戶自定義數據監控
阿里雲多IDC間內網數據傳輸,不占用客戶公網資源
支持對業務數據的通用統計,從各個角度反應服務的運行情況
缺點:
所有服務基於阿里雲,功能單一,擴展性差
功能不夠強大,只能滿足基礎監控需求