雲智慧正式開源運維管理平台(OMP),加速AIOps社區生態建設


 
近日,在雲智慧推出數據可視化編排平台FlyFish后,又重磅推出開源運維管理平台OMP(Operation Management Platform)。這款由雲智慧自主設計與研發,集輕量級、聚合型、智能運維為一體的綜合管理平台,具備 納管、部署、監控、巡檢、自愈、備份、恢復等功能,可為用戶提供便捷的運維能力和業務管理,在提高運維人員等工作效率的同時,極大提升了業務的連續性和安全性。

 

Gitee地址:https://gitee.com/CloudWise/OMP
 
為什么雲智慧要推出這款功能如此強大的開源運維管理平台OMP呢?讓我們來聽聽該項目負責人雲智慧技術總監Simon的心聲:“我們想把雲智慧在智能運維領域所積累十余年的創新實踐經驗,以開源的方式賦能給廣大的開發者,通過OMP來真正解決運維人的痛點,讓運維工作可以更簡單與高效,未來我們期望與行業內所有人一起來推動AIOps社區的發展。”

OMP的初衷:切實解決運維痛點

 
在數字化轉型如火如荼的當下,公司項目與產品都在快速迭代升級。這對軟件開發者與客戶一線駐守的工程師,在 快速安裝、快速定位、自動分析、監控告警、故障自愈等方面,都提出了新的需求和挑戰。
 
比如當遇到主機登陸不統一的問題時,有的客戶允許SSH直連,有的客戶需要跳板機,有的客戶卻只允許顯示器操作。產品上線后往往缺少成熟的保障機制,如果沒有精准的監控、告警、自愈系統,一旦遇到異常或故障將會非常被動,很難快速解決問題。 甚至在產品根據前期的規划部署后,由於缺少定期的巡檢及分析,運維人員難以快速掌握當前業務系統的運行狀態及業務處理能力從而給出優化方案。
 
以上的這些問題是我們經過多方調研了解到運維人員常會遇到的工作場景,以下是我們簡單總結的運維痛點:
  • 主機環境多樣性,難以統一管理如混合雲、私有雲、跨IDC、虛擬化、容器化等
  • 業務變更難度較大,自動編排能力較低
  • 業務監控多平台難以實現數據聯動
  • 業務出現異常難以實現故障自愈
  • 業務運行狀態難以進行評估分析
  • 運維知識匱乏,缺少專家指導及專家解決方案
 
為了切實幫助運維人員解決以上運維痛點,雲智慧以降低交付難度與提升產品的可維護性的設計初衷,打造了OMP(運維管理平台),該平台目前擁有主機納管、應用管理、應用監控、狀態巡檢等核心特性。

OMP核心特性

主機納管

可納管所有主機資源,並實時監控主機運行狀態,支持在線管理。

應用管理

提供常用基礎組件、應用服務及符合標准的自研產品,支持安裝部署、變更發布、彈性擴縮容、在線配置優化等服務狀態管理。

應用監控

涵蓋標准監控、定制監控、鏈路監控、智能監控等多種業務場景,可通過大數據智能測算,感知未來趨勢,將異常控制在發生前。

狀態巡檢

定期進行業務指標、運行狀態匯總,可按需自動執行並發送報告。
以上這些特性設計源自雲智慧多年深耕於運維領域所獲的創新理念,更有為廣大客戶提供專業服務的實踐經驗。OMP優秀的不止有搭載雲智慧高精技術與算法的特性,還有核心技術架構。

OMP核心技術架構

 
如下面OMP架構圖所示,OMP前端基於Ant Design設計的React框架,后端使用Django框架,集成SaltStack等組件,實現基礎功能。Agent端通過saltstack agent端實現對服務的安裝管控,並自研monitor agent實現對數據的指標采集。
其中監控組件采用了當前比較流行的Prometheus、Grafana、AlertManager、Loki等開源產品。在數據儲存方面,OMP使用了MySQL存儲持久數據,Redis用於存儲臨時數據、緩存及簡單的消息隊列。

OMP未來開源計划

 
在進一步完善OMP技術架構與核心特性的創新實踐中,我們也發現僅有這些特性與功能,或還不足以支持廣大開發者對運維的所有需求,因此我們仍在持續開源着OMP其他功能,比如以下這些模塊,請大家拭目以待的同時,歡迎給我們提出寶貴的開發建議。
 
故障自愈 當業務系統出現異常或故障時,按照預定的自愈策略進行故障治理,極大降低故障對業務影響,減少企業損失。
備份/恢復 針對核心數據進行備份異地並自動執行並發送備份,達到異地+異地的存儲效果,使用戶數據足夠安全。
精簡工具 搭建運維常用工具、命令、腳本、SQL等,降低誤操作及技術門檻,可按需自行維護與擴充工具,為日常運維提供便利。
知識文庫 積累運維常用技術、解決方案、業務功能等知識,按需自行維護並擴充知識內容。
小智解答 當需要如操作文檔、解決方案、常用技術等內容時可快速檢索,當需要技術支持時,可申請人工支持。
 

開源社區加速創新

 
自今年8月份雲智慧成立AIOps社區以來,社區先后分享了數據可視化編排平台-FlyFish、雲服務管理平台-摩爾平台、Hours算法等產品。其中業內首次開源的智能運維開源數據集-GAIA數據集,填補了AIOps開源集數據領域的空白,FlyFish開源一周便斬獲中國開源雲聯盟2021優秀開源項目獎。
 
未來,雲智慧將在AIOps社區中更加重視OMP的創新與推廣,與廣大用戶、研究者、開發者一起建設和諧、包容、開放的OMP開發者社區。
 
如果你想面對面與OMP項目的維護者交流,第一時間知道OMP開源的信息,掃描下方二維碼,添加AIOps社區小助手(備注OMP)的微信呦~
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM