運維自動化平台實踐之路


運維自動化平台之路


導讀

  • 什么是運維
  • 自動化運維體系
  • 后記

      
運維自動化已經不再是新鮮名詞,特別是隨着Devops思想的影響下,越來越多的互聯網產品公司已經開始搭建屬於自己的運維自動化平台,甚至個別公司已經走在了AIDevOps實踐的路上。那么,運維自動化的到底是什么,為什么需要自動化?如何落地呢?
       當然本文是基於中小型互聯網公司自動化平台實踐,大型公司的自動化不在討論之列。另外,由於涉及數據安全等原因,每個公司都趨向於搭建各自的自動化運維體系,仁者見仁,智者見智。


什么是運維

  
在不同的企業中,關於運維的這個崗位的理解也有很多不同。有的說是網管、有的說是搞網絡相關的、有的說是搞機房監控相關的、有的說負責備份與上線的、也有的說是寫腳本和程序的,還有的人說是專業背鍋的,其實所有的理解都是都對,這些都屬於運維工作的一部分,只不過是不同層次、不同崗位的人負責而已,每一項技術都可以說是運維工作,所以不能否認任何人對運維的理解。
   運維的主要工作職責是保障業務的正常運行,不斷的更新和提高產品技術的穩定性和安全性。運維部與研發部、測試部和系統管理部門統稱為互聯網產品技術支撐的四大部門。運維部門又可以大方向的分為:業務實施、應用實施、架構實施、自動化實施和安全管理實施。運維工程師是集合網絡、系統、安全、監控、日志、數據、腳本、程序、虛擬化、雲計算和集群分布式等所有技術為一體的自動化、結構化、智能化和全面化的崗位

  • 傳統運維

  傳統運維部門在制訂IT設備和信息化系統管理目標時,關注的是一台台IT設備的故障率和一套套應用系統的可用性,在基礎設施、數據庫、中間件、災備、存儲等環節通常大量采用商業閉源的軟硬件產品及其解決方案,設備的開放性差、標准也不統一,管理時遵循嚴格的ITIL管理體系,喜歡采用兩地三中心這種典型的重量級、集中式運維管理方式。

  隨着IT規模越來越大、系統越來越復雜,運維保障工作由最初的硬件運維不斷細分,網絡工程師、系統運維工程師、DBA、安全工程師等崗位加入到運維體系中。

  當業務系統發生故障時,IT主管首先召集自掃門前雪的各個運維崗位進行自檢,查看各自負責的設備、應用組件、系統是否運行正常。

  所以,傳統運維部門常常被稱為“救火”隊員,依靠人工巡檢的工作方式,不但工作被動,而且效率低下。

  • 互聯網運維

   到了互聯網時代,一切以互聯網為核心,IT的邊界被完全打開,IT系統不再是為企業內部管理提供支撐,而是為億萬互聯網用戶提供各種線上服務。因此,IT部門成為了互聯網企業的核心,而保障線上業務持續、穩定運行,也是互聯網企業的第一使命。

  互聯網運維最關注互聯網用戶體驗,重視響應時間、可用率等性能指標,常常會要求系統可用性達到四個九。因此,互聯網運維在基礎設施、數據庫、中間件、分布式存儲、自動化部署等環節通常大量采用開源或基於SaaS的自動化運維監控工具,如Zabbix、Nagios和雲智慧監控寶等,這些產品的橫向擴展能力很強,具有分布式、輕量級、模塊化、去中心化等特點。

  故障發生時,要求互聯網運維能夠第一時間發現問題,並快速定位問題。依靠人工巡檢的傳統運維管理方式嚴重落后,因此,自動化運維逐漸流行。這就對互聯網運維工程師的開發能力提出了更高的要求,熟悉Python之類的腳本語言只是基礎,玩得轉各種開源監控系統,能夠根據業務特點和企業需求定制開發自動化監控和告警工具。

  這一時期,運維和開發之間的邊界變得模糊起來,DevOps成為互聯網產品從開發到上線維護的新選擇。同時,傳統運維部門已經開始組建專業的運維開發團隊來支撐自動化體系平台的搭建。運維人員也將通過自動化平台來完成服務器操作,從手工運維到自動化,到無人值守。


自動化運維體系

  以下是筆者針對公司某個階段運維場景整合的自動化體系(公司處於快速成長期),這里僅供參考:

自動化運維體系

  •   運維體系采用自建服務器+雲服務模式
  •   ETCP基礎數據管理中心
  •   工單系統屬於一個平台+工具套件,從入口到終端,實現一條龍運維。
  •   同時還有多種監控報警體系,實現人機互動,事前可預知,事后可追溯。
  • 平台的建立,解放運維,讓更多相關人進入系統,基本實現自助式,自動化運維。
  • 不斷整合,形成一個平台,讓運維工作更聚焦。

  一幅小圖,旨在拋磚引玉。往往看似簡單的道理,每一點進步都或背后大量精細的的實踐。其中涉及的技術和細節也是蠻多的多種主流操作系統,數據庫,雲平台,開發語言,安全,架構,算法等...

以下是平台的截圖,可以吐槽一下,哈哈
自動化運維體系

運維知識體系

  這是一位互聯網運維老兵總結的運維知識體系,感謝他的分享,希望對新人有所幫助。
自動化運維體系

任重道遠

  坊間此前流行一句話,"能程序完成的事情盡量不要用人去干"。運維自動化道路並不是一帆風順的,很多時候是需要自己造輪子。 每個公司發展狀況不同,並且涉及各自公司的隱私,基本都有定制化的成分,你所要的工具網上可能都會有相關開源項目,但是需要自己整合到體系中。
自動化的下一步是智能化,未來還有更多的路要走。

后記

  魯迅說過:"世界上本沒有路,走的人多了,也就變成了路。"想做一個統一的運維自動化平台的產品或許不太可能, 但是做一點表准化自動化插件或者小工具,是有可能的,這個其實也是商機,你做到了,這條路便可以走的更遠。

自動化運維體系

據說今天是724運維日,祝各位互聯網的幕后英雄節日快樂!

自動化運維體系


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM