標准化是一切運維自動化的基礎,無標准、不自動。所以自動化運維的前提條件是做好運維標准化工作。以下是自己總結的一些內容:
1、雲端系統鏡像(模板鏡像命名規則)鏡像一定要是干凈的,如果不干凈很有可能引起生產事故,包含各種服務客戶端(如zabbix-agent、salt-minion)
2、系統優化標准參數、自動化一鍵優化腳本
3、操作系統命名規則site qa pre prd
4、軟件安裝版本標准化
5、軟件安裝目錄標准化
6、應用系統名稱命名規則、應用系統數據庫命名規則
7、監控模板標准化、特殊監控特殊對待
8、綜合管理機器 前期規划性能爭取比較好,因為后期可能有很大性能需求
9、日志備份機器,磁盤以及性能盡量可能較高
10、ip地址管理(可以寫腳本生產一個動態更新表)
11、自動化工具salt、ansible、Jenkins
12、監控標准化(基礎cpu、內存、磁盤、網絡流量、系統連接數、業務指標監控)
13、資源統計表標准化模板(雲端ecs、slb、redis、rds...、專人負責統計、該員工負責資源開通、升配、降配)
14、運維各類實施文檔(各種中間件部署、升級、問題解決)
15、安全審計-堡壘機或安全審計日志(密碼+私鑰訪問)
16、權限標准化管理(專人負責)
17、自動化腳本編寫 避免重復性工作,如創建用戶
18、安全防護,雲端ddos、waf,應用端如nignx有防sql注入、防爬蟲等安全配置
19、端口統一規划表,需要統一管理
20、新開通資源第一時間增加監控、日志收集
22、運維制度或標准最小單元化,標准化最小單元化
其他:對於公司運維人員,一定要存在備份人員,杜絕某些系統只有某一位運維同學熟悉。這樣容易導致人員離職,系統交接不到位,系統維護困難以及踩坑