今天偶爾翻出以前做運維的筆記, 感慨良多:
當時剛參加工作, 對工作有極大的熱情, 做了很多筆記.
現在很多多遺失了, 現在也轉崗做開發了, 運維方面的知識很多都不用了, 生疏了
今天翻出筆記, 干脆就把紙質的文檔(當時印象筆記和有道雲筆記等工具並不是很流行)重新記錄在博客里.
- 檢查測試環境中需升級的程序版本是否已經通過回歸測試 (根據測試用例進行)
- 備份生產環境中主備兩台服務器的所有數據和程序
- 檢查生產環境數據庫與測試環境數據庫是否一致。
3.1 若不一致,要確保修改后的數據庫能讓所有程序(有些不升級的程序)正常工作。
a) 備份測試環境所有數據和程序
b) 將生產環境所有程序放到測試環境中,APP和UUWiFi進行基本流程測試(根據測試用例進行)
c) 若測試通過,確定數據庫的修改不會影響到其它程序。可在生產環境中更新數據庫。
d) 若測試未通過,需反饋給開發人員,需調整數據庫的字段屬性或更新對應程序3.2 若數據庫一致,則進入下一步。
4. 在生產環境的備機中更新程序。
5. 檢查配置,程序版本等,再次確認更新無誤。
6. 切換集的主備,讓生產系統工作在備用服務器(最新版本程序上)
7. 在生產系統上進行常用功能的回歸測試,如 APP 和 WebService 的使用等,web管理界面的訪問,這些測試根據測試用例進行。
7.1 若測試未通過,應第一時間切換回主服務器,以保證用戶正常使用。 然后在備用服務器上做回滾操作。檢查問題所在,再安排下一次的升級。
7.2 若測試通過,則進入下一步。
8. 保持三天的觀察期,觀察期間主動檢查系統運行狀態,如 cpu,內存等,以及程序日志(是否有異常和錯誤)
8.1 在觀察期間,有影響用戶正常使用的異常時,都需要切換回主服務器,然后在備用服務器上做回滾操作。(同7.1)
8.2 觀察期間無問題,則進入下一步
9. 升級生產環境主服務器的程序,切換集群到主服務器上,進行回歸測試(根據測試用例進行)
10. 保持兩天的觀察期,
10.1 若主服務器運行有問題,切換到備服務器,若問題依然存在,則整個系統做回退操作。
10.2 若無問題,則此次升級完成。
三個注意點:
1. 數據和程序在操作前要備份!
2. 數據和程序在操作前要備份!!
3. 數據和程序在操作前要備份!!!