最近上線因為高並發多線程定時任務引發了一次事故問題,當上線完成,且將事故處理完后回顧了下本次事故原因。
1、后半夜上線,人都比較困乏,極容易產生疏忽得情況。
2、上線業務較多,上線后測試點很多。與測試間都是口口相傳的方式。上線條理性極差。
3、定時任務這塊沒有專人負責處理。且也沒有對其作相關上線方案。
解決方案:
公司一定要有明確上線流程的強制要求;和相關的每個環節的文檔記錄。
解決問題:
上線無條理性(亂);責任划分不清;上線是否成功無標准;上線失敗原因不明確;丟掉原有上線測試內容;上線開始后服務器部分服務器不具備上線條件等問題。
聲明:本文檔只是一種上線流程的簡要概述,如果需要使用請根據實際情況完善。
簡要流程圖:
流程圖描述:上線前業務測試-》生成測試文檔(主業務完全通過,副業務90%通過。滿足上線條件。)-》上線前服務器測試(項目對服務器的網絡要求以及環境要求測試通過)-》生成上線流程文檔(包含上線幾個項目,項目上線的先后順序,每個項目測試的內容和重點注意項)-》正式上線開始-》生成上線結果文檔-》結束上線
上線前業務測試:
要求:主業務完全通過,副業務90%通過。滿足上線條件。
形成測試文檔簡單表格如下:
上線前服務器測試:
要求:項目開發人員和服務器管理員提前會議溝通具體事項。最終形成服務器要求完備文檔。
服務器要求測試文檔簡單表格如下:
正式上線開始:
要求:請嚴格按照上線前業務測試形成的表格一一測試,並記錄測試結果。測試不通過的一定要寫原因。
上線測試文檔簡單表格如下: