項目上線出現bug
一. 第一步 — 評估bug的影響范圍
(1)分析bug影響的用戶數量
檢查bug是否業務核心環節的功能問題,是的話則影響的用戶量比較多
(2)分析bug影響的嚴重程度
檢查bug是否涉及到用戶的個人信息泄露、資金財產損失等比較敏感的功能,涉及的話則
認為bug比較嚴重
對於bug影響范圍的評估,必須盡可能的快速且准確,因為影響范圍和程度會隨着時間不
斷擴大,及時了解目前的bug影響,可以為后續解決問題提供最適合的指導意見。
二. 第二步 — 解決線上問題
針對線上問題最重要的是要解決,在評估完影響范圍后,就需要制定對應的措施來解決問 題並恢復系統的正常使用。
(1)影響范圍比較小的bug
了解bug出現的場景,業務操作,努力復現bug
測試人員結合bug出現時的各種日志(系統日志、數據庫日志、操作日志、debug日
志),定位bug產生的原因
按照項目規划的發布/升級的時間節點,將bug修復的代碼發布到線上,bug解決
(2)影響范圍比較大的bug
bug影響范圍比較大時,如果還是通過修復bug的方式來解決,對用戶的影響或者公司的
損失無法把控,此時最重要的是:將問題范圍降到最低。無法明確問題引入原因時,可
以通過回滾版本的方式來規避。部分用戶功能可以通過后台配置的方式將功能降級或關
閉,如果是資源不足等性能問題時,可以通過重啟系統或者擴容的方式解決,再進一步
觀察,以上幾種規避問題的方法只是幫助我們爭取到時間,規避問題后還是要按照之前
修復bug的方式來定位問題,修復問題,並將修復的代碼發布線上,將bug徹底解決。
在實際工作中,我們需要根據bug的影響范圍來選取最適當的解決方法,目的只有一個:
將問題影響范圍降到最低。
三. 第三步 ——回溯線上問題
當線上問題解決后,我們還需要對問題進行總結回溯,避免同樣的問題再次發生。線上
問題回溯主要從如下幾個方面進行:
(1)檢查其他的業務是否有同類型的問題
有問題的話提前解決,避免遺漏上線
(2)分析bug的根本原因,考慮如何避免此類問題再次發生
分析bug是在哪個階段引入?是設計階段、開發階段、測試階段?
分析bug引入的原因是什么?是流程問題、技術問題、管理問題?
處理問題的流程是否合理?是否有問題預警、是否有緊急上線規范?