最近在做一個實際項目的性能測試中,碰到一個問題,被測系統在壓測試過程中,服務器默名其妙的關機了。而且原來有激活過的系統突然變成未激活了。由於我們這個被測試應用比較特
別,包括服務器硬件和軟件? 那到底是硬件部分出現了問題還是軟件問題呢?不找出問題的元凶,如果是硬件問題,問題就大了,這個問題讓我心里非常不安。於是我決定花點時間來分析一
下。問題的難處在於系統重啟是發生在凌晨3點多鍾的時候那時候根本沒人在動電腦,當時沒人在現場,從應用層面來看,被測應用根本沒有任何日志,那說明不是軟件導致的。於是我決定從操
作系統分析日志着手,下面是分析步驟:
1.首先確定系統重啟時間在,2015/8/12 3:28,見附件0.png
2.其次分析系統應用日志,發現在同日重啟前有發生SystemRestore事件,即創建系統還原點。見附件1.png
3.查找系統還原點信息,在這個時刻確定創建系統還原點。信息為WindowsUpdate且為關鍵更新。也就是說系統強制更新的事件。見附件2.png
4.然后查找Setup日志信息,發現在系統重啟前,有一系列補丁更新操作,隨便查找一個KB3064209,發現已經安裝成功,但需要重啟生效。見附件3.png
5.然后觀察下一條信息,發現KB3064209補丁已經成功標記為已更新,據些判定系統已經重啟過了。時間點和1吻合。
結論: 到此,問題就非常清晰了,90%的可能性是由於windows的自動更新導致的,而這次的更新中包含了一個正版驗證的關鍵更新,為了 更新生效,windows給你自動重啟了。 疑問: windows怎么能這樣呢,自動給重啟了,難怪不得大型的服務器都不用windows,是有道理的。后來跟同事了解了一下,他的意思 是windows的個人版他也碰到過類似問題,服務器版本會提示讓你重啟不會自動重啟,但願吧!
其實一個好的性能測試工程師,必須是一個合格的系統工程師,^_^