軟件工程師遭遇硬件故障RAID5兩塊硬盤離線


一台IBM x3650 M2服務器,6塊硬盤(SAS 146G)組成RAID5,無熱備盤,系統運行正常無錯誤警告,關機后開機系統找不到RAID無法啟動,兩塊硬盤亮黃燈,硬件報DASD錯誤。由於已經過保請硬件供應商維修工程師上門檢查發現RAID狀態為offline,3號(PD Missing)、4號(failed)兩盤錯誤,結論為兩塊硬盤先后損壞無法修復,建議轉交第三方公司進行數據恢復。

由於沒有類似問題的處理經驗,為了最大程度保護數據沒有自行嘗試恢復,標號盤序交由數據恢復公司進行數據恢復,將數據完整鏡像至備份硬盤(大概2個小時),抽樣驗證數據完全恢復。

有了數據安全的保證自行嘗試恢復服務器,啟動過程中自檢竟然看不到RAID自檢,通過BIOS設置進入WEB BIOS管理界面,選擇3號盤(應選擇后下線的硬盤,恢復公司分析后給出的結論),將其狀態更改為“Unconfig Good”,保存設置退出后重啟(此時3號盤黃燈熄滅),竟然仍然看不到RAID自檢,但重新進入WEB BIOS界面后看到RAID狀態已經變成Online處於降級狀態,且3號盤狀態也變為正常(Online)。

不死心,開始胡亂嘗試(此步驟操作應該沒有什么參考價值),將系統安裝盤放入光驅,選擇啟動設備為光驅,出現”按任意鍵從光盤啟動“的提示信息后沒有理會,系統繼續引導竟然出現了久違的Windows啟動界面。

服務器啟動后恢復正常運行狀態且給出了RAID降級的警告對話框,此時3號盤狀態正常,4號盤仍然亮黃燈,隨后在熱機狀態下更換掉4號盤,服務器自動開始Rebuild,自此服務器完全恢復正常,原有應用運行正常。

總結:

1.RAID5僅支持1塊硬盤離線,一旦出現第2塊硬盤離線即進入offline狀態,重新拔插硬盤並不會自動進行恢復,需要手工對后下線硬盤進行”強制上線“。

2.一旦遭遇RAID損壞在不熟悉數據恢復的情況下盡量保護現場,可轉交數據恢復公司進行數據恢復(有償),數據恢復的幾率還是很高的。(即便硬盤出現硬件損傷亦有幾率恢復)

3.本例中第2塊硬盤並沒有真正損壞但離線原因暫無法確定,奇怪的是在第1塊硬盤損壞RAID降級時服務器竟然沒有任何錯誤提示。(硬件巡檢工作也沒有做好)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM