1、故障環境
兩組分別由4塊600G容量的SAS硬盤組成的raid5陣列,並且兩組陣列划分LUN,組成LVM結構,並格式化為EXT3文件系統。
2、故障分析
一塊硬盤意外離線,熱備盤上線,頂替離線硬盤。但在熱備盤上線過程中,又一塊硬盤離線,導致熱備盤同步失敗,兩組raid陣列中的一組崩潰,LVM結構不完整,文件系統無法正常使用。對兩塊離線硬盤進行檢測,發現先離線硬盤無法識別,初步推斷是硬件故障,需要進行開盤修復操作,另一塊硬盤可以識別。
二、解決方案概述
根據前期的故障分析結果,總結出以下解決方案:
1、對故障硬盤進行修復,使用MRT專業數據恢復軟件對故障硬盤進行備份。
2、使用專業數據恢復軟件winhex對raid其余成員盤和另一組raid全部成員盤進行全盤備份。
3、分析每個硬盤的數據,根據分析的結構重組RAID 陣列。
4、分析重組完的陣列,找到LVM信息,重組LVM卷。
5、對重組的LVM卷上的EXT3文件系統進行解析,恢復並導出全部數據。
三、實施解決方案
1、故障盤修復
對故障硬盤進行開盤修復操作。開盤后發現,硬盤盤片磨損嚴重,已無法修復,只能對陣列進行缺盤處理。
2、硬盤備份
使用專業數據恢復軟件winhex對故障raid陣列的其余成員盤進行全盤備份,並且對另一組好的raid陣列的全部成員盤進行全盤備份,備份情況如下:
3、重組raid陣列
仔細分析硬盤底層數據,通過對EXT3文件系統結構進行解析,分別分析出兩組raid陣列的盤序、條帶大小、校驗方向等配置信息,使用專業數據恢復軟件winhex重組出兩組raid陣列。經分析,兩組raid陣列塊大小都為64K,校驗方向為做同步,對故障raid進行重組時注意進行缺盤處理。
4、重組LVM結構
重組出兩組raid陣列之后,對兩組raid中的底層數據進行分析,找到LVM結構信息,對LVM結構進行分析,將兩組raid中作為PV(LVM物理卷)的LUN導出,然后使用專業數據恢復軟件UFS Explorer將兩個PV重組,重新生成LVM邏輯卷。
5、恢復數據
LVM重組之后,對LV(邏輯卷)中的EXT3文件系統進行解析,恢復並導出其中的全部數據。以下為回復出來的數據:
五、數據恢復結論
由於故障硬盤損壞嚴重,硬件無法修復,並且部分硬盤存在壞道,導致raid結構中可能存在缺陷,部分文件損壞,但大部份文件經驗證后恢復成功,只有小部分文件丟失或者損壞,本次數據恢復成功完成。