服務器數(shù)據(jù)恢復環(huán)境:
一臺使用NTFS文件系統(tǒng)的服務器;
7塊硬盤組成了一組raid5磁盤陣列。
服務器故障&初檢:
raid5磁盤陣列磁盤故障離線導致服務器癱瘓。用戶在處理掉線磁盤時只添加新的硬盤rebuild,并沒有將掉線的3塊硬盤從陣列中拔掉。
硬件工程師對故障服務器中所有硬盤進行了物理檢測,沒有發(fā)現(xiàn)硬盤物理故障,只好交由服務器數(shù)據(jù)恢復工程師對所有硬盤做全盤鏡像&分析。
服務器數(shù)據(jù)恢復過程:
1、對所有硬盤鏡像備份后,服務器數(shù)據(jù)恢復工程師分析服務器raid結構。故障服務器中的硬盤每512字節(jié)多加了一個8字節(jié)的校驗,也就是說每扇區(qū)520字節(jié)。北亞數(shù)據(jù)恢復工程師編寫了一個小程序將8字節(jié)的校驗去掉,方便后續(xù)的數(shù)據(jù)恢復。
2、完成磁盤轉換后開始分析RAID的結構。由于多了3塊離線盤(故障離線后沒有拔出),需要比較每塊磁盤。因為其中會有兩塊磁盤前面的一部分相同,這兩塊前面部分相同的磁盤中有一個是舊盤,舊盤數(shù)據(jù)量沒有新盤多,可以排除舊盤。
3、由于故障服務器使用的是NTFS文件系統(tǒng),使用MFT就可以找到RAID結構。搞清楚RAID結構后發(fā)現(xiàn)這不是一個普通的RAID5,而是一個雙循環(huán),無法通過常規(guī)手段重組RAID。
4、通過其他方法重組RAID后發(fā)現(xiàn)數(shù)據(jù)不是新的。推測可能是RAID5掉線第一塊硬盤時用戶沒有及時發(fā)現(xiàn),沒有及時添加新的硬盤做rebuild,服務器運行一段時間后又有一塊硬盤掉線了,造成整個RAID不可用。
5、服務器數(shù)據(jù)恢復工程師使用窮舉+校驗的方法進行分析:假設某個磁盤掉線,踢掉該磁盤后重組RAID,不用生成全部的數(shù)據(jù),只生成前面幾個G的數(shù)據(jù),然后通過查看這個索引表的位圖信息是否正確就可以判斷此RAID是否正確。如果索引表的位圖信息正確,生成此RAID數(shù)據(jù)即可完成RAID的重組。
6、數(shù)據(jù)恢復完成后由用戶親自核檢,數(shù)據(jù)完整可用,本次數(shù)據(jù)恢復完成。
Tips:
1、服務器發(fā)生故障后,切忌對服務器進行操作;也不要隨意取出硬盤,以免弄亂盤序。
2、如果需要取出硬盤,標記好硬盤的順序之后再取出。
3、服務器陣列癱瘓后應該立即斷電,不要做同步或強制上線操作,防止數(shù)據(jù)進一步破壞。
審核編輯 黃昊宇
-
數(shù)據(jù)恢復
+關注
關注
10文章
650瀏覽量
18155
發(fā)布評論請先 登錄
服務器數(shù)據(jù)恢復—重裝系統(tǒng)導致XFS文件系統(tǒng)分區(qū)丟失的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—ocfs2文件系統(tǒng)被格式化為Ext4文件系統(tǒng)的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—Linux系統(tǒng)服務器崩潰的數(shù)據(jù)恢復案例
虛擬化數(shù)據(jù)恢復—VMware虛擬化環(huán)境下重裝系統(tǒng)導致服務器數(shù)據(jù)丟失的數(shù)據(jù)恢復

服務器數(shù)據(jù)恢復—Zfs文件系統(tǒng)服務器數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—Lustre分布式文件系統(tǒng)數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—ZFS文件系統(tǒng)下RAIDZ數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列+reiserfs文件系統(tǒng)數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—異常斷電導致linux系統(tǒng)無法啟動的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—EXT3文件系統(tǒng)下誤刪除數(shù)據(jù)的恢復案例

服務器數(shù)據(jù)恢復—raid5熱備盤上線過程中又有磁盤離線的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—V7000存儲NTFS文件系統(tǒng)數(shù)據(jù)恢復案例

評論