服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺IBM某型號服務(wù)器上有16塊FC硬盤組建RAID陣列。上層linux操作系統(tǒng),ext3文件系統(tǒng),部署有oracle數(shù)據(jù)庫。
服務(wù)器故障&檢測:
服務(wù)器上跑的業(yè)務(wù)突然崩潰,管理員發(fā)現(xiàn)服務(wù)器上有2塊磁盤的指示燈顯示黃色。
通過IBM storage manager查詢服務(wù)器狀態(tài),發(fā)現(xiàn)服務(wù)器報告邏輯卷狀態(tài)失敗。物理硬盤狀態(tài)為:一塊盤報告“警告”,指示燈顯示黃色的2塊盤報告“失敗”。通過IBM storage manager將當(dāng)前服務(wù)器的日志完整備份。北亞企安數(shù)據(jù)恢復(fù)工程師在備份服務(wù)器日志的同時分析日志內(nèi)容,獲取數(shù)據(jù)恢復(fù)所需要的邏輯卷信息。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將服務(wù)器中所有硬盤編號標(biāo)記后從服務(wù)器內(nèi)取出,由硬件工程師對所有硬盤進(jìn)行硬件故障檢測,經(jīng)過檢測發(fā)現(xiàn)16塊盤均可以讀取。針對16塊盤的SMART狀態(tài)進(jìn)行檢測,經(jīng)過檢測發(fā)現(xiàn)在IBM storage manager中報告“警告”的那塊盤的SMART狀態(tài)也報告為“警告”,結(jié)果一致。
2、在windows環(huán)境下將識別出來的FC盤在磁盤管理器中標(biāo)記為脫機(jī)狀態(tài),然后對這些磁盤進(jìn)行扇區(qū)級別全盤鏡像,將原始磁盤中的所有物理扇區(qū)鏡像到windows系統(tǒng)下的邏輯磁盤并以文件形式保存。在鏡像過程中發(fā)現(xiàn)SMART狀態(tài)報告為“警告”的磁盤鏡像速度異常,windows環(huán)境下的一般應(yīng)用軟件無法對其進(jìn)行操作,結(jié)合前面的檢測結(jié)果可以判斷該盤應(yīng)該存在損壞/不穩(wěn)定的扇區(qū)。
3、使用專業(yè)硬盤鏡像設(shè)備對這塊SMART狀態(tài)報告為“警告”的磁盤進(jìn)行鏡像,在鏡像過程中觀察發(fā)現(xiàn)該盤的壞道并不多,但是存在大量的讀取響應(yīng)時間長的不穩(wěn)定扇區(qū),于是調(diào)整鏡像策略,修改“遇到壞道跳過扇區(qū)數(shù)”和“響應(yīng)等待時間”等參數(shù)后繼續(xù)對該盤進(jìn)行鏡像。
4、所有其他磁盤(除了SMART狀態(tài)報告為“警告”的磁盤)鏡像完成后,查看鏡像過程中生成的日志,發(fā)現(xiàn)在IBM storage manager和硬盤SMART狀態(tài)中均沒報錯的另外一塊磁盤中也存在壞道,指示燈顯示黃色的2塊盤也存在大量不規(guī)律的壞道分布,根據(jù)壞道列表定位到目標(biāo)鏡像文件分析發(fā)現(xiàn),ext3文件系統(tǒng)的一些關(guān)鍵源數(shù)據(jù)信息已經(jīng)被壞道破壞,只能等待SMART狀態(tài)報告為“警告”的磁盤鏡像完畢后,通過同一條帶進(jìn)行xor以及根據(jù)文件系統(tǒng)上下文關(guān)系手動修復(fù)被損壞的文件系統(tǒng)。
5、SMART狀態(tài)報告為“警告”的磁盤鏡像完成,但是之前為了最大限度做出有效扇區(qū)以及為了保護(hù)磁頭而設(shè)置的拷貝策略會自動跳過一些不穩(wěn)定扇區(qū),所以該盤的鏡像是不完整的。調(diào)整拷貝策略,繼續(xù)鏡像被跳過的扇區(qū),直到該盤所有扇區(qū)全部鏡像出來。
6、將服務(wù)器中16塊硬盤的物理扇區(qū)鏡像完成后,在windows平臺下使用軟件將所有鏡像文件全部展開。經(jīng)過對ext3文件系統(tǒng)的逆向分析以及對日志文件的分析,獲取到16塊FC盤的盤序,RAID的塊大小,RAID的校驗(yàn)走向和方式等信息。
7、利用這些raid相關(guān)信息虛擬重組RAID,RAID重構(gòu)完成后對ext3文件系統(tǒng)進(jìn)行解析。
8、和用戶溝通后,數(shù)據(jù)恢復(fù)工程師提取出了一些oracle的dmp文件,由用戶嘗試進(jìn)行恢復(fù)?;謴?fù)的過程中oracle報告imp-0008錯誤。北亞企安數(shù)據(jù)庫工程師仔細(xì)分析導(dǎo)入dmp文件的日志文件,發(fā)現(xiàn)提取出來的dmp文件存在問題。
9、重新分析raid結(jié)構(gòu),進(jìn)一步確定ext3文件系統(tǒng)被破壞的程度。又經(jīng)過數(shù)小時的努力,北亞企安數(shù)據(jù)恢復(fù)工程師重新提取了dmp文件和dbf原始庫文件。將恢復(fù)出來的dmp文件移交給用戶進(jìn)行導(dǎo)入,這次導(dǎo)入一切順利,沒有報錯。對恢復(fù)出來的dbf原始庫文件進(jìn)行校驗(yàn),結(jié)果所有文件均通過測試。經(jīng)過仔細(xì)核檢測后,用戶認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果,本次服務(wù)器數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
硬盤
+關(guān)注
關(guān)注
3文章
1348瀏覽量
59332 -
服務(wù)器
+關(guān)注
關(guān)注
13文章
10000瀏覽量
90107 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
674瀏覽量
18544
發(fā)布評論請先 登錄
服務(wù)器數(shù)據(jù)恢復(fù)—RAIDZ多塊硬盤離線導(dǎo)致服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器斷電導(dǎo)致raid模塊損壞的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—壞道“突襲”Raid5陣列,數(shù)據(jù)恢復(fù)大揭秘
服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線導(dǎo)致raid上層的卷無法掛載的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)raid5磁盤陣列數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列中硬盤壞道導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—如何預(yù)防服務(wù)器故障與恢復(fù)服務(wù)器數(shù)據(jù)!
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器raid5陣列硬盤出現(xiàn)壞道掉線如何恢復(fù)服務(wù)器數(shù)據(jù)?

服務(wù)器數(shù)據(jù)恢復(fù)—Zfs文件系統(tǒng)服務(wù)器數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器硬盤燈閃黃燈的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—ZFS文件系統(tǒng)下RAIDZ數(shù)據(jù)恢復(fù)案例

云硬盤掛載到新服務(wù)器,怎么恢復(fù)數(shù)據(jù)?
服務(wù)器數(shù)據(jù)恢復(fù)—浪潮服務(wù)器硬盤指示燈亮黃燈的數(shù)據(jù)恢復(fù)案例

評論