服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境&故障:
一臺(tái)某品牌X3650M3服務(wù)器,服務(wù)器中有一組raid5磁盤(pán)陣列,上層采用zfs文件系統(tǒng)。
服務(wù)器未知原因崩潰,工作人員排查故障后發(fā)現(xiàn)服務(wù)器的raid5陣列中有兩塊硬盤(pán)離線導(dǎo)致該陣列不可用,服務(wù)器內(nèi)的數(shù)據(jù)丟失。
數(shù)據(jù)恢復(fù)工程師在現(xiàn)場(chǎng)對(duì)故障服務(wù)器raid5陣列中的磁盤(pán)進(jìn)行硬件故障檢測(cè),經(jīng)過(guò)檢測(cè)發(fā)現(xiàn)該raid5陣列中離線的兩塊硬盤(pán)均無(wú)硬件問(wèn)題。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、將故障服務(wù)器raid5陣列中所有磁盤(pán)編號(hào)后取出,以只讀方式進(jìn)行扇區(qū)級(jí)的全盤(pán)鏡像,鏡像完成后按照編號(hào)將所有磁盤(pán)還原到原服務(wù)器中,隨后數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作均在鏡像文件進(jìn)行,確保原始數(shù)據(jù)不被修改和破壞。
2、基于鏡像文件對(duì)所有磁盤(pán)鏡像文件進(jìn)行分析,發(fā)現(xiàn)該raid5陣列中有兩塊熱備盤(pán),2塊硬盤(pán)離線時(shí)只有一塊熱備盤(pán)成功激活,此時(shí)raid5陣列處于缺盤(pán)狀態(tài),數(shù)據(jù)并未同步。數(shù)據(jù)恢復(fù)工程師通過(guò)分析獲取到原raid5陣列中的硬盤(pán)分布規(guī)律、raid條帶、盤(pán)序等raid信息。
3、根據(jù)分析獲取到的RAID信息分析每一塊硬盤(pán)中的數(shù)據(jù),發(fā)現(xiàn)有一塊硬盤(pán)在同一個(gè)條帶上的數(shù)據(jù)和其他硬盤(pán)明顯不一樣,數(shù)據(jù)恢復(fù)工程師初步判斷此硬盤(pán)是最先掉線的。使用北亞企安自主開(kāi)發(fā)的RAID校驗(yàn)程序?qū)@個(gè)條帶進(jìn)行校驗(yàn),發(fā)現(xiàn)除掉剛才分析的那塊硬盤(pán)后所得出的數(shù)據(jù)是最好的,因此可以確定最先掉線的那塊硬盤(pán)。
4、根據(jù)獲取到的raid信息重組raid5陣列,在重組出的raid5陣列中分析lun的分配情況和數(shù)據(jù)塊情況。使用北亞企安自主開(kāi)發(fā)的軟件導(dǎo)出lun并解析文件系統(tǒng)時(shí)提示報(bào)錯(cuò),重新調(diào)試軟件后報(bào)錯(cuò)情況依舊,可以排除由于軟件問(wèn)題所導(dǎo)致的文件系統(tǒng)解析報(bào)錯(cuò)。手動(dòng)檢查導(dǎo)出的文件后發(fā)現(xiàn)導(dǎo)致解析報(bào)錯(cuò)的原因是文件系統(tǒng)元文件損壞。經(jīng)過(guò)檢測(cè)發(fā)現(xiàn)元文件損壞原因是服務(wù)器癱瘓時(shí)zfs文件系統(tǒng)正在進(jìn)行IO操作。由于軟件無(wú)法解析文件系統(tǒng),于是數(shù)據(jù)恢復(fù)工程師手動(dòng)修復(fù)zfs文件系統(tǒng)中損壞的元文件后再使用軟件進(jìn)行解析。
5、將手動(dòng)修復(fù)好的文件系統(tǒng)再次使用軟件進(jìn)行解析,這次成功解析所有文件節(jié)點(diǎn)和文件目錄結(jié)構(gòu),然后將數(shù)據(jù)導(dǎo)出。
6、驗(yàn)證恢復(fù)出來(lái)的數(shù)據(jù)沒(méi)有發(fā)現(xiàn)問(wèn)題。交由用戶方對(duì)恢復(fù)出來(lái)的數(shù)據(jù)進(jìn)行檢查,經(jīng)過(guò)仔細(xì)檢查,用戶方確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)完整可用。本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
13文章
9784瀏覽量
87887 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
648瀏覽量
18136 -
磁盤(pán)
+關(guān)注
關(guān)注
1文章
390瀏覽量
25818 -
RAID5
+關(guān)注
關(guān)注
0文章
131瀏覽量
13047
發(fā)布評(píng)論請(qǐng)先 登錄
raid5數(shù)據(jù)恢復(fù)—Raid陣列重建后如何恢復(fù)原陣列的數(shù)據(jù)?
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列多塊硬盤(pán)離線導(dǎo)致EMC存儲(chǔ)不可用的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)raid5磁盤(pán)陣列數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—Raid5陣列熱備盤(pán)上線失敗的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器raid5陣列硬盤(pán)出現(xiàn)壞道掉線如何恢復(fù)服務(wù)器數(shù)據(jù)?

服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)中RAID5陣列數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—用5盤(pán)RAID5陣列中的4塊盤(pán)重建RAID5陣列后如何恢復(fù)原始數(shù)據(jù)?
服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列硬盤(pán)離線但熱備盤(pán)未激活的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤(pán)上線同步失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)RAID5陣列崩潰,數(shù)據(jù)如何恢復(fù)?
服務(wù)器數(shù)據(jù)恢復(fù)—不當(dāng)操作導(dǎo)致raid5陣列數(shù)據(jù)無(wú)法恢復(fù)的案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤(pán)未全部成功啟用的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—搬遷導(dǎo)致服務(wù)器無(wú)法識(shí)別raid的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—5盤(pán)RAID5陣列重建4盤(pán)raid5陣列如何恢復(fù)原raid5數(shù)據(jù)?

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤(pán)同步失敗的數(shù)據(jù)恢復(fù)案例

評(píng)論