中建國際(深圳)設計顧問有限公司成立于一九九四年七月,隸屬于中國建筑工程總公司,是一家擁有國家甲級設計資質的建筑設計公司,曾經設計出不少國內外知名建筑,目前年營業額超過億元。作為公司信息化建設的重要組成部門,該公司選擇了HP MSA1000磁盤陣列作為公司設計數據的存儲設備。
2005年 4 月20日,管理員發現系統提示MSA1000磁盤陣列分區$MFT錯誤,并提示運行CHKDSK進行修復,但是管理員訪問該磁盤陣列時,數據還是正常的,所以對系統提示不予理會。但是到了第二天,該磁盤陣列中2號磁盤亮紅燈提示故障,于是管理員就用一塊新盤替換出問題的2號磁盤,可是用新磁盤替換2號盤后,陣列運行一段時間后,該陣列便不能訪問了,系統仍然提示$MFT錯誤,并提示運行CHKDSK進行修復。根據系統提示,管理員開始運行CHKDSK命令整理修復陣列,運行一段時間后,沒有完成整理動作就自動停止,反復運行CHKDSK幾次,結果都是在接近完成時就自動停止了。隨后,磁盤分區就不能打開了。
作為一家國際知名的建筑設計公司,磁盤陣列中存放的工作數據重要性不言而喻,這意味著企業在行業中的信譽。如果丟失,后果將不堪設想,甚至有可能給企業帶來巨大的經濟損失。在對比、咨詢過幾家數據恢復廠商提供的資料后,中建國際選擇了在國內磁盤陣列的數據恢復方面久負盛名的北京護航時代科技有限公司。
一下飛機,護航時代派出的首席數據恢復專家覃廷良就直奔中建國際的機房,投入到了緊張的修復工作中。眾所周知,惠普的這個產品采用了獨有的RAID ADG技術,是對RAID 5進行擴展后的一個磁盤配置方案。其最大特點是部署了2個奇偶校驗集,并提供了2個硬盤的容量存儲這些奇偶校驗信息。這個陣列能同時允許2塊硬盤出現故障,突破了以往的RAID允許在同一時刻只可以有一塊硬盤發生故障的限制,很有效地提高了服務器硬盤上數據的可靠性。簡單的說,RAID ADG技術在原理上解決了RAID 5在二塊硬盤同時出現故障時可能給企業帶來的災難。
為什么會出現這樣一個從硬件設計上來說不可能出現的問題呢?
經過對磁盤底層數據的分析,經驗豐富的覃廷良發現,2號盤和7號盤大約前15GB冗余信息所在的位置一樣,不符合RAID ADG數據組合規律,在每塊盤大約15GB以后,數據組合方式才符合RAID ADG。很有可能是管理員在因為2號盤故障換上新盤后,系統把2號盤當成7號盤,用其余的磁盤來Rebuild,造成了數據混亂,同時又執行CHKDSK命令整理修復陣列,導致目錄結構錯亂,幾方面因素綜合在一起,產生了這個原本可以通過物理冗余解決的問題。
找到了問題的根源,離最后成功也就不遠了。覃廷良開始采用由護航時代獨立開發出的磁盤數據修復工具——“護航艦”對磁盤數據進行重組,并對磁盤的錯亂目錄結構進行恢復。15個小時的緊張工作過去了,丟失的200 多GB的設計圖片數據終于找到了,并且全部正確恢復,客戶翹起了大拇指。
中建國際的信譽得到了維護,護航時代參加此次修復工作的技術工程師也長長出了口氣,護航時代也再一次通過客戶滿意的稱贊證明了自己在國內磁盤陣列數據恢復領域無可質疑的“龍頭”地位。(新聞稿 上智傳播提供 2005-09-20)