伺服器raid信息丟失恢復過程
來自專欄數據恢復
[磁碟陣列數據恢復故障描述]
北亞數據恢復中心接收到客戶的一台HP DL380 G4伺服器,伺服器使用hp smart array控制器掛載了一台國產磁碟陣列,磁碟陣列由14塊146G SCSI硬碟組成一組RAID5。操作系統為LINUX,構建了NFS+FTP,作為公司內部文件伺服器使用。
由於伺服器機房進行搬遷,搬遷過程中管理員順便打掃了一下伺服器和磁碟陣列設備,隨後在新機房鏈接線路後伺服器無法識別RAID,未做初始化。
[磁碟陣列初檢結果]
工程師對設備進行簡單的初檢,發現數據丟失的原因為raid信息丟失,HP smart array系列控制器源自康柏,RAID中的冗餘採用雙循環的校驗方式。
[raid數據恢復步驟]
1、先將SCSI硬碟櫃直接連接到不包含有RAID功能的SCSI擴展卡上。
2、然後工程師們在專用(windows2003改裝後)的修復平台上以單盤的方式連接伺服器陣列中的所有硬碟。
3、為了保護客戶原有數據,避免因數據恢復操作更改客戶原始數據,在所有的數據恢復過程中都必須對所有硬碟以只讀方式做完整鏡像,同時鏡像亦存儲於帶冗餘保護的設備上。
4、安排工程師從鏡像文件中分析原RAID的雙循環校驗參數,搭建虛擬raid平台.
5、在虛擬RAID平台去掉早離線的盤,解釋文件系統,此時已經可以導出raid數據。
6、在客戶原HP 伺服器上連接盤陣,重新配置RAID。
7、最後通過網路dd、NFS、SAMBA、FTP、SSH等數據傳輸方法把所有數據傳回新建的raid磁碟陣列中。
[數據恢復結果]
Raid中所有數據100%恢復成功,全部工作歷時2 天。
[伺服器存儲安全建議]
1.盡量保證機房電源供應穩定,以減少電源異常對主機及存儲的衝擊;
2.最好為重要的伺服器及存儲配置UPS,可在機房意外斷電的情況下保證核心業務系統能繼續維持一定時間的正常工作,從而為企業尋求應急解決方案贏得寶貴的時間;
3.對於服務年限已久的伺服器應定期進行安全狀況檢查,並對其整體運行狀態進行評估以決定是否進行硬體及系統的全面升級,同時提前制定突發數據災難的緊急處理方案,以降低數據災難帶來的業務損失。
推薦閱讀:
※如何在外網遠程桌面連接區域網中的伺服器
※九個可能危害雲伺服器安全的因素
※11-30關於龍隱論壇伺服器換機房的奇門局
※什麼是伺服器?
※用戶態操作系統之一 Seastar簡介