2012年10月8日

NVIDIA MediaShieldのRAID復旧方法

先週、NVIDIA MediaShieldで組んでいる、自作PCのRAID (RAID1:Mirroring) のステータスがDegradeとなり、2台のHDD (Hard Disk Drive) 間で同期できなくなりました。
その時の復旧方法をご紹介します。
RAID1を対象にしていますが、RAID5でも同様の手順で復旧できるはずです。
  1. 不具合のあるHDDを見つける
    1台ずつSATAのケーブルを外して起動を試み、起動できないHDDがないか調査します。
    また、同時にHDDとドライブレター (Cドライブ、Dドライブなど) 、SATAの接続チャネルやナンバーとの関係 (SATA 0.0やSATA 0.1) を確認します。
  2. FDISKをかける
    Windowsが起動するようであれば、FDISKをかけてHDDに不良セクタ (Bad Sectors) がないか調査します。
    不良セクタが見つかったHDDは寿命ですので、交換します。
    MirroringであればRAIDを解除してシングル構成として復旧させるのも1つの手です。
    保証期間内であれば、HDDを修理に出すのも良いでしょう。
  3. 不具合の見つかったHDDボリュームをRAIDから削除する
    BIOS画面の後のMediaShield画面で「F10」キーを押し、RAID管理画面に移動します。
    そして起動できないHDD、またはCドライブの割り当てがないHDD (2台のHDDともにWindowsが正常起動する場合、Degrade時に優先的にCドライブ割り当てのあったドライブをマスターとするため)、または不良セクタの見たかったHDDのボリュームを「[V] Remove Vol」メニューでRAIDセットから削除します。
  4. 不具合の見つかったHDDを交換する
    HDDに論理的不具合ではなく、物理的不具合が見つかった場合は、該当のHDDを交換します。
    交換するHDDは、同じ製品型番である必要があります (異なると不具合の原因になることがある) 。
    HDDのFirmware Versionが同じだと、なお良いです。
  5. RAIDのRebuildを行う
    再び、BIOS画面の後のMediaShield画面で「F10」キーを押し、RAID管理画面に移動します。
    「[R] Rebuild」メニューを実行し、交換したHDDまたはRAIDから削除したHDDをRAIDに組み入れてRAIDをRebuild (再構成) します。
  6. Rebuild完了までRAIDのステータスを確認する
    Windowsを起動し、NVIDIAコントロールパネルなどからストレージの状態を確認します。
    RAIDのステータスに「5% (再構成)」といったRebuildの状態が表示されます。
    このステータスが「正常に動作」に変わるとRebuild完了です。
    Rebuild中はHDDにかなりの負荷がかかるため、アプリケーションは極力終了し、作業は何もしないようにします。
  7. FDISKとSMARTセルフテストを実行する
    Rebuild完了後、MediaShield画面でもRAIDが「Healthy」となっていることを確認します。
    そして、改めてFDISKをかけます。
    また、NVIDIAコントロールパネルからSMARTセルフテストを実行し、HDDに異常が見られないことを確認します。
  8. Rebuild後のイベントログにエラーが出ていないことを確認する
    1日程度普通に利用して、イベントログにエラーがでてなければ復旧として判断します。
    参考までに、Degradeが起こったときのイベントログを載せておきます。

以上で復旧手順は終わりです。
以下は、Degradeが起こったときの「システム」イベントに記録されたイベントログです。
ご参考まで。

【イベント 1種類目】
イベントの種類:エラー
イベント ソース:nvgts
イベント カテゴリ:なし
イベント ID:9
日付:2012/10/06
時刻:9:12:32
説明:デバイス \Device\Scsi\nvgts1 はタイムアウト期間内に応答しませんでした。
【イベント 2種類目】
イベントの種類:エラー
イベント ソース:nvgts
イベント カテゴリ:なし
イベント ID:5
日付:2012/10/06
時刻:9:12:32
説明:\Device\Scsi\nvgts1 でパリティ エラーが検出されました。
【イベント 3種類目】
イベントの種類:情報
イベント ソース:nvrd32
イベント カテゴリ:なし
イベント ID:259
日付:2012/10/07
時刻:9:07:24
説明:The signature for Raid Array \Device\00000083 - NVIDIA  MIRROR   596.17G0100 was updated after a degrade.

【イベント 4種類目】
イベントの種類:エラー
イベント ソース:nvrd32
イベント カテゴリ:なし
イベント ID:262
日付:2012/10/07
時刻:9:07:24
説明:Raid Array \Device\00000083 - NVIDIA  MIRROR   596.17G0100 was marked as degraded.  A Raid Disk from the Array was not enumerated correctly.


なお、Rebuild (再構成) にかかった時間は640GBのHDD、RAID1 (Mirroring) 、使用率約50%の条件で約3時間でした。

0 件のコメント: