Ubuntu Linux 10.04 Lucid Lynxで運用中のRAID6ユニットが3つ以上Faultした。その後復旧。

Ubuntu Linux 10.04 Lucid Lynxで運用中のRAID6のデバイスが3つ以上Faultしてしまい動作しなくなくなった。

  • まず mdadm -QE  -scan を実行してmetadataから読み出しが可能か確認。なおハードディスクは10台でRAID6構築。
  • 読み出しはOKだが、mdadm –run /dev/md0 ではInput/Output Errorと表示されて動作しない。
  • cat /proc/mdstat でも/dev/md0は表示されない。
  • mdadm -A /dev/md0 -u UUID値 –run –force で強制的に動作させてもダメ。
  • mdadm -A /dev/md0 /dev/sd[klmnopqrst]1 で更に強制的に動作させても、3つ以上のユニットデバイスがremoved状態で一つがspare状態で復旧しない。
  • 基本に戻って https://raid.wiki.kernel.org/index.php/Linux_Raid を読み直す。
  • https://raid.wiki.kernel.org/index.php/RAID_Recovery に記載されている「Don’t Panic」を心に刻むw
  • https://raid.wiki.kernel.org/index.php/Reconstruction に記載されているmdstat –assemble –force /dev/md0 を実行。
  • すると、cat /proc/mdstat で/dev/md0の情報が表示された。
  • どうやら3つのブロックデバイスが removedになって再構築ができない様だ。
  • 3wareの3dm2をつかってハードディスクの情報をsudo tw_cli /cX showで表示すると4つのデバイスが「Not Presents」と表示されている。どうやらケーブル関連のようだ
  • マシンを停止して、ハードディスクとRAIDボードのケーブルをいくつか交換する。
  • 再起動するとこれまで通り/dev/md0は動作しない。
  • そして mdadm –assemble –force /dev/md0 を打ち込むと、なんとcat /proc/mdstatで/dev/md0デバイスがactiveとなり、Recovery(復旧)モードになった。
  • そのまま現在Recoveryモードで復旧中。
  • なおmountでちゃんとマウントOKである。

これにて復旧終了。3時間かかった。Recovery完了までは5日程度で完了予定。

広告
コメントする

1件のコメント

  1. Tweets that mention Ubuntu Linux 10.04 Lucid Lynxで運用中のRAID6ユニットが3つ以上Faultした。その後復旧。 « PCハードウエアとLinux情報 Leddownのブログ -- Topsy.com

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。