Westerndigital製ハードディスク WD20EARS-00S8B1(500GBプラッタ)の代替保留セクタ数が26に

現在Ubuntu Linux 10.04 Lucid LynxでRAID6アレイで利用中のWesterndigital製WD20EARS-00S8B1(500GBプラッタ)だが、購入したうちの1台が1ヶ月半で代替保留セクタ数が26を数えた。syslogに出力された値は下記の内容。

26 Currently unreadable (pending) sectors

最初は当然0だったが、13→26と非連続で増加している。これは初期不良品にあったのだろうかと思案中。

追加 2010年7月21日〜23日

代替保留セクタが増加しているハードディスクWD20EARSで回復不能なセクタをsyslogに出力していた。

2 Offline uncorrectable sectors

ハードディスク表面に傷がついている可能性大。だが購入したハードディスクの代理店はCFDなので、SMART値変化・劣化は交換保証外だからなぁ。

…と現在23時10分。代替保留セクタが593セクタとでた。もうダメだろう。

更に22日で代替不能セクタが543セクタに増加。来月まで持ちますように…。

と23時7分で代替保留セクタ数が596セクタ。おいおいあと10日持つのか?

23日現在、代替保留セクタが596セクタである。syslogがtimeoutエラーを吐き出しているのでSATAケーブルの問題と確信する。抜けやすくなったSATAケーブルのメスコネクタを無理矢理復活させる方法で挿し直すとピタリとエラーが止まる。550円もしたSATAケーブルが80円のSATAケーブルよりエラー率が高いという寂しい結果となった。

Ubuntu Linux 10.04 Lucid Lynxでハードディスクのチェック&テスト

WesternDigital 製ハードディスク WD20EARS-00MVWB0 667GBプラッタ初期不良品を代替品と交換した。

CFDにWesternDigitalにRMA申請を行なったあと、Ubuntu Linuxに接続してハードディスクが初期不良品かどうかのチェックを行う。

まずはハードディスクのSMARTを利用したショートテストを行う。

$ sudo smartctl -t short /dev/sdt

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: “Execute SMART Short self-test routine immediately in off-line mode”.
Drive command “Execute SMART Short self-test routine immediately in off-line mode” successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Tue Jul  6 00:03:28 2010

Use smartctl -X to abort test.

数分でショートテストは完了する。エラーが起きなければ次はSMARTのセルフテストのログ表示を行う。

$ sudo smartctl -l selftest /dev/sdt

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%         6         –

ここでエラーが表示されたら問題があるということ。今回は問題無し。

最後にハードディスクの全セクタチェックを行う。

$ sudo badblocks -vs -o sdt.txt /dev/sdt

Checking blocks 0 to 1953514583
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found.

WD20EARSの2TBハードディスクで6時間ほどで完了した。上記のコマンドは読み出しチェックのみだが、書き込みチェックの場合は-wオプションを追加する。もし不良セクタがあればメッセージが出力されるので、ショップに連絡し初期不良交換。今回はbad blockは無し。

このWD20EARSは問題がなさそうなので常用可能であろう。

なお自前で修復する場合は下記のコマンドで不良セクタを利用しないようfsckを利用する。

$ sudo fsck -l sdt.txt /dev/sdt

これで完了。

CFD株式会社がJetwayとDFI製品の取り扱いを終了

CFD マザーボード製品メニューより。

これまでのJetwayDFIのマザーボードが「お取扱終了製品」に移動し、代わりにGIGABYTETYAN製品が追加されている。

まあ新製品が出ないマイナーマザーボードメーカより、ブランドが確立しているGIGABYTEやサーバ製品中心のTYANを取り扱うほうが良いだろうが、MA3-79GDG COMBO/D使いとしては少し寂しい。

それでも近所のPCショップでTYAN製マザーボードが手に入る可能性が高くなることは良いことだ。

SAMSUNGのハードディスクHD103SIが故障

Ubuntu Linux 10.04 Lucid Lynx + Promise Supertrak ex8350でSoftwareRAIDを構築しようとしたところ、RAIDボードからビープ音が鳴った。確認すると、2009年5月に購入したハードディスクHD103SIに大量のリードエラーが発生。

badblocksコマンドを利用して不良セクタを確認したところ532セクタでエラー発生。フォーマットも途中でリードエラーとなり完了できないのでCFD行き。

立て続けにハードディスクが故障するのはKEIANの電源のせいだろうか。次ハードディスクの故障が発生したらサーバの電源をSeasonicへ乗り換えよう。