Ubuntu Linux 10.04 Lucid Lynxのカーネルでタイムアウトでハングアップしたとログが表示される

Ubuntu Linux 10.04 Lucid Lynxのsyslogに大量にカーネルログが吐き出されていた。

以下の通り。

Jul  9 14:06:07 server kernel: [13200.403026] INFO: task jbd2/dm-0-8:1311 blocked for more than 120 seconds.
Jul  9 14:06:07 server kernel: [13200.403032] “echo 0 > /proc/sys/kernel/hung_task_timeout_secs” disables this message.
Jul  9 14:06:07 server kernel: [13200.403036] jbd2/dm-2-8   D ffff8800805a9880     0  1311      2 0x00000000
Jul  9 14:06:07 server kernel: [13200.403042]  ffff880186b65d30 0000000000000046 ffff88005d173430 ffff880188f64f50
Jul  9 14:06:07 server kernel: [13200.403048]  ffff880186b64000 ffff880186b65fd8 0000000000015bc0 ffff880186b65fd8
Jul  9 14:06:07 server kernel: [13200.403054]  ffff880196c15bc0 ffff880196c15f80 ffff880186b65fd8 0000000000015bc0
Jul  9 14:06:07 server kernel: [13200.403059] Call Trace:
Jul  9 14:06:07 server kernel: [13200.403071]  [<ffffffff8122aa75>] jbd2_journal_commit_transaction+0x1c5/0x12c0
Jul  9 14:06:07 server kernel: [13200.403078]  [<ffffffff815696e9>] ? sub_preempt_count+0x9/0xa0
Jul  9 14:06:07 server kernel: [13200.403082]  [<ffffffff81566561>] ? _spin_unlock_irq+0x21/0x50
Jul  9 14:06:07 server kernel: [13200.403088]  [<ffffffff810580a0>] ? finish_task_switch+0x50/0xd0
Jul  9 14:06:07 server kernel: [13200.403092]  [<ffffffff815696e9>] ? sub_preempt_count+0x9/0xa0
Jul  9 14:06:07 server kernel: [13200.403095]  [<ffffffff8156651c>] ? _spin_unlock_irqrestore+0x2c/0x50
Jul  9 14:06:07 server kernel: [13200.403100]  [<ffffffff81089190>] ? autoremove_wake_function+0x0/0x40
Jul  9 14:06:07 server kernel: [13200.403106]  [<ffffffff81232747>] kjournald2+0xb7/0x210
Jul  9 14:06:07 server kernel: [13200.403110]  [<ffffffff81089190>] ? autoremove_wake_function+0x0/0x40
Jul  9 14:06:07 server kernel: [13200.403114]  [<ffffffff81232690>] ? kjournald2+0x0/0x210
Jul  9 14:06:07 server kernel: [13200.403118]  [<ffffffff81088da6>] kthread+0x96/0xa0
Jul  9 14:06:07 server kernel: [13200.403123]  [<ffffffff810142da>] child_rip+0xa/0x20
Jul  9 14:06:07 server kernel: [13200.403128]  [<ffffffff81088d10>] ? kthread+0x0/0xa0
Jul  9 14:06:07 server kernel: [13200.403132]  [<ffffffff810142d0>] ? child_rip+0x0/0x20

要はRAIDブロックデバイスが120秒間返答なしでタイムアウトでハングしたということらしい。

ハードディスクを確認したところ故障の兆候はなく、単純にファイルコピーの容量が大きくて時間がかかっているときに吐き出されているようだ。そこで下記のURLを参考にsyslog表示を止めた。

http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=517586

方法はsyslog中にも出力されているが、下記の通り。

$ sudo -s

$ echo 0 > /proc/sys/kernel/hung_task_timeout_sec

これでsyslogにカーネルのタイムアウトハングアップのメッセージは表示されなくなる。

広告
コメントする

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。