2012年10月11日

修復

管理しているBUFFALOのNASサーバのひとつから
RAIDディスクエラーのメールが飛んできた。
(しかも、間髪いれず10通くらい
 ディスクエラー
 ディスクエラー
 ディスクエラー
 ・
 ・
 ・ もうええって)

おー、もう5年くらい、故障もなく
機嫌よく動いてくれてると思ってたけど
そろそろ来たか・・・

いったんWebのアクセス画面を起動してみる。

普通にログインは可能で、たしかにディスク2が
エラーだとおっしゃっている。

うーむ。

ま、交換用ディスクはあるしと思って
打合せに出席して帰って来たら
また通知メールが10通ほど。

うえー。

そして、最後の通知メールに

「RAIDアレイがデグレード状態になりました」

おおっ、なんですと。

デグレード?デグレード状態って何?

慌ててWebのアクセス画面を起動したものの
反応なし・・・

およよ。しかも、対象領域が・・・

対象アレイ:システム領域 (md0)
エラー発生ディスク:ディスク2

うそ・・・

まぢか。これ。

一応、「障害があった場合はシャットダウンを行う」設定に
していたのだけれど、現物を見にいくと
電源ランプがブルーで点滅状態。

あららららら。

まぁ、どうにもならないので、ちょっと躊躇しつつ
強制終了するべく、背面のスイッチをOFF。

ん?状態変らず・・・

こうなりゃ、電源を抜くしかないのだけれど
シャットダウンには少し時間がかかるしね・・・今やって本当に大丈夫なのか?

というわけで、この状態で放置するのがいいか
電源引っこ抜くか悩んだけど、とりあえず、今日は帰宅することにする。
もしかしたら、がんばってシャットダウン処理中かもしれんやん。

(いや、たぶんこの時点でシステムはフリーズ状態だろうが・・・
 気が乗らないことは先送りしたい性格)

そして、翌朝。

祈りは通じず?昨晩と同じ状態。

こりゃもう電源引っこ抜くしかないですな。

仕方ないので覚悟を決めて、はい、終了。

すでに新しいHDDは用意してあるので、交換手続きを進める。

あ、ここでもう一回電源入れてみよーなんてことを考えたら、ダメ。
RAIDのディスクエラーは、電源落としたら、エラーのディスクを
新しいのに交換してから電源入れること。(特にBUFFALOのNASは)

障害がシステム領域だし、通常のシャットダウンが
できてなかったから、ちょっとドキドキ。

とはいえ、HDD交換自体は簡単なので、新品のディスクと入替えたら
さっそく電源ON。

説明書には自動でRAID再構築はできませんとあるけど
今回はなんだか勝手に再構築してくれました。

500GBで3時間弱くらい。

完了通知メールが飛んできて、WebからアクセスもOK。
設定内容もOK。ネットワークでブラウズしても
ちゃんと以前のフォルダが見えてる。OK。

いやー、ちょっとヒヤヒヤしたけど
うまく行ってよかった〜。

なんちゃってRAIDでも、組んでてよかったと
今回はつくづく思いました。

当たり前のことですが

・通知メールの自動送信
・障害時の自動シャットダウンの有効化
・交換ディスクの準備

これらは必須です。

そして、RAIDのディスクエラーは電源落としたら
障害のディスクを交換してから、電源を入れること。

ディスクチェックしようとか考えないほうがいい。

これは運用の経験上、そう思う。
(実は、他の課で同じタイプのNASを使ってて
 ドツボにはまったのを知っています)

なんちゃってRAIDだと思ってたけど
やりますな、BUFFALOさん・・・

そういうわけで、昨晩からの障害は昼前に無事に復旧。

実をいうと、このサーバのバックアップをとってた
外付けUSBの調子が悪く、10月以降の分がとれてなかったり
するわけですね。それもあって、ヒヤヒヤ度が大きかったのです。

とりあえず、バックアップ用のブツは購入済みなので
バックアップも早速設定。

バックアップをあなどったら、あかんな、やっぱり。
posted by 芳野 at 23:26| Comment(0) | TrackBack(0) | 芳野徒然草 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。