IBM ServeRAID MR10i搭載のIBM System x3650 M2 (Type.7947)上で RAID 1運用中のシステムのうち、1基のSAS HDDに障害発生し、降格しているのを見つけたので、システムを落とすことなく ホットスワップ でのディスク 交換 をしてみました。
既に発売から10年以上経過している本機ですが、ドメインコントローラからファイル共有までを担う、スモールオフィスではよくあるオールインワンサーバとして今でも現役で運用しています。
自席から離れたフロアにある為、その存在すら忘れかけていた頃に、ふとリモートデスクトップで久しぶりに入り、MegaRAID Storage Manager (MSM) を開くとログイン前から警告が出ているのを確認。
ログイン後、ダッシュボードページにも警告が出ているものの、その内容までは判別には至らず。
タブをクリックしてPhysical、Logicalの各ビューを開いてようやくディスク障害を確認。
このサーバでは、計6本のSAS HDDを2本1組のRAID1ペアにして、システム、ファイル共有、バックアップの3つのRAID1冗長化ドライブを構成しています。そして今回障害が発生しているのはシステムを構成するスロット0番のドライブで、もう数カ月OSの入ったドライブを片肺運転していたことになります。
早速実機を見に赴くとMSMの警告通り、スロット0のHDDが異常を示していました。
本機はホットスワップに対応しているため、そのまま障害のあるHDDを取り外して入れ替えることも出来るのですが念の為、MSMで当該ディスクを右クリックしてオフラインを選択。
すると確認のプロンプトが出るので、チェックボックスにチェックを入れてからYes押下。
さらにもう一度プロンプトが出るので、同様にYes押下します。
前回、別機で初期化した同容量のSAS HDDと入れ替えると、自動的にオンラインに復帰されます。
MSMのダッシュボードで確認すると、自動的にリビルトが始まっていました。
146GBのディスクで構成されるこのRAID1ドライブは、ディスク交換からおよそ20分程度でリビルトが完走して、Optimalな状態へ復帰しました。
今後発生する障害はEメールで通知を受けるようにすべく、次回はMegaRAID Storage Managerに備わっているメール通知機能を設定したいと思います。
投稿 IBM System x サーバにおけるSAS RAIDディスクのホットスワップ交換手順 は Fun Scripting 2.0 に最初に表示されました。