先日来、悪戦苦闘している3wareのRAIDカード。ようやく期待通りのパフォーマンスも出るようになりましたが、いつの間にやら奇怪な事態になってました。気付いたのは偶然で、他の作業のため筐体をあけて作業をしたところ、気付かずにSATAケーブルを1本抜いてしまったところから始まります。
別の作業を終え、リブートすると、起動BIOS画面で5番ディスクがNot used表示されています。げげっと思って、「5番」ディスクを抜き差しして起動してみても、状態は変わらず。HDD壊しちゃったかなと思いつつ、「5番」を抜いてみると、4番ディスクが消える。えっと思って、「5番」を挿してみると、4番が復活。不思議に思って、確認してみると、以前は
となっていたはずが、いつの間にか、
5番 0番 6番 1番 7番 2番 8番 3番 9番 4番
という順番に変わっていました。カードを見ると、コネクタは2つ1組になっていて、説明書によると0番と1番、2番と3番…がそれぞれ組になっています。パターンは見えたので、同じコネクタに繋がっている2本のケーブルを全て入れ替えると、めでたく元に戻りました。さらに、さっきまで5番だったHDDの線を確認すると、チェンジャー側の線が見事に外れていて、接続したらちゃんと認識されるようになりました。
4番 1番 7番 0番 6番 3番 9番 2番 8番 5番
一番怪しいのはBIOSのアップデートですが、本当にそうなのかどうかは分かりません。気付かずに本運用に入っていたらと思うとぞっとするエピソードでした。
件のRAIDマシンはマザーボードにSupermicroのX6DHT-Gというやつを使っているんですが、これが、カーネルのapicオプションを有効にすると、IDEのハードディスクを認識に行くところで止まっていました。最初はまあいいかと思ってapicオプションを外したカーネルでこれまで試験していたのですが、カーネルでSMPを有効にするにはapicオプションが必須と知って大慌て。このままではせっかくのDual Xeonが宝の持ち腐れに。実は4.xは実質的に1TBに壁があるというのを知らなくて、メーカーさんには4.11Rが動けばよいですよといって注文したマシンなので、いまさら文句も言えない。5.x系の話として、似たような現象で、HDDをPrimary-masterではなく、Secondary-masterにすると起動するとか書いてあったので、試してみるも駄目。ああ、これは4.11Rあたりに戻して、1GB未満の論理ディスク2つという構成じゃなきゃ駄目かなと覚悟をしたとき、『そういえば、RAIDはBIOSのアップデートで直ったな』と思い出し、Supermicroのサポートページから最新のBIOS(R1.3b)を入手してアップデート。祈るような思いで再起動してみると、