HPC計算機の高速化、大容量化、高品質化が進んだ結果、取り扱うデータ量が急増し、利用用途や研究内容によっては研究室レベルでも100TB級のストレージの導入が現実のものとなってきました。
この急増するデータ量に対応するストレージを導入するだけでも負担が重いのに、さらに全データの定期バックアップが取れる環境まで導入するとなると、その導入費用や設置スペースだけでなく管理を担当される方の手間もかかり、非常に重い負担となります。そのため現実には、より安全性の高いRAID6に更新されたり、部分的なバックアップに限定されたり、バックアップは利用者サイドに委ねられたりと、バックアップ環境は窮地に陥っています。
バックアップは必要ですが、現実には全てをバックアップできる環境の導入は負担が重く、部分的なバックアップに頼らざるを得ないのが実情です。この状況を改善するためには、ファイルサーバそれ自体の信頼性を高め、バックアップを取ることに匹敵する水準にしなければなりません。
HPCクラスタが本格利用されるようになると、多数の利用者からの多量のジョブが投入され、HPCクラスタは昼夜連続で自動運転されるようになります。そのため、ファイルサーバは無停止運用が必須となります。HPCクラスタでのファイルサーバの役割は幅広く、ユーザファイルの管理のみならず、アプリケーションソフトの管理や、各種設定情報の管理、そして定期バックアップの管理なども行っています。さらに、管理サーバと兼用されることも多く、この場合にはログイン情報の管理や、ジョブ管理、果てはUPSと連動した電源管理まで行うことも珍しくありません。そのため、ファイルサーバが突然止まってしまうとHPCクラスタ全体がパニック状態に陥り、大きなダメージが発生することもあるのです。このように、HPCクラスタでのファイルサーバの役割は幅広いだけでなく重い責任も担っているため、無停止運用可能なことが強く求められています。
弊社はHPCクラスタ用のファイルサーバのRAIDポリシーとして、「RAID10+ホットスペアディスク」という構成を強く推奨します。その理由をご説明するにあたっては、具体例でご紹介した方が判りやすいので、弊社のファイルサーバでご紹介させていただきます。
弊社のファイルサーバの優れた点は、1個のRAIDコントローラから最大90個のディスクを一括して管理できることです。この機能を利用して45個のディスクを用いた「RAID10+ホットスペアディスク」の構成例をご紹介します。最初に40個のディスクを用いて4個のディスクで構成された10セットのRAID10を設定します。次に残りの5個のディスクをホットスペアディスク用に設定し、10セットのRAID10全体で共有できるようにしておきます。このように設定しておくことで、40個のディスクのどれが障害を発生させても、自動的リビルドの際に順番にRAIDに組み込まれて行きます。
「RAID10+ホットスペアディスク」の特徴は、「RAID1+ホットスペアディスク」という信頼性を担う階層と、「RAID0」という速度や容量を担う階層に、明確に役割されていることです。このため、シンプルな動作原理となり確実に動作することができます。特に信頼性を担う「RAID1+ホットスペアディスク」は冗長性の高さを活用して、高い信頼性を達成しています。
「RAID10+ホットスペアディスク」は各RAIDレベルの中で最も贅沢な構成であり、その実効容量は物理容量の半分以下しかありません。しかし、1TB弱の大容量ディスクが低価格で発売されたことと、最大90個のディスクを一括して取り扱えるファイルサーバが登場したことで、「RAID10+ホットスペアディスク」を採用したファイルサーバは非常に魅力的な製品となっています。
それでは「RAID10+ホットスペアディスク」の信頼性の核となっている「RAID1+ホットスペアディスク」の信頼性について少しご紹介します。RAID1はご存知のように2個のディスクをミラー化したものです。RAID1にデータを書き込むと、両方のディスクに同時にデータが書き込まれ、リアルタイムにバックアップが取られている状態になります。そのため、片方のディスクに障害が起こっても他方のディスクがあるため、なんら変わることなく運用を継続できます。さらに自動リビルトは、生きている側のディスクからホットスペアディスクへ、RAIDコントローラが直接ビットデータを一括コピーだけです。パリティー計算を必要とせず、OSを介することもありません。安全で低負荷です。そして作業時間も長くて約2〜3時間と短時間で冗長性を回復させます。
「RAID1+ホットスペアディスク」の優秀さを理解するには、通常の「差分バックアップ」との比較が適切です。差分バックアップでは最初に差分計算を行うためRAIDアレイ全体が調査されます。その後、ディスクアレイ全体に散らばっている差分データを読み出し、バックアップ先に書き込まれます。このように差分バックアップ処理は重く、処理時間も長くかかります。このため、ディスクが障害を発生させたRAIDでり差分バックアップはリスクの高い作業になります。この比較から、ディスクが障害を発生させた際のバックアップとしては、上記の「RAID10+ホットスペアディスク」によるバックアップの方がリスクが遥かに少ないことが判ります。
RAID5やRAID6では自動リビルドはリスクが高いということで推奨は控えていました。しかし、「RAID10+ホットスペアディスク」構成での自動リビルド設定は強く推奨いたします。上記のように、「RAID10+ホットスペアディスク」による自動リビルドは安全で速度も速いためです。「RAID10+ホットスペアディスク」では自動リビルドが動作することで、冗長性が失われた危険な時間を最短に抑えることができます。
「RAID10+ホットスペアディスク」で自動リビルドが設定されていると、ディスクに障害が発生しても即座にリビルドが開始されます。同時に、HPCテクノロジーズのファイルサーバはLCDパネルにより障害警告が点灯し、メールによる障害通知も発信されます。そこで、ブラウザ対応の管理ツールから障害の状況を確認したり、LCDパネルやディスクのLEDの点灯で障害部品を直接確認します。このように状況を確認が終わると、お客様とHPCテクノロジーズは連絡を取り合い、デルサポートに対してオンサイトでの障害ディスク交換作業の段取りを行います。ここで素晴らしいのは、リビルド作業が長くても2〜3時間しか掛からないため、オンサイト修理スタッフがディスクの交換に駆けつけたときには、リビルト作業は完了していることが通常です。そのため、ディスク交換はRAIDアレイから切り離されたディスクに対して行え、しかも冗長性は復活しているので安全です。さて、お客様のサイトに駆けつけたオンサイト修理スタッフは、決められた手順に従い故障したディスクを新しいディスクと交換し、新しいディスクを追加し、ファイルサーバのホットスペアディスクに設定すると、復帰作業は完了します。
実は「RAID10+ホットスペアディスク」は内部的にバックアップを取っていることに近い構造です。そのため、ストレージ全体のバックアップを取ることが難しい場合でも、比較的安全性が確保されているとみなせます。しかし、ストレージの運用ではいかなるトラブルにおいても完璧ということはありません。もし可能であればバックアップを取るに越したことはありません。フルバックアップが難しいのであれば、絶対に再生が難しいような貴重なデータだけでもバックアップを取るようにしてください。
全てのバックアップを取っておくためには、ストレージの容量が非常に大きくなければなりません。HPCテクノロジーズのファイルサーバは最大135TBの物理容量まで搭載することができます。具体的には、1台のサーバには2枚のRAIDコントローラを実装できます。このRAIDコントローラには2ポートのSASポートが実装されています。各SASポートには3台のディスクエンクロージャが接続できます。各ディスクエンクロージャには15個のディスクが内蔵できます。そして、750GBのディスクドライブがサポートされています。その結果、750GB x 15 x 3 x 2 x 2 = 135000GBの物理容量まで接続することが可能です。この内部に複数のRAID10アレイを構築することができるため、共用領域やバックアップ領域などを自在に使い分けることができます。