HPC-ProFS 2900V+ MD1000
拡張性の高いXeon 2way 5Uサーバと大容量ディスクエンクロージャで構成
156TB(RAID6)、84TB(RAID10+スペア)、8コア、48GBメモリまで拡張可能
10GbEx2をオプション、シリーズ中で最も低騒音、システムディスクはRAID1
冗長化電源、冗長化ファン、部品のホットプラグにも対応
Linux (CentOS) を採用し、標準的な操作で利用可能
システム全般のセットアップ実施、オンサイト設置サービス可能
3年間当日4時間プラス対応オンサイト保守 (部品先出、障害切り分け) にて安心
障害予兆検出、早期部品交換、予防部品交換、HPC運用復旧支援にて信頼性が向上
「HPC-ProFS DPe2900III + MD1000」は性能、容量、拡張性、信頼性、可用性などに優れ、ホスト部とストレージ部が独立した構造の、分離型ファイルサーバです。ホスト部にはXeon 2way 5Uラック型サーバ 「HPC-ProFS DPe2900III」を採用し、実績のある高性能RAIDコントローラ「PERC6/E」を搭載しています。ストレージ部には大容量ディスクエンクロージャ「HPC-ProFS DPvMD1000」を最大で12台まで接続でき、ディスク180基、物理容量180TBのストレージを構成できます。また、10GbEなどの強力なネックワークにも対応できる拡張性があります。信頼性や保守性の面では、冗長化システムディスク、冗長化電源、冗長化ファン、統合管理ツールなどを採用し高い可用性と迅速な復旧を実現しています。さらに、当日4時間オンサイト保守サービスを3年間無償実施しています。
「HPC-ProFS DPe2900III + MD1000」のシステム構築では、「スケーラブル・エンタープライズ」という手法が採用されています。この手法は、高品質なコンポーネントの組み合わせにより、大規模なエンタープライズ級システムを構築しようとするものです。そのためには高品質コンポーネントの生産が鍵となります。そこで巨大な生産規模を持つDELLが総力を挙げて製品種類を絞込み、量産効果を高めることで品質の向上と価格の低下を実現させています。その努力が結実した優れた基本コンポーネントを直交的に組み合わせて構成したシステム製品が「HPC-ProFS DPe2900III + MD1000」です。
「HPC-ProFS DPe2900III + MD1000」は「スケーラブル・エンタープライズ」で則っているので使用するサーバやディスクエンクロージャ、ディスク、ケーブル類などの基本コンポーネントは、開発段階から相互に組み合わせて動作検証されており、サポートでも包括的サービスが期待できます。この効用は大きく、万一障害が発生すると、オンサイト修理担当が当日4時間で急行するのと平行して、障害に関連しそうな部品を筐体を飛び越したシステムレベルで潤沢に準備し、各地の物流センターから修理現場に別便で急送されます。現場で障害を確認し、もし原因調査に時間が掛かりそうなら調査を断念し、障害に関係しそうな部品を広範囲に交換してしまう「予防交換」に切り替えることで、原因調査に費やす時間を大幅に削減し、迅速・確実な復旧を実現し、障害の再発までも抑制します。これも「スケーラブル・エンタープライズ」の大きな効用です。
ファイルサーバでは高速CPU、大容量メモリ、高性能RAIDコントローラ、高性能ネットワークなどの高機能部品を多数搭載し安定動作させる必要があり、余裕ある筐体の採用が望まれます。「HPC-ProFS DPe2900III」は十分な5Uサイズと十分なスペースを持っており、CPUヒートシンクやメモリ専用ファンを搭載し、多数の拡張スロットを備え保守性も良く、ファイルサーバとして優れた特長を備えています。
最新のHPCクラスタは高性能化しているためファイルサーバの負担も増大しています。さらに定期バックアップを実施するようになると、この負担にも対応する必要があります。幸いにもマルチコアプロセッサの登場により、価格が低廉な2wayサーバでも高い処理能力を実現できるようになりました。1CPU 4コアはエントリーモデル、2CPU 8コアは定期バックアップなども行える高機能モデルとして、用途によって最適な性能のプロセッサ構成を選択できます。
システムには標準で8GBのメモリが搭載されています。メモリ容量に関しては通常の利用ではこの容量でも不足することはありません。しかし、HPCでは性能を優先してメモリキャッシュ機能をオンにする設定が通常です。そのため、もしファイルI/Oに大きなピークが発生するような状況ではメモリ容量の拡張が効果的です。特にマルチポートGbEや10GbEを搭載しているシステムではメモリの拡張は大きな効果が期待できます。
ストレージの性能を強化すると、それに応じた通信性能の高速化が求められます。「HPC-ProFS DPe2900III」では高速ネットワークのオプションとして高い価格性能比を実現するマルチポートGbEカード (GbE x2、GbE x4) あるいは、圧倒的な通信性能を持つ10GbEカードが、純正品として選択できます。マルチポートGbEカードのついかによる性能増強では既存のGbEスイッチの空ポートを利用できますから、費用負担が少なくて済みます。これに対して10GbEカードは10GbE対応のスイッチも併せて導入する必要があり、コストも考慮する必要があります。しかし、従来は高価だった10GbEスイッチも低価格化が進んでおり導入しやすくなっています。
システムディスクの強化も大切です。もしシステムディスクにはOSが搭載されているだけではなく、ストレージの構成情報やネットワーク情報なども搭載されているため、システムディスクが故障すると取り返しの付かない事態に陥る可能性があります。そこで「HPC-ProFS DPe2900III」では2基の160GBディスクを搭載し、RAID1構成による冗長化を実現していすま。システムディスクに障害が発生しても運用が継続できるのみならず、待機ディスクにより自動的に冗長化が復活します。もちろん、ディスクはホットプラグ交換できるため、運用を停止する必要もありません。
電源は大容量の冗長化電源を搭載しています。この電源もホットプラグ交換に対応しており、当日4時間で駆けつける技術サービス員により、電源を落とすことなくホットプラグ交換でき運用を停止する必要はありません。また、冷却用ファンもホットプラグ対応の冗長化ファンを採用しています。
「HPC-ProFS DPe2900III + MD1000」では原因の特定に時間がかかるような障害に際しては、障害に関係しそうな部品を広範囲に交換する「予防交換」を行う場合があり、原因調査に費やす時間を大幅に削減し、迅速・確実な復旧を目指します。予防交換を行うことで障害の原因となる可能性が潜んでいる箇所が根こそぎ交換されるため、障害が再発する心配も解消されます。
ファイルサーバの基幹部品はRAIDコントローラです。「HPC-ProFS DPe2900III + MD1000」には「PERC6/E」と呼ばれる高性能RAIDコントローラが搭載されます。「PERC6/E」には外付けディスクエンクロージャ「HPC-ProFS DPvMD1000」と接続するためのSASx4ポートが2ポート実装されています。各SASx4ポートには「DPvMD1000」を最大3台までディジーチェーン接続できます。この「DPvMD1000」には最大15基のディスクが搭載できます。そのため「PERC6/E」のSASx4ポートには45基のディスクが接続できます。この45基のディスクは「PERC6/E」からは境界の無いディスクアレイとして認識されます。さらにこの45基のディスクアレイから、複数のRAIDボリュームを作成でき、さらに複数の共有スペアディスクを設定することもできます。これは非常に便利な機能です。なお、「PERC6/E」にはSASx4ポートが2ポート実装されているので、45基ディスクアレイを別にもう1セット接続することができ、総計では90基のディスクを接続できる高い拡張性があります。さらに拡張性の高い「HPC-ProFS DPe2900III」は「PERC6/E」を2枚搭載できるため、SASx4ポートを4ポート実装でき、総計で180基のディスクを接続できます。
SAS接続の大きな特長としてSAS Expanderによるディジーチェーン接続のサポートがあります。RAIDコントローラや、ディスクエンクロージャにはSAS Expanderと呼ばれるスイッチが実装されており、そのスイッチ間をSASx4マルチレーン接続にて数珠繋ぎに接続し、さらに途中のSAS ExpanderからSASポートを枝分かれさせ、ディスクを接続することで、全体がスイッチに接続した状態となり、一括して利用できます。

SASは1レーンあたり3Gbpsと高速シリアル通信を実現しています。このSAS高速シリアル通信を集合させたものがSASx4マルチレーン接続です。「HPC-ProFS DPe2900III + MD1000」では3GbpsのSASレーンを4レーン集合させていますから総合帯域は12Gbpsと高速です。しかも、内部は1レーン毎に平行処理されますから、多数のディスクを接続して負荷を掛けても、コリジョンが起こりにくい仕組みになっています。
最大45基のディスクが接続できることで、幅広い容量レンジのRAID10ストレージが構築できます。1TBディスクを用いた場合、各SASx4ポート毎に最小2TBから最大20TBまでのRAID10を構築できスペアディスクも十分な数を設定できます。さらにSASx4ポートを2ポート使用すると40TB、 「PERC6/E」を2枚搭載しSASx4ポートを4ポート使用すると80TBまで拡張できます。
「PERC6/E」は全世界のDELL製ストレージで共通利用されているRAIDコントローラです。そのため非常に多くの導入実績を誇っています。
「HPC-ProFS DPe2900III + MD1000」では原因の特定に時間がかかるような障害に際しては、障害に関係しそうな部品を広範囲に交換する「予防交換」を行う場合があり、原因調査に費やす時間を大幅に削減し、迅速・確実な復旧を目指します。予防交換を行うことで障害の原因となる可能性が潜んでいる箇所が根こそぎ交換されるため、障害が再発する心配も解消されます。
「HPC-ProFS DPvMD1000」は3Uサイズの筐体に最大15基のディスクを搭載し、15TBの物理容量を実現できる外付けのディスクエンクロージャです。搭載するディスクはホットプラグに対応し、大容量の冗長化電源、冗長化ファンなどもホットプラグに対応したものが採用され高い可用性を実現します。
「HPC-ProFS DPvMD1000」は最大3台を相互にディジーチェーン接続することができ最大45基のディスクをRAIDコントローラからはディスク筐体を飛び越えて単一のディスクアレイとして認識することができます。
ファイルサーバの信頼性を担う重要部品はディスクドライブです。本製品で主に用いているディスクはSATA 7500rpm 1TB規格のものです。このディスクはDELLの圧倒的な購買力により、製品の開発段階からディスクメーカー共同で試験を行い、製造段階でも厳重な品質管理を実施したディスクが採用されており安定動作が期待できます。
「HPC-ProFS DPe2900III + MD1000」では原因の特定に時間がかかるような障害に際しては、障害に関係しそうな部品を広範囲に交換する「予防交換」を行う場合があり、原因調査に費やす時間を大幅に削減し、迅速・確実な復旧を目指します。予防交換を行うことで障害の原因となる可能性が潜んでいる箇所が根こそぎ交換されるため、障害が再発する心配も解消されます。
「HPC-ProFS DPe2900III + MD1000」で採用しているRAID構成はRAID10が基本です。RAID10はRAID1の特長である信頼性や可用性と、RAID0の特長である高速性と大容量を兼ね備えた優れたRAIDポリシーです。しかも従来RAID10の課題であったコスト問題や容量問題は、ディスク低価格化と大容量化により大きく緩和されています。少ない損で大きな得があるRAID10の採用をお勧めします。
ストレージでの障害の連鎖的な発生は危険です。しかし、障害が連鎖する可能性はあります。そのような場合でもRAID10は比較的耐性が高いRAID構成です。そこにさらに、複数の共有スペアディスクを搭載していると連鎖障害に対する耐性はより高いものになります。
弊社では標準的なRAID10のボリュームサイズを2TBとしています。その最初の理由は2TB程度のボリュームサイズが管理しやすいからです。2TB程度であれば、バックアップやリストア作業は約半日で完了します。次の理由は32bit制限の残骸による影響です。ファイルサーバはHPCクラスタ外部の不特定の計算機からアクセスされる可能性があります。これらの計算機がもし2TBの制限を持っていると、ファイルサーバに搭載しているファイルシステムにも影響が出る場合があります。但し、お客様のご要望があればOver 2TBのボリュームをご提供することも可能です。
システムの冗長化が進むと多少の障害が発生しても、システムが自己修復するため、ユーザが障害を見落としている場合もあります。しかし、自己修復された後のシステムは冗長性が失われている場合も多いので一刻も早い対応が求められます。そこで、システムには複数の障害通報機能が搭載されています。LEDがオレンジ色に点滅していたり、LCDがオレンジ色に点滅しエラーメッセージが表示されていると障害です。さらに、ブラウザベースの統合管理ツールでも障害が確認できます。さらに、メールにより障害通知機能も搭載されています。
メールによる障害通知機能を活用するためには、適切な設定がポイントです。単に通知機能が搭載されているだけでは、設定しても迷惑メールとして処理されてしまうケースも見聞きしています。適切に機能させるためには、多くのノウハウが必要です。