HPC-ProConnect M3601Q (QDR 32port)
HPC-ProConnect M2401G (DDR 24port)
ブレード専用32ポート QDR InfiniBandスイッチ (内部 x16、外部QSFP x16)
ブレード専用24ポート DDR InfiniBandスイッチ
(内部 x16、外部CX4 x8)
BladeServerのミドルプレーン経由の接続により簡潔なシステムを実現
アプリケーション、開発環境、OSを含むトータルシステムインテグレーション
3年間の24時間365日当日4時間プラス対応オンサイト保守を標準実施
HPC-ProConnect M3601Qは32個のQDR (40Gbps) ポートを備えたブレード専用スイッチです。32個のポートは内部接続用として16ポートがBladeServerのミドルプレーンと呼ばれる5Tbps以上の通信帯域を持つ基板上のコネクタに接続され、そこから最大で16台の計算ノード接続されます。残り半分の16ポートは外部との通信用に用意されておりノンブロッキング通信が可能です。
内部16ポート外部16ポートをバランス良く持つことで、2台のM外部とのノンブロッキング通信が可能となり、大規模かつ高速なクラスタシステムの構築にBladeServerを利用することができるようになりました。
スイッチの帯域は2.56Tbpsを持ち、32個のQDRポート間の通信を、ノンブロッキングで実現します。
電源部や冷却ファンなどはBladeServer側の冗長化されたモジュールを利用しており、部品点数の削減とあわせ、高い信頼性の実現に大きく寄与しています。
HPC-ProConnect M3601Qは広帯域のQSFPコネクタを採用しています。QSFPは双方向で80Gbpsの高帯域を持ちながら、従来のCX4コネクタよりも小型化されており省スペースを実現できます。
HPC-ProConnect M2401Gは24個のDDR (20Gbps) ポートを備えたブレード専用スイッチです。24個のポートは内部接続用として16ポートがBladeServerのミドルプレーンと呼ばれる5Tbps以上の通信帯域を持つ基板上のコネクタに接続され、そこから最大で16台の計算ノード接続されます。残りの8ポートは外部との通信用に用意されておりCX4規格のポートが用意されています。
スイッチの帯域は960Gbpsを持ち、内部の16個のDDRポート間はノンブロッキングが可能です。しかし16ノードのブレードを搭載した場合での外部との通信はブロッキングが発生します。さこで、外部とのノンブロッキング通信を希望される場合は、HPC-ProConnect M3601Qを選択してください。
電源部や冷却ファンなどはBladeServer側の冗長化されたモジュールを利用しており、部品点数の削減とあわせ、高信頼性に寄与しています。
HPC-ProConnectMシリーズはHPC-ProServer DPeM1000eブレードサーバの専用スイッチとして製品化されており、一緒に組み合わせるブレード筐体や計算ノード、共通電源、システム管理ツールなどとのバリデーションが徹底的に行われています。その結果、組み合わせ問題に起因する不具合の発生が低く封じ込められています。
さらに世界中での多くの稼動現場からフィードバックされる情報に基づき、日夜システムの回線やアップデートを行われており、ファームウェアやドライバのアップデートなどを行うことでさらなる安定稼動が保たれます。
量産により競争的な価格を実現MellanoxはInfiniBandの主要半導体製品メーカーであり、同時に完成品のスイッチやHCAカード類を多くの大手コンピュータベンダーにOEM提供していることで知られています。
HPC-ProConnectMシリーズのInfinibandスイッチとHCAカードもこの米Mellanox社製品のOEMです。右写真は計算機側に搭載されるInfiniBand用のHCA Mezzanine Cardです。このカードもMellanox社製です。さらに搭載されているチップもMellanox社製です。
HPC-ProConnectMシリーズは、大量生産することで、他の追従を許さない競争的な価格提供を実現しています。価格表を参照してください。3年間の24時間365日当日4時間のオンサイト保守と修理部品先出無償交換が付属しての価格です。
高い実装密度BladeServerを採用したクラスタは高い実装密度を実現できます。右掲のイラストは、42Uラック上に次のような機器を搭載した完成品のHPCクラスタです。
・ Blade筐体3台による48node 96CPU 384core構成のQDR-Infnibandクラスタ
・ 管理ノード兼ファイルサーバ (15TB-10GbE)
・ 無停電電源装置、KVM
従来同様の構成を実現するためには2台のラックが必要でしたが、これを半分の床面積で実現します。
簡素なケーブリング右写真は8nodeのInfinibandクラスタの配線作業中の背面写真です。この規模のクラスタでも背面は多くのケーブルが張り巡らされます。これがさらに大規模なクラスタに発展すると、KVMケーブルなども追加され計算機の背面は夥しい数のケーブルで覆われはじめます。
そのため、空気の流れが妨げられ、計算機の発熱を避けるため、計算機の間にスペースを設けるなどの工夫を施します。そこで実際のクラスタ構築では、42Uラックを用いても32node程度の実装密度に密度を落として実装しています。
これに対してBlade筐体に内蔵するHPC-ProConnectMシリーズのInfiniBandスイッチは嵩張るInfiniBandケーブルの配線が不要です。スイッチと計算ノード間の接続は、BladeServerに実装されている5Tbpsを越える転送帯域を持つミドルプレーンボードを用いて行えるからです。また、このミドルプレーンボードにはまだ十分な通信帯域の余裕があり、10GbE、FiberChanel、KVMなどの接続にも利用されています。
これまでInfiniBand接続のクラスタを構築する場合は、ラック搭載サーバとInfiniBandスイッチを個別に異なるベンダーより導入しシステムインテグレーションする手法が一般的でした。この方法は構成の自由度が高い反面、マルチベンダー化のデメリットとして、十分な保守サービスを得るため高い保守コストを覚悟する必要がありました。
これに対して、BladeServerを用いてInfiniBandクラスタを構築する場合は、InfiniBandスイッチ類などを含む全ての構成部材が単一ベンダーの純正オプション品のみで構成でき、システム全体にわたる包括的な24時間365日当日4時間オンサイト保守を廉価に提供できます。
さらに大手ベンダーならではの高度な物流システムで実施される迅速な保守パーツのデリバリーと、高スキルの保守要員の全国展開により、素早い障害復旧が実現され、ミッションクリティカルな用途でも安心して導入していただくことができます。
HPC-ProConnectMシリーズとInfiniBand HCAメザニンカードには標準で3年間の24時間365日の当日4時間プラス対応オンサイト保守サービスが付属します。もちろん部品は先出対応なので、万一の障害にも修理作業は迅速です。
4時間プラス対応では障害の通知と同時に、修理で必要と判断される可能性が高い部品のユーザ先への発送が開始され、修理スタッフが約4時間以内に到着する際には部品も届いている必要があります。そのため、全国各地の物流サービス拠点には必要な部品が常備在庫されています。このサポート用ロジスティクスの充実はシステムの安定運用では非常に重要です。
HPCクラスタは長期間の安定運用が求められます。HPC-ProConnect-MシリーズならびにHPC-ProServer DPeM1000eブレードサーバ製品群の標準3年間のオンサイト保守は、 お客様のご要望に応じて最長で5年間までの保守期間の延長が可能です。そのため長期間の運用計画でも安心です。
弊社が提供するHPC-ProConnectMシリーズはシステム提供に際して、コンパイラなどの開発環境やMPIライブラリなどをインストールし使い易く設定してご提供するのみならず、アプリケーションの搭載やジョブ管理環境の搭載、ファイルサーバ管理サーバ類とのインテグレーション作業などを含んだ完全動作システムに仕上げてご提供します。ブレードサーバを始めて導入されるお客様にも安心して利用開していただけるようなサービスを行っています。さらに、オンサイトでのシステム導入説明好評です。