GbEクラスタを構築する場合に、GbEスイッチは性能を左右する重要部品です。一般のIT用途に限れば高機能なスイッチを選択する方が良いと思われます。しかし、HPC用途では経験的に、高価なスイッチが計算速度の向上に直結しないことを知っています。安いスイッチだからHPCでの並列演算性能が劣るということもなさそうです。そこで、IT用のインテリジェントな機能が備わったGbEスイッチと、あまりインテリジェントな機能は備わっていない市販されている普及品のスイッチを比較してみます。
グラフは8プロセス計算まで表示していますが、このレベルではIT用スイッチでもSimpleスイッチでも性能差はみられません。
IT SW : IT用のインテリジェントなスイッチ
Simple SW : 市販の普及型GbEスイッチ

16プロセスや32プロセスの並列になると、スイッチの差が頭を出してきました。市販の普及型スイッチの方がHPC並列性能は高いです。

ITスイッチでは8プロセスで性能が飽和しています。MPI実装はMPICHでもIntel-MPIでも変わりが無くなっています。

Simple スイッチでは32プロセスでも性能が飽和しません。特にMPI実装で、Intel-MPIを用いたものは性能が伸びています。
Intel-MPIは万能かというと、そういうことはなく、Simple スイッチでは32プロセスでも性能が飽和しませんが、IT SWでは32プロセスから性能飽和してます。

MPICHでは、Simple スイッチが16プロセスでも性能の飽和を起こしている。IT SWもでは16プロセスから性能飽和してます。MPICHはIntel-MPIに比較してネットワークのオーバーヘッドが大きく、早い段階での飽和となっているようです。
HPC並列計算を行うには、Simple スイッチとIntel-MPIの組み合わせが良いです。

HPCクラスタを構築する場合、システムインターコネクトは高速スイッチ類、InfiniBand、10GbE、Myrinet、クアドリックスなどに焦点があてられており、小型のHPCクラスタに適しているスイッチのテストは、意識的に行われて来なかったというのが実情ではないのでしょうか。このすこし靄がかかったような状態の中で、一方では安定稼動の大切さから、ブランド品のIT SWへのGbE SWのアップグレードを考えるのは自然なことです。
しかし片方で、CPUコアの演算性能も向上しています。 させに、Quad-Core Xeon機により、CPUコア単価が低下しており、一回のMPI並列に用いるCPUコア数は増加しています。そのため、ネットワーク性能の優劣が実際の並列性能に現れる機会も増えることになります。8CPUコア機の登場により、GbEでの並列計算は、その手軽さから重要度は増すのです。
今回のテストから、HPC並列機に於いては、IT用のインテリジェント機能によるオーバーヘッドが多いと推測されるIT SWよりも、それらを多く持たないSimple SWがHPC並列計算には向いていることがわかりました。そこで弊社では、HPC計算用途にはこれらのスイッチを用いると共に、各種スイッチの性能測定をも定期的に行い、その結果を製品に反映させたいと考えています。