先に「Quad-Core Xeon 2.66GHz 8node 16CPU 64CPUコア GbE Intel-MPIクラスタ Amber9 jacテスト」ではDual-Core XeonによるIntel-MPIのデータが無かったため、両者の直接比較はできていません。そこでお客様のご協力によりAmber9での追加テストを実施しました。
Intel-MPIを採用したGbEクラスタにおいて、Quad-Core Xeonが良いのか、Dual-Core Xeonが良いのか、条件を揃えてAmber9での直接比較を行いました。
Intel-MPIによりDual-Core Xeonも性能向上がみられました。しかし、Quad-Core Xeonはそれ以上の性能を示しています。8並列では、Dual-Core Xeonは2nodeを用いるため総合メモリ帯域は42GB/s (21GB/s x2)と大きくなっいるのに対して、Quad-Core Xeonは依然として21GB/sのままですから、メモリ帯域の差が顕在化することが心配でした。ところが実測してみると、ノード数を多く必要とするDual-Core Xeon構成の方がGbEによる通信のオーバーヘッドの影響の方が大きくなり、性能が出ないことが判明しました。

価格では、4CPUコア搭載のDual-Core Xeonと、8CPUコア搭載のQuad-Core Xeonは、ほとんど同一ですから、Quad-Core Xeonは倍以上のコストパフォーマンスを持っていることになります。
4CPUコアでの計算でもQuad-Core Xeon機がDual-Core Xeon機よりも高速でした。両者の大きな違いは、搭載キャッシュの総容量がQuad-Core Xeonでは16MB (4MB x2 x2)であるのに対して、Dual-Core Xeonはその半分の8MB (4MB x2)という点です。今回のテストではそのメカニズムが直接には見えていませんが、このような点もポジティブな効果を及ぼしている可能性があります。
ここからは推測となりますが、Core DuoのGbEクラスタでも同様にGbEによる通信オーバーヘッドのペナルティーの影響は十分に警戒される必要があります。Amber9 jac Benchなどでは4node 8CPUコア程度で性能向上が停滞するようなことになると問題です。
計算機: HPC-ProServer DPe1950 8台
計算機ノードの仕様
CPU: Quad-Core Xeon (Clovertown) X5355 2.66GHz
FSB1333MHz
CPU構成: 2CPU 8CPUコア
Memory: 8GB (DDRII-667 FB-DIMM)
System HDD: SATA 250GB 7200rpm x2
OS: RedHat EL WS4 Update4 EM64T
Kernel: 2.6.9-42
開発環境: Intel-MPI 3.0, MPICH 1.2, Intel Compiler
System Interconnect: Gigabit Ethernet SW
計算機: HPC-ProServer DPe1950 8台
計算機ノードの仕様
CPU: Quad-Core Xeon (Woodcrest) 5250 2.66GHz
FSB1333MHz
CPU構成: 2CPU 8CPUコア
Memory: 8GB (DDRII-667 FB-DIMM)
System HDD: SATA 250GB 7200rpm x2
OS: RedHat EL WS4 Update4 EM64T
Kernel: 2.6.9-42
開発環境: Intel-MPI 3.0, MPICH 1.2, Intel Compiler
System Interconnect: Gigabit Ethernet SW
Dual-Core Xeonで、Intel-MPIとMPICHのAmber9における性能比較を行いました。4nodeまでは僅差ですが、8nodeで明暗がはっきりと分かれています。

以下は全ての結果をグラフ化してものです。赤のQuad-Core Xeonの性能が光っています。GbEによる並列機としてはこのチューニングレベルが最高水準に近く、今後はコンパイラや数値演算ライブラリの改善による性能向上に関心は移ります。そこで、性能向上への新しいアプローチとして高速なネットワークデバイスの利用があります。

Qual-Core Xeon 2.66GHz 8node 16CPU 64CPUコア Intel-MPIクラスタは、8node 64CPUコア計算にてネットワークが飽和しており、演算性能性能が急激に低下しています。そこで、この条件において、GbEをInfiniBandにアップグレードすることで、どのような性能変化がテスト全域に現れるのかは、多くの方の関心を寄せるテストであろうと考えています。そこで、テストを準備してます。ご期待ください。