2台のWestmere-EPによる4CPU構成と、1台のNehalem-EXによる4CPU構成とでは、どちらが良いのかということは判断が難しいところです。そこで基礎的な判断材料となるように「SPEC fp-rates」を元にして性能比較をしてみようと考えました。
最初に単純な2CPU構成での比較によって両者の違いを明らかにしたいと考えました。下のグラフの右から2番目と3番目の構成がそれです。「CPU性能」については、理論性能と実効性能の双方でWestmere-EPが高速でした。なぜならCPUクロック速度はWestmere-EPが3.33GHzであるのに対してNehalem-EXは2.0GHzとです。ところがコア数は6コアと8コアであり僅差です。そのため「CPU性能律速型アプリケーション」ではWestmere-EPが勝っています。
ところが「メモリ性能」はNehalem-EXが勝っています。なぜならNehalem-EXは4本のメモリチャンネルを搭載しており、1チャンネル分だけ高速であるからです。「メモリ性能律速型アプリケーション」ではNehalem-EXの方が高速です。2CPU機の比較は以上です。
Nehalem-EX 4CPU機は2CPU機の2倍の性能を持っています。下のグラフの右端が4CPU機です。これと同等の性能をWestmere-EPで実現するためにはネットワーク並列環境が必要です。ネットワーク並列環境を実現するためには廉価なGbE、中間的な価格の10GbE、あるいは高価なInfiniBandが必要です。
32並列を利用する場合に、ネットワーク負荷の低いアプリケーションを利用する場合はGbEでも大丈夫なのでWestmere-EPの方が廉価です。ところが高速なネットワーク性能を必要とするアプリケーションを利用する場合は高価な10GbEやInfiniBandを必要とするため高価になります。このような場合はNehalem-EXも価格的に折り合います。しかもNehalem-EXはOpenMP並列や数値演算ライブラリによる並列計算でも32並列まで動作します。この2点についてはWestmer-EPでは逆立ちしても実現できないポイントとなります。例えばGaussianでの32並列ではNehalem-EXは最適の計算機となります。おおよそこのような領域がNehalem-EXのスイートスポットです。するとこの領域の外部はWestmere-EPの独壇場ということになりそうです。

SPECベンチマークは17種類の主要な科学技術計算系アプリケーションによるベンチマークテストです。その中でも「SPEC fp-rates」と呼ばれるテストは、計算機に投入できる最大数のジョブを同時に投入し、処理が完了するまでの時間を計測することで、最大スループット性能を求めるテストです。SPECベンチマークの公式サイトでは計算機ごとのアプリケーション別の処理時間が詳細に公表されています。このデータは計算機の評価に非常に有用です。
※ 上記グラフはSPEC CFP2006に公開されている資料を参照して作成しています。
SPEC CFP2006で利用されている浮動小数点演算アプリケーションの一覧。
(公開されているSPEC CFP2006より転記しています。)
bwaves (Fortran) : Computational Fluid Dynamics
gamess (Fortran) : Quantum chemical computations
milc (C) : Physics/Quantum Chromodynamics
zeusmp (Fortran) : Physics/Magnetohydrodynamics
gromacs (Fortran and C) : Chemistry/Molecular Dynamics
cactusADM (Fortran and C) : Physics/General Relativity
leslie3d (Fortran) : Computational Fluid Dynamics
namd (C++) : Classical Molecular Dynamics Simulation
dealII (C++) : Adaptive Finite Element Method
soplex (C++) : Simplex Linear Program (LP) Solver
povray (C++) : Computer Visualization
calculix (Fortran and C) : Structural Mechanics
GemsFDTD (Fortran) : Computational Electromagnetics
tonto (Fortran) : Quantum Crystallography
lbm (C) : Computational Fluid Dynmaics
wrf (Fortran and C) : Weather Forecasting
sphinx3 (C) : Speech Recognition
本サイト記載の会社名および製品名は、それぞれ各社の商標または登録商標です。
【SPEC CPU2006の公開データを資料として引用】
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of March, 2010. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Fujitsu Limited and Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/