4ソケット機に用いるXeon MPプロセッサは、2ソケット用のXeon DPプロセッサが新しいNehalem Microarchitectureを採用した後も、旧世代のCore Microarchitectureを使用しつづけてきました。旧世代のCore Microarchitectureでは各プロセッサが単体のメモリコントローラを共有するというアーキテクチャを利用しているため、メモリ帯域幅の高速化には限界がありました。そのため「メモリ性能律速型アプリケーション」では厳しいメモリボトルが発生するため大きな並列性能の向上は期待できませんでした。高い性能が期待される「CPU性能律速型アプリケーション」は相応の平行処理性が確認されています。しかし並列処理でのノード内通信が並列度を高くすると通信量が増大し並列化効率が頭打ちになる可能性がありました。
下記のグラフはSPEC fp-rateで公開されている各CPUのベンチマーク結果から、アプリケーション別の処理時間を抽出し、Xeon X7550 2.26GHz 32Core機の結果を基準として各プロセッサとの相対的な性能比をグラフ化したものです。またグラフを分かりやすくするため補助線を書き加えています。赤の破線はCPUの理論性です。青の破線はメモリの理論性能です。
さて、このグラフの左側にはNetBurst MicroarchitectureとCore Microarchitectureに属する歴代の計算機が並べられています。この結果を見ると、CPU性能は順調に伸びてゆくのに対して、メモリ帯域幅は僅かしか向上していません。当然「CPY性能律速型アプリケーション」は性能が徐々に向上していますが、「メモリ性能律速型アプリケーション」の性能は停滞したままです。
ところがグラフの右側に掲載している3台の計算機は最新のNehalem Microarchitectureを採用した計算機です。CPUの理論性能も順調に向上していますが、注目していただきたいのは急激に向上したメモリ帯域幅です。QPI 6.4GT/sのプロセッサは各プロセッサあたり42.5GB/sの理論帯域幅を持ち、4ソケットを搭載するシステムでの総メモリ帯域幅は170GB/sという高い数値を示しています。実際のアプリケーションでの実効性能をグラフによって確認すると約8倍の性能向上になります。理論性能の高さが実際の性能にも反映されていることが確認できました。

※ 上記グラフはSPEC CFP2006に公開されている資料を参照して作成しています。
SPEC CFP2006で利用されている浮動小数点演算アプリケーションの一覧。
(公開されているSPEC CFP2006より転記しています。)
bwaves (Fortran) : Computational Fluid Dynamics
gamess (Fortran) : Quantum chemical computations
milc (C) : Physics/Quantum Chromodynamics
zeusmp (Fortran) : Physics/Magnetohydrodynamics
gromacs (Fortran and C) : Chemistry/Molecular Dynamics
cactusADM (Fortran and C) : Physics/General Relativity
leslie3d (Fortran) : Computational Fluid Dynamics
namd (C++) : Classical Molecular Dynamics Simulation
dealII (C++) : Adaptive Finite Element Method
soplex (C++) : Simplex Linear Program (LP) Solver
povray (C++) : Computer Visualization
calculix (Fortran and C) : Structural Mechanics
GemsFDTD (Fortran) : Computational Electromagnetics
tonto (Fortran) : Quantum Crystallography
lbm (C) : Computational Fluid Dynmaics
wrf (Fortran and C) : Weather Forecasting
sphinx3 (C) : Speech Recognition
本サイト記載の会社名および製品名は、それぞれ各社の商標または登録商標です。
【SPEC CPU2006の公開データを資料として引用】
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of March, 2010. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/