2ソケット系のXeon DPプロセッサが新たにXeon 5600番台 「Westmere-EP」 として2010年3月17日に発表されました。このプロセッサの特徴は製造プロセスを45nmから32nmへと微細化したことです。その結果、動作周波数の向上、搭載トランジスタ数の増加、電力効率の向上などが実現されました。最高仕様の製品は6個のコアと12MBのキャッシュを搭載し3.33GHzの動作周波数を実現しています。このプロセッサによって「CPU性能依存型アプリケーション」は高いスループット性能の実現が期待できます。また、コア数を4個に減らした代わりに動作周波数を3.46GHzへと向上させ製品もラインナップされています。このプロセッサはシリアル計算の高速処理に適しています。新しいWestmere-EPで少し残念な点はメモリシステムの高速化が据え置きになっている点です。その結果「メモリ性能律速型アプリケーション」での性能向上はあまり期待できません。このページでは2010年3月17日に「Westmere-EP」が発表された直後にSPECサイトに公開された結果を引用して、速報的にこのプロセッサのファーストインプレッションを報告いたします。
Westmere-EPプロセッサで最も気になる点は6コアによる平行処理性能の向上レベルです。そこで、Westmere-EP X5680 3.33GHz 2CPU 12Coreと比較するため前代の3種類のNehalem-EPプロセッサと比較できるグラフを作成しました。そのプロセッサはE5520 2.26GHz、E5540 2.53GHz、W5590 3.33GHzです。これら4種類のプロセッサによるアプリケーション別の平行処理性能の上昇率をグラフ化しました。
グラフは相対性能を評価するため、最も性能の低しE5520 2.26GHz 2CPU 8Coreを基準機としました。縦軸はアプリケーション別の処理時間短縮率です。横軸は各プロセッサです。また補助線を太い破線で記入しています。赤い太破線はCPU理論性能の上昇率を表しています。CPU理論性能は、CPUクロック速度×スーパースカラー数×コア数×CPU数で求めた値です。青い太破線はメモリ帯域幅の上昇率を表しています。

新プロセッサと旧プロセッサの違いを明確にするため、CPUクロック周波数が3.33GHzと同じNehalem-EP W5590とWestmere-EP X5680に着眼して検討します。双方の違いはコア数が4個と6個であること。キャッシュ容量が8MBと12MBであることです。
赤色の線で示した「CPU性能律速型アプリケーション」では6コア化で実現された1.5倍の「CPU理論性能」の向上に対して、約1.5倍の実効性能の向上を実現しています。具体的なアプリケーション名はGAMESS、GROMACS、NAMD、POVRAYです。
青色の線で示した「メモリ性能律速型アプリケーション」では平行処理性能の向上は確認できませんでした。その原因は双方の「メモリ理論帯域幅」が32.0GB/sと同一性能だからです。このグループのアプリケーションの性能を向上させるためにはメモリ帯域幅の向上が必要です。
両者の他に緑色の線で示したグループがあります。基本的にはCPU律速ですが、メモリ性能の影響も受けています。具体的なアプリケーション名はZEUSMP、cactusADM、dealII、tontoです。
※ 上記グラフはSPEC CFP2006に公開されている資料を参照して作成しています。
SPEC CFP2006で利用されている浮動小数点演算アプリケーションの一覧。
(公開されているSPEC CFP2006より転記しています。)
bwaves (Fortran) : Computational Fluid Dynamics
gamess (Fortran) : Quantum chemical computations
milc (C) : Physics/Quantum Chromodynamics
zeusmp (Fortran) : Physics/Magnetohydrodynamics
gromacs (Fortran and C) : Chemistry/Molecular Dynamics
cactusADM (Fortran and C) : Physics/General Relativity
leslie3d (Fortran) : Computational Fluid Dynamics
namd (C++) : Classical Molecular Dynamics Simulation
dealII (C++) : Adaptive Finite Element Method
soplex (C++) : Simplex Linear Program (LP) Solver
povray (C++) : Computer Visualization
calculix (Fortran and C) : Structural Mechanics
GemsFDTD (Fortran) : Computational Electromagnetics
tonto (Fortran) : Quantum Crystallography
lbm (C) : Computational Fluid Dynmaics
wrf (Fortran and C) : Weather Forecasting
sphinx3 (C) : Speech Recognition
本サイト記載の会社名および製品名は、それぞれ各社の商標または登録商標です。
【SPEC CPU2006の公開データを資料として引用】
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of March, 2010. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Fujitsu Limited and Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/