お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

New Xeon MP "Nehalem-EX" の特性をSPEC CFP2006を引用して調査

Nehalem-EXとWestmere-EPの特性をSPEC CFP2006を引用して調査

 次のグラフはNehalem-EXとWestmere-EPによる4プロセッサ環境でのスループット性能を比較したものです。Nehalem-EXは4プロセッサ環境を1台で実現できます。しかしWestmerer-EPは2プロセッサ機です。そのため4プロセッサ機を実現するためにはクラスタ環境を追加する必要があります。そこで2台の計算機を10GbEによるシステムインターコネクトで接続した構成を仮定しています。追加費用としては10GbE NICとスイッチのコストとして40万円を想定しました。次の比較したシステムの構成を記載します。

【4ソケット1台・基準機】 Nehalem-EX 4Core Xeom MP E7520 1.86GHz 4CPU 16Core 128GBメモリ QPI:4.86GT/s
【4ソケット1台】 Nehalem-EX 6Core Xeon MP L7555 1.86GHz 4CPU 24Core 128GBメモリ QPI:5.86GT/s
【4ソケット1台】 Nehalem-EX 8Core Xeon MP X7550 2.0GHz 4CPU 32Core 128GBメモリ QPI:6.4GT/s

【2ソケット2台】 Westmere-EP 4Core Xeon DP X5640 2.66GHz 2node 4CPU 16Core 96GBメモリ QPI:6.46GT/s 10GbE
【2ソケット2台】 Westmere-EP 6Core Xeon DP X5660 2.80GHz 2node 4CPU 24Core 96GBメモリ QPI:6.46GT/s 10GbE

 グラフは左右に分割されており、左側が4ソケット機、右側が2ソケット2ノード機となっています。基準機はXeon 4コア E7520 4CPU 16コアです。このシステムの性能を100%として、比較対象となる計算機でのアプリケーション別のスループット性能の向上率をグラフにプロットしています。

 グラフには補助線が引かれています。赤く太い点線はCPUの理論スループット性能を表しています。性能の求め方はCPUクロック速度 X 搭載コア数 X 総CPU数です。青く太い点線はメモリの理論スループット性能を表しています。性能の求め方はCPUごとの帯域幅 X 総CPU数です。   

 まず赤い実線で示した「CPU性能律速のアプリケーション」のスループット性能を観察します。この性能についてはNehalem-EX系でもWestmere-EPでも理論スループット性能に倣って性能が変化しています。

 つぎに青い実線で示した「メモリ性能律速のアプリケーション」のスループット性能を観察します。この性能については両者のアーキテクチャの差が大きく出ています。すなわちNehalem-EXが持つ50GB/sの性能と、Westmere-EPが持つ32GB/sの性能が実効性能にも反映しています。

 価格のことを考えなければ最高スペックの計算機が良いに決まっています。しかし、最高機種は高価ですから適切なスペックダウンの方法を考えておくことも重要です。

価格比較の補助線を追加

 次のグラフは上記のグラフに価格の上昇率を示す緑色の太い点線による補助線を追加したものです。なお、Westmerer-EPによって4プロセッサ環境を実現するためには、計算機が2台と高速なシステムインターコネクト機器が必要です。ここでは10GbEでの接続を想定し10GbE NICとスイッチの費用として40万円を仮定しています。また使用メモリは90GBと仮定しています。

 緑色の太い点線と青色の線は重なっています。ことのことから「メモリ性能律速型のアプリケーション」のコストパフォーマンスはバランスがとれていることがわかります。

 これに対して、緑色の太い点線と赤色の線の関係は、クロック速度が速くなると効率がより良くなることがわかります。クロック速度の高い計算機の方がコストパフォーマンスが良いことが分かります。この傾向は搭載メモリ容量が大きくなるに従い強くなる傾向にあります。

 また別の視点から、すなわち使いやすい並列環境の実現という視点で考えます。左側のNehalem-EX機はSMP (NUMA) 構成の計算機です。このタイプの計算機は搭載しているコア数の範囲内であればOpenMP並列処理、数値演算ライブラリによる並列処理、MPIによる並列処理など多様な並列手法に対応できます。ところが左側のWestmerer-EP機は最大でも16コアまでしか搭載できないため、16並列を超える計算を実行する場合はMPIによるネットワーク並列計算によって行う方法だけしか対応できません。このように16並列から32並列の共有メモリを持ついたOpenMP並列処理、数値演算ライブラリによる並列処理を必要とされるのであればNehalem-EX 8Core 4CPU 32Core計算機は良い選択です。 

 

 

 

 

※ 上記グラフはSPEC CFP2006に公開されている資料を参照して作成しています。

SPEC CFP2006で利用されている浮動小数点演算アプリケーションの一覧。
(公開されているSPEC CFP2006より転記しています。)

bwaves (Fortran) : Computational Fluid Dynamics
gamess (Fortran) : Quantum chemical computations
milc (C) : Physics/Quantum Chromodynamics
zeusmp (Fortran) : Physics/Magnetohydrodynamics
gromacs (Fortran and C) : Chemistry/Molecular Dynamics
cactusADM (Fortran and C) : Physics/General Relativity
leslie3d (Fortran) : Computational Fluid Dynamics
namd (C++) : Classical Molecular Dynamics Simulation
dealII (C++) : Adaptive Finite Element Method
soplex (C++) : Simplex Linear Program (LP) Solver
povray (C++) : Computer Visualization
calculix (Fortran and C) : Structural Mechanics
GemsFDTD (Fortran) : Computational Electromagnetics
tonto (Fortran) : Quantum Crystallography
lbm (C) : Computational Fluid Dynmaics
wrf (Fortran and C) : Weather Forecasting
sphinx3 (C) : Speech Recognition

本サイト記載の会社名および製品名は、それぞれ各社の商標または登録商標です。

【SPEC CPU2006の公開データを資料として引用】

SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of March, 2010. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/