HPC-ProServer DPeR210
Xeon 3400番台 (Nehalem) のプロセッサを1個搭載できる1Uサーバ
4個のDIMMスロットを搭載し4GBモジュールにて16GBのメモリ空間を実現
1333MHzのDIMMモジュールを提供し21.3GB/sのメモリ帯域を実現
1TB 3.5インチHDDを最大2台搭載でき2TBのディスク容量を実現
3年間オンサイトサポートを実施
Xeon 3400番台プロセッサの特徴は、標準的なXeon (Nehalem)と比べて搭載しているメモリ接続チャンネル数が少なく、メモリ帯域幅が3分の2と低いことです。そのためHPCでは十分な演算性能が得られないことが懸念されます。その影響の範囲を特定するため公開されている"SPECfp rate"の結果を引用して「CPU性能評価グラフ」を作成しました。
"SPECfp rate" は主な科学技術計算用アプリケーションを用いて計算機のスループット性能を評価するベンチマークテストです。テストでは、計算機が同時に処理できる最大数のジョブを同時投入し、処理が完了するまでの経過時間をアプリケーション別に測定しています。
本頁ではこの結果を引用して計算機の性能比較をグラフを使って行っています。グラフではXeon (Nehalem) E5520 2.26GHzの結果を基準値としています。この基準値に対して、各アプリケーション毎のCPUクロック速度別の処理速度向上率を求め、その値をグラフにプロットしています。縦軸は、処理速度の上昇率、横軸はCPUクロック速度を表しています。また補助線として、CPUクロック速度の上昇率とメモリ帯域幅の上昇率も太線で追記しています。
"SPECfp rate" で用いるアプリケーションはその特性から、「CPU性能律速型アプリケーション」と「メモリ性能律速型アプリケーション」に区分できます。一般的に、HPC計算機は特定のアプリケーションの専用機として利用されます。そのアプリケーションの特性が「CPU性能律速型アプリケーション」か、あるいは「メモリ性能律速型アプリケーション」のどちらであるかが分かっていると、SPECfp rateの結果を参考にして、適切な計算機の選択が行えます。
Xeon 3400番台のプロセッサは最新のNehalemマイクロアーキテクチャを採用しています。そのため「CPU性能律速型アプリケーション」では高速に動作します。赤い線のグラフで表された「CPU性能律速型アプリケーション」はCPUクロック速度の上昇に比例した性能向上を示しています。懸念されていたメモリ帯域幅の低さによる影響はありません。
Xeon 3400番台のプロセッサを搭載する計算機は「CPU性能律速型アプリケーション」の平行処理、あるいは4並列までのOpenMP並列処理には適しています。
上位のXeon 3500番台やXeon 5500番台のプロセッサはメモリ接続チャンネルを3チャンネル持ち、メモリ帯域幅は32.0GB/s (1333MHz DDR3) ないし25.6GB/s (1066MHz DDR3) と高速です。これに対してXeon 3400番台のプロセッサはメモリ接続チャンネルを2チャンネルしか持たないため、メモリ帯域幅は17.1GB/s (1066MHz DDR3 2ch)ないし21.3GB/s (1333MHz DDR3)と少し低速です。このメモリ性能の低さが「メモリ性能律速型アプリケーション」に大きな影を落とすのではと心配されていました。しかし結果は予想に反して、メモリ性能の低さによる性能劣化は僅かでした。Xeon 3400番台の計算機は、メモリ律速型アプリケーションでも予想以上の性能を発揮しています。
Xeon 3400番台の計算機を「メモリ性能律速型アプリケーション」で使用する場合は、クロック速度の効果は小さいため、価格の安い2.66GHz X3450プロセッサを搭載した計算機をお勧めします。
Xeon 3400番台のプロセッサの特徴を把握するため他のプロセッサと比較できるように、Xeon 5500番台、Xeon 3300番台のグラフを追加しています。全てのグラフはXeon (Nehalem) E5520 2.26GHzを基準値にしており、同じスケールでグラフ化しました。

(出典 : SPEC CPU2006)

(出典 : SPEC CPU2006)

(出典 : SPEC CPU2006)
(公開されているSPEC CFP2006より転記しています。)
bwaves (Fortran) : Computational Fluid Dynamics
gamess (Fortran) : Quantum chemical computations
milc (C) : Physics/Quantum Chromodynamics
zeusmp (Fortran) : Physics/Magnetohydrodynamics
gromacs (Fortran and C) : Chemistry/Molecular Dynamics
cactusADM (Fortran and C) : Physics/General Relativity
leslie3d (Fortran) : Computational Fluid Dynamics
namd (C++) : Classical Molecular Dynamics Simulation
dealII (C++) : Adaptive Finite Element Method
soplex (C++) : Simplex Linear Program (LP) Solver
povray (C++) : Computer Visualization
calculix (Fortran and C) : Structural Mechanics
GemsFDTD (Fortran) : Computational Electromagnetics
tonto (Fortran) : Quantum Crystallography
lbm (C) : Computational Fluid Dynmaics
wrf (Fortran and C) : Weather Forecasting
sphinx3 (C) : Speech Recognition
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Fujitsu Siemens Computers, IBM Corporation and Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/