お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

Xeon(R) (Nehalem Microarchitecture) の基本性能調査をSPEC CFP2006を用いて実施

Xeon (Nehalem) | Xeon (Nehalem) 1066MHzと1333MHzメモリ | Core(TM) i7 | OS別コンパイラ
歴代CPU | Xeon(R) | AMD Opteron(TM)-Xeon(R) | AMD Opteron(TM) | AMD Opteron(TM)整数演算
ハイパースレッド | QPI | STREAM | STREAMグラフ | 並列処理の階層化

 

Nehalem上での
Linux版Intel(R)コンパイラとWindows版Intel(R)コンパイラの比較調査 (09.4.30)

 Intel(R)コンパイラにはLinux版以外にWindows版も発売されており、その性能差を確認しておくことは意味があります。そこで、Xeon(R) (Nehalem) のクロック速度別、メモリ性能別、アプリケーション別、処理効率比較図に、Linux版Intel(R)コンパイラと、Windows版Intel(R)コンパイラの結果を追加し、その性能特性を俯瞰できるようにしてみました。

テスト環境

 テストに用いられた計算機はプロセッサにQuad-Core Xeon(R) W5580 3.2GHz (Nehalem)を2個搭載し、メモリはDDR3 1333MHz 24GBを実装したワークステーションです。コンパイラは、Linux版とWindows版の双方ともIntel(R)コンパイラ11.0を用いています。

テスト内容

 公開されている1ジョブ処理のアプリケーション別経過時間と、最大投入可能ジョブ数でのアプリケーション別の経過時間を用いて、2.26GHz CPU 1066MHzメモリを搭載する計算機での値を基準とし、各計算機の上昇率を求め、それを散布図にプロットすることで、アプリケーション別のCPU速度とメモリ速度の効果を一目瞭然に理解できるように作図しました。

Linux版とWindows版のIntel(R)コンパイラに優劣はつかない

 1ジョブ処理では、Linux版とWindows版のコンパイラの性能差は、「CPU性能律速型アプリケーション」では性能差がみられませんが、「メモリ性能律速型アプリケーション」ではアプリケーションによって性能差がみられます。

 16ジョブ処理では、Linux版とWindows版のコンパイラの基本的な性能差は解消してきています。ただし一部のアプリケーションでは性能低下がみられます。具体的には、sphinx3、milk、bwaves、cactusADMの4種類です。

 基本的にHPC用途では並列処理ないし平行処理ですから、16ジョブ処理でのスループットが大切です。

 

 

  SPEC CFP2006 Base Rates (並行処理性能) SPEC CFP2006 Base (単体コア性能)
型番 T7500 T7500
CPU W5580 W5580
製造プロセス 45nm 45nm
CPUクロック(GHz) 3.2GHz 3.2GHz
メモリ(MHz) 1333MHz 1333MHz
OS Linux Windows Vista Linux Windows Vista
コンパイラ Intel 11.0 Intel 11.0 Intel 11.0 Intel 11.0
CPU 数 2 2
コア数 4 4
総コア数 8 8
投入ジョブ数 16 1
SPECfp base値→
各経過時間(秒)↓
195 185 37.4 36.3
経過時間
(秒)
経過時間
(秒)
経過時間
(秒)
経過時間
(秒)
bwaves 1165 1288 139 168
gamess 1462 1475 777 780
milc 821 963 243 316
zeusmp 683 692 282 277
gromacs 551 550 292 285
cactusADM 818 934 64.8 121
leslie3d 1104 1097 312 274
namd 662 655 393 391
dealII 621 977 317 402
soplex 915 917 273 282
povray 302 311 175 171
calculix 536 558 280 285
GemsFDTD 1394 1367 224 248
tonto 734 767 365 362
lbm 1766 1654 253 238
wrf 792 819 264 257
sphinx3 1518 1512 437 434

 

 

【SPEC CPU2006の公開データを資料として引用】

SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/