お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

Xeon(R) (Nehalem Microarchitecture) の基本性能調査をSPEC CFP2006を用いて実施

Xeon (Nehalem) | Xeon (Nehalem) 1066MHzと1333MHzメモリ | Core(TM) i7 | OS別コンパイラ
歴代CPU | Xeon(R) | AMD Opteron(TM)-Xeon(R) | AMD Opteron(TM) | AMD Opteron(TM)整数演算
ハイパースレッド | QPI | STREAM | STREAMグラフ | 並列処理の階層化

 

Xeon(R) (Nehalem)でのメモリ速度差の演算性能への影響 (09.4.9)

Xeon(R) (Nehalem) は1個のCPUに接続するメモリ数を増やすに従いメモリクロック速度が低下するという特徴があります。例えばCPUクロック速度2.93GHzのCPUに3〜6枚のメモリを接続するとメモリクロックは1333MHzですが、メモリを9枚に増やすとメモリクロックは1066MHzへと低下します。その場合の性能への影響はどの程度なのでしょうか。その影響をSPECテストにて確認してみます。

グラフを見ていただくと一目瞭然です。「CPU速度依存型アプリケーション」 (赤線) は最もメモリ負荷が高い16ジョブ並行処理でもメモリクロック速度低下の影響は受けていません。ところが「メモリ性能律速型アプリケーション」 (青線) ではメモリ速度低下の影響を強く受け大きく性能低下し、2.93GHzのCPUを利用しているにもかかわらず、2.26GHzのCPUと同じスループットしか得られていません。それならば最初から廉価な2.26GHzのCPUを選択する方が得策です。

SPEC CFP2006よりの引用資料

  SPEC CFP2006 Rates (並行処理性能) SPEC CFP2006 Base (単体コア性能)
製品 8200EX 6026T 6026T 6026T 6026T 6026T 6026T 8200EX 6026T 6026T 6026T 6026T 6026T 6026T
CPU Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon
製造プロセス 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm
CPU番号 X5570 X5570 X5560 X5550 X5540 X5530 X5520 X5570 X5570 X5560 X5550 X5540 X5530 X5520
CPU
クロック
(GHz)
2.93 2.93 2.80 2.66 2.53 2.40 2.26 2.93 2.93 2.80 2.66 2.53 2.40 2.26
チップセット 5520 5520 5520 5520 5520 5520 5520 5520 5520 5520 5520 5520 5520 5520
DDR3
メモリ
(MHz)
1066
48GB
1333
24GB
1333
24GB
1333
24GB
1066
24GB
1066
24GB
1066
24GB
1066
48GB
1333
24GB
1333
24GB
1333
24GB
1066
24GB
1066
24GB
1066
24GB
OS Linux Linux Linux Linux Linux Linux Linux Linux Linux Linux Linux Linux Linux Linux
コンパイラ Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11
CPU 数 2 2 2 2 2 2 2 2 2 2 2 2 2 2
コア数/CPU 4 4 4 4 4 4 4 4 4 4 4 4 4 4
総コア数 8 8 8 8 8 8 8 8 8 8 8 8 8 8
投入
ジョブ数
16 16 16 16 16 16 16 1 1 1 1 1 1 1
経過時間(秒)                            
bwaves
1268 1181 1188 1188 1359 1361 1364 165 139 140 150 173 174 174
gamess 1566 1555 1643 1702 1835 1929 2072 801 797 831 865 953 1000 1053
milc 937 818 819 821 964 964 968 243 243 247 253 278 286 292
zeusmp 712 704 720 741 817 847 875 276 283 288 297 332 341 352
gromacs 581 579 601 633 667 703 754 302 302 314 327 362 376 396
cactusADM 855 842 855 880 971 1011 1048 66.8 66.3 67.4 70.6 78.2 81.1 84.6
leslie3d 1232 1107 1109 1112 1306 1307 1311 323 284 321 328 365 374 386
namd 699 699 723 765 808 849 910 407 405 424 442 481 506 535
dealII 641 642 658 683 747 774 813 328 325 339 353 387 406 423
soplex 1001 940 939 930 1105 1105 1114 278 277 283 291 320 330 340
povray 319 318 331 348 372 388 416 181 181 188 197 216 226 241
calculix 567 567 587 618 661 690 737 290 289 299 311 343 360 378
GemsFDTD 1568 1408 1418 1406 1686 1686 1686 268 225 227 249 259 263 267
tonto 773 751 765 802 895 921 960 374 373 388 405 446 468 492
lbm 2107 1760 1756 1757 2172 2170 2166 289 252 252 252 290 290 290
wrf 858 774 796 799 937 955 949 274 268 275 283 317 327 340
sphinx3 1611 1527 1538 1542 1746 1759 1779 451 453 486 483 540 567 622

 

Nehalem Microarchitectureはメモリ速度については800MHz、1066MHz、1333MHzの3種類の中から選択できるので注意が必要です。

【SPEC CPU2006の公開データを資料として引用】

SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Intel Corporation and SGI. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/