お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

Xeon(R) (Nehalem Microarchitecture) の基本性能調査をSPEC CFP2006を用いて実施

Xeon (Nehalem) | Xeon (Nehalem) 1066MHzと1333MHzメモリ | Core(TM) i7 | OS別コンパイラ
歴代CPU | Xeon(R) | AMD Opteron(TM)-Xeon(R) | AMD Opteron(TM) | AMD Opteron(TM)整数演算
ハイパースレッド | QPI | STREAM | STREAMグラフ | 並列処理の階層化

 

Nehalemと歴代AMD Opteron (TM)の性能調査 (09.6.23)

 SPEC CFP2006に掲載されている歴代の主なAMD Opteron (TM)は以下の2機種です。

 これらのプロセッサをSPEC値を用いて調査します。調査ではXeon (Nehalem) 2.26GHzを基準値とし、各アプリケーション別の経過時間
用います。

1ジョブ処理による基本性能の調査

 左側のグラフは1ジョブ処理の結果を示したものです。1ジョブ処理でのBalceronaとShanghaiの特性を見ると、赤いラインで表記している「CPU速度依存型アプリケーション」ではCPUクロック速度は2.5GHzから2.4GHzへと多少低下しているにもかかわらず、コアの演算性能は10%〜20%向上しています。

 次にShanghaiでのクロック速度上昇の影響を確認するため2.4GHz、2.8GHz、2.9GHz、3.1GHzの4種類のデータをプロットしました。赤いラインで表記している「CPU速度依存型アプリケーション」はクロック速度の上昇に比例して性能が向上しています。

 これに対して青いラインで表記している「メモリ性能律速型アプリケーション」はメモリ性能に律速されています。

16ジョブ平行処理によるスループット性能の調査

【16ジョブ並行処理に合わせるためデータを補正】
  AMD Opteron(TM)のSPEC Rate値は2CPU 8コアでの8スレッド平行処理で測定されています。これに対して、新Xeon (Nehalem)のベンチマークテストは2CPU 8コア HT-onの16スレッド平行処理で測定されています。そこで、条件を合わせるため、AMD Opteron(TM)の側のデータを次のように補正します。具体的には、8スレッド平行処理を2回行った場合の時間を16スレッド並行処理とみなして評価します。右側のグラフはそのようにして作成した16ジョブ並行処理の結果をプロットしたものです。

 16ジョブ並行処理にてBalceronaとShanghaiを比較すると「CPU速度依存型アプリケーション」はクロック速度が近いにもかかわらず性能向上がみられます。

 次にShanghaiでのクロック速度上昇の影響を確認するため2.4GHz、2.8GHz、2.9GHz、3.1GHzの4種類のデータをプロットしました。赤いラインで表記している「CPU速度依存型アプリケーション」は8並行処理でもメモリボトルネックを起こさずクロック速度上昇に比例して性能向上しています。メモリ性能の影響は少ないようです。

 これに対して青いラインで表記した「メモリ性能律速型アプリケーション」はメモリ性能に強く律速されています。CPUクロック速度の影響は皆無近いです。

 

  SPEC CFP2006 Rates (並行処理性能) SPEC CFP2006 Base (単体コア性能)
製品 R805 R805 R805 R805 M805 R805 R805 R805 R805 M805
CPU Opteron Opteron Opteron Opteron Opteron Opteron Opteron Opteron Opteron Opteron
製造プロセス 45nm 45nm 45nm 45nm 65nm 45nm 45nm 45nm 45nm 65nm
CPU番号 2393 2389 2387 2378 2360SE 2393 2389 2387 2378 2360SE
CPU
クロック
(GHz)
3.10 2.90 2.80 2.40 2.50 3.10 2.90 2.80 2.40 2.50
チップセット                    
DDR2
メモリ
(MHz)
800 800 800 800 667 800 800 800 800 667
OS Linux Linux Linux Linux Linux Linux Linux Linux Linux Linux
コンパイラ pgi pgi pgi pgi pgi pgi pgi pgi pgi pgi
CPU 数 2 2 2 2 2 2 2 2 2 2
コア数/CPU 4 4 4 4 4 4 4 4 4 4
総コア数 8 8 8 8 8 8 8 8 8 8
投入
ジョブ数
16 16 16 16 16 1 1 1 1 1
経過時間(秒) 111 107 106 97.7 81.9 20.3 19.6 19.2 17.1 13.7
bwaves
1039 1042 1043 1059 1416 515 528 538 598 888
gamess 1021 1088 1128 1313 1271 1020 1088 1129 1318 1446
milc 940 940 940 949 1219 459 463 467 495 588
zeusmp 612 634 641 701 789 529 541 552 615 663
gromacs 415 441 457 530 607 411 436 451 525 663
cactusADM 771 791 798 847 1053 549 557 564 622 918
leslie3d 1148 1150 1153 1167 1480 502 507 513 553 679
namd 540 575 596 694 693 539 574 594 693 809
dealII 540 567 581 652 769 499 519 532 615 691
soplex 906 919 922 961 1212 559 569 575 619 781
povray 263 280 290 340 341 262 280 290 338 357
calculix 412 437 451 520 539 403 427 440 510 593
GemsFDTD 1348 1338 1339 1375 1792 606 602 606 542 877
tonto 565 596 613 693 780 503 534 552 640 670
lbm 1776 1777 1777 1779 2339 430 439 447 493 877
wrf 799 811 809 846 1001 480 492 503 561 684
sphinx3 1064 1091 1107 1176 1961 782 804 817 904 1307

 

【SPEC CPU2006の公開データを資料として引用】

SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Intel Corporation and Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/