お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

Xeon(R) (Nehalem Microarchitecture) の基本性能調査をSPEC CFP2006を用いて実施

Xeon (Nehalem) | Xeon (Nehalem) 1066MHzと1333MHzメモリ | Core(TM) i7 | OS別コンパイラ
歴代CPU | Xeon(R) | AMD Opteron(TM)-Xeon(R) | AMD Opteron(TM) | AMD Opteron(TM)整数演算
ハイパースレッド | QPI | STREAM | STREAMグラフ | 並列処理の階層化

 

Xeon(R) (Nehalem) VS Core(TM) i7 (Nehalem) (09.5.8)

高性能版Core(TM) i7 3.2GHz Extreme Edition はXeon(R)と同水準の性能を持つ

 最高仕様のCore(TM) i7 3.2GHz Extreme Edition機とXeon(R) 3.2GHzとの比較では、両者に大きな性能差は認められませんでした。ただ、「メモリ性能律速型アプリケーション」の性能が少し低いことが気になる程度です。

通常版Core(TM) i7の性能

 これに対してメモリ速度が低い普及版のCore(TM) i7-940 2.93GHz (メモリ1066MHz 25.6GB/s)、Core(TM) i7-920 2.66GHz (メモリ1066MHz 25.6GB/s) ではどの程度の性能が得られるのでしょうか。

 そこで元のグラフに (少し変則的な図になりますが) 普及版のCore(TM) i7のデータを追記しました。すると驚いたことに、2.93GHzや2.66GHzの高クロック速度のプロセッサであるにもかかわらず、メモリのクロック速度が1066MHzと低く抑えられている影響は大きく、1333MHzのメモリを搭載するXeon(R)よりも大幅な性能低下が確認されました。

 特にHPCで大切な8/16ジョブ並行処理のスループット性能を見ると、普及版のCore(TM) i7の「メモリ性能律速型アプリケーション」の結果は、Xeon(R) 2.26GHz機よりも低速です。さらに「CPU性能律速型アプリケーション」についても少しですが性能の落ち込みがみられました。

 結論としてはCore(TM) i7でHPCに相応しい性能が得られる製品は「Core(TM) i7 3.2GHz Extreme Edition」だけのようです。さらにCore(TM) i7はECCメモリに対応していないため、「Core(TM) i7 3.2GHz Extreme Edition」といえども本格的なHPC利用には向いていないことを付記いたします。

 

その他の違い

 Nehalemマイクロアーキテクチャを採用するプロセッサには一般用のCore(TM) i7と業務用のXeon(R)の2種類の製品が用意されています。これら両者の主な相違点を下表に挙げます。

  Core(TM) i7 Xeon(R) 2S
対応ソケット数 1S 1S, 2S
CPU毎の最大メモリ容量 24GB (4GB x6) 72GB (8GB x9)
メモリ速度 1333MHz 32.0GB/s
1066MHz 25.6GB/s
800MHz 19.2GB/s
1333MHz 32.0GB/s
1066MHz 25.6GB/s
800MHz 19.2GB/s
ECCメモリ 非対応 対応

 

Single CPU機をHPCに利用する必要について

 2世代以前のXeon(R) 2ソケット機は、メモリ帯域が貧弱なため2CPU機としての利用しても高い並列化効率は得られませんでした。その課題の克服のために編み出された対策が、高速なメモリシステムを搭載した1CPU機を基本ノードに採用し、ネットワーク並列により処理速度を稼ぐ手法でした。幸いにもその当時の1ソケット機は、 2ソケット機よりもCPUクロック速度、と同じ弱点を持たないため高い性能が得られました。

 しかし、Nehalemマイクロアーキテクチャは、1CPU機の長所である、個々のCPUがローカルなメモリシステムを持ち高い演算性能を持つという特徴を、マルチCPU機であるにも関わらず持っています。

 

SPEC CFP2006よりの引用資料

  SPEC CFP2006 Rates (並行処理性能) SPEC CFP2006 Base (単体コア性能)
製品 R670 P6T6 P6T P6T R670 P6T6 P6T P6T
CPU Xeon i7 i7 i7 Xeon i7 i7 i7
製造プロセス 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm
CPU番号 W5580 i7-965 i7-940 i7-920 W5580 i7-965 i7-940 i7-920
CPUクロック 3.20 3.20 2.93 2.66 3.20 3.20 2.93 2.66
DDR3 メモリ 1333MHz
24GB
1333
12GB
1066
12GB
1066
12GB
1333MHz
24GB
1333
12GB
1066
12GB
1066
12GB
OS Linux Linux Windows Windows Linux Linux Windows Windows
コンパイラ Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11 Intel11
CPU 数 2 1 1 1 2 1 1 1
コア数/CPU 4 4 4 4 4 4 4 4
総コア数 8 4 4 4 8 4 4 4
投入
ジョブ数
16 8 8 8 1 1 1 1
SPEC値
経過時間(秒)
195 98.8 79.2 76.0 38.9 38.5 29.5 27.7
bwaves
1123 1168 1486 1488 137 146 194 195
gamess 1435 1412 1827 2013 766 753 1214 1312
milc 797 833 1021 1025 233 235 270 279
zeusmp 672 634 783 813 275 247 277 294
gromacs 543 532 659 715 289 304 361 395
cactusADM 800 786 1028 1107 62.7 110 205 223
leslie3d 1077 1155 1435 1437 273 271 310 330
namd 651 641 766 838 390 405 481 526
dealII 603 595 935 1012 313 324 514 560
soplex 886 933 1095 1100 268 269 307 324
povray 295 295 338 369 175 180 211 231
calculix 526 518 658 716 281 280 419 453
GemsFDTD 1372 1474 1771 1771 242 232 289 296
tonto 726 698 901 949 360 358 463 503
lbm 1761 1958 2303 2303 254 237 289 289
wrf 776 758 972 981 257 242 374 398
sphinx3 1460 1488 1687 1703 437 433 487 528

 

【SPEC CPU2006の公開データを資料として引用】

SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by ASUSTeK Computer Inc. and Fujitsu. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/