Xeon (Nehalem) | Xeon (Nehalem) 1066MHzと1333MHzメモリ | Core(TM) i7 | OS別コンパイラ
歴代CPU | Xeon(R) | AMD Opteron(TM)-Xeon(R) | AMD Opteron(TM) | AMD Opteron(TM)整数演算
ハイパースレッド | QPI | STREAM | STREAMグラフ | 並列処理の階層化

最高仕様のCore(TM) i7 3.2GHz Extreme Edition機とXeon(R) 3.2GHzとの比較では、両者に大きな性能差は認められませんでした。ただ、「メモリ性能律速型アプリケーション」の性能が少し低いことが気になる程度です。
これに対してメモリ速度が低い普及版のCore(TM) i7-940 2.93GHz (メモリ1066MHz 25.6GB/s)、Core(TM) i7-920 2.66GHz (メモリ1066MHz 25.6GB/s) ではどの程度の性能が得られるのでしょうか。
そこで元のグラフに (少し変則的な図になりますが) 普及版のCore(TM) i7のデータを追記しました。すると驚いたことに、2.93GHzや2.66GHzの高クロック速度のプロセッサであるにもかかわらず、メモリのクロック速度が1066MHzと低く抑えられている影響は大きく、1333MHzのメモリを搭載するXeon(R)よりも大幅な性能低下が確認されました。
特にHPCで大切な8/16ジョブ並行処理のスループット性能を見ると、普及版のCore(TM) i7の「メモリ性能律速型アプリケーション」の結果は、Xeon(R) 2.26GHz機よりも低速です。さらに「CPU性能律速型アプリケーション」についても少しですが性能の落ち込みがみられました。
結論としてはCore(TM) i7でHPCに相応しい性能が得られる製品は「Core(TM) i7 3.2GHz Extreme Edition」だけのようです。さらにCore(TM) i7はECCメモリに対応していないため、「Core(TM) i7 3.2GHz Extreme Edition」といえども本格的なHPC利用には向いていないことを付記いたします。
Nehalemマイクロアーキテクチャを採用するプロセッサには一般用のCore(TM) i7と業務用のXeon(R)の2種類の製品が用意されています。これら両者の主な相違点を下表に挙げます。
| Core(TM) i7 | Xeon(R) 2S | |
| 対応ソケット数 | 1S | 1S, 2S |
| CPU毎の最大メモリ容量 | 24GB (4GB x6) | 72GB (8GB x9) |
| メモリ速度 | 1333MHz 32.0GB/s 1066MHz 25.6GB/s 800MHz 19.2GB/s |
1333MHz 32.0GB/s 1066MHz 25.6GB/s 800MHz 19.2GB/s |
| ECCメモリ | 非対応 | 対応 |
2世代以前のXeon(R) 2ソケット機は、メモリ帯域が貧弱なため2CPU機としての利用しても高い並列化効率は得られませんでした。その課題の克服のために編み出された対策が、高速なメモリシステムを搭載した1CPU機を基本ノードに採用し、ネットワーク並列により処理速度を稼ぐ手法でした。幸いにもその当時の1ソケット機は、 2ソケット機よりもCPUクロック速度、と同じ弱点を持たないため高い性能が得られました。
しかし、Nehalemマイクロアーキテクチャは、1CPU機の長所である、個々のCPUがローカルなメモリシステムを持ち高い演算性能を持つという特徴を、マルチCPU機であるにも関わらず持っています。
| SPEC CFP2006 Rates (並行処理性能) | SPEC CFP2006 Base (単体コア性能) | |||||||
| 製品 | R670 | P6T6 | P6T | P6T | R670 | P6T6 | P6T | P6T |
| CPU | Xeon | i7 | i7 | i7 | Xeon | i7 | i7 | i7 |
| 製造プロセス | 45nm | 45nm | 45nm | 45nm | 45nm | 45nm | 45nm | 45nm |
| CPU番号 | W5580 | i7-965 | i7-940 | i7-920 | W5580 | i7-965 | i7-940 | i7-920 |
| CPUクロック | 3.20 | 3.20 | 2.93 | 2.66 | 3.20 | 3.20 | 2.93 | 2.66 |
| DDR3 メモリ | 1333MHz 24GB |
1333 12GB |
1066 12GB |
1066 12GB |
1333MHz 24GB |
1333 12GB |
1066 12GB |
1066 12GB |
| OS | Linux | Linux | Windows | Windows | Linux | Linux | Windows | Windows |
| コンパイラ | Intel11 | Intel11 | Intel11 | Intel11 | Intel11 | Intel11 | Intel11 | Intel11 |
| CPU 数 | 2 | 1 | 1 | 1 | 2 | 1 | 1 | 1 |
| コア数/CPU | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 |
| 総コア数 | 8 | 4 | 4 | 4 | 8 | 4 | 4 | 4 |
| 投入 ジョブ数 |
16 | 8 | 8 | 8 | 1 | 1 | 1 | 1 |
| SPEC値 経過時間(秒) |
195 | 98.8 | 79.2 | 76.0 | 38.9 | 38.5 | 29.5 | 27.7 |
| bwaves |
1123 | 1168 | 1486 | 1488 | 137 | 146 | 194 | 195 |
| gamess | 1435 | 1412 | 1827 | 2013 | 766 | 753 | 1214 | 1312 |
| milc | 797 | 833 | 1021 | 1025 | 233 | 235 | 270 | 279 |
| zeusmp | 672 | 634 | 783 | 813 | 275 | 247 | 277 | 294 |
| gromacs | 543 | 532 | 659 | 715 | 289 | 304 | 361 | 395 |
| cactusADM | 800 | 786 | 1028 | 1107 | 62.7 | 110 | 205 | 223 |
| leslie3d | 1077 | 1155 | 1435 | 1437 | 273 | 271 | 310 | 330 |
| namd | 651 | 641 | 766 | 838 | 390 | 405 | 481 | 526 |
| dealII | 603 | 595 | 935 | 1012 | 313 | 324 | 514 | 560 |
| soplex | 886 | 933 | 1095 | 1100 | 268 | 269 | 307 | 324 |
| povray | 295 | 295 | 338 | 369 | 175 | 180 | 211 | 231 |
| calculix | 526 | 518 | 658 | 716 | 281 | 280 | 419 | 453 |
| GemsFDTD | 1372 | 1474 | 1771 | 1771 | 242 | 232 | 289 | 296 |
| tonto | 726 | 698 | 901 | 949 | 360 | 358 | 463 | 503 |
| lbm | 1761 | 1958 | 2303 | 2303 | 254 | 237 | 289 | 289 |
| wrf | 776 | 758 | 972 | 981 | 257 | 242 | 374 | 398 |
| sphinx3 | 1460 | 1488 | 1687 | 1703 | 437 | 433 | 487 | 528 |
【SPEC CPU2006の公開データを資料として引用】
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by ASUSTeK Computer Inc. and Fujitsu. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/