お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

基礎情報

計算機本体

ストレージ

ネットワーク

OS環境

開発環境

ジョブ管理

システム管理

設置環境


プロセッサ番号一覧へ

Linpack HPL定点観測テストへ

Core(TM) i7 (Nehalem Microarchitecture) の基本性能調査をSPEC CFP2006結果により実施

Core(TM) i7データ一覧 | 単体コア | i7対Xeon (R) | i7対AMD Opteron(TM) | Xeon (R) 対AMD Opteron(TM)
クロック速度 | メモリクロック | メモリ | QPI | 並列の階層

Core(TM) i7 (Nehalem)のクロック速度向上の効果を確認

Core(TM) i7 SPEC CFP2006 Rates (並行処理性能) SPEC CFP2006 (単体コア性能)
型番 asus クロック
速度向上
による
経過時間
変化率
理想値

92 %
asus クロック
速度向上
による
経過時間
変化率
理想値

91 %
asus asus クロック
速度向上
による
経過時間
変化率
理想値

92 %
asus クロック
速度向上
による
経過時間
変化率
理想値

91 %
asus
CPU コアi7 コアi7 コアi7 コアi7 コアi7 コアi7
製造プロセス 45nm 45nm 45nm 45nm 45nm 45nm
CPU番号 965 940 920 965 940 920
CPUクロック(GHz) 3.2GHz 2.93GHz 2.67GHz 3.2GHz 2.93GHz 2.67GHz
チップセット X58 X58 X58 X58 X58 X58
メモリ(MHz) 1066 1066 1066 1066 1066 1066
OS WinVis WinVis WinVis WinVis WinVis WinVis
コンパイラ Intel11 Intel11 Intel11 Intel11 Intel11 Intel11
CPU 数 1 1 1 1 1 1
コア数 4 4 4 4 4 4
総コア数 4 4 4 4 4 4
投入ジョブ数 8 8 8 1 1 1
SPECfp 値→
各経過時間(秒)↓
82.9 96 % 79.2 96 % 76.0 31.7 93 % 29.5 94 % 27.7
   

クロック
速度変化
による
経過
時間比

  クロック
速度変化
による
経過
時間比
    クロック
速度変化
による
経過
時間比
  クロック
速度変化
による
経過
時間比
 
bwaves 1466 99 % 1486 100 % 1488 190 98 % 194 99 % 195
gamessもに 1688 92 % 1827 91 % 2013 1115 92 % 1214 93 % 1312
milc 1021 100 % 1021 100 % 1025 248 92 % 270 97 % 279
zeusmp 719 92 % 783 96 % 813 254 92 % 277 94 % 294
gromacs 605 92 % 659 92 % 715 331 92 % 361 91 % 395
cactusADM 955 93 % 1028 93 % 1107 188 92 % 205 92 % 223
leslie3d 1439 100 % 1435 100 % 1437 291 94 % 310 94 % 330
namd 704 92 % 766 91 % 838 442 92 % 481 91 % 526
dealII 861 92 % 935 92 % 1012 471 92 % 514 92 % 560
soplex 1083 99 % 1095 100 % 1100 281 92 % 307 95 % 324
povray 311 92 % 338 92 % 369 194 92 % 211 91 % 231
calculix 602 91 % 658 92 % 716 384 92 % 419 92 % 453
GemsFDTD 1783 101 % 1771 100 % 1771 283 98 % 289 98 % 296
tonto 826 92 % 901 95 % 949 424 92 % 463 92 % 503
lbm 2337 101 % 2303 100 % 2303 293 101 % 289 100 % 289
wrf 959 99 % 972 99 % 981 346 93 % 374 94 % 398
sphinx3 1635 97 % 1687 99 % 1703 444 91 % 487 92 % 528

 

Core(TM) i7 (Nehalem)でのクロック速度の効果 (09.3.24)

2.67GHz、2.93GHz、3.2GHzを用いてのCPUクロック速度上昇による実効性能の上昇を確認します。

シリアル計算での効果

背景色がブルーの欄がCore(TM) i7による1ジョブ処理でのCPUクロック速度向上による実効性能の上昇率を表にしたものです。大部分のアプリケーションは良好な速度向上を示しています。残念なことにbwabes、GemsFDTD、lbmの3種類のアプリケーションはクロック速度向上の効果がありませんでした。既に他のボトルネックに阻まれているようです。

8ジョブ並行処理について

マルチコア計算機の真価はマルチコア動作時の性能評価です。テストはハイパースレッディングをオンに設定した4コア8スレッド実行環境にて8ジョブ並行処理でテストしており、メモリボトルネックが起こりやすい厳しい環境でのテストです。

8ジョブ並行処理では、CPUクロック速度向上が効果的なアプリと
効果がないアプリに区分が明確になった

背景色がグリーンの欄がCore(TM) i7による8ジョブ処理でのCPUクロック速度向上による実効性能の上昇率を表にしたものです。約半数のアプリケーションはCPUクロックの上昇に応じた良好な速度向上を示していました。しかし残念なことに、約半数のアプリケーションでクロック速度向上の効果が得られませんでした。もしこれらのアプリケーションが今後の行われる4ジョブのテストでも性能が得られないのであれば、高速なCPUクロックの製品を導入するよりも、CPU数の確保を優先し、性能は並列計算により実現する方が現実的です。

今後の課題

Core(TM) i7 (Nehalem)ではCPUクロック速度以外にメモリのクロック速度も性能を左右する要素となる可能性があります。特に今回の調査でCPUクロック速度の上昇で性能向上しなかったアプリケーションは、既にメモリボトルネックに性能向上が阻まれていた疑いが濃厚です。それならばメモリクロック速度の向上が効果的である可能性が高まります。この点も今後の調査では重要なポイントになります。

【参考】 SPEC CFP2006で利用されている浮動小数点演算アプリケーション一覧

410. bwaves (Fortran) : Computational Fluid Dynamics
416. gamess (Fortran) : Quantum chemical computations
433. milc (C) : Physics/Quantum Chromodynamics
434. zeusmp (Fortran) : Physics/Magnetohydrodynamics
435. gromacs (Fortran and C) : Chemistry/Molecular Dynamics
436. cactusADM (Fortran and C) : Physics/General Relativity
437. leslie3d (Fortran) : Computational Fluid Dynamics
444. namd (C++) : Classical Molecular Dynamics Simulation
447. dealII (C++) : Adaptive Finite Element Method
450. soplex (C++) : Simplex Linear Program (LP) Solver
453. povray (C++) : Computer Visualization
454. calculix (Fortran and C) : Structural Mechanics
459. GemsFDTD (Fortran) : Computational Electromagnetics
465. tonto (Fortran) : Quantum Crystallography
470. lbm (C) : Computational Fluid Dynmaics
481. wrf (Fortran and C) : Weather Forecasting
482. sphinx3 (C) : Speech Recognition

(公開されているSPEC CFP2006より転記)

【参考】

All SPEC CFP2006 Results Published by SPEC
All SPEC CFP2006 Rates Results Published by SPEC

(注意) 表が巨大なため、ページを開く際に少し時間が掛かります。また、個別のデータのリンクに移動後、この表に戻る場合にも時間が掛かります。移動の際は「別ウインドで開く」か「別タブで開く」を利用されると軽快な操作ができます。

○ 本サイト記載の会社名および製品名は、それぞれ各社の商標または登録商標です。

【SPEC CPU2006の公開データを資料として引用】

SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Intel Corporation, ASUSTeK Computer Inc. and Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/