| 型番 | asus p6t | DPeR300 | ||||||||
| CPU | Core i7 (Nehalem) | Xeon (Intel Core) | ||||||||
| 製造プロセス | 45nm | 45nm | ||||||||
| CPU番号 | 965 | X5470 | ||||||||
| CPUクロック | 3.2GHz | 3.33GHz | ||||||||
| チップセット | X58 | 5100 | ||||||||
| メモリ(MHz) | 1066MHz | 667MHz | ||||||||
| OS | Linux | Linux | ||||||||
| コンパイラ | Intel11.0 | Intel11.0 | ||||||||
| CPU 数 | 1 | 1 | ||||||||
| コア数 | 4 | 4 | ||||||||
| 総コア数 | 4 | 4 | ||||||||
| 投入ジョブ数 | 4 | 4 | ||||||||
| SPECfp rate Peak | SPECfp Peak | SPECfp rate Peak | SPECfp Peak | |||||||
| 経過時間(秒) | 4ジョブ での Core i7 と Xeon の 経過時間比 |
1ジョブ での Core i7 と Xeon の 経過時間比 |
Core i7 での 4ジョブ 経過時間 (秒) |
Core i7 での 1ジョブと 4ジョブの 経過 時間比 |
Core i7 での 1ジョブ 経過時間 (秒) |
Xeon での 4ジョブ 経過時間 (秒) |
Xeon での 1ジョブと 4ジョブの 経過 時間比 |
Xeon での 1ジョブ 経過時間 (秒) |
||
| bwaves | 30 % | 31 % | 557 | 384 % | 145 | 1843 | 390 % | 473 | ||
| gamess | 95 % | 95 % | 729 | 100 % | 727 | 771 | 100 % | 769 | ||
| leslie3d | 36 % | 52 % | 564 | 208 % | 271 | 1563 | 301 % | 519 | ||
| soplex | 39 % | 53 % | 420 | 161 % | 261 | 1080 | 220 % | 490 | ||
| GemsFDTD | 33 % | 38 % | 702 | 319 % | 220 | 2143 | 367 % | 584 | ||
| lbm | 32 % | 32 % | 924 | 390 % | 237 | 2844 | 384 % | 741 | ||
Core(TM) i7 (Nehalem) とXeon (R) での「メモリ性能依存型」アプリケーションについては、1ジョブ処理でもCore(TM) i7はXeon (R) よりも2倍も高速です。しかも、驚くべきことに4ジョブ処理でもその比率はスライドしています。この理由は、Core(TM) i7のメモリシステムが刷新されXeon (R) と比較して3倍以上の帯域を実現したことによるものです。
それに対して、gamessなどの「CPU性能依存型」アプリケーションの処理性能向上についてはCore(TM) i7 (Nehalem) では僅かな性能向上しかみられませんでした。これは既にXeon (R) でも十分に性能が引出されていたためです。さらなる性能向上を実現するためには、CPUクロック速度の向上と、コア数の増加が必要です。
Core(TM) i7 (Nehalem) 系のアーキテクチャはマチルCPUになっても、各CPUとメモリは個々に接続されており、CPU数の増加とメモリデータ転送帯域の向上は正比例します。そのため、CPU数が増えると並列処理も比例して向上することが約束されています。
SPECfpで公開されているCore(TM) i7に関するSPECfp base rate値は、「ハイパースレッディング」をオンに設定した8ジョブ同時実行テストのみが実施されているだけで、HPCに必須の「ハイパースレッディング」をオフに設定した4ジョブ同時実行テストは実施されていません。これには困りました。しかし、弊社が標準では参照していないSPECfp peak値の方では、ハイパースレッドをオフに設定した4ジョブ同時実行テストが、bwaves、gamess、leslie3d、soplex、GemsFDTD、ibmについてのみ実施されていました。そこでこのSPECfp peak値を用いて調査を行いました。
410. bwaves (Fortran) : Computational Fluid Dynamics
416. gamess (Fortran) : Quantum chemical computations
433. milc (C) : Physics/Quantum Chromodynamics
434. zeusmp (Fortran) : Physics/Magnetohydrodynamics
435. gromacs (Fortran and C) : Chemistry/Molecular Dynamics
436. cactusADM (Fortran and C) : Physics/General Relativity
437. leslie3d (Fortran) : Computational Fluid Dynamics
444. namd (C++) : Classical Molecular Dynamics Simulation
447. dealII (C++) : Adaptive Finite Element Method
450. soplex (C++) : Simplex Linear Program (LP) Solver
453. povray (C++) : Computer Visualization
454. calculix (Fortran and C) : Structural Mechanics
459. GemsFDTD (Fortran) : Computational Electromagnetics
465. tonto (Fortran) : Quantum Crystallography
470. lbm (C) : Computational Fluid Dynmaics
481. wrf (Fortran and C) : Weather Forecasting
482. sphinx3 (C) : Speech Recognition
(公開されているSPEC CFP2006より転記)
【参考】
All SPEC CFP2006 Results Published by SPEC
All SPEC CFP2006 Rates Results Published by SPEC
(注意) 表が巨大なため、ページを開く際に少し時間が掛かります。また、個別のデータのリンクに移動後、この表に戻る場合にも時間が掛かります。移動の際は「別ウインドで開く」か「別タブで開く」を利用されると軽快な操作ができます。
○ 本サイト記載の会社名および製品名は、それぞれ各社の商標または登録商標です。
【SPEC CPU2006の公開データを資料として引用】
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Intel Corporation, ASUSTeK Computer Inc. and Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/