Xeon (Nehalem) | Xeon (Nehalem) 1066MHzと1333MHzメモリ | Core(TM) i7 | OS別コンパイラ
歴代CPU | Xeon(R) | AMD Opteron(TM)-Xeon(R) | AMD Opteron(TM) | AMD Opteron(TM)整数演算
ハイパースレッド | QPI | STREAM | STREAMグラフ | 並列処理の階層化

Intel(R)コンパイラにはLinux版以外にWindows版も発売されており、その性能差を確認しておくことは意味があります。そこで、Xeon(R) (Nehalem) のクロック速度別、メモリ性能別、アプリケーション別、処理効率比較図に、Linux版Intel(R)コンパイラと、Windows版Intel(R)コンパイラの結果を追加し、その性能特性を俯瞰できるようにしてみました。
テストに用いられた計算機はプロセッサにQuad-Core Xeon(R) W5580 3.2GHz (Nehalem)を2個搭載し、メモリはDDR3 1333MHz 24GBを実装したワークステーションです。コンパイラは、Linux版とWindows版の双方ともIntel(R)コンパイラ11.0を用いています。
公開されている1ジョブ処理のアプリケーション別経過時間と、最大投入可能ジョブ数でのアプリケーション別の経過時間を用いて、2.26GHz CPU 1066MHzメモリを搭載する計算機での値を基準とし、各計算機の上昇率を求め、それを散布図にプロットすることで、アプリケーション別のCPU速度とメモリ速度の効果を一目瞭然に理解できるように作図しました。
1ジョブ処理では、Linux版とWindows版のコンパイラの性能差は、「CPU性能律速型アプリケーション」では性能差がみられませんが、「メモリ性能律速型アプリケーション」ではアプリケーションによって性能差がみられます。
16ジョブ処理では、Linux版とWindows版のコンパイラの基本的な性能差は解消してきています。ただし一部のアプリケーションでは性能低下がみられます。具体的には、sphinx3、milk、bwaves、cactusADMの4種類です。
基本的にHPC用途では並列処理ないし平行処理ですから、16ジョブ処理でのスループットが大切です。
| SPEC CFP2006 Base Rates (並行処理性能) | SPEC CFP2006 Base (単体コア性能) | |||
| 型番 | T7500 | T7500 | ||
| CPU | W5580 | W5580 | ||
| 製造プロセス | 45nm | 45nm | ||
| CPUクロック(GHz) | 3.2GHz | 3.2GHz | ||
| メモリ(MHz) | 1333MHz | 1333MHz | ||
| OS | Linux | Windows Vista | Linux | Windows Vista |
| コンパイラ | Intel 11.0 | Intel 11.0 | Intel 11.0 | Intel 11.0 |
| CPU 数 | 2 | 2 | ||
| コア数 | 4 | 4 | ||
| 総コア数 | 8 | 8 | ||
| 投入ジョブ数 | 16 | 1 | ||
| SPECfp base値→ 各経過時間(秒)↓ |
195 | 185 | 37.4 | 36.3 |
| 経過時間 (秒) |
経過時間 (秒) |
経過時間 (秒) |
経過時間 (秒) |
|
| bwaves | 1165 | 1288 | 139 | 168 |
| gamess | 1462 | 1475 | 777 | 780 |
| milc | 821 | 963 | 243 | 316 |
| zeusmp | 683 | 692 | 282 | 277 |
| gromacs | 551 | 550 | 292 | 285 |
| cactusADM | 818 | 934 | 64.8 | 121 |
| leslie3d | 1104 | 1097 | 312 | 274 |
| namd | 662 | 655 | 393 | 391 |
| dealII | 621 | 977 | 317 | 402 |
| soplex | 915 | 917 | 273 | 282 |
| povray | 302 | 311 | 175 | 171 |
| calculix | 536 | 558 | 280 | 285 |
| GemsFDTD | 1394 | 1367 | 224 | 248 |
| tonto | 734 | 767 | 365 | 362 |
| lbm | 1766 | 1654 | 253 | 238 |
| wrf | 792 | 819 | 264 | 257 |
| sphinx3 | 1518 | 1512 | 437 | 434 |
【SPEC CPU2006の公開データを資料として引用】
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of April 03, 2009. The comparison presented above is based on the best performing 2-cpu servers currently shipping by Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/