お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

ベンチマークTOP

アプリケーション別ベンチマーク

 Gaussian (test397)大規模計算
 VASP (Hg)VASP (large job)
 GAMESS
 Amber9 (jac)
 CHARM
 FLUENT
 STAR-CD
 LS-Dyna


SPEC CFP2006の結果評価

Linpack HPL定点観測

システムインターコネクトの試験

ストレージのべンチマーク

基礎のベンチマークテスト


プロセッサ番号一覧へ

HPC計算機テストセンター概要
HPC計算機テストセンター利用法

LS-Dyna Xeon 2n4p16c (08.9.29)

LS-Dyna Xeon 1n2p8c (08.7.23)

LS-Dyna Xeon 1n2p8c (07.1.26)

Xeon 8node 16CPU 64CPUコアでのMPI実装比較テスト (Amber9)

はじめに

先に「Quad-Core Xeon 2.66GHz 8node 16CPU 64CPUコア GbE Intel-MPIクラスタ Amber9 jacテスト」ではDual-Core XeonによるIntel-MPIのデータが無かったため、両者の直接比較はできていません。そこでお客様のご協力によりAmber9での追加テストを実施しました。

Quad-Core Xeon Intel-MPIと、Dual-Core Xeon Intel-MPIとの優劣

Intel-MPIを採用したGbEクラスタにおいて、Quad-Core Xeonが良いのか、Dual-Core Xeonが良いのか、条件を揃えてAmber9での直接比較を行いました。

GbE Intel-MPIクラスタは、Quad-Core Xeonが高速、価格性能比は圧倒的優位

Intel-MPIによりDual-Core Xeonも性能向上がみられました。しかし、Quad-Core Xeonはそれ以上の性能を示しています。8並列では、Dual-Core Xeonは2nodeを用いるため総合メモリ帯域は42GB/s (21GB/s x2)と大きくなっいるのに対して、Quad-Core Xeonは依然として21GB/sのままですから、メモリ帯域の差が顕在化することが心配でした。ところが実測してみると、ノード数を多く必要とするDual-Core Xeon構成の方がGbEによる通信のオーバーヘッドの影響の方が大きくなり、性能が出ないことが判明しました。

価格では、4CPUコア搭載のDual-Core Xeonと、8CPUコア搭載のQuad-Core Xeonは、ほとんど同一ですから、Quad-Core Xeonは倍以上のコストパフォーマンスを持っていることになります。

4CPUコアでの計算でもQuad-Core Xeon機がDual-Core Xeon機よりも高速でした。両者の大きな違いは、搭載キャッシュの総容量がQuad-Core Xeonでは16MB (4MB x2 x2)であるのに対して、Dual-Core Xeonはその半分の8MB (4MB x2)という点です。今回のテストではそのメカニズムが直接には見えていませんが、このような点もポジティブな効果を及ぼしている可能性があります。

ここからは推測となりますが、Core DuoのGbEクラスタでも同様にGbEによる通信オーバーヘッドのペナルティーの影響は十分に警戒される必要があります。Amber9 jac Benchなどでは4node 8CPUコア程度で性能向上が停滞するようなことになると問題です。

 

テスト環境 Quad-Core Xeon

計算機: HPC-ProServer DPe1950 8台
計算機ノードの仕様
CPU: Quad-Core Xeon (Clovertown) X5355 2.66GHz FSB1333MHz
CPU構成: 2CPU 8CPUコア
Memory: 8GB (DDRII-667 FB-DIMM)
System HDD: SATA 250GB 7200rpm x2
OS: RedHat EL WS4 Update4 EM64T
Kernel: 2.6.9-42
開発環境: Intel-MPI 3.0, MPICH 1.2, Intel Compiler
System Interconnect: Gigabit Ethernet SW

テスト環境 Duad-Core Xeon

計算機: HPC-ProServer DPe1950 8台
計算機ノードの仕様
CPU: Quad-Core Xeon (Woodcrest) 5250 2.66GHz FSB1333MHz
CPU構成: 2CPU 8CPUコア
Memory: 8GB (DDRII-667 FB-DIMM)
System HDD: SATA 250GB 7200rpm x2
OS: RedHat EL WS4 Update4 EM64T
Kernel: 2.6.9-42
開発環境: Intel-MPI 3.0, MPICH 1.2, Intel Compiler
System Interconnect: Gigabit Ethernet SW

 

 

Dual-Core XeonクラスタでのIntel-MPIとMPICHの性能比較

Dual-Core Xeonで、Intel-MPIとMPICHのAmber9における性能比較を行いました。4nodeまでは僅差ですが、8nodeで明暗がはっきりと分かれています。

 

全ての結果

以下は全ての結果をグラフ化してものです。赤のQuad-Core Xeonの性能が光っています。GbEによる並列機としてはこのチューニングレベルが最高水準に近く、今後はコンパイラや数値演算ライブラリの改善による性能向上に関心は移ります。そこで、性能向上への新しいアプローチとして高速なネットワークデバイスの利用があります。

[予告] InfiniBandのテストを準備中

Qual-Core Xeon 2.66GHz 8node 16CPU 64CPUコア Intel-MPIクラスタは、8node 64CPUコア計算にてネットワークが飽和しており、演算性能性能が急激に低下しています。そこで、この条件において、GbEをInfiniBandにアップグレードすることで、どのような性能変化がテスト全域に現れるのかは、多くの方の関心を寄せるテストであろうと考えています。そこで、テストを準備してます。ご期待ください。