お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

基礎情報

計算機本体

ストレージ

ネットワーク

OS環境

開発環境

ジョブ管理

システム管理

設置環境


プロセッサ番号一覧へ

Linpack HPL定点観測テストへ

Core(TM) i7 (Nehalem Microarchitecture) の基本性能調査をSPEC CFP2006結果により実施

Core(TM) i7データ一覧 | 単体コア | i7対Xeon (R) | i7対AMD Opteron(TM) | Xeon (R) 対AMD Opteron(TM)
クロック速度 | メモリクロック | メモリ | QPI | 並列の階層

QPIによる高速なCPU通信の実現 (09.3.30)

QPIの並列利用により通信バス競合が解消

さて、従来のXeon (R) のCPUの通信は、単一のFSB (Front Side Bus) により行われています。この方法はメモリを効良く利用できる反面、通信帯域が10.6GB/sのFSBを複数コアが共有するため、各コア上のジョブが求めるメモリI/O、ディスクI/O、ネットワークI/Oなどが集中するとバス競合が懸念されます。さらに「メモリ性能依存型」アプリケーションではメモリ帯域不足による性能向上の停滞も課題でした。

これに対してNehalem Microarchitectureでは、従来のFSBに代わって、QPI (QuickPath Interconnect) と呼ばれる25.6GB/sの通信帯域を持つ、チップ間通信用のコントローラをCPU上に搭載し、CPU間の通信や、CPUとI/Oハブ間の通信を独立QPIを介して行うことで、バス競合の起こらない高速な通信を実現しています。さらにメモリコントローラも25.6GB/sの帯域を持つ独立したコントローラを備えています。

そのため、Nehalem MicroarchitectureのCPU通信帯域は、1ソケット用CPUにて51.2GB/sの帯域を、2ソケット用CPUでは76.8B/sの帯域を、4ソケット用CPUではなんと128GB/sのの通信帯域を実現しているのです。

このように、従来のCPUでは10GB/sの1本のポートで全ての通信を賄っていたものが、Nehalemでは機能別に独立した25.6GB/sの通信ポートを複数備えることで、極めてスケーラブルな通信帯域を実現するようになり、今後のさらなる多コア化やCPUコアの性能向上に対しても大きな余裕を持って対応できるようになっています。

QPIにより超高速QDR InfiniBandにも対応

高速な並列計算を目指すためには、高速なシステムインターコネクトの搭載が必須です。ところが従来のXeon (R) では、メモリI/Oと、並列通信I/O処理がFSBを共有していたので、通信バス競合の懸念がありました。さらに、マルチコア化やCPU性能が向上すると、いつバス競合に遭遇するかわかりません。また、これから登場する40Gbpsの帯域を持つQDR InfiniBandの採用ではさらに厳しい条件となります。ところがInfiniBandを接続するIOハブを25.6GB/sの帯域を持つQPIでCPUに直接接続することで、従来懸念されていたバス競合を発生させることがありません。

QPIにより10GbEを用いたシステムの性能向上

HPC計算では、計算規模の巨大化により、高速大容量ストレージへの要求が高まっています。その切り札として期待されるのが10Gigbit Ethernet (10GbE) です。この10GbEの性能を引出すためにもQPIの性能は欠かせません。Intel(R)の資料によると、現在のXeon (R) を用いて1portの10GbEを動作させるためだけでも、PCI Express性能の33%、メモリ性能の約20%、FSB性能の約50%、CPU性能の約80%が消費されています。なお、このテストはメモリ上でのテストですが、実際にはストレージとのI/O負荷も加わります。ですから、従来のXeon (R) では1portの10GbEを搭載したファイルサーバが上限のようです。

これに対して、Nehalem Microarchitectureが採用するQPIでは、CPUとPCI Expressバス間の通信が高速化されるだけでなく、CPUとメモリ間の通信、CPU間の通信などが高速に、かつ独立して行われるため、十分な性能マージンが得られます。Intel(R)の資料によると1portの10GbEではメモリ性能の約3%、FSB性能の約3%、CPU性能の約20%しか消費しないそうです。通信帯域の全般にわたりこれだけの余裕があれば、複数の10GbEポートと複数の高速ストレージを搭載した超高速ファイルサーバシステムの実現が可能となります。

この状況に呼応して、マルチポート化された10GbEメザニンカードがサーバのオプションとして市販され始めており、近い将来の総10GbEネットワーク化の先駆となっています。