お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

基礎情報

計算機本体

ストレージ

ネットワーク

OS環境

開発環境

ジョブ管理

システム管理

設置環境


プロセッサ番号一覧へ

Linpack HPL定点観測テストへ

技術情報

1. x86系CPUのHPC性能調査 (2009 Q2)

 最近のx86系計算機の性能把握は難しさを増しています。その理由は階層的な並立処理により性能が実現されるようになったため、階層的な並列処理系の組み合わせが性能に大きく影響を与えているからです。その要素は次のようなものです。並列化階層としてはハイパースカラー、マルチコア、マルチCPU、マルチ計算機の4階層があり、それらを接続するキャッシュシステム、メモリシステム、システムインターコネクトシステムも性能に強い影響を与えています。また個別のアプリケーションが計算機の各要素に求める性能特性も異なります。実際の計算機性能はこれら諸要素の組み合わせで決定されます。もしその関係を把握できていないと蜃気楼を見るような事になりかねません。

 ところが幸いにも、公開されている「SPEC CPUベンチマーク」を利用すると、x86系計算機の全体像を俯瞰できる図を作成できる可能性があります。なぜならSPECベンチは、評価している計算機の数が非常に多く(計算機ベンダー別、型番別、CPUクロック速度別、OS別)、テストに用いられているアプリケーションにも網羅性があり、さらにシリアル処理と並行処理が併せて実施されており、しかもテスト結果が詳細に公開されており、確かに実像が存在しているからです。そこで公開されているSPEC CPUベンチマークの結果を利用し、x86系計算機全体の特性を簡単に把握できるような作図を試みました。

 図は2種類あり、アプリケーション別のシングルスレッド性能図と、実行可能な最大スレッド数のジョブを同時実効させたマルチスレドでのスループット性能図を作成しました。各図ではXeon (Nehalem) 2.2GHz機の処理時間を基準にしその相対性能をアプリケーション別にプロットしています。横軸はCPU別、クロック速度別、メモリ帯域別に計算機別に並べています。また補助線として、CPUクロックを表す線とメモリ帯域を表す線を太線で追記しています。

1) CPUクロック速度とメモリクロック速度のアプリケーション別での効果比較 【グラフ】)
2) メモリ容量を稼ぐためメモリクロック速度を低下させた場合の影響をアプリケーション別に調査 【グラフ】
3) Xeon(R) (Core) と AMD Opteron(TM) (Shanghai) 【グラフ】
4) Xeon(R) 【グラフ】
5) AMD Opteron(TM) 【グラフ】 (6core Opteron追加)
6) Xeon(R) と Optero 【グラフ】
7) 整数演算性能 Xeon (Core)、Opteron (Shanghai)、Opteron (Isanbul)、Xeon (Nehalem) 【グラフ】 (6core Opteron追加)
8) Core(TM) i7 【グラフ】
9) OS別のコンパイラ 【グラフ】
10) ハイパースレッド 【グラフ】
11) OpenMPでのQPI 【グラフ】
12) STREAMを用いてQPI 【グラフ】
13) STREAMでのXeon (R) (Nehalem) テスト結果 【グラフ】
14) CPU内部の平行処理性能とCPU間の並行処理性能 【グラフ】 【メモリ早見表】
15) 並列処理の階層性 【おさらい】