HPC-ProServer DPeR815
理論演算性能単価のスコアが最も高い計算機
AMD Opteron 6200番台 (Interlagos) プロセッサを4個搭載できる2Uサーバ
4個の16コアプロセッサにより64コア機を実現
16GB DIMMを32個搭載することで512GBメモリを実現
16チャネルのDDR3メモリにより205GB/sのメモリバンド幅を実現
2.5インチHDDを最大6台搭載でき3TBのディスク容量を実現
Single Port 10GBASE-TとDual Port 10GBASE-SFP+に対応
3年間のオンサイト保守と技術支援を無償で実施
いま節電が求められています。しかし作業の能率を下げることは許されません。そこで、省エネ製品への買い替えが進められています。HPC計算分野でも節電効果の高いシステムへの買い替えが検討されています。
節電効果の高いシステムを設計する場合は、どの計算機を導入すれば、どの程度の効果が期待できるのかの情報の把握が必要です。そこで、計算機の電力性能比を過去3世代にわたって調べ、結果をグラフ化しました。
このグラフを見ると、現世代のXeon 2-socket機とOpteron 4-socket機の電力性能比が特に良いことがわかります。これらの計算機は、3世代前のXeon 2-socket機と比べて約3倍、2世代前のXeon 2-socket機と比べて約2倍にも電力性能比が向上していることがわかりました。
HPC計算機の省エネ化は目覚ましい勢いで進んでいます。HPC計算機の買い替えは大きな省エネ効果が期待できます。
しかし実際のHPC計算では、アプリケーションと計算機の組み合わせによって電力性能比が何倍も異なる場合があります。それでは的確なシステム設計は不可能です。そのため計算機毎のアプリケーション別の性能上昇率を調べてみる必要があります。
調査では、公開されているSPECfpのベンマーク結果を引用し、計算機毎のアプリケーション別の性能上率を調べました。さらに性能上昇と消費電力の関係を把握するため、計算機毎の消費電力上昇率を調べました。また価格上昇率も調べました。
調査の基準となる計算機は、リプレース期を迎えた前々世代のCore Microarchitecture Xeon X5470 3.33GHz 2-socket 2-node 4CPU機としました。この計算機の性能を100%として、同じ4CPU構成の代表的な計算機やクラスタの性能上昇率をアプリケーション別にグラフ化しました。
基準機と比較する計算機は、前世代の計算機と、現行世代の計算機です。3世代にわたる計算機を比較しています。
基準機は2-socket Xeon 2-node 4CPUのクラスタです。これと比較するため他の計算機も4CPU構成に換算して取り扱っています。
このグラフは一枚のグラフで、計算機毎のアプリケーション別の性能向上率、消費電力向上率、価格上昇率などを一挙に把握できるので、計算機の性能比較、電力性能比の比較、価格性能比の比較ができます。
" wrf" は利用者が増えている気象解析用のアプリケーションです。この "wrf" 用の計算機を節電を意識して選択する場合はどのプロセッサを搭載した計算機が良いのでしょうか。グラフを参考にして検討します。
"wrf" はメモリ性能律速型のアプリケーションです。同じ系統のアーキテクチャ内であればメモリ帯域幅の上昇に比例して性能が向上します。
今回比較する2世代前のXeonと現世代のXeonやOpteronのメモリ帯域幅を比較すると300%〜400%になります。ところがSPECfpでり "wrf" の処理性能の上昇率はこれを大幅に上回る500%〜700%を記録しています。この大幅な上ぶれには理由があります。2世代前のCore Microarchitectureに比べて、現在のNehalem MicroarchitectureやK10 Microarchitectureではメモリ利用効率が高くなったため、物理的なメモリ帯域幅を超える性能上昇が起こっていました。
個々の計算機の性能上昇率を見ると、基準機のXeon X5470 3.33GHz 2-node 4CPUに対して現在の3機種の計算機の性能上昇率は次のとおりです。
・ 基準機 Core MA Xeon X5470 3.33GHz 2-socket 2-node 4CPUの性能上昇率 : 約100%
・ Westmere Xeon X5690 3.46GHz 2-socket 2-node 4CPUの性能上昇率 : 約500%
・ Magny-Cours Opteron 6175 2.3GHz 4-socket 1-node 4CPUの性能上昇率 : 約600%
・ Westmere Xeon E7-4860 2.27GHz 4-socket 1-node 4CPUの性能上昇率 : 約700%
この値だけを見るとXeon E7-4860 2.27Hz 4-socket 1-node 4CPUが最も優れた印象を受けます。しかし消費電力上昇率を加えて比較しなければ節電効果の評価にはなりません。そこで次に消費電力上昇率を示します。
・ 基準機 Core MA Xeon X5470 3.33GHz 2-socket 2-node 4CPUの消費電力上昇率 : 約100%
・ Westmere Xeon X5690 3.46GHz 2-socket 2-node 4CPUの消費電力上昇率 : 約100%
・ Magny-Cours Opteron 6175 2.3GHz 4-socket 1-node 4CPU消費電力上昇率 : 約120%
・ Westmere Xeon E7-4860 2.27GHz 4-socket 1-node 4CPU消費電力上昇率 : 約170%
消費電力を考慮するとOpteron 4-socketとXeon 2-socketは互角です。Xeon 4-socketだけが少し離されています。
さらにこの比較に価格の要素を追加します。価格ではOpteron 4-socketはXeon 2-socketよりも1割安価です。価格ではOpteronが僅かに優勢です。
・ 基準機 Core MA Xeon X5470 3.33GHz 2-socket 2-node 4CPUの価格上昇率 : 約100%
・ Westmere Xeon X5690 3.46GHz 2-socket 2-node 4CPUの価格上昇率 : 約80%
・ Magny-Cours Opteron 6175 2.3GHz 4-socket 1-node 4CPUの価格上昇率 : 約70%
・ Westmere Xeon E7-4860 2.27GHz 4-socket 1-node 4CPUの価格上昇率 : 約120%
このように、上のグラフを用いると、メモリの理論性能だけ得られなかった高い解像度の評価を得ることができ、適切なシステム設計を実施することができます。
弊社ではより詳細な調査を行うことができますので "wrf" システムを検討される際にはお声掛けをお願いします。
次はCPU性能律速型アプリケーションを代表して "gamess" についての最適な計算機の導入を、グラフを参考にして検討します。
Core Microarchitecture Xeon機と最新のXeonやOpteron機とでは、CPUの理論性能の上昇率は300%〜400%です。ところがSPECfpでの "gamess" による実効性能の上昇率は170%〜200%の間です。CPU律速型のアプリケーションは、アーキテクチャの刷新の効果が小さいようです。
そのため500%を超える節電効果が期待できたメモリ性能律速型アプリケーションと比べると節電効果は170%です。
各計算機の性能上昇率を見ると、170%〜200%の間です。さらに消費電力を確認する必要があります。
・ 基準機 Core MA Xeon X5470 3.33GHz 2-socket 2-node 4CPUの性能上昇率 : 約100%
・ Westmere Xeon X5690 3.46GHz 2-socket 2-node 4CPUの性能上昇率 : 約170%
・ Magny-Cours Opteron 6175 2.3GHz 4-socket 1-node 4CPUの性能上昇率 : 約180%
・ Westmere Xeon E7-4860 2.27GHz 4-socket 1-node 4CPUの性能上昇率 : 約200%
消費電力の上昇率を考慮に入れると2-socker Xeonと4-socket Opteronが優れています。
・ 基準機 Core MA Xeon X5470 3.33GHz 2-socket 2-node 4CPUの消費電力上昇率 : 約100%
・ Westmere Xeon X5690 3.46GHz 2-socket 2-node 4CPUの消費電力上昇率 : 約100%
・ Magny-Cours Opteron 6175 2.3GHz 4-socket 1-node 4CPU消費電力上昇率 : 約120%
・ Westmere Xeon E7-4860 2.27GHz 4-socket 1-node 4CPU消費電力上昇率 : 約170%
価格の上昇率を確認すると、僅かに4-socket Opteronが優れています。
・ 基準機 Core MA Xeon X5470 3.33GHz 2-socket 2-node 4CPUの価格上昇率 : 約100%
・ Westmere Xeon X5690 3.46GHz 2-socket 2-node 4CPUの価格上昇率 : 約80%
・ Magny-Cours Opteron 6175 2.3GHz 4-socket 1-node 4CPUの価格上昇率 : 約70%
・ Westmere Xeon E7-4860 2.27GHz 4-socket 1-node 4CPUの価格上昇率 : 約120%
"gamess" についても2-socker Xeonと4-socket Opteronが共に優れています。しかし、絶対的な節電効果はメモリ性能律速型のアプリケーションに及びません。
このように節電を意識して、3世代にわたる計算機の能力を横断的に調べると、利用するアプリケーションによって、点力効率の上昇率に大きな差があることがわかります。これを参考にして、適切なシステムの節電対策を考えてください。
※ 上記グラフはSPEC CFP2006に公開されている資料を参照して作成しています。
SPEC CFP2006で利用されている浮動小数点演算アプリケーションの一覧。
(公開されているSPEC CFP2006より転記しています。)
bwaves (Fortran) : Computational Fluid Dynamics
gamess (Fortran) : Quantum chemical computations
milc (C) : Physics/Quantum Chromodynamics
zeusmp (Fortran) : Physics/Magnetohydrodynamics
gromacs (Fortran and C) : Chemistry/Molecular Dynamics
cactusADM (Fortran and C) : Physics/General Relativity
leslie3d (Fortran) : Computational Fluid Dynamics
namd (C++) : Classical Molecular Dynamics Simulation
dealII (C++) : Adaptive Finite Element Method
soplex (C++) : Simplex Linear Program (LP) Solver
povray (C++) : Computer Visualization
calculix (Fortran and C) : Structural Mechanics
GemsFDTD (Fortran) : Computational Electromagnetics
tonto (Fortran) : Quantum Crystallography
lbm (C) : Computational Fluid Dynmaics
wrf (Fortran and C) : Weather Forecasting
sphinx3 (C) : Speech Recognition
本サイト記載の会社名および製品名は、それぞれ各社の商標または登録商標です。
【SPEC CPU2006の公開データを資料として引用】
SPEC, SPECint and SPECfp are resistered trademarks of the Standard Performance Evaluation Corporation. For more information on this SPEC benchmarks see www.spe.org. SPEC and the benchmark name SPEC CPU2006 are registered trademarks of the Standard Performance Evaluation Corporation. Competitive benchmark results stated above reflect results published on www.spec.org as of May, 2011. The comparison presented above is based on the best performing 2-cpu, 4-cpu servers currently shipping by Dell Inc. For the latest SPEC CPU2006 benchmark results, visit http://www.spec.org/cpu2006/