お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

HPC計算機導入事例

ファイルサーバ導入事例 (抜粋)

Gaussian導入事例 (抜粋)

固体電子状態の第一原理計算用Quad-Core Xeon 3node 6CPU 24core GbEクラスタ【導入事例】

お客様の状況

お客様は大学の研究室の方で、固体の電子状態の第一原理計算を並列計算機で実行されています。研究室では現在ラックマウント型Pentium4クラスタを2セット所有されており、先生方と生徒さんの約10数名で共同利用されています。利用されるアプリケーションは
・ Gaussian
・ VASP
・ WIEN2k
・ DMOL
・ CASTEP
などです。また自作プログラムの開発と並列実行を行い深い造詣と経験をお持ちでした。

お客様のご要望

お客様が現在所有されている2セットの並列計算機はGbEによるPentium4のネットワーク並列機のためネットワークが飽和しやすく、高並列度の実現にはハードルがありました。そこで、今回は搭載コア数の多い計算機をクラスタ化し、通信ボトルネックを低減させたシステムの構築には大きく期待されていました。

1. 高速なコアを導入したい
2. コアの数量もほしい
3. 最新のCPUに対応した最新の開発環境を導入したい
4. 多コアの計算機を採用して高並列度の計算を高速動作させたい
5. MPI通信の最適化を的確に行ううえで相談に乗ってほしい
6. メモリはコアあたり2GB程度ほしい
7. 設置スペースに余裕があるので、安価なワークステーション型計算機でよい
8. 既存システムからの移行に関して相談にのってほしい
9. 居室に置くわけではないが出来るだけ静かな計算機が良い
10. 教員と学生で利用者が十数名と多いので、共同利用に耐えうるような計算機システムにして欲しい
11. 厳しい納期だが、納期を守って納めてほしい
12. 3年間のオンサイト保守も含んでほしい

計算機の構成

お客様とのご相談

お客様はご予算の中で、可能な限り要求に沿った計算機の導入を希望されていました。そこで、色々とご相談を行いながら仕様の絞り込みを行いました。採用するCPUはQuad-Core Xeonを筆頭としながらも、他との比較や技術的な見通しも織り込みながら検討を行いました。

Quad-Core Xeon 8コア機に対抗するオプテロンを採用した計算機となると、4ソケットのDual-Core Opteron機による8コア機が適当なのですが、4ソケット機はホワイトボックス系を選択しても決して安くはありません。また価格の安い2ソケットのDual-Core Opteron機では8コア機と比較してノード数が倍になるため通信飽和が起こりやすくなり魅力がありません。

次の対抗機種はIntelの1ソケット機です。しかしこれも2〜4コア機なので、8コア機と比較するとノード数が4〜2倍となり通信飽和が起こりやすくなります。しかも現状の1ソケット機はFSBが1066MHzと遅く、メモリ帯域も小さいなどHPCとしての基本性能でFB-DIMMを採用したXeon 2ソケット機が大きく勝っています。さらに、コアあたりの単価も決して安くはありません。そのうえこちらもノード数が多くなるので通信飽和が起こりやすくなります。これらの理由からHPC利用での難点があることがわかります。昨年、FB-DIMMを採用したXeon 2ソケット機が登場したことによりHPC用途での1ソケット機の魅力は急速に失われています。

では2ソケット機によるQuad-Core Xeon 2CPU 8コア機は性能が出るのでしょうか。この問いに対して弊社は一貫して性能は出るとの立場を取り続けています。そして、Quad-Core Xeonで性能が確認されていないケースに対しては、「どのようなチューニングを施せば期待どうりの性能が得られるのか。」ととらえて課題に向き合い、試行錯誤を繰り返す中で性能向上を実現し続けています。これらの事例は弊社ホームページに実例として掲載しています。そのなかでも特に印象的であったのは、Intel-MPIを採用したことによるQuad-Core Xeon 8コアのクラスタ機の並列性能を向上させたシステムチューニング例の発表です。この発表の影響は大きく、これが影響して市場の流れも変化しはじめています。

このように、Quad-Core Xeon + Intel-MPI並列機により以前ならば高価な大規模クラスタでなければ実現できなかった高速計算が、机の上に置いた数台のワークステーションで実現可能となっています。

計算機の構成

このような状況のなかで、お客様とお話を進めるうちに計算機の構成は自ずと決まってゆきました。

○ クアットコアXeon搭載の静音ワークステーション DPr490 3台
CPU : Quad-Core Xeon 2.66GHz 3node 6CPU 24コア
Memory : 16GB/node (total 48GB)
HDD : システム 250GB (SATA 250GBx2 2重化)
FS : 1台を論理的にホストと見なし、そこをファイルサーバとして全体で共有
HOST : ホストと見なしたマシンに開発環境をインストールし、全体で共有

○ 開発環境
Intel Fortran
Intel C/C++
Intel MKL
Intel MPI

○ ジョブ管理ソフト/その他
LSF-HPC
16ポートGbEスイッチ

○ 搭載アプリケーション
CASTEP
自作プログラム

設置されたシステム

右写真は先生の研究室に設置されたシステムの写真です。机の上に設置された3台のワークステーション3台で構成されたクラスタですが、その演算性能は非常に大きなものです。しかし、その動作音は非常に小さいです。

納入時に伺ったお客様のご感想

この計算機の性能に期待されているお客様は、「計算機の性能が確認できたら、3年ほど前に導入した37Uラック搭載のPentium4 10台構成のクラスタは現役を引退させ、新しい学生さん用の勉強や練習用のマシンとして活用したい。」と話されていました。

お客様はこれ以外に、19台のPentium4で構成された19コアの大きなクラスタをお持ちなので、今回の24コアと合わせると大きな演算性能を稼動させていることになります。

これらのシステム全体はLSFにより複数の異なるシステムとして認識されたうえで、自動的にジョブ管理されており、多数の方で共同利用されても、スムーズに動作しています。