お客様の状況お客様は大学の理論化学系の研究室様です。研究室には多数のPCクラスタとUNIX計算機が設置されていました。研究室としては独自プログラムの開発とその利用に力を注いでおられているそうです。またアプリケーションとしてはGaussianやGAMESSなども利用されているそうです。利用者は研究者や学生さんたちで、10名以上での共同利用環境として運用されていました。
お客様は、高速で大規模計算を可能とする新しいマシンの導入を希望されているのですが、高速なマシンを導入すると研究室の熱問題が深刻さを増すため、これに折り合いをつけながらの機器更新が課題だとのことでした。さらに、設置のコンパクトさ、静粛さ、簡単な運用、優れたサポートなど、計算機を使い込まれている研究室ならではのご希望をいくつも伺うことができました。
1. コアそのものが高速なものがほしい
2. コアの数量もほしい
3. 大きなメモリ空間もほしい
4. 電力性能比の高い計算機がほしい (空調が限界)
5. 静粛な計算機がほしい (居室に設置)
6. 設置場所が限られているのでコンパクトに設置してほしい
7. 古い計算機はリプレースしたい
8. これまでの計算機環境と並存させてほしい
9. 最新の開発環境を使いやすく整備してほしい
10. Gaussian、GAMESSの動作環境構築は安心して任せたい
11. 共同利用環境なのでジョブスケジューラーを搭載し設定してほしい
12. ファイルはユーザ側に保存するのでファイルサーバは小容量で良いから堅牢にしてほしい
13.
短納期で納入し、確実に稼動開始させてほしい
14. 忙しいので手離れ良くやってほしい
15. しっかりしたオンサイト保守を3年間はおこなってほしい
お客様のご要望を満は、Quad-Core Xeon 2ソケット機を採用することで満たせると考えました。Quad-Core Xeon 2ソケット機なら高い性能と高い電力性能比を両立させることができます。また、お客様と相談し今回はスクラッチディスクの搭載は断念するかわりに、ノードあたり16GBのメモリを搭載し自作プログラムによる大規模演算の実行を可能にしました。さらに、設置場所が研究室となるため静粛性かつコンパクトなワークステーションであるDPe490を採用しました。この計算機を6台ワイヤーラックにスマートに設置することにしました。コア数は全体で48コア、メモリ総量は96GBと充実した内容になっています。蛇足ですが、DPr490はワークステーションタイプなので、将来このマシンが役目を解かれた際には、Windows OSを搭載することでPCとして再利用ができます。
管理ノードは低騒音のタワー型サーバDPe840を用い、こちらも静粛性に配慮しました。また、管理ノードにはサーバ機を採用するメリットとしてサーバ機には高機能な管理ユーティリティーが搭載されており、障害の検知と修理が容易であるという理由があります。ストレージには500GBのRAID1を搭載しています。
管理ノードには、全体で使用する開発環境としてIntelコンパイラとIntel-MPIを搭載しています。この開発環境の選択と適切なインストールは非常に重要でありノウハウとなっています。その結果、8コアのメモリ共有機でOpenMP並列性能やMPI並列性能を最大限に発揮させることができます。その他に、Gaussianのビルド用としてPGIコンパイラも追加します。
システム全体は10名以上の利用者の方に共同利用環境として公開されるため、LSFを用いて自動ジョブスケジューリングを行います。そのキューの設定もお客様のご希望を伺い設定します。
また、システムの主要コンポーネントは3年間のオンサイト保守サービスか3年間の部品デリバリー交換サービスが付属しており安心です。
このような考えに従い各構成要素を揃えた上で、弊社の経験を駆使して使いやすくかつ性能が出るようにチューニングを行いクラスタとして完成させます。年度末のため、納入期限は4週間程度しか残されておらず、確実な納入が求められました。そこで弊社では各セクションのスケジューリングを調整し3週間強の納入スケジュールを立てました。
CPU: Quad-Core Xeon 2.66GHz FSB1333MHz 2CPU 8コア
Memory: 16GB 667MHz (FB-DIMM 2GB x 8)
Ssystem HDD: 250GB SATA x2 (2重化)
CPU: Duad-Core Xeon 2.13GHz FSB1066MHz 1CPU 2コア
Memory: 2GB 533MHz (DDR2-SDRAM 1GB x 2)
RAID Card: PERC5i
Storage: 500GB RAID1 (500GB SATA x2)
コンパイラ: PGI Workstation Linux 64bit、Intel Compiler
MPIライブラリ: Intel-MPI
ジョブスケジューラー: LSF
スイッチ: GbE 16port (3年保守付き)
2月の下旬に契約を頂いてから特急で作業を進め、3月の中旬には弊社でインストールとテストを完了することができました。そして、約束どおりの納期でシステムの納入と置納を行い、無事にカットオーバーすることができました。
写真はお客様の研究室で計算機とファイルサーバをワイヤーラックに搭載した様子の写真です。システムを動作させたところお客様は、このコンパクトで静粛なクラスタの中で理論演算性能が500GFlopsに到達する48コアと、96GBのメモリや管理サーバが実際に動いていることに驚かれていました。さらに納期に関しても、この短い納期でシステムのカットオーバーまで本当に行えるのか、心配されておられたとのことでした。しかし結果は、お客様のご想像よりも短い納期で納入が行われ、カットオーバーも納入日の夕刻には行われ、当日中に運用開始が行われたので安心されたそうです。