マルチコアCPUの高性能化により並列性能が向上したことで、Gaussian 03用の主力プラットホームは、従来のネットワーク並列機からマルチコア並列機へ移行しています。これらの計算機をいち早く導入されたお客様は「実際の実験で扱うサイズの分子をモデル化することなくリアルに扱える能力がある」と高くご評価されていました。単体の計算機上で実用的な計算を流せるようになったことで、大規模なGaussianジョブの大量処理が可能になっています。この点を意識して計算機システムの情報を整理します。
> お客様の評価
過去にメモリ共有計算機機が高価だった時代には、LindaによるGaussianのネットワーク並列は大きな価値がありました。Lindaにより大規模なGaussian計算が容易に行えるようになり、Gaussianの利用者が増え、Gaussianの有効性の検証も進みました。しかし、ネットワーク並列はシステムを複雑にするため、Gaussianを道具として使ううえでは制約もありました。
このような制約からGaussianのネットワーク並列環境は広く普及するには至りませんでした。実際にGaussianの機能をフルに活かした計算が普及するためには、高速かつ安定した計算機がリーズナブルナな価格で登場する必要がありました。※ もちろん、ネットワーク環境の難しさを克服され成果を収められたサイトも数多くあります。
45nmプロセスで製造されたQuad-Core Xeon 2CPUを搭載する計算機が登場したことで、これまでLinda並列でしか実現できなかった大規模な計算が、単体ワークステーションで実現できるようになりました。さらに、利用可能なメモリサイズも最大で64GBと十分大きく、搭載できるスクラッチディスク容量もRAID0で2TBと大きいため、計算サイズの制限も解消されています。ノード内計算のメリットを箇条書きにします。
このように最新のマルチコア機は性能と機能が大きく向上したことで、ネットワーク並列で指摘されていた課題が消滅することとなり、これを契機としてGaussianの計算環境にブレークスルーを起こそうとしています。
現在入手可能な最高性能の計算機は45nm Quad-Core Xeon FSB1600MHz、DDR2 800MHz FB-DIMMです。この製品はまだ出荷前なのでテスト結果は出ていませんが、近い構成のシステムでは性能が出ているとの情報を頂いています。その性能の片鱗はtest397にもあらわれています。
大規模なGaussian計算には高速なスクラッチディスクが必要です。計算規模が大きくなると、経過時間の大半をスクラッチディスクのI/Oに空費することもあります。そこで弊社ではスクラッチディスクにRAID0を採用し高速化しています。さらにファイルシステムにも高速なXFSを採用しています。スクラッチディスクの速度に関してはベンチマークテストのページで詳しく報告しています。
Gaussian 03の並列計算では並列度が増すと必要とするメモリ容量も増えます。これは、Gaussian 03では計算規模と指定したメモリサイズから並列度を割り出しているからです。そのためメモリ容量が少ないと、nproc値を大きく指定していても、自動的に並列度を下げて計算を実行します。このように搭載メモリ量が少ないとCPUコアを遊ばせてしまう場合があり、計算は実行されているのですが、計算速度は向上しない場合があります。そこで、大規模な計算をマルチコア計算機で高速に実行させるたためには、十分な容量のメモリを搭載する必要があります。現在の導入例ではシステムあたり16GB程度の搭載量が安心サイズとされているようです。
マルチコア機にて並列度が高くなるとそれに応じたメモリI/O速度も求められます。これまで最速のメモリはDDR2 667MHz FB-DIMMでしたが、弊社計算機のDPr7400では従来より20%も高速なDDR2 667MHz FB-DIMMを搭載することができます。
ディスクI/Oが多いアウトコアソルバーによる計算では大容量メモリを搭載し、このメモリをディスクキャッシュとして機能させることで計算速度を向上させることができます。これまで大容量メモリを搭載できる計算機は高価な64bit UNIX機が中心でしたが、ようやくPCベースの計算機でも64bit環境が熟成しています。さらに大容量メモリの低価格化が進んだことで、このような利用方法も可能になってきています。約100万円程度の費用で32GBのメモリが追加でき、ディスクI/O時間の劇的な削減が可能なら、この投資は決して高価なものとはならない分野も多いと思われます。
Gaussianではシステムが大規模になるのみならず、長期間の連続負荷がかかりますから高品質な計算機でなければ安定運用は難しいとされています。弊社では各種の計算機を事前調査した結果、DELLのサーバやワークステーションが高品質と高性能を両立させていると判断しました。さらに、DELLのサーバやワークステーションを1年半以上にわたってクラスタ用に使用しているなかでも、高い品質には確かな手応えを感じています。また、障害対応の迅速さも優れています。
計算機を安心して良いコンディションで利用するためには、OSを含むシステム構築や、ジョブ管理システムの実装、最新の開発環境のインストールと設定まで、細部に気を配った開発環境の構築が必須です。弊社は長年の計算機環境構築の経験を元に優れたGaussian 03用の計算機システムをご提供いたします。
Gaussianにはバイナリー版も存在します。速度もGaussian E01 以降は並列処理効率が向上し高速です。さらに、Lindaによるネットワーク並列も動作します。Gaussianのサイトライセンスをお持ちの場合には、同じ住所の同じ組織であれば誰でもGaussianをインストールし利用することができます。バイナリ版のCDメディアの入手は比較的容易です。導入に際しては弊社が親切にサポートします。本格的にGaussianの利用を目指されるのならソースコード版のGaussianをインストールされることをお勧めしますが、ソースコードレベルにまで踏み込んだ調査は行わず、単なるユーザとして利用されるだけでしたら、コンパイラを必要としないバイナリー版のGaussianの導入は優れた選択です。
GaussianはPGIコンパイラ上で開発されていますが、そのコンパイラをIntelコンパイラに変更すると高速化することが知られています。しかし高速化のために開発環境を混在させると弊害が起こります。そのためGaussianの開発者は利用規約のなかでPGIコンパイラの使用を指定しています。PGIを使用することで多少の性能を失するかもしれませんが、それ以上に得るものが多いのです。その良い例がPGIコンパイラではGaussianのバージョンアップに迅速に対応できることです。またPGIコンパイラを使っていればGaussianへの問い合わせも安心して行えます。純正で性能を出すことが大切です。
Gaussian用の計算機を何台も利用してゆくと、管理サーバやアプリケーションサーバを立ち上げ、管理サーバから一括して計算機を利用する仕組みにした方が便利です。もし、管理サーバを利用しないで多数の計算機を運用すると、柔軟な管理が難しくなり、硬直的な運用を導入せざるを得なくなり、大幅なスループット低下を招くことになります。
ファイルサーバは使いやすい計算機環境の実現には必須のインフラストラクチャーです。また、リモートの計算センターを併用されている場合でもファイル保管はローカルで行う必要があります。弊社はファイルサーバの導入まで含んだ設計を行います。
ジョブ管理システムが導入されていないと計算機の運用が硬直化します。個人で独占的に利用していてもジョブ管理システムが導入されていると便利になります。まして共同利用環境では他人の計算機利用は予測がつきません。実際には計算機が空いていても許可を得ないとジョブ投入はできません。また操作方法が異なると意図しないトラブルの可能性もあります。ジョブ管理システムを導入すると、このようなジョブ投入に関するインターフェースの部分を一元化できるので合理的な運用が可能になり、計算機の利用効率を向上させることができます。
弊社の計算機は社内で完成品に仕上げて納入するため、お客様のサイトでのシステム立ち上げは迅速です。そのためオンサイト作業では多くの時間をお客様へのレクチャーに費やすことができます。このレクチャーでは実際に動作する計算機を用いてお客様の望まれる操作だけを直接的に行うため、お話を伺いながらその場で操作を行い、実際のジョブ投入まで一気に行います。
Gaussianの実践的利用が活発になると、処理能力の向上が求められるようになります。実験の前段階で利用される場合には、候補の分子を複数同時に計算させることも起こります。Gaussianのサイトライセンスを導入されていると、計算機台数を増やしてもライセンス費は変わらず、計算機の費用だけで能力の拡大ができるので効率が高いです。さて、弊社のシステムは、お客様のご希望により、当初から計算ノードの追加を前提としたシステムインテグレーションを行って納入することができます。ご利用の際のイメージとしては、これまでジョブを投入されていたノードに同じようにジョブを投入するだけで、自動的に新しいノードの空を探してジョブが投入されます。さらに負荷分散の仕組みだけでなく、共有ファイルサーバの仕組みなども併せて設定することができます。この場合にはあらかじめ弊社担当にご要望をお伝えお願いします。
Gaussianは活発な開発が続いているソフトウェアのため、アップグレードも細かく行われます。そのため、逐次アップグレードする必要があります。このような作業も弊社で承ります。
弊社の計算機は、3年間の無償当日のオンサイト修理サービスと部品保証サービスを含んでいます。高品質な計算機ですから信頼性はありますが、高負荷のGaussian計算を何年も動かすとディスク障害の心配は払拭できますせん。しかし、当日オンサイト修理により迅速な復旧が約束されています。もうセンドバック修理によって発生する費用と時間で困ることはありません。
ハードウェア以外のシステム的な障害に関しては、弊社のテクニカルサポートにより復旧を強力にサポートします。システムに詳しい方でも、日常的に作業に携わっておられないと完全な復旧は難しいことがあります。また、ハード的な障害かソフト的な障害かの見極めにも経験が必要です。弊社のテクニカルサポートにより、このようなシステム的な障害をお客様のストレス無しで解決することができます。
GaussianはGaussViewという優れたプリポストが用意されており、LinuxだけでなくWndowsやMACでも広く利用されています。GaussViewを使うと、グラフィク環境で分子モデルを作成や、チェックポイントでの計算状況の途中確認、計算結果の可視化、グラフの作成などがマウスを使って簡単にできます。GaussViewにはGaussianを利用するための便利な機能が満載されています。
この便利なGaussViewをサイトライセンスで導入していると、各自のPCにインストールしてリポスト処理を手元で行うことができます。実際の計算は、LinuxベースのHPCクラスタにジョブ投入し、ジョブの割り振りはジョブスケジューラに丸投げすることが可能です。弊社ではこのような、Linuxクラスタに商用のジョブスケジューラを搭載し、さらにWndowsやMACベースのプリポスト環境と併せて利用できる統合環境のシステムインテグレーションを最高の完成度で実施いたします。