お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

HPC計算機導入事例

ファイルサーバ導入事例 (抜粋)

Gaussian導入事例 (抜粋)

Gaussian用の高速・大容量スクラッチディスク『ExtremeDisk』開発【導入事例】

はじめに

お客様は私立大学の研究室の方です。量子化学分野での先進的な研究をされており、大規模な数値計算を行われている研究室です。お客様は研究室の方々を含めて計算機に関しても豊富な知見をお持ちです。そのため計算機の実利用からの情報交換を行わせていただいております。こうしたなかで検証された手法などの成果は、HPCテクノロジーズがインテグレーションする計算機に反映させていただいています。

お客様の計算機の導入

お客様は計算機を弊社から導入されました。右写真中段の計算機が導入された計算機です。構成は下記のようになっています。

◆ HPC-ProServerDPe 2950 : 2台、4CPU、16core
◇ CPU : Quad-Core Xeon 2.66GHz 2CPU 8core /node
◇ Memory : 16GB /node
◇ スクラッチディスク : 1TB (RAID0 SATA 500GB x2) /node
◇ Cent OS
◇ LSF

Gaussian用の高速・大容量スクラッチディスク『ExtremeDisk』開発

Gaussianが必要とする高速ストレージ

Gaussianなどで利用されているアウトコアソルバーは大きなスクラッチファイルを激しく読み書きします。そのため実際の計算時間は、CPUでの計算時間に、ファイルI/O時間を足した時間 (経過時間) となります。このファイルサイズは計算規模が大きくなるに従い増大し、ファイルI/O時間も長くなります。もちろん計算規模が大きくなるとCPUの計算時間も増加しますが、これはCPUの高速化や並列化などによって短縮されていますから、相対的にファイルI/O時間が占める割合が大きくなる傾向があります。そこでCPUの高速化に対応したファイルI/Oの高速化が強く求められます。

高速ストレージのチューニングの要点

高速ストレージのチューニングは主に以下の要素の組み合わせで決まります。

◇ 高速なディスクの選択
◇ 高速なRAIDの選択
◇ 最適なOSの設定
◇ 最適なファイルシステムの選択

さらに、Gaussianなどのように長期間に亘り頻繁なファイルI/Oを行うアプリケーションでは、高速ストレージの安定稼動は速度以上に重要な要素です。

試作システムでのテストと、関連する要素の検討

お客様はGaussianでの非常に大規模な計算を行っていらっしゃいます。そこで、導入されたシステムをさらに高速化するためのアイディアをお持ちであり、試作した実機によるテストと実用上の評価を希望されていました。幸いにも弊社でもシステム高速化のための試作機によるテストを行っていたので、全面的に協力させていただきたいと申し入れました。テストの結果は、信頼性、速度、費用などの主要な評価ポイントでバランス良く納得できるシステムに仕上がりました。

システムチューニングにより20%以上の性能向上

テストに用いた計算は40GB程度のスクラッチファイルを用いる規模でしたが、それでもシステムチューニングにより20%以上の性能向上 (時間短縮) が確認できました。そのため実際の大規模計算ではさらに大きな効果が得られると期待されます。この技術は他のお客様にとっても有用となるので『ExtremeDisk』と銘を打ち、定型化されたサービスとして提供する予定です。

スクラッチディスクではアフターケアも大切

実際に利用者の立場からシステム・チューニングを見ると、大切なのは性能だけでなく、安定性と復旧後のアフターケアまで含む迅速なサポート体制までの全体バランスが大切です。

◇ ストレージシステムの動作そのものが安定していること
◇ 高い品質 (ディスク障害を起こしにくい) を持つこと
◇ 万一の障害発生後での迅速なオンサイト修理の仕組み (オンサイト対応が原則) を持つこと
◇ 保守契約期間中は修理費用が発生しないこと (突然の修理費が発生しない)

スクラッチディスクでは、オンサイト保守サービスは必須

Gaussianなどの大規模計算はジョブが長期間に亘るためシステムは連続稼動が求められ、安定稼動は必須要件です。ところがスクラッチディスクは高い負荷を長期間に亘って与え続けられるため、利用方法そのものが障害の原因を構成してしまいます。この相反した要求に対応するには、高い品質だけでは不十分です。万が一の障害が発生しても、迅速な復旧 (ジョブの再スタート) 手段を準備しておくことで、実際のダメージを最小限度に抑えることが可能です。幸いにも、HPCテクノロジーズの計算機には3年間の当日/翌日オンサイト保守サービスが無償で付随しています。所定の時間内であれば当日中のオンサイトでの修理交換も実施します。

煩雑なセンドバック作業は不要

このサポートシステムによりシステムをお客様の設置場所から返却することなく、ハード的な修理作業はオンサイトでご訪問する専門の修理スタッフにより行い、お客様の手間や時間を煩わせることなく実施します。しかも3年間までは無償で実施します。

システムレベルの復旧 (ジョブの再スタート)

HPC計算機のディスク障害では、ハード的な修理交換だけではシステムの修理は完了しません。運用を再開するためにはファイルシステムの再構築作業などのシステム的な作業も必要です。そこで、HPCテクノロジーズの技術スタッフによる復旧支援サービスもオンサイト修理サービスと平行して実施されます。そのため、技術的なアドバイスを受けながら簡単なコマンド操作で、確実な復旧を短時間で安心して完了させることができます。

まとめ

高速なスクラッチディスクを構築するためには、ストレージの高速化が必須です。しかし、ストレージの高速化の前提としては品質の向上が必要であり、さらに優れたサポート体制の整備が必須です。HPCテクノロジーズの高速なストレージシステムには、にはこのような安心のサポート体制が準備されており、安心して利用していただくことができます。