ジョブ管理を自動で行う「ジョブスケジューラ」をHPC計算機にインストールし、直ぐに利用できるように「ジョブスケジューラ」をシステムやお客様の状況に合わせてカスタム設定するセットアップサービスです。
高機能なマルチコア世代のクラスタ機を、ジョブ管理ソフト無しで効率良く利用するのは至難の業です。クラスタにジョブを投入するためには、クラスタの稼動状況の確認と、投入予定の他のユーザの状況を確認し、調整したうえでジョブ投入や実行予約をしなければなりません。この手続きを手動ですることは大変な手間がかかります。
◇ 誰が、どのコアやメモリやホストを、どの程度利用しているのか、把握し難い
◇ 実行中のジョブが何時終了するかわからない (次のジョブは何時投入可能かがわからない)
◇ ジョブを投入予定の他のユーザの状況がわからない (優先度や並列度など)
◇ 並列ジョブを投入するまでの、空きCPUの確保が難しい
ジョブ管理ソフトが無いとクラスタ計算機の運用スタイルは、シングルジョブ専用の並列計算機になるか、あるいはバラバラの計算機の集まりになります。これでは使い勝手が良くありません。システムを共同利用する場合は管理にも気を使います。
ところが、ジョブ管理ソフトを導入すると、面倒なジョブ管理はジョブ管理ソフトが引き受けるため、利用者 は煩雑な監視や管理作業から開放され、理想的なクラスタ利用環境で快適にジョブを実行することができます。
◇ ジョブ管理ソフトは計算機の利用状況を常時監視している
◇ ジョブ管理ソフトは計算機のコアやメモリやホストの空きを瞬時に把握する
◇ ジョブ管理ソフトは全ユーザのジョブ投入状況を把握している
その結果、効率の良いジョブの実行が実現します。
◇ ジョブ管理ソフトは優れたアルゴリズムにより公正で的確なジョブの実行を実現する
◇ 並列計算と非並列計算が混在しても、適切なリソースが確保され、ジョブが実行される
◇ ライセンス数に限りのある商用ソフトを利用しても、ライセンス数にあわせて的確なジョブ投入される
◇ 管理サーバを操作するだけでクラスタ全体のジョブを一元管理できる
効率の良いジョブ管理ソフト搭載クラスタを構築するには、ジョブ管理ソフトの利用を前提としたシステムインテグレーションを行う必要があります。
◇ 管理サーバ、アプリケーションサーバ、ファイルサーバの適切な実装
◇ 搭載メモリサイズ、搭載CPUコア数、利用ネットワークの適切な選択
◇ 利用アプリケーションに適した計算機の選択
弊社では、システムの構成案や積算を考える時点から、お客様と相談しながら構成を考えます。
効率の良いジョブ管理ソフト搭載クラスタを構築するには、ジョブ管理ソフトの搭載を前提とした、適切な利用ポリシーを予め用意しておく必要があります。
◇ どのような計算が多いのか
・ 実行時間の長短
・
ネットワーク並列計算か、ノード内並列計算か、シリアル (非並列) 計算のどれが多いのか
・ ネットワーク並列計算機ではネットワーク負荷の多寡はどうなのか
・ メモリやローカルディスクなどの使用量は多いのか
◇ ユーザ数とグループ分けはどうするのか
◇ 商用アプリケーションのライセンス数制限はあるのか
◇ ホストを用途ごとに分けるのか
・
メモリ使用量の大小で分けるのか
・
並列計算用と非並列計算用
・ プログラム開発に伴う試し計算用と本計算用
・ 計算機のスペックやOSのバージョンが単一か複数か
弊社では、システムの構成案や積算を考える時点から、お客様と相談しながら利用ポリシーを考えます。さらに、オンサイトでの納入・設置・引渡し時にも、実機を用いて利用ポリシーを考え、設定に反映させます。
以上のような点に注意を払ったシステムインテグレーションでは、ジョブ管理ソフトに関する経験のみならず、アプリケーションの動作特性や、最新の計算機の実際の動作に関しても熟知している必要があります。これらの経験と知識をベースとしてシステムを構築することで、完成度の高いHPCクラスタを構築できます。