CPU : Pentium4 600番台 Single Core 1CPU FSB 800MHz
Memory : DDR2 400MHz 2GB
HDD : SATA 500GB x 2 (RAID1)
OS : Windows Compute Cluster Server 2003
CPU : Dual-Core Xeon 5160 2CPU FSB 1333MHz
Memory : FB-DIMM 667MHz
HDD : SATA 250GB x 1
OS : Windows XP SP2
お客様は、「MATLAB」による最適化シミュレーションを分散処理により高速化したいと要望されていました。そこで自動最適化ツール「OPTIMUS」を用いての最適化計算の自動化を考えられました。さらに、OPTIMUSによるMATLABの分散処理を効率よく行うためLSFを採用されました。LSFはOPTIMUSでの分散処理に対してインターフェースを持っており、かつ商用のジョブスケジューラーとして経験の蓄積が厚く、しかもWindows CCS OSとの整合性も高い優れた製品です。これのソフトウェアは、システム運用の容易さを考慮してWindows OS上で動作させます。
1. Matlabの最適化シミュレーションを分散処理により高速化したい。
2. 自動最適化ツール「OPTIMUS」を使いたい。
3. LSFでジョブ管理とリソース管理も自動化したい。
4. 計算機運用の容易さを考慮し、Windows OSでシステムを構築したい。
1. LSFを動作させるWindows Serverのライセンス形態や適合ハードウェアなど、実際の状況が不明。
2. OPTIMUSの分散処理で必要な高速、高信頼性ネットワークやストレージなどの構成が不明。
管理ノードに搭載するOSとしてはWindows Serverが適しています。しかしWindows Serverは、管理ノードに接続する計算機やユーザーの数に対応したCALと呼ばれるライセンスが別途必要となり、そりの取扱いが難しいです。そこで、PCクラスタを構築するのに大変便利なようにパッケージされている「Windows CCS」の採用を提案しました。Windows CCSはWindows Serverとした堅牢なサーバ用OSです。しかも、多ノードのHPCクラスタのホストとして利用できるよう、CALが不要となるなど、親切な仕様です。
LSFは、異なるアーキテクチャ、OSであってもジョブの管理を統合できる、しかも安定して動作する点が最大の長所で、多くの信頼を集めています。本件では、導入コスト低減の目的で、管理ノード以外は、Windows XPを導入する必要がありました。LSFを採用することで、このようにOS環境がヘテロジニアスであっても問題無く全体を統合した分散処理環境を構築することが可能です。
OPTIMUSの分散処理は、ジョブに依存関係をつけながら連続的なジョブの実行が求められます。この背後でファイルサーバは、計算実行ホストへのファイルの転送、データの共有、計算結果の蓄積などのインフラ役を行っています。そこで、お客様の運用方針をヒアリングの上、性能面でのボトルネックを排除したストレージ構成を提案しました。管理ノードに500GBのハードディスク2基でRAID1を構成しデータの保全性を高めたうえで、計算結果を管理ノードで一元的に処理できるシステムを構築しました。
本計算機の管理ノード上にはMicrosoft Officeもインストールされており、ポスト処理も可能です。そこで、リモートデスクトップ接続によるリモート操作で、手元のWindows パソコンから管理ノードにログインし、PowerPointを使ったレポート作成等のポスト処理も、管理ノード上で一元的にリモート処理できるため、大変使い勝手が良いとご評価頂いています。
弊社が納めた他のお客様でも、リモートディスクトップ接続の便利さは高くご評価されています。
[マイクロソフト社のホームページの「Windows Compute Cluster Server 2003 事例サイト」にて「日本語版 第一号ユーザー様 導入レポート」として弊社インテグレーションがご紹介されています。このインタビュー記事のなかで鈴木教授が「リモート デスクトップ機能」は本当に便利で助かっています。」と述べておられました。]弊社ホームページでの「Windows CCS クラスタ構成例」もご参考にしてみてください。
計算機のみならず、ネットワークスイッチなどもデルの純正品を採用しています。HPCクラスタは全体が相互に依存して稼動しており、特にホスト機、ネットワークスイッチなどの停止はシステム全体の停止に直結します。これらの基幹部にもデル純正品を採用することで、デルサポートによる迅速なオンサイト修理の実施と、無償修理パーツ保証が受けられ、万一の故障時にも迅速な復旧が無償で可能となり、稼働時間の最大化を実現します。
迅速で質の良いサポートがシステムに付加していることは、システム導入での重要な導入条件となります。弊社のシステムでは安心のデルサポートのみならず、弊社のHPCサポートを複合させることで、HPC計算機としての復旧までもサポートします。
社内で、計算機、ファイルサーバ、スイッチまでの全てを、お客様がご利用される状態にまで組み上げ、さらにOS、開発環境、ネットワークやアプリケーションまでもインストールと設定を行い、いつでも利用開始できる状態にまで仕上ます。
完成品に徹底的な負荷テストを長期間かけるシェイクダウン運転を行うことで、お客様先での導入初期に発生しやすい不具合を事前に発見・改修することができ、システムの迅速な立ち上げと、安定稼動の早期達成を実現します。
弊社の標準納期は5週間です。お客のご発注を受けてから、サーバ本体が弊社に入荷するまでに約3週間弱かかります。サーバが入荷すると、その当日にOS・開発環境のインストールからネットワーク設定までを行い、ハードウェアの負荷テストを開始します。これと平行してシステムの設定と全体のテストや調整を行い、システムとしての機能確認と性能確認を行い約4週間の工程で完了させます。5週目はオンサイト設置と引渡しとなります。