既存の計算機環境では達成できなかった高速で大規模な計算を実現するため、新たに導入する計算機システムには強力な新機能を盛り込みたいものです。その計画を実り多いものにするためには、目立たないですが「導入作業」は重要です。この「導入作業」は下記の作業の流れの中で行われます。
◇ ハードウェアなどの選定
◇ システムの設計
◇ 製造、設置、設定
◆
既存システムとの結合や移行 (導入作業)
◇ 新システムの保守と運用
この (◆) の「既存システムとの結合や移行の作業」が「導入作業」です。その内容は以下のようなものです。
◇ 新旧のOSの調整
◇ 新旧の開発環境の調整
◇ 新旧のファイルサーバや管理サーバの調整
◇ 新旧のジョブスケジューラの調整
◇ 新旧のネットワーク環境の調整
◇ アプリケーションなどの挙動確認
実際のシステムではこれらの要素が入り組んで機能しており、実運用に照準を当てて実践的な調整を心掛ける必要があります。この「導入作業」を迅速かつ確実に行うことで、新システムは本来の力を存分に発揮するようになります。
最近のハードウェアは高品質になりハード障害は減少しており、ハード的な「導入作業」は簡単になっています。しかし、マルチコアCPUと64bit環境の普及に代表される技術進歩により、システム構造は複雑化しているため、それらを使いこなすためのソフト的な「導入作業」の難易度は高くなっています。
既存システムだけの運用では問題がなく、追加システムだけの運用でも問題がない場合でも、双方を一緒に動作させたり、連携させる不調になるような障害はその典型例です。このような複合的な障害の問題解決は容易ではありません。以下にその他の典型例を挙げてみます。
◇ 既存システムでも追加システムでも動くのに、双方を連携させると不調
◇ 既存システムでは動いていることが、追加システムでは不調
◇ 追加システムを稼動させると、既存システムが不調
◇ 追加システムが既存システムから利用できない
◇ 機能A単独では動き、機能B単独でも動くのに、双方を使えるようにすると不調
◇ ジョブの投入はできるが、追加システムでは実行されない
「導入支援サービス」は、HPC計算機システムを限定された条件下で安定稼動させるだけではなく、お客様の既存の計算機環境との併用まで考慮し、実際の利用に即したシステムインテグレーションを行う実践的サービスです。
◇ 弊社のノウハウを駆使してシステムを設計
◇ 導入の際に既存システムとの併用を考慮して調整
◇ 導入後もお客様からのお問い合わせに的確に対応
このような「導入支援サービス」を行うことで、高品質なシステムを迅速にカットオーバーさせることができます。
実際のシステム導入で「導入支援サービス」が役立った事例ご紹介します。このケースでは、計算機の更新に伴いOSやコンパイラのバージョンを新しくしていました。もちろんシステムの増設作業時には動作テストを実施し、問題の無いことを確認していました。ところが本運用が始まった後で、あるプログラムをコンパイルすると、これまでは出なかったエラーが出るようになりコンパイルできないという障害が発生したとの連絡を、弊社のサポートメールアドレス宛 (support@hpc-technologies.co.jp) で受けました。
そこで弊社では、社内に「導入支援サービス」のためのテスト環境を構築し検証作業を行いました。色々とテストを行い症状を絞り込み、ついに原因が新しいバージョンのコンパイラの仕様変更に起因していたものであることを突き止め、その対処方法も確認しました。この結果をお客様に報告し、問題を解決できました。
この例のように、システムを利用するなかで遭遇する運用上の課題を解決することも「導入支援サービス」の役割のひとつです。そしてこのようなサービスを的確に行えるようになるためには、豊富な実地経験からなるノウハウの蓄積が必須です。幸いにも弊社は多くのシステム構築経験を持っており、その過程でこのノウハウを蓄積してきています。しかし、このノウハウは弊社が単独で蓄積したものではありません。これはお客様から実践的に教えて頂いたことの集大成です。「導入支援サービス」は多くのお客様から教わったことを再び多くのお客様の手元にお返しする作業だと考えています。