お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内

HPC計算機導入事例

ファイルサーバ導入事例 (抜粋)

Gaussian導入事例 (抜粋)

HPCクラスタの増設ファイルサーバ【FS導入事例】

はじめに

お客様は大学付属の研究機関の研究者の方で自然現象の研究をされています。研究室では理論研究のみならず、計算プログラムの開発と実行、研究結果の社会への応用までを一貫して行われています。そのため大きな計算機資源を必要とされており、センターの計算機のみならず48CPUのHPCクラスタを研究室で独自運用されています。それらから生成されるデータを多量の計算結果を蓄積するため、複数のファイルサーバも運用されています。

このファイルサーバが容量不足になっているので容量の追加をご検討中でした。

お客様からのお話

お客様がご利用のファイルサーバは、貴重なデータを大量に蓄積し、高速に利用できる必要があります。そのため、容量、信頼性、性能、サポート、価格において総合バランスの良い製品をお求めでした。ちょうど弊社は、お客さまの研究室にHPCクラスタをお納めしており、その製品の性能や安定性、サポート、価格などで実績がありました。そこでファイルサーバに関しても良い提案をしてほしいと声をかけていただきました。

以下に、お客様の具体的なご要望を箇条書きにしました。

・ 計算機から出るデータは膨大で、ファイルサーバは短期間で一杯になる
・ 研究室のメンバーも増えたので、さらにファイルサーバの消費は激しくなった
・ 以前はテープバックアップでデータの退避をしていたが、管理や運用が大変に面倒
・ ハードディスクを使ったファイルサーバが便利
・ 容量、信頼性、性能、サポート、価格の全てで優れたファイルサーバが必要

・ ファイルサーバの設置はオンサイトでやってほしい
・ HPCクラスタへのファイルサーバ増設作業まで完璧に仕上げてほしい
・ 既存の複数のHPCクラスタからNFS利用できるように設定してほしい
・ NISの設定を行い、研究室の計算機からも利用できるようにしたい
  (HPC計算機へのファイルサーバ増設はHPCクラスタ業者が適任)
  (一般のファイルサーバベンダーはHPCクラスタに詳しくない)
・ 既存のKVMからも使えるようにケーブリングもやってほしい
・ 既存のラックに設置し、将来の拡張性にも配慮してほしい

・ 大手ベンダー製の高品質で安心できるハードを導入したい
  (HPCテクノロジーズから導入したサーバ (デル製) は安定していて良い)
・ 納期どうりに納めてほしい
・ 導入後すぐに運用開始できるようにしてほしい
・ 手ごろな価格で提案してほしい
・ 容量の追加が必要になったら、迅速・確実に稼動させてほしい
・ 当日/翌日のオンサイト保守は必須

お客さまのご要望をできるだけ満たせるような提案を考えました。

デルのサーバを採用することで安定性を実現

さて、お客様に昨年納入させていただいた計算機は安定稼動しているということです。この計算機に利用しているサーバはデルの製品です。弊社のファイルサーバも、お客様のサイトで実績のあるデル製サーバを用いており、非常に安定した稼動実績を他も含めて多く持っています。

>> 2006年Q4の導入事例にジャンプ (お客さまの導入事例が、最初の導入事例です。)

ファイルサーバはHPCクラスタの基幹となるため、品質に優れた大手ベンダー製の機器が安心です。特にデルのサーバ製品は品質や性能のみならず、容量や価格の面でも非常に優れています。これまでのように、容量や価格の制約から大手ベンダーの高品質サーバ導入を見送られていた方々には朗報です。

HPCクラスタを熟知した弊社がHPCクラスタに接続

既設のHPCクラスタ群へのファイルサーバの適切な組み込み作業は、HPCクラスタとファイルサーバの双方を熟知していなれば難しいです。単にネットワークに接続しftpやNFSを動作させるだけでは、快適な運用環境を実現できません。お客様のクラスタやファイルサーバの運用ポリシーや使い方のご希望を伺ったうえで、基幹サーバとしての設定を行う必要があります。さらに、既設のファイルサーバからのデータの移行や、使い分けに関しても提案や設定作業が必要です。これらを考慮しながら、製造・設定からオンサイトサービスまで一貫して行い、お客さまにご満足してご使用していただけるファイルサーバ環境を責任を持って構築させていただくことをお伝えしました。

弊社からのご提案

下記のサーバをご提案しました。

・ ファイルサーバ (ホスト)
DPe860:Dual-Core Xeon 1CPU 2コア、メモリ2GB

・ ディスクエンクロージャ (SAS接続)  2台 2TB + 2TB
DPm1000: 2TB RAID10 + スペアディスク (500GB x9)、冗長化電源
DPm1000: 2TB RAID10 + スペアディスク (500GB x9)、冗長化電源

・ 3年間の当日オンサイト保守 (当日4時間)
・ 3年間の弊社の技術サポート (翌日)

ご提案した構成の特徴

ご提案した機器の特徴とサポートの概要を以下に記載します。

・ 実績のあるデル製のサーバ、ディスクエンクロージャ、RAIDコントローラを採用
・ 迅速な復旧を考えRAID10を採用し、スペアディスクも搭載
・ ストレージ容量はRAID10で2TB + 2TBと合計4TBを提供
・ ディスクエンクロージャはあと4台追加可能 (最大で6台まで接続可能)
・ ディスクエンクロージャはSAS接続でラックを跨いでも実装でき自由度が高い

・ オンサイトで既設のHPCクラスタに接続する
・ NISサーバにも対応させ、研究室のマシンからも利用可能とする
・ 障害通知ツールを持ち、弊社とデルサポートが連動して保守にあたる
・ 障害の対応の弊社が責任を持って実施する
・ 3年間の当日/翌日オンサイト保守とする

この弊社の提案に対して、おおむね良い提案であるとのご評価をいただきました。また、弊社の実績も評価していただけました。

製造・設定・オンサイト運用支援サービス

お客さまよりご注文をいただくと、デルに製造手配を行い、平行してお客様からは設定情報を頂きました。弊社工場に入荷すると、作業用の簡易ラックに搭載してから、OSインストールと設定、RAIDの構築、ネットワークの設定を行い、ファイルサーバとしての長期間エージングを実施しました。

長期間エージングの実施

HPC計算機やファイルサーバなどはクラスタとして連係動作するため、機器の不安定な動作はクラスタ全体の不安定さに直結します。これを予防するためには、設定完了後のシステムに対する実践的な高負荷エージングが最適です。HPC利用では、一般利用では考えられないような負荷がかけられることが多く、例えば1つのディレクトリに数千万ファイルが作成されたり、ネットワーク越しの膨大な連続I/Oなどにより計算機を不安定にしてしまうことがあります。そこで、このような負荷を人為的に作り出すことで、隠れていた問題箇所を顕在化させ、早期の対策を行うことができます。写真は弊社社内でのエージング中のシステムです。

迅速なオンサイト作業と、システムのカットオーバー

主要な作業箇所は、予めお客さまより頂いた情報を元に、弊社内で設定してあるため、オンサイトでの作業は組み付けと動作確認が中心となります。そのため迅速・確実なカットオーバーが実現できます。