お客様は大学の研究者の方で、バイオインフォマティスクの研究をされています。計算機はセンターのシステムを利用されていますが、利用されるデータベースや計算結果は研究室のファイルサーバに保存されています。ところが現在利用されているファイルサーバは導入されてから時間が経っていることもあり、容量、運用、保守を含めて今後の計画を考えていらっしゃいました。
弊社では、お客様からファイルサーバ更新のご相談を頂くことが増えています。その際に課題となるのが、ファイルサーバ/管理サーバの安全な更新方法です。新しいファイルサーバに一挙に移行できれば良いのですが、現実には運用上のマージンを確保するため時間をかけ、手順に注意しての移行計画が必要です。
このようなことを念頭にシステム提案を開始しました。
お客様は、ファイルサーバと管理サーバを2台の計算機で個別に運用されています。そのファイルサーバの特殊性としては1、000万個以上の膨大な数のファイルが保存されていることです。この2台のサーバを更新する際のポイントを整理しました。
このようにポイントを整理したうえでお客様に、「このような課題をクリアするシステム提案を、魅力的な価格でご提案させていただけないでしょうか」と申し出ました。
ファイルサーバ : HPC-ProFileServer DPe2900FS (2way) システム構築の焦点は、既存ファイルサーバにある1260万個のファイルの定期バックアップ実施です。このバックアップの実現がシステム構築の要となります。上記のシステムはこのような課題に対応するシステムです。
上記のようなシステム構成とサービス内容でご提案をいたしました。
お客様が高く評価された点は、既存ファイルサーバからのデータバックアップ作業と技術サポートを含んだサービス提案でした。さらに機器の信頼性や3年間の当日4時間オンサイトサポートなども高く評価していただきました。
完成したシステムレベルでの初期不良対策を徹底的に実氏することは重要です。そこで弊社では、計算機に対してはLinpack HPLを連続動作させ、システムやメモリ周辺の初期不良を可能な限りスクリーニングし、障害の予兆が表面化した部品は早期部品交換により悉く良品と交換します。さらにストレージの場合は、ファイルシステムを構築してからファイルの読み書きテストをLinux OS上から行い、こちらもシステムレベルでのスクリーニングを行い、早期部品交換を行います。このようして社内でシステムの完成度を高めてから出荷します。その結果、システム稼動開始初期の障害を最小化しています。実際には初期不良は皆無に近くなります。
社内でシステムを完成させ十分なテストを行い、ファイルサーバとして安定動作を確認し、準備万端でオンサイト作業に臨んでいるため、システムは即座にファイルサーバとしての本格稼動が可能でした。そこで直ちに懸案のバックアップ作業に取り掛かることができました。バックアップを開始するとデータサイズこそ840GBでしたが、ファイル数は1260万個という膨大な数でした。しかし、今回のシステムは、rsyncが行う全処理を4コアと8GBのメモリを搭載する新サーバ側で行うため、既存のファイルサーバに掛ける負荷が最小に抑えられており、安定した作業を実施できました。
新たに導入していただいたサーバにはXeon 1CPU 4コアと8GBメモリという強力なシステムリソースが搭載されており、性能には大きな余裕があります。そこで、管理サーバも併せて移行してしまうことになりました。
全ての作業が完了し、無事に運用が開始されました。
多くのデータが蓄積され利用が最盛期を迎えたファイルサーバは、他方で導入から時間が経ち、容量、性能、信頼性などで運用の限界に近づいています。特にHPC分野は、計算機の処理性能が加速度的に向上しているため、ファイルサーバへのリソース要求も加速度的に高まります。
しかし、ファイルサーバの更新では、単に最新のサーバを導入すれば課題が自動的に解決するわけではありません。システムの効果的なりようを目論見システムの集約を果たすに従い、ファイルサーバや管理サーバの役割は複雑化し、その移行にも高度なシステムインテグレーション技術が持ちめられるようになっています。
HPCテクノロジーズではこのような高度化するHPCでのシステムインテグレーション課題に対して、高品質なデルのサーバとサポート体制を上手に利用することで、最良のソリューションをご提供しています。
□ 参考リンク:
>> GbE Bonding によるNFSとFTPのロードバランシング
>> HPC-ProFileServer DPe2900FS