HPC-ProServer DPeT605
45nmプロセス採用 Opteron 2way HPCサーバ、DDR2 800MHzメモリ搭載
最大32GBのメモリを搭載可能、最大4TB (1TB x4) ストレージ搭載可能
設計から部品生産、製品製造までを統合管理し高い品質を実現
総合管理ツールと状況表示装置を搭載し迅速な保守運用を支援
高度なHPC設定を無償実施、LSFによるジョブスケジューリングを標準実施
3年間の長期保証
(翌営業日オンサイト保守、部品保証、技術・運用支援) (最長5年まで延長可)
「HPC-ProServer DPeT605」の特長は、高品質なデル製タワー型サーバ上に、高い並列性能が期待できるクアッドコア/デュアルコアAMD Opteronプロセッサを2個搭載することで、高品質と高性能を両立させることに成功したシステムです。さらに、HPC技術に定評のある弊社がシステムインテグレーションすることでHPC計算機としての高い完成度を達成しています。「HPC-ProServer DPe2970」は、高品質、高性能、高完成度と三拍子そろったHPC計算機です。
「HPC-ProServer DPeT605」の登場は、これまでAMD Opteronプロセッサ搭載機の導入を希望されていたが、ノーブランドPCサーバでは維持管理の手間を懸念され、伝統ブランドのPCサーバではSE費などの別予算が予想され、導入を見送られていたお客様には優れたソリューションです。
確かな情報に基づいた生産管理と品質管理により、受注から納入までの期間が確実に守られます。さらに、確かなシステムインテグレーション技術により、お客様の手を煩わすことなく迅速な本格稼動を実現します。
AMD OpteronプロセッサはHyperTransportテクノロジーと呼ばれる技術が採用され、CPU上にメモリーコントローラーが搭載されることでスケーラブルなメモリI/O速度が実現されています。この効果により、並列計算時に高速なメモリI/Oを必要とする一部のアプリケーションでは高い並列効率を達成すると報告されています。

AMD Opteronプロセッサが採用するHyperTransportテクノロジーでは、汎用的なDDR2 SDRAMを用いて高速かつ大容量なメモリシステムを構築できるというメリットがあります。さらに汎用的なDDR2 SDRAMメモリはFB-DIMMに比べて発熱量が小さいです。また価格も廉価です。
大容量メモリーを搭載した計算機を長時間連続動作させ結果を求めるHPC計算では、安定した計算機の稼動を実現するためメモリーエラー対策が必須です。その対策を考えるため代表的な3種類のメモリーエラーを示します。1種類目は「初期不良」によるメモリーエラーです。これは半導体ウエハ処理工程で発生した欠陥や不具合が、半導体メーカーのスクリーニングを通り抜け潜在的不良として残されたまま製品化され、その潜在的不良が使用開始後に顕在化しメモリーエラーを引き起こしているものです。2種類目は「経年劣化」によってメモリ不良が発生しメモリーエラーを引き起こしているものです。3種類目は「ソフトエラー」と呼ばれるメモリーエラーです。これは宇宙線が原因で偶発的にメモリー値が反転する非破壊的なシングルビットエラーです。
「初期不良」メモリをスクリーニングする最良の手段は、組み立てが完了したHPC計算機上でLinpack HPLなどの負荷の高い計算を連続動作させ、メモリエラーが発生しやすい条件で十分な試運転を行うことです。試運転中にメモリエラーが発生するとエラーはECCメモリにより自動修復され、同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると初期不良メモリと判断し、早期部品交換を行い計算機の信頼性を回復させます。
何ヶ月も安定動作していた計算機のメモリが突然エラーを発生させることがあります。このような場合でもECCメモリを使用しているとエラーは瞬時に訂正され動作は継続されます。同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると不良メモリと判断し、致命的な障害を起こす前に早期部品交換を行います。
「ソフトエラー」と呼ばれる宇宙線が原因で非破壊的にメモリ値が反転するシングルビットエラーも稀に発生するようです。このような「ソフトエラー」対策としてはECCメモリの搭載が最善です。ECCめもりによりシングルビットエラーが発生しても何事も無かったように動作が継続され実害は発生しません。
「HPC-ProServer DPeT605」に搭載されているSATAディスクは、デルの圧倒的な技術力と生産力そして購買力によって徹底的な品質管理が実現され、ディスクの長期安定稼動を実現しています。さらに、オンサイト修理サービスと修理部品保証サービスにより、万一のディスク障害でも迅速な修理が行われ安心です。ディスクはホットプラグ対応ですから修理交換も迅速です。また、リカバリーDVDが添付されていますからシステムの復旧も迅速です。この完備した保守体制は長期安定稼動では非常に大切です。
長期安定稼動を目指す場合は、冗長化電源の搭載も大切です。「HPC-ProServer DPeT605」は冗長化電源にオプション対応しています。
デルのサーバやワークステーションは、品種をハイグレード製品に絞ったうえで大規模生産することで、高品質と低価格の両立に成功しています。その品質の高さは、年間1000台弱の計算を実際にシステムインテグレーションしている弊社が最も深く知るところです。品質管理は、開発時の動作検証や製造時の品質管理のみならず、出荷後の修理部品管理などまで、一貫した責任体制を確立しています。
サーバとワークステーションでは、製品品質が同等だとしても、求める信頼性の水準は大きく異なります。サーバはクライアントにサービスを提供するため、安易に停止させることができません。そのため冗長化構成やホットプラグを採用し無停止運用を目指します。さらに手厚いサポート体制やサポート内容を持っています。サーバは停止しにくくサポートも手厚いのです。これに対してワークステーションはクライアントのため停止の影響は限定的です。そのため、停止させての修理が一般的です。停止した計算機をお客様のご協力も得ながら迅速な復旧を追及するサポートがワークステーションの基本です。
HPC計算機におけるサーバ利用のメリットは、お客様を煩わせないことです。無停止運用を追及するサーバでは、サポート体制も高度に整備されており、障害の発見、障害箇所の特定、部品の手配、障害箇所の交換までが迅速・確実・丁寧です。また、サーバでは予防交換も積極的に実施されます。これは故障箇所の特定に時間が掛かるような障害では、時間のロスを最小化するために、疑わしい部品群を一挙に予防的に交換することです。
サーバ製品には、サーバ本体やCPU、メモリ、ディスク、拡張装置類などを一括して把握や操作ができる統合管理ツールが搭載されています。このツールが搭載されていると、万一の障害時には総合管理ツールから得られた情報を保守サービスに伝えることができ、迅速かつ的確な保守サービスの実現に役立ちます。
LEDによるシステム診断パネルが実装されており、障害を起こした部品の情報が表示されます。そのため、障害対応の依頼を行う際にも、その表示内容を伝えていただくことで、障害の特定が素早く行うことができ、修理部品の準備が迅速に行え、訪問する修理スタッフも準備万端の状態で作業に臨むことができます。そのため、保守時間を大幅に短縮することができ、仕事の確実性も高めることができます。サーバ製品にはこのような保守サービスを充実させるための仕組みが豊富に搭載されています。