HPC-ProServer DPeR805
Hexa Core / Quad Core Opteron対応の2socet 2U HPCサーバ
冷却性能と拡張性に優れた2Uサイズ筐体により長期間高負荷連続稼動での安定稼動を実現
3年間の長期保証 (翌営業日オンサイト保守、部品保証、技術・運用支援) (最長5年まで延長可)
Hexa Core Opteron Istanbul 2CPU搭載「HPC-ProServer DPeR805」は高品質なデル製の2Uサーバ上にHexa-CoreあるいはQuad-Core AMD Opteron (TM)プロセッサを2基搭載し最大12コアを利用することで、整数演算や浮動小数点演算処理での高いスループットを期待できる最新鋭の計算機です。
メモリシステムは、DDR2メモリに対応した16基のメモリスロットを実装しており、8GBのメモリモジュールを搭載することで最大128GBのメモリ空間を実現します。メモリはもちろんECC対応です。
CPU上に独立したメモリコントローラを搭載し、2チャンネルのメモリ接続ポートを実装しており、800MHzのDDR2メモリを4枚接続することで最大12.8GB/sのメモリ通信バンド幅をCPU毎に実現しています。
Opteronの大きな特長として、HyperTransportと呼ばれる複数のCPU間を高速に接続するポートを採用していることを挙げられます。HyperTransportにより、各CPU毎にローカルに接続されているメモリーを、他のCPUからも高速に読み書きすることが可能となります。しかも、Opteronでは各CPUのメモリ転送帯域は12.8GB/sであるのに対して、HyperTransportの通信帯域はポートあたり19.2GB/sの性能を実現しており、遺伝子解析やデータ検索などのアプリケーションが複数動作し各コア上から全領域のメモリに対してランダムなアクセスを繰り返しても遅滞の無いデータ供給を実現します。

Opteron計算機で利用するメモリは低消費電力かつ低発熱な汎用のDDR2 SDRAMを採用しています。そのため、大容量メモリを使用し、クラスタ化する際には、維持管理費の面でも多くのメリットをもたらします。
大容量メモリーを搭載した計算機を長時間連続動作させ結果を求めるHPC計算では、安定した計算機の稼動を実現するためメモリーエラー対策が必須です。その対策を考えるため代表的な3種類のメモリーエラーを示します。1種類目は「初期不良」によるメモリーエラーです。これは半導体ウエハ処理工程で発生した欠陥や不具合が、半導体メーカーのスクリーニングを通り抜け潜在的不良として残されたまま製品化され、その潜在的不良が使用開始後に顕在化しメモリーエラーを引き起こしているものです。2種類目は「経年劣化」によってメモリ不良が発生しメモリーエラーを引き起こしているものです。3種類目は「ソフトエラー」と呼ばれるメモリーエラーです。これは宇宙線が原因で偶発的にメモリー値が反転する非破壊的なシングルビットエラーです。
「初期不良」メモリをスクリーニングする最良の手段は、組み立てが完了したHPC計算機上でLinpack HPLなどの負荷の高い計算を連続動作させ、メモリエラーが発生しやすい条件で十分な試運転を行うことです。試運転中にメモリエラーが発生するとエラーはECCメモリにより自動修復され、同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると初期不良メモリと判断し、早期部品交換を行い計算機の信頼性を回復させます。
何ヶ月も安定動作していた計算機のメモリが突然エラーを発生させることがあります。このような場合でもECCメモリを使用しているとエラーは瞬時に訂正され動作は継続されます。同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると不良メモリと判断し、致命的な障害を起こす前に早期部品交換を行います。
「ソフトエラー」と呼ばれる宇宙線が原因で非破壊的にメモリ値が反転するシングルビットエラーも稀に発生するようです。このような「ソフトエラー」対策としてはECCメモリの搭載が最善です。ECCめもりによりシングルビットエラーが発生しても何事も無かったように動作が継続され実害は発生しません。
8並列機ともなると複雑な内部構造を持ち、安定稼動を実現するためにはシステムにも高い完成度が求められます。「HPC-ProServer DPeR805」は高度な開発力と生産力を持つDellが威信にかけてリリースした高品質サーバです。そしてHPC技術やサポートでは高い評価を頂いている弊社がシステムインテグレーションを行うことで確実な運用が実現できます。「HPC-ProServer DPeR805」は品質、性能、完成度の三拍子が揃ったHPC計算機です。
「HPC-ProServer DPeR805」を安心して利用していただくために品質管理とメンテナンス体制が完備しています。採用されているCPUをはじめとした各パーツは、Dellの圧倒的な購買力をバックに徹底的した品質管理がされています。さらに開発段階で徹底的に改善され、製造段階でも厳しく検査され、出荷後はデータベースを駆使した履歴管理の実施、サポート段階では修理部品のストックと迅速なデリバリーの実施、当日4時間オンサイト保守サービスの実現など、全てがシステマティックに機能し、お客様に安心を提供しています。
世界標準にわたるの優れたサポート体制が整備されており、長期間にわたり安心して利用していただけるバツクアップ体制も魅力です。
計算機システムには標準で3年間の翌営業日オンサイト保守を標準で無償提供しています。さらにオプションで、24時間365日の当日4時間オンサイト保守へのアップグレードや、最長5年間の保守期間延長にも対応しています。
ワークステーションとサーバの違いは、要求される可用性の水準が異なることです。ワークステーションはクライアント側のため、万一停止しても影響は限定的です。そのため万一故障すると一旦停止させてから修理することが通常のスタイルです。また修理に際してはお客様にもご協力を仰ぎ、力をあわせて復旧に努めることが通常です。これに対してサーバは、複数のクライアントにサービスを提供しているため、突然停止することは許されません。基本的には障害が起こっても運用を継続し無停止での復旧を目指しています。そこで部品の冗長化とホットプラグ化を実施します。
サーバをお勧めするメリットとして、修理作業時にお客様を煩わせることが無いことが挙げられます。無停止運用を追及するサーバでは、サポート体制も高度に整備されており、障害の発見、障害箇所の特定、部品の手配、障害箇所の交換までが迅速・確実・丁寧です。また、サーバでは予防交換も積極的に実施されます。これは故障箇所の特定に時間が掛かるような障害では、時間のロスを最小化するために、疑わしい部品群は予防的に一挙に交換されます。その結果、障害は迅速に完治し、不安定な状態がズルズルと長引くようなことがありません。
サーバ製品には、サーバ本体やCPU、メモリ、ディスク、拡張装置類などを一括して把握や操作ができる統合管理ツールが搭載されています。このツールが搭載されていると、万一の障害時には総合管理ツールから得られた情報を保守サービスに伝えることができ、迅速かつ的確な保守サービスの実現に役立ちます。
LCDによるシステム診断パネルが実装されており、障害を起こした部品の情報が表示されます。そのため、障害対応の依頼を行う際にも、その表示内容を伝えていただくことで、障害の特定が素早く行うことができ、修理部品の準備が迅速に行え、訪問する修理スタッフも準備万端の状態で作業に臨むことができ、保守時間を大幅に短縮することができます。
確かな情報に基づいた生産管理と品質管理により、受注から納入までの期間が確実に守られます。さらに、確かなシステムインテグレーション技術により、お客様の手を煩わすことなく迅速な本格稼動を実現します。