HPC-ProServer DPrT5400
45nmテクノロジ採用のXeonプロセッサ搭載
Quad-Core Xeon 5400番台、Dual-Core Xeon 5200番台
高性能 Intel 5400 Chipset採用のミニタワー型WS
32GBメモリ搭載可能 (4GB-DIMM x16DIMMs)
静粛性と安定稼動の両立、大口径ファン + 大容量ヒートシンク
80%以上の電力効率を達成する875Wの大容量電源採用
高性能Intel純正開発環境対応 (コンパイラ、各種ライブラリ群)
標準Linux OS (CentOS) を採用、LSF搭載、各種管理ツール搭載
完成度の高いシステムセットアップにより導入後即座に利用可能
3年間の長期保証 (当日/翌日出張修理サービス、修理部品保証、技術相談、運用支援、最長5年まで延長可)
「HPC-ProServer DPrT5400」のような新技術を積極的に採用する計算機は性能と信頼性の両立が大切です。新しいアーキテクチャを採用した製品の開発では、基本デバイスが発表されてから2〜3ヶ月間の開発期間を設けることで、製品の完成度は格段に増します。実際に大手計算機ベンダーは充分な開発期間や準備期間を設けることで、安定した品質の計算機を製品化しています。もちろんその代償として新製品の発売開始までには多少の期間が必要です。しかし完成度の高い製品開発が完成すると、高品質な計算機の大量生産と安定供給を迅速に行えます。そのため、次のシステム構築工程や運用の段階では以下のような利点が得られます。
◇ 納期が確かで部材不足に悩まされない
◇
初期障害が皆無に近く、修理も迅速確実
◇ 確実なスケジュールを設定できる
◇ 納入後の立ち上がりが迅速かつ容易
◇ 納入後の安定稼動が期待できる
「HPC-ProServer DPrT5400」は最高の性能と拡張性を誇るHPCワークステーションです。プロセッサは最新のQuad-Core Xeon 3.16GHz FSB1333MHzが搭載でき、メモリは最大32GBまで実装できます。データ転送を司るチップセットには最新のIntel 5400チップセットが採用されています。最初に、このシステムに適した用途をご紹介します。
◇ 3.16GHz動作の8コア、12MBキャッシュ、FSB1333MHz、32GB/sの高速メモリ ⇒ 高速8コア処理
◇ コンパクトかつ静粛な筐体 ⇒ ワークステーション・クラスタに最適
◇
最大32GBメモリを搭載可能 ⇒ 大容量メモリを必要とする計算、メモリディスクで高速化できる計算
◇ 最大2基のハードディスクでRAID0を構成可能 ⇒ 高速大容量なスクラッチディスクが効果的な計算
◇
多彩な高速デバイス搭載に対応する875W大容量電源 ⇒ 各デバイスを一挙に動作させても安定稼動
「HPC-ProServer DPrT5400」に搭載しているプロセッサは45nmプロセスで製造される最新のPenrynコアを採用したQuad-Core Xeon 5400番台 (Harpertown) です。「HPC-ProServer DPrT5400」に搭載しているプロセッサの特長は、CPUクロック周波数が最高で3.16GHzに達し、搭載キャッシュサイズは12MB (6MB x2)へと拡大し、システムバス帯域も最高FSB1333MHzで動作し、高速化が実現されています。
CPUとチップセットの接続には最高モデルではFSB1333MHzで動作する2本の独立したシステムバスが採用され、各プロセッサとは10.6GB/s の転送帯域を実現しまています。なお、総合帯域は21GB/sに到達します。
45nmプロセスで製造される最新のPenrynコアでは、動作周波数が向上し、キャッシュサイズも増加しているにもかかわらず、消費電力の高騰に歯止めが掛かっています。一世代前の最高動作周波数であった3GHz駆動時の消費電力は従来120Wであったものが80Wと66%にまで低下し、しかもキャッシュ容量は12MBと1.5倍に増加しています。同様の120Wで動作するプロセッサは現在では動作周波数3.16GHz、12MBキャッシュ、FSB1333MHzと高性能化されています。
プロセッサの消費電力は120Wに達するため冷却は大切です。「HPC-ProServer DPrT5400」は、その前身のDPr490の時代からCPU冷却性能の高さは折り紙つきでした。そのカギは写真の巨大なファンによってもたらされる大きな送風量と、大きな表面積を持つヒートパイプ付の大型ヒートシンクとの組み合わせにあります。
「HPC-ProServer DPrT5400」は8本のメモリスロットを実装できます。対応するDDR2 667MHz FB-DIMMモジュールには1GB、2GB、4GBのモジュールが用意されており、最大で32GBのメモリ容量を実現できます。この大規模メモリは大規模計算で有効のみならず、メモリファイルシステムとして利用することで非常に高速なスクラッチファイル領域としても有効です。
DDR2 667MHz FB-DIMMを使用する際のデータ転送レートはread21.3GB/s、write10.7GB/sとなり理論総合値は32.0GB/sに到達すると記されています。
高速なメモリは発熱量が大きく、搭載容量が大きくなるに従い強力な排熱の仕組みが必要です。「HPC-ProServer DPrT5400」は大型の筐体を持つためメモリを強制冷却する仕組みを搭載できます。写真右下のファンがメモリ冷却用ファンで、左側から冷気を取り入れメモリに直接冷気を吹き付けています。
大容量メモリーを搭載した計算機を長時間連続動作させ結果を求めるHPC計算では、安定した計算機の稼動を実現するためメモリーエラー対策が必須です。その対策を考えるため代表的な3種類のメモリーエラーを示します。1種類目は「初期不良」によるメモリーエラーです。これは半導体ウエハ処理工程で発生した欠陥や不具合が、半導体メーカーのスクリーニングを通り抜け潜在的不良として残されたまま製品化され、その潜在的不良が使用開始後に顕在化しメモリーエラーを引き起こしているものです。2種類目は「経年劣化」によってメモリ不良が発生しメモリーエラーを引き起こしているものです。3種類目は「ソフトエラー」と呼ばれるメモリーエラーです。これは宇宙線が原因で偶発的にメモリー値が反転する非破壊的なシングルビットエラーです。
「初期不良」メモリをスクリーニングする最良の手段は、組み立てが完了したHPC計算機上でLinpack HPLなどの負荷の高い計算を連続動作させ、メモリエラーが発生しやすい条件で十分な試運転を行うことです。試運転中にメモリエラーが発生するとエラーはECCメモリにより自動修復され、同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると初期不良メモリと判断し、早期部品交換を行い計算機の信頼性を回復させます。
何ヶ月も安定動作していた計算機のメモリが突然エラーを発生させることがあります。このような場合でもECCメモリを使用しているとエラーは瞬時に訂正され動作は継続されます。同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると不良メモリと判断し、致命的な障害を起こす前に早期部品交換を行います。
「ソフトエラー」と呼ばれる宇宙線が原因で非破壊的にメモリ値が反転するシングルビットエラーも稀に発生するようです。このような「ソフトエラー」対策としてはECCメモリの搭載が最善です。ECCめもりによりシングルビットエラーが発生しても何事も無かったように動作が継続され実害は発生しません。
低消費電力化の実効性を高くするためにはシステム全体の低消費電力化も大切です。そこで、エネルギー効率80%を誇る電源の採用や、システム全体の低消費電力化、細かな電源管理の実施などをトータルに実施しています。
メモリの相性問題を解消するためには徹底したバリデーションの実施と、部品レベルからの品質管理が欠かせません。この点、弊社が採用しているDellの計算機は、開発・製造・サポートまでの一貫した品質管理が行われています。そして多数の安定稼動の実績を積み重ねて来ています。
このように、基本的に高い品質の計算機のために、これまでお客様のサイトで運用中に発生したメモリトラブルは550件中、2〜3件しか発生しておらず皆無に近い状況です。さらにこれらの障害も迅速なオンサイト修理サービスにより翌営業日には修理が完了しています。このようにDellの計算機を全面採用することで、万一のメモリ障害でも迅速確実なオンサイト修理が実施され、無駄なシステムのアイドルタイムを最小しています。
「HPC-ProServer DPrT5400」はタワー型の大型筐体により最大で3基のハードディスクを内蔵できます。選択できるディスクはご注文時にSASかSATAかを選択していただき、さらにSATAでは250GB、500GB、750GB、1TBからの選択、SASでは146GB、300GB、400GB、450GBからの選択が可能です。最大搭載容量は1TBディスクで3TBになります。
RAID0構成で200MB/s以上の転送速度を実現できる最新鋭のRAIDコントローラ「PERC 6/i」を搭載できます。このRAIDコントローラを本体のPCI-Expressスロットに実装することで、上記の最大3基のハードディスクを用いてRAIDアレイを構築できます。PERC 6/iの設定や管理は、付属の管理ツール「Open Manage」から他の設定まで含めて一括して行えるため便利です。
計算サーバとして用いる場合には、大容量・高速スクラッチディスクを構築できることが魅力です。構成例としては、1TBディスク2個をRAID0化し2TBのRAID0ボリュームを構成できます。
HPCクラスタの運用ではシステムの安定稼動が大切です。HPC-ProServer DPr490多数のHPCクラスタとしての安定した稼動実績を持ち、お客様から高い信頼を勝ち得ています。このHPC-ProServer DPr490の実績をベースにして改良された製品がHPC-ProServer DPrT5400です。
システム構築する側にとってもハードウェアの安定稼動は、SE作業の品質を大きく左右するため、非常に重視しています。限られた時間の中でシステムを完成させるため、ハードウェアが素早く安定すれば、多くの時間をシステム構築のブラッシュアップに投入できます。
HPCテクノロジーズの経験によりHPCに最適化したCentOSを搭載しています。(標準的なLinux OSはHPC利用を考慮していません。) 最適化作業としては、HPCで必要となるパッケージの追加、HPCで不要なデーモンやサービスの停止、HPCで必要なデーモンやサービスの起動、開発環境などとのマッチング、アプリケーションの動作検証などです。
■ CentOSとRedHat
■ LinuxでのHPCチューニングの必要性
商用アプリケーションなどではLinux OSのディストリビューションを指定されることがあります。そこでRedHatにオプション対応しています。もちろん、コンパイラなどの緻密なバージョン指定にも対応しています。
8CPUコアを搭載するシステムを共同利用する際には、利用効率と利便性を向上させる負荷分散システムの搭載が必須です。そこで、大型のUNIX並列計算機で圧倒的な動作実績を誇るPlatform LSFを標準搭載しています。LSFは適切なジョブスケジューリングを、並列度、CPU負荷、メモリ利用状況、ライセンス状況、他ノードの負荷状況などを考慮したうえで実施します。これらの要素への配慮に関してLSFの完成度は圧倒的な高さを持っており、他のスケジューラとは比較になりません。
最新のハードウェアを利用するには、適切な開発環境の選択と、整然としたインストールが必須です。標準的なインテルコンパイラのみならず、お客様のご用途に合わせてIntel-MPI、Inte-MKL、パフォーマンス・チューニングツール類、PGIコンパイラなどの最適なインストールサービスも実施します。もちろん、ライセンスサーバにも対応します。また、GbEやInfiniBandにも適応した開発環境のカスタマイズも実施します。
8並列計算が可能になったことで、ネットワーク並列では対応できなかった計算の並列度を向上させることができます。また、32GBの大容量メモリを必要とする計算にも対応できます。このような計算環境を要求するアプリケーションの搭載と運用をサポートする予定です。
ディスク障害や誤操作などによりOSが正常に利用できなくなるようなトラブルに際して、OSの復旧を簡単かつ確実に行えるように「OSリカバリDVD」を添付しています。弊社の「OSリカバリDVD」は、弊社工場でお客様に納入する計算機のカスタム設定が完了した時点で、そのシステムイメージをフルコピーするものです。そのため、「OSリカバリDVD」を用いると出荷時の状態に確実に復旧できます。さらに導入後のシステム設定変更やアプリケーション追加をされた場合にも、簡単に新たな「OSリカバリDVD」を作成できるように、簡単なコマンド操作で任意のタイミングの「OSリカバリDVD」のISOイメージを作成することが可能です。
システムにはDell純正のシステム管理ツールが搭載されています。このツールは便利な障害表示機能を持ち、障害時には便利に利用できます。
「HPC-ProServer DPrT5400」は2CPU 8並列のHPCワークステーションとしてのシステム構築が期待されます。そこで、弊社ではお客様の計算機や開発環境、オプションツール類、アプリケーション類などの導入調査などを可能な限り行い、快適な利用環境の実現に努めます。これらのインテグレーション作業をお客様が単独で実施されるには手間と時間が必要です。HPCテクノロジーズはこのようなお客様のご要望に応えるべく対応しています。
一般に大手ベンダー製のワークステーションは市販ワークステーションに比べて量産開始判断が慎重です。実はこのタイムラグこそ品質管理の最後の砦であり、徹底的なバリデーションなどが行われている期間です。全ての問題がクリアされた製品は、生産を一挙に立ち上げることができます。そして弊社工場では実運用レベルのテストと改修を行い、さらに仕上には納入後の動作確認、不具合箇所の特定、迅速なオンサイト改修までを一連の工程として実施しています。
「HPC-ProServer DPrT5400」は、標準で3年間の当日/翌営業日オンサイト保守が無償実施されます。万一の障害でもお客様の手を煩わせることなく、HPCテクノロジーズの技術スタッフとオンサイト修理スタッフが協力して障害切り分け作業を行い、迅速かつ確実な復旧を実現します。