HPC-ProServer DPrR5400
45nmテクノロジ、高性能Xeonプロセッサ2CPU 4/8core搭載
Intel 5400 Chipset採用の2Uラックマウト型ワークステーション
32GBメモリ搭載可能 (8GB FB-DIMM x4DIMMs)
ハイエンドグラフィクカードを2枚まで搭載可能
HPC利用可能なGPUを搭載可能
画像ハードウェア圧縮/伸張とPC-over-IPによる遠隔操作を実現
高性能Intel純正開発環境対応 (コンパイラ、各種ライブラリ群)
標準Linux OS (CentOS) を採用、LSF搭載、各種管理ツール搭載
完成度の高いシステムセットアップにより導入後即座に利用可能
3年間の長期保証 (当日/翌日出張修理サービス、修理部品保証、
技術相談、運用支援、最長5年まで延長可)
タワー型のXeon 2way ワークステーション「HPC-ProServer DPrT5400」をラックマウントができるようにEIA 2U筐体に搭載したモデルが「HPC-ProServer DPrR5400」です。応用範囲の広いワークステーションをラックマウントでも使用したいというご要望にお応えした製品です。
一般的にサーバーは安定動作が優先され、拡張性を抑えた設計が基本とされます。これに対してワークステーションは高い機能が求められ、拡張性に富んだ設計が基本とされます。「HPC-ProServer DPrR5400」の外観は2Uサーバですが、内部は最新のワークステーションそのもので、高い拡張性を備えています。写真で引き出されているライザカードはPCI-Express x16 Gen 1 フルハイト/フルレングスのカードを2基搭載できるもので、150Wの電源が2系統 (合計300W) 給電されており、高速グラフィックスカードやGPUコンピューティング用の演算ボードにも余裕で対応できる仕様です。
PCIe x16用ライザカードとは独立して、一般的な拡張カードに対応するライザカードも装備しています。このライザカードは2種類用意されており、PCI-e x8 (形状x16) 1基とPCIX 64bit 1基に対応するライザカードか、あるいはPCIX 64bit 1基とPCI 32bit 1基に対応するライザカードの一方を用途に応じて選択できます。筐体背面の写真の左側がPCI-e x8 (形状x16) 1基とPCIX 64bit 1基に対応するライザカードで、FX100 リモートアクセスホストカードが搭載されています。右側がPCI-Express x16対応ライザカードで高速グラフィックスカードが搭載されています。
外形、消費電力、発熱量が大きい高機能な拡張カードを搭載するには、スペースに余裕があり、給電能力、冷却能力も十分確保されている必要があります。HPC-ProServer DPrR5400は2U筐体を採用しており、フルサイズの拡張カードをスクリューレスの保守性に優れたカセットのライザカードに搭載できます。その他大容量電源、大流量の4連ファンなどを備え、安定した動作が期待できます。
計算機が高速大容量化したことで取り扱うデータサイズも巨大化しています。この巨大なデータをネットワーク経由で利用する際に、ネットワークがボトルネック化すると、快適な利用が阻まれます。この問題を解決するため、HPCクラスタ側に可視化ワークステーションを搭載し、HPCクラスタの内部でプリポスト処理を完結させ、ネットワークの影響を受けない可視化環境の構築がスマートです。HPC-ProServer DPrR5400はラックに搭載が可能で、しかも高速なグラフィックスカードを内蔵できるため、このような用途には最適のラック搭載型ワークステーションです。
HPC-ProServer DPrR5400は高速グラフィクスカードの標準オプションとして以下のような製品を準備しています。これらのグラフィックスカードについては十分なテストを行っており、組み合わせ問題もクリアされています。
NVIDIA Quadro FX 570 256MB DDR2 (12.8GB/s) x1
NVIDIA Quadro FX 3700 512MB GDDR3 (51.2GB/s) x1
NVIDIA Quadro FX 3700 512MB GDDR3 (51.2GB/s) x2
NVIDIA Quadro FX 4600 768MB GDDR3 (67.2GB/s) x1
NVIDIA Quadro FX 4600 768MB GDDR3 (67.2GB/s) x2
HPC-ProServer DPrR5400ではワークステーションと高性能グラフィックスカードをセットでご提供しています。そのため、ワークステーション本体のみならず高速グラフィックスカードについても、当日オンサイト保守サービスを実施しており、本格的な運用にも安心して利用していただけます。もしサーバとグラフィックスカードを個別に購入していると、システム全体としてのサポートは期待できません。さらに障害の切り分けはユーザ責任とされ、修理サービスもセンドバック対応となり時間を要するため本格的な運用では不安が残ります。
HPCクラスタに蓄積されている巨大なデータの利用を容易にするためには、可視化サーバをHPCクラスタの内部ネットワークに直結し高速なプリポスト処理を行う構成が適しています。しかし高速化の代償として、利用者はHPCクラスタの設置場所まで出向いて操作する必要があります。ところがHPCクラスタが離れた場所や、寒くて騒々しい計算機室などに設置されていると、出かける手間や操作環境の劣悪さに悩まされることになります。その対策としてサーバのリモート利用が検討されますが、従来のXサーバやリモートディスクトップなどでは映像をソフト的に圧縮/伸張しているため処理が遅いことや、圧縮レートが低いため低速なネットワークでは高品位映像の送信が難しいなどの課題があり、一般のネットワークでは対話型の操作は困難です。
この難問に対する回答が「FX100リモートアクセスデバイス」です。FX100は高品位映像に対応したIPネットワーク経由のKVMシステムです。高品位映像に対応するため映像の圧縮と伸張を専用のエンジンで行うことで、圧縮/伸張処理が速く、しかも高い圧縮レートが可能でネットワークへの負荷も最小に抑えることができ、しかもホストCPUに負担を掛けません。システム構成としてはホスト機のPCI-xバスに実装する「FX100のリモートアクセスホストカード」と、リモート側としてスタンドアロンで利用する「FX100のポータルデバイス」から構成されています。両者間はGbEで接続されます。この接続技術はPC-over-IPと呼ばれています。
FX100はリモート側のキーボードやマウス入力をサーバー側に伝え、サーバの操作を手元から実現する機能も備えています。もちろん、HPC-ProServer DPrR5400に搭載した高性能なグラフィックスカードの映像も高速に表示しますから、離れた場所から高速グラフィックス表示を見ながらキーボードやマウスでサーバを操作できます。
手元のモニターに遠隔地のサーバの高解像度グラフィックを高速表示できる
グラフィックス映像だけの転送のためネットワークへの負担が小さい
サーバや可視化装置本体を別室に置くことでセキュリティ管理が容易
処理はすべて拡張カード側のCPUが処理し主CPUへの負担が無い
USBハブ機能を持ちUSB機器も利用できる
端末側のマウスやキーボードでサーバを操作できる
インターネット経由での利用も可能
写真は「FX100 リモートアクセスホストカード」のサンプル品と機能説明図です。FX100 リモートアクセスホストカードは、ホスト機に搭載したビデオカードからの映像信号が入力されると、それを専用チップで圧縮し、ネットワーク経由でFX100ポータルデバイスに送信します。またFX100ポータルデバイスに接続されたキーボード、マウス、USBの入力をホスト機に伝えます。「FX100 リモートアクセスホストカード」はサーバ側のPCI-xバスに装着して利用します。

写真は「FX100ポータルデバイス」と機能説明図です。FX100ポータルデバイスはFX100 リモートアクセスホストカードから送信されたてきた映像を伸張しモニターに表示させます。さらにキーボード、マウス、USB機器類を接続しホスト機に搭載した「FX100 リモートアクセスホストカード」を介してホスト機を遠隔地から操作できます。
FX100のリモートアクセスホストカード(左)と高性能グラフィックスカード(右)を実装したHPC-ProServer DPrR5400の背面写真。
※ なお、「FX100 リモートアクセスホストカード」と「FX100ポータルデバイス」とは1対1対応しており、複数の「FX100ポータルデバイス」を利用することはできません。ご注意をお願いします。
リモート側のモニタに表示される映像を撮影した静止画のカメラ撮影による現物をお見せします。写真をクリックすると高解像度に拡大されますので、画質の確認を行っていただけます。非常に高画質かつ動きも滑らかなため、圧縮された動画のネットワーク越しの映像であることは知らされていないと気が付かないレベルです。(孤立した1ピクセルのドット表示は苦手のようですが、細線はきれいに出ています。)なお静止画像の解像度は画質確認用の高解像度画像のため圧縮表示されております。マウスでクリックすると本来の解像度になります。
文字の表示もキレイです。マウスとキーボードの応答性も良く操作でストレスを感じることはありません。
「FX100 リモートアクセスホストカード」と「FX100ポータルデバイス」との接続はGbEスイッチ (写真のモニターの下に写っている) です。画面表示されているものは自動車のローテーション画像です。圧縮による画質の劣化はみられませんでした。GbEでも十分に実用的です。(FX100は100Baseで動作しています。)
市販のデジカメに付属の動画撮影機能を用いて、リモート側のモニタに表示される映像を市販デジカメにオマケで付いている動画撮影機能で撮ったムービーをお見せします。以下の画像をクリックするとクイックタイムでCAD画像のローテーションを確認できます。データが大きいため立ち上がりに多少の時間がかかります。モニターをデジカメで撮影しているため画質は落ちています。
注意) 動画を見ていただくためにはお手元のコンピュータにQuickTimeがインストールされている必要があります。もしインストールされて無い場合は、以下の方法でインストールしてください。
▼ クイックタイムの無償ダウンロード
・ QuickTimeのダウンロードを選択 (デフォルト設定ではiTunesも併せてダウンロードされるので気をつけてください)
・ 次のダイアログボックスで「実行 (R)」を選択 以降は指示どうりでインストールが完了し、即座にクイックタイムが使える
通常のCPUの代わりにグラフィックスボード上のGPUで浮動小数点演算を処理をさせることで計算の高速化が期待できます。この手法を調査するために試験的なシステムを導入される場合にHPC-ProServer DPrR5400はお勧めの計算機です。HPC-ProServer DPrR5400はPCI-Express x16 と大容量電源を搭載しており、GPUカードを安心して搭載できる設計となっています。さらに写真のTESLA C870でも公式のサポートプラットホームとしてDPrT5400が掲載されています。
GPU専用エンジンではなく、一般的なグラフィックスカードでもGPUのテストは可能です。HPC-ProServer DPrR5400が標準でサポートしているグラフィックスカードもCUDA環境がサポートされています。
NVIDIA Quadro FX 570 256MB DDR2 (12.8GB/s)
NVIDIA Quadro FX 3700 512MB GDDR3 (51.2GB/s)
NVIDIA Quadro FX 4600 768MB GDDR3 (67.2GB/s)
「HPC-ProServer DPrR5400」は高性能なラック搭載タイプの2UサイズHPCワークステーションです。プロセッサは最新のQuad-Core Xeon 3.0GHz FSB1333MHzが搭載でき、メモリは最大32GBまで実装できます。データ転送を司るチップセットには最新のIntel 5400チップセットが採用されています。
「HPC-ProServer DPrR5400」に搭載しているプロセッサは45nmプロセスで製造される最新のPenrynコアを採用したQuad-Core Xeon 5400番台 (Harpertown) です。このプロセッサの特長は4コア動作時の高効率化が達成されていることと、搭載キャッシュサイズは12MB (6MB x2)へと拡大していることなどがあります。
「HPC-ProServer DPrR5400」は4本のメモリスロットを実装し、1GB、2GB、4GB、8GBのDDR2 667MHz FB-DIMMモジュールが選択でき、4GB、8GB、16GB、32GBのメモリシステムを構成できます。大規模なデータの可視化ではこの32GB大容量メモリが活躍します。
大容量メモリーを搭載した計算機を長時間連続動作させ結果を求めるHPC計算では、安定した計算機の稼動を実現するためメモリーエラー対策が必須です。その対策を考えるため代表的な3種類のメモリーエラーを示します。1種類目は「初期不良」によるメモリーエラーです。これは半導体ウエハ処理工程で発生した欠陥や不具合が、半導体メーカーのスクリーニングを通り抜け潜在的不良として残されたまま製品化され、その潜在的不良が使用開始後に顕在化しメモリーエラーを引き起こしているものです。2種類目は「経年劣化」によってメモリ不良が発生しメモリーエラーを引き起こしているものです。3種類目は「ソフトエラー」と呼ばれるメモリーエラーです。これは宇宙線が原因で偶発的にメモリー値が反転する非破壊的なシングルビットエラーです。
「初期不良」メモリをスクリーニングする最良の手段は、組み立てが完了したHPC計算機上でLinpack HPLなどの負荷の高い計算を連続動作させ、メモリエラーが発生しやすい条件で十分な試運転を行うことです。試運転中にメモリエラーが発生するとエラーはECCメモリにより自動修復され、同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると初期不良メモリと判断し、早期部品交換を行い計算機の信頼性を回復させます。
何ヶ月も安定動作していた計算機のメモリが突然エラーを発生させることがあります。このような場合でもECCメモリを使用しているとエラーは瞬時に訂正され動作は継続されます。同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると不良メモリと判断し、致命的な障害を起こす前に早期部品交換を行います。
「ソフトエラー」と呼ばれる宇宙線が原因で非破壊的にメモリ値が反転するシングルビットエラーも稀に発生するようです。このような「ソフトエラー」対策としてはECCメモリの搭載が最善です。ECCめもりによりシングルビットエラーが発生しても何事も無かったように動作が継続され実害は発生しません。
「HPC-ProServer DPrR5400」は最大で2基のハードディスクを内蔵できます。選択できるディスクはSATA 7200rpm 250GB、500GB、750GB、1TBあるいはSATA 10000rpm 300GBからの選択となります。
HPCテクノロジーズの経験によりHPCに最適化したCentOSを搭載しています。(標準的なLinux OSはHPC利用を考慮していません。) 最適化作業としては、HPCで必要となるパッケージの追加、HPCで不要なデーモンやサービスの停止、HPCで必要なデーモンやサービスの起動、開発環境などとのマッチング、アプリケーションの動作検証などです。
■ CentOSとRedHat
■ LinuxでのHPCチューニングの必要性
商用アプリケーションなどではLinux OSのディストリビューションを指定されることがあります。そこでRedHatにオプション対応しています。もちろん、コンパイラなどの緻密なバージョン指定にも対応しています。
8CPUコアを搭載するシステムを共同利用する際には、利用効率と利便性を向上させる負荷分散システムの搭載が必須です。そこで、大型のUNIX並列計算機で圧倒的な動作実績を誇るPlatform LSFなどに対応しています。LSFは適切なジョブスケジューリングを、並列度、CPU負荷、メモリ利用状況、ライセンス状況、他ノードの負荷状況などを考慮したうえで実施します。これらの要素への配慮に関してLSFの完成度は圧倒的な高さを持っており、他のスケジューラとは比較になりません。
最新のハードウェアを利用するには、適切な開発環境の選択と、整然としたインストールが必須です。標準的なインテルコンパイラのみならず、お客様のご用途に合わせてIntel-MPI、Inte-MKL、パフォーマンス・チューニングツール類、PGIコンパイラなどの最適なインストールサービスも実施します。もちろん、ライセンスサーバにも対応します。また、GbEやInfiniBandにも適応した開発環境のカスタマイズも実施します。
8並列計算が可能になったことで、ネットワーク並列では対応できなかった計算の並列度を向上させることができます。また、32GBの大容量メモリを必要とする計算にも対応できます。このような計算環境を要求するアプリケーションの搭載と運用をサポートする予定です。
ディスク障害や誤操作などによりOSが正常に利用できなくなるようなトラブルに際して、OSの復旧を簡単かつ確実に行えるように「OSリカバリDVD」を添付しています。弊社の「OSリカバリDVD」は、弊社工場でお客様に納入する計算機のカスタム設定が完了した時点で、そのシステムイメージをフルコピーするものです。そのため、「OSリカバリDVD」を用いると出荷時の状態に確実に復旧できます。さらに導入後のシステム設定変更やアプリケーション追加をされた場合にも、簡単に新たな「OSリカバリDVD」を作成できるように、簡単なコマンド操作で任意のタイミングの「OSリカバリDVD」のISOイメージを作成することが可能です。
システムにはDell純正のシステム管理ツールが搭載されています。このツールは便利な障害表示機能を持ち、障害時には便利に利用できます。
HPC-ProServer DPrR5400はHPCクラスタの内部に組み込んで利用する高速グラフィックス装置や、そのリモート接続、さらにはGPUカードを組み込んだHPC計算機など、高度なシステムインテグレーションが求められます。そこで、弊社ではお客様の計算機や開発環境、オプションツール類、アプリケーション類などの導入調査などを可能な限り行い、快適な利用環境の実現に努めます。これらのインテグレーション作業をお客様が単独で実施されるには手間と時間が必要です。HPCテクノロジーズはこのようなお客様のご要望に応えるべく対応しています。
一般に大手ベンダー製のワークステーションは市販ワークステーションに比べて量産開始判断が慎重です。実はこのタイムラグこそ品質管理の最後の砦であり、徹底的なバリデーションなどが行われている期間です。全ての問題がクリアされた製品は、生産を一挙に立ち上げることができます。そして弊社工場では実運用レベルのテストと改修を行い、さらに仕上には納入後の動作確認、不具合箇所の特定、迅速なオンサイト改修までを一連の工程として実施しています。
「HPC-ProServer DPrR5400」は、標準で3年間の当日/翌営業日オンサイト保守が無償実施されます。万一の障害でもお客様の手を煩わせることなく、HPCテクノロジーズの技術スタッフとオンサイト修理スタッフが協力して障害切り分け作業を行い、迅速かつ確実な復旧を実現します。