HPC-ProServer DPrT7400
45nmプロセスのXeon 5400番台かXeon 5200番台を搭載
Intel 5400チップセットを搭載、FSB 1600MHzで動作
高速DDR2 800MHzメモリを搭載、大容量128GBまで対応
大口径ファンと大容量ヒートシンクの相乗効果により安定稼動
80%以上の電力効率を達成する980Wの大容量電源を採用
Intelコンパイラ、Intel MPI、Linuxなどを最適インストール
業界標準のLinux OS (CentOS) を高い完成度でセットアップ
Gaussian、GAMESS、VASP、商用流体/構造アプリなどとSI実施
3年間の長期無償保証 (当日出張修理サービス、修理部品保証、技術・運用支援)
「HPC-ProServer DPrT7400」は最新技術を最大限に採用した最高峰のHPCワークステーションです。その特長を列挙してご紹介します。
・ 45nmプロセス技術を採用したQuad-Core Xeon 5400番台か、Dual-Core Xeon 5200番台プロセッサを採用
・ 最速CPUを迅速に製品化、Quad-Core Xeon 3.2GHz、Dual-Core Xeon 3.33GHzを量産中
・ 新CPUは大容量12MBキャッシュ搭載 / 高速演算回路の追加 / 消費電力抑制とクロック速度向上を両立
・ 最新鋭チップセットIntel 5400 Chipsetを採用
・ CPUバスは最速のFSB 1600MHzで駆動
・ メモリは最速のDDR2 800MHzを採用
・ 最大メモリ容量は128GB (DDR2 667MHz 8GB FB-DIMM使用)
DPrT7400はこのような基本性能の高さを獲得することで45nmプロセス技術を採用したQuad-Core Xeon / Dual-Core Xeonによるマルチコア並列計算を最高速に動作させることができる最高峰のHPCワークステーションです。さらに、メモリ容量もシーズ最大であり、大規模計算にも途を開けています。DPrT7400により量子化学計算、分子動力学計算、流体計算、構造計算、数式処理計算などのHPCアプリケーションの並列計算はより高速に実行されることが期待されます。
DPr7400はGaussian03やGAMESS、VASP、AMBERなどから、流体計算ソフト、構造計算ソフトなど幅広い領域のアプリケーションの高速処理に適しています。さらに弊社では、これらの主要アプリケーションの挙動を理解したうえで高品質なシステムインテグレーションを提供します。
・ アプリケーション毎に最適構成したDPr7400の提案
・ アプリケーション毎に最適構成した開発環境を設定済みで提供
・ アプリケーション毎の最適化ビルド
・ 並列動作環境のアプリケーション特性に合わせた提案
・ ジョブスケジューラLSFとの統合
・ ライセンスサーバとの接合
・ ブリポスト環境との統合
このように弊社のDPr7400は単調なハードウェアとして提供するのではなく、実用的な科学技術計算アプリケーションとの高度なシステムインテグレーション含んだ計算環境製品としてご提供する製品です。
DPrT7400は驚いたことにワークステーションであるにもかかわらず、計算センターなどでも採用されている本格的ジョブスケジューラー Platform LSF (Load Sharing Facility) の搭載がサポートされています。しかし、これには合理的な理由があります。この計算機にはCPUが8個 (8core) も搭載されています。そのため複数の並列度が異なるジョブを混在させて投入することが可能です。外観こそワークステーションですが、実態としては以前の大型UNIX並列計算機に近いハードウェア内容を備えているのです。ですから、大型計算機センターと同様のジョブ管理をすることで効率良く快適に利用することが可能です。その一例として、LSFにはライセンス管理機能も搭載されておりライセンスサーバのライセンス数と、利用可能なプロセッサ数を把握したうえで、最適なジョブ投入の制御が可能です。この他にもLSFは多くの便利な機能を持っており、高性能なマルチコア計算機に搭載することでその価値をさらに向上させることができます。またLSFは適切なジョブスケジューリングの実施に関しても定評があり並列度、CPU負荷、メモリ利用状況、ライセンス状況、他ノードの負荷状況などを考慮して適切に動作します。このような利用ではLSFの完成度の高さが光り、他のスケジューラとは比較になりません。
>> Platform LSFの紹介へリンク
45nmプロセス技術を採用したXeonを採用した計算機のベンチマークテストはまだ緒についたばかりです。これまで報告されている45nm Xeonベンチマークの機器スペックはQuad-Core Xeon 3.0GHz、FSB 1333MHz、DDR2 667MHzですが、素晴らしいベンチマーク結果が報告されています。そしてこれからさらに機器スペックがQuad-Core Xeon 3.2GHz、FSB 1600MHz、DDR2 800MHzと高速化されますから、そのベンチマーク結果には非常に興味をそそられます。さらに、DPr7400をInfiniBandでクラスタ化した並列計算機によるベンチマークテストも予定しています。これにもご期待ください。
>> 弊社べチンマークページへリンク
45nmプロセス技術によるXeonの改良点をご紹介します。
・ 45nmと線幅が細くなり、大容量キャッシュや高速演算回路が追加された
・ FSBが1333MHzから1600MHzへと約20%の高速がを達成
・ 素材の改良により「リーク電流」による発熱問題が解消されCPUクロックが高速化されはじめた
※ 発熱問題によりCPUのクロック速度の上昇が停滞し、その代案として登場してきたマルチコアCPUは、幸いにも並列化が進んでいた科学技術計算とは親和性が高かったため並列計算の普及に拍車をかけることになりました。しかし、並列度が高くなるに従いメモリI/O速度によるボトルネックの壁などが次々と見えてきそうです。45nmプロセス技術はこのような壁を越えてゆくためのパワフルな基礎技術としてこれから有効利用されそうです。
Xeonをマルチコアで高速に並列動作させるには、それに併せたシステムの高速化も必要です。DPrT7400ではチップセットにIntel 5400 Chipsetを採用し、システムバスはFSB 1600MHzで駆動、メモリはDDR2 800MHz FB-DIMMを採用するなどシリーズ最速のシステムを実現しています。
最新のアーキテクチャを採用した計算機が製品化されるまでには十分な開発期間が必要です。市販のCPU、メモリ、マザーボードを組み立てOSをインストールしただけではHPCワークステーションとしては不十分です。試作と徹底的なテストを繰り返し、部品メーカーも参加した製品開発が必要です。このようにして基礎部品レベルから緻密な改良を行い、生産管理にも万全を期した製品化が必要です。DPr7400はこのような開発により実現された最速のプレミアムHPCワークステーションです。
・ 確実な納期の実現
・ 初期不良の解消
・ 高品質なシステム + システムインテグレーションの提供
・ 長期安定動作の実現
・ 補修部品の安定提供
最速のQuad-Core Xeon X5284 3.20GHzは消費電力も150Wと並ではありません。このプロセッサが2個も高負荷連続運転するのですからCPUの冷却は大切です。DPrT7400のCPU冷却性能は折り紙付です。その秘密は巨大なクーリングファンと、ヒートパイプを採用した大表面積のヒートシンクにあります。写真左が巨大なファンで、その右側がヒートシンクです。写真ではこれらはむき出しになっていますが、実際は全体がスッポリとダクトで覆われており、吸入された冷気は無駄なくヒートシンクに導かれ効率良くCPUを冷却します。(写真はクリックすると拡大)
搭載される最大128GBのDDR2 667MHz FB-DIMMメモリの発熱も大きなものです。発熱量の大きなメモリを十分に冷却せずに利用していると、連続動作をさせた際にシステムが高熱に晒され動作が不安定になることがあります。DPrT7400はメモリの発熱対策も充実しています。マザーボードにメモリライザが垂直に実装されており、その上に16本のメモリスロットが搭載されています。このように立体的に実装することで表面積を広げて冷却効率を高めることができます。さらに、写真左の大口径ファンから取り入れられた冷気は空気ダクトによりメモリに導かれ強力に冷却します。しかもダクトの排気部には排気用ファンまで取り付けられている徹底ぶりです。(写真はクリックすると拡大)
大容量メモリを使う場合は大規模計算を考えられている場合が多いので計算速度の向上は大切です。DDR2 800MHzメモリの採用は課題にも大きな効果が期待できます。また、GaussianやGAMESS、あるいはアウトコアソルバーを採用している構造計算アプリケーションには、メモリキャッシュによるスクラッチディスクの高速化が大きな高速化をもたらす場合があります。ジョブの種類によっては全計算時間の半分程度をスクラッチファイルのI/O待ちで空費している場合すらあるからです。まだ128GBのメモリは高価だと思える局面が多いのはたしかですが、少しずつ採算が合うようになってきているのではないのでしょうか。
大容量メモリーを搭載した計算機を長時間連続動作させ結果を求めるHPC計算では、安定した計算機の稼動を実現するためメモリーエラー対策が必須です。その対策を考えるため代表的な3種類のメモリーエラーを示します。1種類目は「初期不良」によるメモリーエラーです。これは半導体ウエハ処理工程で発生した欠陥や不具合が、半導体メーカーのスクリーニングを通り抜け潜在的不良として残されたまま製品化され、その潜在的不良が使用開始後に顕在化しメモリーエラーを引き起こしているものです。2種類目は「経年劣化」によってメモリ不良が発生しメモリーエラーを引き起こしているものです。3種類目は「ソフトエラー」と呼ばれるメモリーエラーです。これは宇宙線が原因で偶発的にメモリー値が反転する非破壊的なシングルビットエラーです。
「初期不良」メモリをスクリーニングする最良の手段は、組み立てが完了したHPC計算機上でLinpack HPLなどの負荷の高い計算を連続動作させ、メモリエラーが発生しやすい条件で十分な試運転を行うことです。試運転中にメモリエラーが発生するとエラーはECCメモリにより自動修復され、同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると初期不良メモリと判断し、早期部品交換を行い計算機の信頼性を回復させます。
何ヶ月も安定動作していた計算機のメモリが突然エラーを発生させることがあります。このような場合でもECCメモリを使用しているとエラーは瞬時に訂正され動作は継続されます。同時にエラー情報として記録に残されます。この記録を検査し、もし閾値を超える回数のエラー情報が記録されたメモリーモジュールが発見されると不良メモリと判断し、致命的な障害を起こす前に早期部品交換を行います。
「ソフトエラー」と呼ばれる宇宙線が原因で非破壊的にメモリ値が反転するシングルビットエラーも稀に発生するようです。このような「ソフトエラー」対策としてはECCメモリの搭載が最善です。ECCめもりによりシングルビットエラーが発生しても何事も無かったように動作が継続され実害は発生しません。
CPUやメモリの消費電力の大きさを少しでも相殺するため、エネルギー効率80%強を誇る高品質電源を採用しています。さらに電源容量も余裕の980W電源を採用し安定稼動を目指しています。
DPrT7400の設置場所は計算機室だけではなく、居室への設置も多いです。そのためには静音性も大切です。騒音の大部分は空冷用のファンが原因です。そのため大口径で羽の幅が広いファンを採用し風切音を抑えています。さらにファンはゴムで筐体から浮かして接続されており振動が伝わらない構造が採用されています。筐体の外板も制振性を考慮した複層版となっており音を筐体内に閉じ込め共振も抑えられています。また、電源も効率が良いものを採用しているため冷却ファンの騒音も抑えられています。
DPrT7400には最大4基のハードディスクを搭載できます。対応するディスクはSATA 3.5インチ 7200rpmのドライブでは、容量が 250GB、500GB、750GB、1TBから選択できます。SAS 3.5インチ 10krpmドライブでは、容量が146GB、300GB、400GB、450GBからの選択となります。なお搭載できる総容量は2TBの制限がありますのでご注意お願いします。
2個のディスクを用いてノード内バックアップ構成が可能です。構成例としては500GBのディスクを2個用いて、片方をバックアップ先として用い、rsyncによる定期差分バックアップを実施することが可能です。バックアツプによる冗長化はRAIDによる冗長化と比較して可用性では劣りますが、その反面としてオペレーションミスなどによるファイルの削除やデータの更新などに対してもバックアップの可逆性を活かした運用が可能です。
2個ないし3個のディスクを用いて高速スクラッチディスクを構築できます。構成例としては、500GBディスク3個をRAID0化し1.5TBのRAID0ボリュームを構成します。この場合にはファイルシステムにXFSを利用して高速化を追求します。
>> XFSによる高速スクラッチディスクのG03ベンチマークテストへリンク
先にも記載しましたがDPrT7400にはLSFを標準搭載しています。そのメリットを別の観点からもご紹介します。LSFの大きなメリットの1つに、計算ノードの追加が容易なことです。もう気付かれていることと思いますが、ワークステーション1台であってもLSFを搭載することで、その運用スタイルは共同利用環境的になります。すなわち計算機の内部は、管理部、共同利用ストレージ部、計算機部が論理的に独立した構造を持つようになるのです。そしてユーザが利用するフロントエンドは管理部と共同利用ストレージ部になり、計算機部はこれらのバックエンドで動作しているイメージとなります。そのため、新たな計算機を追加しても、利用者からは従来の計算機部と同様にバックエンドで動作しているCPU数が増加したようにしか見えません。ところが増設作業は既存のワークステーションにネットワークで接続し、所定の設定を行うだけで完了します。実際のシステムの制御はLSFが行っています。このため、計算機が一台でも百台でも同様の利用環境となります。この環境は計算機の台数が増えるに従いその素晴らしさが実感されます。もし複数台の計算機を運用されるようでした是非とも弊社のLSFを含んだシステムインテグレーションのご導入をお願いします。
最新のハードウェアを利用するには、適切な開発環境の選択と、整然としたインストールが必須です。標準的なインテルコンパイラのみならず、お客様のご用途に合わせてIntel-MPI、Inte-MKL、パフォーマンス・チューニングツール類、PGIコンパイラなどの最適なインストールサービスも実施します。もちろん、ライセンスサーバにも対応します。また、GbEやInfiniBandにも適応した開発環境のカスタマイズも実施します。
>> 最新の開発環境価格表へリンク
HPCテクノロジーズの経験によりHPCに最適化したCentOSを搭載しています。(標準的なLinux OSはHPC利用を考慮していません。) 最適化作業としては、HPCで必要となるパッケージの追加、HPCで不要なデーモンやサービスの停止、HPCで必要なデーモンやサービスの起動、開発環境などとのマッチング、アプリケーションの動作検証などです。
>> CentOSとRedHat
>> LinuxでのHPCチューニングの必要性
商用アプリケーションなどではLinux OSのディストリビューションを指定されることがあります。そこでRedHatにオプション対応しています。もちろん、コンパイラなどの緻密なバージョン指定にも対応しています。
ディスク障害や誤操作などによりOSが正常に利用できなくなるようなトラブルに際して、OSの復旧を簡単かつ確実に行えるように「OSリカバリDVD」を添付しています。弊社の「OSリカバリDVD」は、弊社工場でお客様に納入する計算機のカスタム設定が完了した時点で、そのシステムイメージをフルコピーするものです。そのため、「OSリカバリDVD」を用いると出荷時の状態に確実に復旧できます。さらに導入後のシステム設定変更やアプリケーション追加をされた場合にも、簡単に新たな「OSリカバリDVD」を作成できるように、簡単なコマンド操作で任意のタイミングの「OSリカバリDVD」のISOイメージを作成することが可能です。
システムにはDell純正のシステム管理ツールが搭載されています。このツールは便利な障害表示機能を持ち、障害時には便利に利用できます。
「HPC-ProServer DPrT7400」は2CPU 8並列のHPCワークステーションとしてのシステム構築が期待されます。そこで、弊社ではお客様の計算機や開発環境、オプションツール類、アプリケーション類などの導入調査などを可能な限り行い、快適な利用環境の実現に努めます。これらのインテグレーション作業をお客様が単独で実施されるには手間と時間が必要です。HPCテクノロジーズはこのようなお客様のご要望に応えるべく対応しています。
一般に大手ベンダー製のワークステーションは市販ワークステーションに比べて量産開始判断が慎重です。実はこのタイムラグこそ品質管理の最後の砦であり、徹底的なバリデーションなどが行われている期間です。全ての問題がクリアされた製品は、生産を一挙に立ち上げることができます。そして弊社工場では実運用レベルのテストと改修を行い、さらに仕上には納入後の動作確認、不具合箇所の特定、迅速なオンサイト改修までを一連の工程として実施しています。
「HPC-ProServer DPrT7400」は、標準で3年間の平日-当日オンサイト保守が無償実施されます。万一の障害でもお客様の手を煩わせることなく、HPCテクノロジーズの技術スタッフとオンサイト修理スタッフが協力して障害切り分け作業を行い、迅速かつ確実な復旧を実現します。