HPC-ProServer DPr690
Dual/Quad-Core Xeon 4/8CPUコア搭載
FSB1333MHz、667MHz FB-DIMM採用
最大64GBメモリ搭載可能
最大3基の大容量ハードディスク追加可能 (スクラッチ用)
安心のOSリカバリDVD標準添付
InfiniBandにも対応し大規模並列機としても利用可能
静粛かつ省スペースで設置場所を選ばない
3年間の当日オンサイト「W保守サービス」付き
HPC-ProServer DPr690 (以下DPr690と略) はインテルのXeonプロセッサを2CPU搭載するHPCワークステーションです。CPU構成としてはDual-Core Xeon 2CPU 4CPUコアか、Quad-Core Xeon 2CPU 8CPUコアとなります。搭載可能なメモリ容量は、16ソケットのメモリスロットにより、4GB FB-DIMMメモリを用いて最大64GBの構成が可能です。搭載可能ディスク容量は、4基のディスクベイを持っているため、750GBドライブを用いることで最大3TBの搭載が可能です。筐体は静粛性に優れたフルタワー型の筐体です。DPr690は大容量かつ高速演算を実現する最高峰のHPCワークステーションです。
DPr690に搭載のXeon CPUには「インテル Core マイクロアーキテクチャ」という新しいCPUコアが搭載されています。このCPUコアの特徴は4命令同時実行が可能なことです。そのため2.66GHz駆動の場合の理論演算性能は10.64GFLOPSに達します。さらにその実効性も高く、Linpack HPLというベンチマークテストで測定すると8.2GFLOPSという性能を叩き出しており、これは理論性能の77%にも達する優れた値です。
DPr690ははこのCPUコアを最大で4コア搭載できるXeonプロセッサを2個搭載することで4CPUコアか8CPUコアを実装する計算機を構成します。計算機アーキテクチャとしてはメモリ共有ですから、MPIによる並列計算のみならずOpenMPによる並列計算もサポートします。そこでOpenMPでの並列演算性能を確認してみました。測定にはLinpack HPLを用いました。すると、2.66GHz駆動での8並列演算で52.3GFLOPSの実行演算性能を確認できました。8並列での理論演算性能は85.12GFLOPSですから、その61%にも達する優れた値です。
DPr690の魅力のひとつに、16個のメモリスロットの搭載により4GBのFB-DIMMを用いて64GBのメモリを構成することがあります。8CPUコアと64GBメモリを搭載した構成でも300万円以下と、導入して頂きやすい価格となっております。
高負荷で動作する一般的なHPC用途では、メモリの発熱が大きいため冷却の仕組みは機器選定時の重要なチェックポイントになります。DPr690はメモリをマザーボードとは別のドータカード上に搭載する設計のため、メモリとメモリの間に十分な通風用のスペースを設けることができ、効率良くメモリモジュールを冷却することができます。そのため、不安定動作の一因であるメモリの発熱を回避することが可能です。
DPr690はGaussianやGAMESSなどのアウトコアソルバーで必須となる高速・大容量のスクラッチディスクが搭載可能です。3.5インチのディスクベイが3基空いており、750GBのSATAドライブ搭載することで2.25TBのRAID0ボリュームが実現できます。利用可能なディスクは250GB/ 500GB/ 750GBから選択できます。
DPr690はオンボードでSAS5iRという簡易RAIDコントローラを搭載しておりハードウェアRAID0を構築することができます。ハードウェアRAIDはCPUへの負担が少ないため、CPUとRAIDの双方に負担を掛けるような利用形態でも安定した性能が期待できます。なお、RAID0のI/O性能はHPCテクノロジーズのベンチマークテストで素晴らしい速度が確認されています。
DPr690は64GBメモリや3TBの大容量ディスクを搭載しても安定稼動が実現できるように1000Wの大容量電源がオプション設定されており32GB以上のメモリを選択すると自動的に電源容量も大きなものに変更されるので安心です。
DPr690はフルタワー型の筐体を採用しており内部に空間的な余裕があります。そのため発熱量の大きな大容量メモリや大容量ディスク、大容量電源などを搭載しても周辺に十分なスペースを取ることができ、効率良く冷却を行うことが出来ます。
DPr690はディスクサイドでの使用を前提としたワークステーションであり、本格的な低騒音設計が施されています。その動作音は想像以上に小さなものです。大容量のメモリやディスクを用いての高負荷連続運転でも安定稼動と低騒音の両立を達成しています。
システムを選定するに当たって、Dual-CoreかQuad-Coreかの選択は難しい問題です。基本的に性能向上はマルチコア化による並列性能で達成されるようになっています。それに対応する計算機やコンパイラなどの開発も発展しています。そして現在の中心的な課題はアプリケーションの最適化にまで至っています。この状況を考慮すると、システム選択ではQuad-Core機の選択が基本となります。
基本的にQuad-CoreはDual-Coreとして利用できますが、Dual-Coreは決してQuad-Coreとしては利用できません。そのためQuad-Core Xeonを選択しておいても損となることは少ないです。性能向上はマルチコアでの並列化で達成されてゆくわけですから、先の傾向を掴んでおく意味からもQuad-Core Xeonの選択が素直な判断となります。しかも、下表を参考にして頂くとわかり易いのですが、その価格差はシステムレベルでは小さいものです。
ただ実際には、コア数を減らしてCPUクロック速度を優先する場合もあります。それは並列化されていないアプリケーションや、並列効率が低いアプリケーションでの絶対的な計算速度を特に重視する場合か、もうひとつの場合は、ライセンス費がCPUコア単位でカウントされしかもそれが高価なアプリケーションの場合です。このような場合にはクロック速度が高速なDual-Core Xeonが適していることになります。しかしこれはレアケースです。
この比較を多少でも判りやすくするために、価格を機能や性能から比較できる簡単な比較表を作成しました。参考にご利用をお願いします。ポイントはDual-CoreとQuad-Coreの価格差が小さいという点です。
| 比較項目 | Dual-Core Xeon 2.66GHz | Dual-Core Xeon 3.0GHz | Quad-Core Xeon 2.66GHz |
| 各構成で32GBメモリ搭載の価格 | 1,311,000 | 1,359,000 | 1,462,000 |
| 4CPU利用時のコア単価 | 327,750 | 339,750 | 365,500 |
| 8CPU利用時のコア単価 | - | - | 182,750 |
| 並列計算 | 4並列 | 4並列 | 8並列 |
| 同時実行ジョブ数 | 4ジョブ | 4ジョブ | 8ジョブ |
| 総合理論性能 (GFLOPS) | 43 | 48 | 85 |
| 実効並列演算性能 (Linpack HPL, GFLOPS) |
- | 35 (4並列) | 52 (8並列) |
(価格は税抜きのアカデミック)
マルチコアによる性能向上が基本ですが、利用CPUコア数に応じてライセンス費がカウントされる商用アプリケーションでは、ライセンス費が嵩む心配があります。ところが一部のアプリケーションでは、CPUコア単位でライセンスをカウントせず、CPUソケット単位でのカウントに切り替えた製品なども出てきています。この流れが定着するとマルチコアの恩恵は大きくなります。
マルチコア機のメリットとしてノード数が集約できる点があります。8並列のクラスタを構成するためには、これまでは4〜8台の計算機が必要でした。ところがQuad-Core Xeon 2CPU 8CPUコアで8並列のクラスタを構成するには1台の計算機で実現します。もしノードの故障率が同じなら、ノード数の少ない方がシステム全体の故障率は低減します。特に並列計算では1ノードが故障しただけでも計算全部が停止してしまいますから、搭載コア数の多い計算機を用いてノードを集約することは可用性の面でも非常に有意義です。
HPC計算機をご利用されるお客様の多くが、増加するマシンにより電源や空調の不足に困られています。そこでマルチコア計算機により既存の計算機をリプレースは非常に有効な策です。マルチコア機は消費電力性能比が高いため、空調への負荷も小さく、省スペースです。そのため、既存の多ノードのクラスタの置き換え用としての採用が盛んです。
標準のLinux OSはHPC計算機やクラスタ用としてはセットアップはできません。なぜなら、セキュリティ関連の設定などが厳しい反面、HPC用途に必須のパッケージなどは含まれていません。さらに、並列計算を行うための各種機能や設定なども無効化されています。Lnux OSをHPC用にセットアップするには、HPCで必要なパッケージの追加と設定を行い、不必要なデーモンやサービスは停止し、必要なデーモンやサービスは起動するように設定します。HPCクラスタでは例えばデフォルト設定のネットワークでは最良ではありません。動きますが性能が引き出されていないのです。HPCテクノロジーズのOS設定ではこれらのチューニングを随所に行う配慮をしています。
マルチコア計算機ではハイレベルな負荷分散機能を持つLSFの導入は不可避となっています。LSFは一般的なジョブスケジューラと異なり、計算機の空き状況のみならず、負荷のレベルまで把握しており、クラスタ全体の負荷レベルが均等になるような"負荷分散"にまで配慮したジョブスケジューリングが行われます。この機能が搭載されていないと、負荷が偏ったジョブスケジューリングとなってしまい。ボトルネックの温床を意図せず作ることになります。
弊社ではHPC計算機に最新のコンパイラや数値演算ライブリを最適にインストールして出荷しておりご好評です。HPCテクノロジーズは多くのアプリケーションのコンパイル経験を持ち、実際に現場で利用していただき性能が出ていることを確認していただいている構成のため安心です。
マルチコア環境では従来一般に利用されていたMPICHでは性能が出ない場合があります。そこで、高速なMPI計算を実現するマルチコア対応のIntel-MPIライブラリをコンパイラと併せて設定済みで納入できます。もちろんMPICHの利用を継続していただけるように片方を利用時に選択できる構成での提供も可能です。
DPr690ではInfiniBandのシステムインテグレーションもサポートしています。GbE接続で性能向上の限界にお困りの場合でも安心です。価格の下がった64GBメモリ搭載機4台をInfiniBand接続してクラスタ化したマシンは、32CPUコア、256GBメモリ搭載のInfiniBandクラスタとして動作し、これを1000万円以下の特別価格でご提供することができます。このクラスタは手元の計算機ですから、計算センターのように利用制限や、システム停止などを気にすることなく、どんなに長期間の計算でも投入しておくことが可能です。
計算機に詳しい方が空席となっている研究室様では、量子化学計算、MD計算、流体計算、構造計算など各種アプリの最適化インストールや最適化コンパイルは手間と負担が大きく、大きな課題となっています。そこでDPr690ではサービスの一環としてこれらの専門的な作業をオプションでサービスしています。
DPr690は高品質なデルの計算機を基本コンポーネントに採用して製造されるHPC計算機です。この計算機は、デルの開発センターにて徹底的なテストを経て開発されています。さらにその生産は、周辺に部品工場を従えた大規模な生産拠点で一貫生産されています。高度技術が速いサイクルで投入される計算機産業では、インテルを含む大手部品メーカーと共同で開発と生産を実現できる大手ベンダーでなければ高品質かつ最先端のワークステーションを製造することは極めて困難です。そこでHPCテクノロジーズは、デル製の高品質ワークステーションに高度なHPCシステムインテグレーションを施し、お客様満足度の高いHPC製品の生産に集中的に取り組んでいます。
従来のDPr690はシステムディスクを2重化することで、万一のシステムディスクの障害に備えてきていました。しかし、最新のDPr690にはOSリカバリDVDを標準添付しています。このDVDは製品出荷時のOSのイメージを焼き付けたものですから、万一システムディスクが障害を起こしても、出荷時の状態に復帰させることができます。さらに、簡単なコマンド操作で、お客様が任意の時点のシステムディスクのイメージをDVDに焼き付けることも可能です。
デルサポートによるオンサイト修理作業はハードウェアの復旧が主であり、障害発生直後の障害の切り分け作業や、修理完了後のシステムレベルの復旧作業などには対応してくれません。そこで、サポートの一次受けをHPCテクノロジーズが対応することでお客様が不慣れな障害復旧時の対応から開放されます。HPC特有の問題に対応するHPC専門のサポートチームにより、お客様に満足していただけるサポートサービスが実現されます。
従来のHPC用のワークステーションは1年間のセンドバック保守が主流でした。HPCテクノロジーズでは3年間の当日オンサイト保守とHPCテクノロジーズによる障害一次受け付けにより長期間安定して製品をご利用していただくことができるようにしています。
お客様の計算機の利用状況によっては4年間や5年間の長期間の保守が必須となる場合があります。そこで、DPr690では最長で5年間のサポート期間の延長を可能としています。
世界最高水準のロジステック網を持つデルは、保守部品の品質管理と在庫管理を徹底して実施しています。必要な場合にはオンサイトで部品のフル交換も可能な修理サービスの存在は、高い負荷で長期間運用されるHPCマシンにとっては心強い限りです。