HPC-ProServer DPrT7400
45nmプロセスのXeon 5400番台かXeon 5200番台プロセッサ搭載
i5400チップセット、FSB 1600MHz、DDR2 800MHz、128GBメモリに対応
Gaussian、GAMESS、VASP、主要な商用流体/構造アプリなどのSIを実施
3年間の長期無償保証 (当日出張修理サービス、修理部品保証、技術・運用支援)
| DPr-T7400* | SPEC CFP2006 Rates (並行処理性能) | SPEC CFP2006 (単体コア性能) | |||||||
| 製品 | DPr T7400 |
DPr T7400 |
DPe 1950III |
DPe R805 (T605) |
DPr T7400 |
DPe 2900III |
DPe T605 (R805) |
DPr T7400 |
DPr T7400 |
| CPU | Xeon | Xeon | Xeon | Opteron (shanghai) |
Xeon | Xeon | Opteron (shanghai) |
Xeon | Xeon |
| 製造プロセス | 45nm | 45nm | 45nm | 45nm | 45nm | 45nm | 45nm | 45nm | 45nm |
| CPU番号 | X5492 | X5492 | X5470 | 2384 | X5492 | X5470 | 2384 | X5272 | X5272 |
| CPUクロック(GHz) (FSBクロック) |
3.4GHz (F1600) |
3.4GHz (F1600) |
3.33GHz | 2.7GHz | 3.4GHz (F1600) |
3.33GHz | 2.7GHz | 3.4GHz (1600) |
3.4GHz (1600) |
| チップセット | 5400 | 5400 | 5000X | - | 5400 | 5000X | - | 5400 | 5400 |
| メモリ(MHz) | 800MHz | 800MHz | 667MHz | 800MHz | 800MHz | 667MHz | 800MHz | 800MHz | 800MHz |
| OS | WinVis | WinVis | Linux | Linux | WinVis | Linux | Linux | WinXP | WinXP |
| コンパイラ | Intel11.0 | Intel10.1 | Intel11.0 | PGI7.2 | Intel11.0 | Intel11.0 | PGI 7.2 | Intel11.0 | Intel10.1 |
| CPU 数 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 |
| コア数 | 4 | 4 | 4 | 2 | 4 | 4 | 4 | 2 | 2 |
| 総コア数 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 4 | 4 |
| 投入ジョブ数 | 8 | 8 | 8 | 8 | 1 | 1 | 1 | 1 | 1 |
| SPECfp base値→ 各経過時間(秒)↓ |
85.0 | 79.2 | 74.7 | 104 | 25.8 | 25.0 | 18.8 | 25.0 | 20.7 |
| bwaves |
2507 | 2506 | 3201 | 1044 | 320 | 399 | 548 | 322 | 359 |
| gamess | 808 | 812 | 789 | 1168 | 883 | 864 | 1170 | 855 | 831 |
| milc | 2173 | 2341 | 1981 | 941 | 758 | 559 | 460 | 734 | 848 |
| zeusmp | 779 | 829 | 979 | 650 | 376 | 419 | 563 | 400 | 465 |
| gromacs | 325 | 329 | 350 | 473 | 311 | 324 | 469 | 312 | 320 |
| cactusADM | 929 | 1091 | 1186 | 804 | 141 | 105 | 574 | 222 | 360 |
| leslie3d | 1840 | 2126 | 2470 | 1153 | 453 | 466 | 516 | 464 | 472 |
| namd | 444 | 455 | 448 | 618 | 434 | 444 | 617 | 434 | 453 |
| dealII | 628 | 761 | 654 | 593 | 452 | 374 | 546 | 446 | 625 |
| soplex | 1587 | 1515 | 1774 | 926 | 565 | 584 | 576 | 560 | 558 |
| povray | 201 | 204 | 193 | 302 | 197 | 196 | 301 | 197 | 204 |
| calculix | 363 | 516 | 388 | 467 | 339 | 331 | 456 | 333 | 491 |
| GemsFDTD | 2210 | 2429 | 3043 | 1345 | 358 | 479 | 606 | 378 | 458 |
| tonto | 615 | 599 | 648 | 629 | 440 | 489 | 573 | 438 | 411 |
| lbm | 2743 | 3167 | 4025 | 1776 | 347 | 507 | 454 | 361 | 1400 |
| wrf | 1309 | 1276 | 1749 | 818 | 471 | 497 | 511 | 462 | 455 |
| sphinx3 | 2215 | 2246 | 2196 | 1105 | 635 | 667 | 827 | 633 | 633 |
★ (単体コア性能)では、1ジョブだけ流し、終了までの経過時間により、単体コアの性能を評価。
★ (並行処理性能)では、搭載するコア数と同数のジョブを流し、終了までの経過時間により、システムのスループット性能を評価。
⇒ 各アプリ別で、(単体コア性能)と(並行処理性能)の比が小さい場合はスループット性能が高く、比が大きい場合はスループット性能が低い。
(シリアル処理で100秒の計算が、8並行処理で100秒なら、スループットは8倍で理想的)
(シリアル処理で100秒の計算が、8並行処理で400秒なら、スループットは2倍で非効率)
⇒ XeonとOpteronを比較するとアプリケーション毎に性能が大きく異なり、プロセッサの適否を判断。
(gamess、namd、gromacsなどはXeon、Opteron共に高性能、leslie3d、GemsFDTDなどはOpteronのみが高性能)
⇒ 並列計算の内部は、シリアル処理部、並行処理部、通信処理部から構成され、通信処理部を除いた部分まで評価可能。
※ 公開されているSPEC CFP2006、SPEC CFP2006 Ratesよりデータを抜粋しています。
※ SPEC CFP2006のジョブは1GB以下のメモリで動作しています。
※ インテルプロセッサにてFSBが未表記の場合はFSB1333MHzです。FSB1600MHzの場合は(F1600)、FSB1066MHzの場合は(F1066)と略記しています。
| アプリケーション特性 | 計算機 アーキテクチャ |
総合 評価 |
ジョブ 投入方法 |
評価 | コメント | ||
| コメント | CPU処理 | メモリI/O | |||||
| CPUの処理は複雑 速度はCPUクロックに比例 スループットはコア数に比例 データ入出力は少い GAMESS、gromacs、namd などはこのタイプの計算 |
複雑 | 少 | 45nm Q/C Xeon | ◎ | 単一 | ○ | CPUは高速 |
| 並行 | ○ | コア間のメモリ競合小 | |||||
| ◎ | CPU間のメモリ競合小 | ||||||
| 45nm D/C Xeon | △ | 単一 | ○ | CPUは高速 | |||
| 並行 | ○ | コア間のメモリ競合小 | |||||
| ○ | CPU間のメモリ競合小 | ||||||
| 65nm Q/C Xeon | △ | 単一 | △ | CPUは少し低速 (CPU律速) | |||
| 並行 | ○ | コア間のメモリ競合小 | |||||
| ○ | CPU間のメモリ競合小 | ||||||
| CPUの処理は単純 速度はCPUクロックに依存 データ入出力が多い スループットは FSB/メモリ帯域に依存 (メモリボトルネック) CFDはメモリの影響中 GemsFDTDはメモリの影響大 |
単純 | 多 | 45nm Q/C Xeon | ○ | 単一 | ○ | CPUは高速 |
| 並行 | X | コア間のメモリ競合大 (コア間メモリ競合が律速) | |||||
| ○ | CPU間のメモリ競合小 (コア間メモリ競合が律速 (2CPU2コア分の性能)) (チップセット性能が顕在化、メモリクロック効果は潜在的) |
||||||
| 45nm D/C Xeon | △ | 単一 | ○ | CPUは高速 | |||
| 並行 | X | コア間のメモリ競合大 | |||||
| ○ | CPU間のメモリ競合小 (コア間メモリ競合が律速 (2CPU2コア分の性能)) (チップセット性能が顕在化、メモリクロック効果は潜在的) |
||||||
| 65nm Q/C Xeon | △ | 単一 | △ | CPUは少し低速 | |||
| 並行 | × | コア間のメモリ競合大 | |||||
| ○ | CPU間のメモリ競合小 (コア間メモリ競合が律速 (2CPU2コア分の性能)) | ||||||
「SPEC CFP2006」は計算機の機種選定において強力な判断材料を提供するベンチマークテストです。SPEC CFP2006は17種類の浮動小数点演算アプリケーションを用いて計算機のベンチマークを行っています。このベンチマークにより計算機の「速度」と「スループット」の測定結果を、それぞれ「平均値」と「個別値」として公開しています。さらに、計算機、OS、開発環境、コンパイル方法などの詳細な情報が公開されており、公平性と透明性に優れた利用しやすいベンマチークテストです。計算機の高度化によりメーカー単独での網羅的なベンチマークテストは困難ですが、公平性と透明性に優れたSPEC CFP2006の結果は横断的な利用が容易なため、偏りが少なく、かつ深く踏み込んだ計算機評価が可能となります。
SPEC CFP2006では「速度」と「スループット」の2種類を測定しています。「SPECfp 2006」は「速度」の測定で、シリアルジョブを1ジョブ投入し経過時間を測定しています。「SPECfp rate2006」は「スループット」の測定で、シリアルジョブを複数ジョブ (搭載コア数と同数) 同時投入し並行処理の経過時間を測定しています。計算機選定ではこの「速度」と「スループット」の双方を評価して、真の性能を導き出すことが大切です。【資料: SPEC CFP2006ドキュメントへリンク】
※「並行処理」 (スループット) と「並列計算」との関係
「並行処理」はそのまま実行されることもありますが、「並列計算」の一部として実行されることもあります。一般的に並列処理では、前処理/後処理、通信処理、並行処理が繰り返して実行されています。このなかで純粋に並列動作している箇所は「並行処理」部だけで、残りは非並列処理です。SPEC CFP2006ではこの「並行処理」 (スループット) を切り出した形で評価しています。また、前処理/後処理部は「速度」として評価されています。しかし通信処理の部分は評価されていません。
SPEC CFP2006での速度とスループットの値は、17種類のアプリケーションの結果を幾何平均した「平均値」と、個別のアプリケーションの経過時間の生の値「個別値」の双方が公開されており、目的に応じて使い分けができます。
計算機の選定において、速度とスループットの「平均値」を基準とするか、あるいはアプリケーション毎の「個別値」を基準とするのかは判断に悩みます。そこで公開されているデータを調べたところ、「個別値」での性能は「アプリケーション特性」と「計算機アーキテクチャ特性」の影響により大きく変動していました。そのためピーク値だけに着目して計算機を選定すると、動作条件がピーク性能を発揮する領域から外れた場合に期待性能との乖離が大きくなることが予想されます。これに対して計算機の基本性能を忠実に反映させることを目的に設計された平均値は、この乖離を小さく抑えることができる優れた指標です。
SPEC CFP2006による計算機選定の基本は平均値の利用です。しかし、ボトルネックの調査や、用途をピンポイントで絞った専用計算機の選定では、「個別値」の検討も大切な作業です。個別値は計算機を深く検討する際に有用な指標です。
下の大きな表は、公開されている「SPECfp rate base2006: スループット」と「SPECfp base2006: 速度」の結果から、特定の計算機の評価に有用なデータを抜粋したものです。しかしこの表では、複数の要素が影響しているため理解が容易ではありません。そこで理解を助けるため「アプリケーション特性」に着目し、アプリケーションを「CPU処理が複雑 = メモリI/Oが少ない計算タイプ」と、「CPU処理が単純 = メモリI/Oが多い計算タイプ」の2種類に区分してみると、全体像が捉えやすくなります。
GAMESS、gromacs、namdなどはこのタイプの計算になります。CPU処理が複雑なため、結果的にメモリI/Oが少なく、メモリボトルネックが発生しにくいタイプの計算です。シリアル処理の経過時間と、並行処理の経過時間との差は僅差です。CPUコア性能が高くクロック速度も高速な45nm Xeonはシリアル計算でも並行計算でも高性能を発揮しています。CPUコア性能が並でクロック速度も低いOpteronはシリアル計算速度が並となり、並行計算速度もシリアル計算速度の影響で並の性能となっています。
流体計算や電磁界解析などはこのタイプの計算になります。CPU処理が単純なため、結果的にメモリI/Oが多く、メモリボトルネックが発生しやすいタイプの計算です。シリアル処理の経過時間と、並行処理の経過時間との差は非常に大きいです。
HPCテクノロジーズは、お客様のHPC利用を総合的にサポートする「HPC-ProSupport」を精力的に行っています。「HPC-ProSupport」サービスでは、お客様の課題のヒアリングから始まり、アプリケーションの調査とテスト、計算機の調査とテスト、システムの設計、費用の積算、導入事務作業のサポート、システムの製造・設置・調整、導入後の保守・修理、技術サポートまで、お客様のHPC利用を総合的にサポートいたします。ここではそのサービスの一部をご紹介します。
「HPC-ProSupport」の基本はお客様のご希望を詳細に伺うことです。急速に技術進歩するHPC分野においては、それまで難しいとされていた計算が、ある日を境として実現されることも少なくありません。あるいは方法を工夫することで、お客様のご希望を容易に実現させることが可能な場合もあります。是非とも最初にお客様のご希望をお聞かせください。
HPCクラスタ構築に関して、一般のPCメーカーやシステムベンダーに問い合わせても、一般論に終始することが多く、満足のできる相談にならないことが予想されます。HPCクラスタを利用されるお客様の専門性が高いため、ご相談を承る技術スタッフにも一定水準以上のHPCクラスタとHPCに関する経験値や予備知識が求められます。弊社では、経験豊富な技術スタッフが直接電話や電子メールにてお客様の課題をヒアリングさせていただき、ご相談に対応させていただきます。
お客様が希望されるアプリケーションの特性と、計算機とのマッチングは大切な作業です。システム設計に際しては、利用状況や運用方法まで踏み込んだマッチング調査を行います。さらに机上の調査では不十分な場合は実機を用いてのテストも行います。
動作検証を行うため、弊社内には専用のベンチマークセンター「HPC計算機テストセンター」を設置しています。このベンチマークセンターでは、お客様のアプリケーションの動作確認だけでなく、各種商用アプリケーションなどの試験動作も実施しています。右写真はテストセンターで常時稼動しているInfiniBand接続のXeonクラスタです。是非ともご活用をお願いします。
技術スタッフによるお客様の課題のヒアリングや調査、ベンチマークテストなどによって得られた情報と、過去からの経験などを総合的に検討し、お客様に最適なシステム設計を行います。
システム設計に併せて費用積算も行います。積算はお客様のご予算に応じて複数の組み合わせを提案し、客様に最適なシステムを選択してただけるようにしています。また、お客様にご満足していただけるような価格の実現にも努力いたします。
ルールを守ったシステム導入では多くの書類が求められます。弊社では、これまで官公庁や研究所様への豊富な導入経験から得られた業務テンプレートが準備されており、高度な事務スキルを備えた技術事務担当者が、必要な書類やカタログ類などを迅速かつ確実に準備し提出いたします。このサービスによりお客様は迅速かつ安心してシステムを導入していただけます。
弊社のHPC製品はシステム主要部にDell純正品を利用する「All Dell」の考え方でシステム構築を行っています。計算機本体、ファイルサーバ、ストレージ、モニタ、ネットワーク用スイッチ、ラック、UPS、ケーブル類の一部などをDell製品で統一することで、システム全体が高度な一貫性を持ち、長期間の継続運用を可能としています。これはDellの「スケーラブルエンタープライズ」という、拡張性と継続的なシステム運用を考慮した設計思想を持っているからです。「All Dell」の考え方に基づきハードウェアを選定することで、計算機環境の拡張・維持・管理が無駄なく合理的に実現でき、長期にわたる安定したシステム運用が可能となります。さらに製品には標準で3年間、最長で5年間のオンサイト保守サービスと修理パーツ保証を付属させ、保証体制の充実も図られています。
「HPC-ProSupport」のシステムコンサルティングでは、既設HPCクラスタの改良作業や増強にも対応しています。具体的には、演算ノード、管理ノード、ファイルサーバ、ネットワーク、ジョブ管理システム、ライセンス管理システム、開発環境、アプリケーションなどの追加、改善、最適化などのシステム改良作業の調査、設計、提案を一貫して行うことができます。しかもこれらは、ハードウェアを提供し単純に接続するだけの作業ては大きく異なり、システム運用レベルの整合性、アプリケーション動作レベルの整合性、ジョブ管理レベルの整合性、などに配慮したシステムインテグレーションサービスを行います。
HPCクラスタの完成度が高いと障害も少なく、高い利用効率を実現します。さらに、3年間のオンサイト保守サービスにより、万一の障害でも迅速確実に復旧します。もちろん必要に応じて最長5年間までの保守サービスの延長を廉価に承り、システムの長期安定稼動を実現します。
HPC計算機分野での経験が豊富な弊社からのシステム導入では、導入作業の際のカスタム調整、親身な利用方法の説明、システムカットオーバー後のアフターケアなどの充実も賞賛されています。標準設定されたHPC計算機を、実際にお客様の環境に接続し動作させる場合にはカスタム調整が必要です。既存のネットワークやファイルサーバ、ライセンスサーバとの接続、既存アプリケーションとのマッチング、ジョブスケジューラのカスタマイズ、OS設定のカスタマイズなど調整箇所は多岐に渡ります。さらにご希望を伺いながら利用方法の説明を行います。
「HPC-ProSupport」の真骨頂としてシステム全体に対する責任あるアフターケアがあります。ハードウェアやミドルウェア、アプリケーションなどに表層的な問題を見出せないにもかかわらず、システムを利用されるお客様の側では不都合な思いをされている場合があります。例えばストレージの応答速度が低下することがあるとか、ハードウェアの修理を終えたらシステムが不安定になったとか、ジョブスケジューラの動作が希望した動作とズレているとか、アプリケーションの追加で困っているなど、お客様がお困りになっている状況は多岐にわたります。弊社ではこのような状況でも責任あるアフターケアの実施に心がけています。
このようにHPCの利用環境をトータルにサポートする「HPC-ProSupport」により、お客様のHPC利用環境は常に安定した動作を実現します。