お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内
他のSPEC性能表へジャンプ TOP
Xeon 1way T3400 T100 R300
Xeon 2way T5400 R5400 T7400
Xeon 2way 1950III 2950III 2900III
Xeon 4way R900    
Opte. 2way T605 R805  
Opte. 4way R905    
Blade Xeon Opteron2/4w
dpe2950

HPC-ProServer DPe2950V

8コア並列演算性能を大幅に向上させた45nm Xeon搭載
冷却性能と拡張性に優れた2Uサイズ筐体により長期間高負荷連続稼動での安定稼動を実現
3年間の長期保証 (翌営業日オンサイト保守、部品保証、技術・運用支援) (最長5年まで延長可)

製品特長 | 基本性能 | システムインテグレーション | 構成例 | サポート | 導入事例 | 構成説明 | 価格 | 仕様 | カタログ

SPEC CFP2006よりデータを抜粋 (08/12/25)

DPe-1950III
DPe-2950III
DPe-2900III
SPEC CFP2006 Rates (並行処理性能) SPEC CFP2006 (単体コア性能)
製品 1950III
2950III
2900III
1950III
2950III
2900III
1950III
2950III
2900III
1950III
2950III
2900III
DPr
T7400
1950III
2950III
2900III
1950III
2950III
2900III
1950III
2950III
2900III
1950III
2950III
2900III
1950III
2950III
2900III
DPr
T7400
1950III
2950III
2900III
CPU Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon Xeon
製造プロセス 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm 45nm
CPU番号 X5470 X5460 X5460 X5450 X5492 X5260 X5470 X5460 X5460 X5450 X5482 X5260
CPUクロック(GHz)
(FSBクロック)
3.33GHz 3.16GHz 3.16GHz 3.0GHz 3.4GHz
(F1600)
3.33GHz 3.33GHz 3.16GHz 3.16GHz 3.0GHz 3.2GHz
(F1600)
3.33GHz
チップセット 5000X 5000X 5000X 5000X 5400 5000X 5000X 5000X 5000X 5000X 5400 5000X
メモリ(MHz) 667MHz 667MHz 667MHz 667MHz 800MHz 667MHz 667MHz 667MHz 667MHz 667MHz 800MHz 667MHz
OS Linux Linux Linux Linux WinVis Linux Linux Linux Linux Linux WinVis Linux
コンパイラ Intel11.0 Intel11.0 Intel10.1 Intel11.0 Intel11.0 Intel11.0 Intel11.0 Intel11.0 Intel10.1 Intel11.0 Intel10.0 Intel11.0
CPU 数 2 2 2 2 2 2 2 2 2 2 2 2
コア数 4 4 4 4 4 2 4 4 4 4 4 2
総コア数 8 8 8 8 8 4 8 8 8 8 8 4
投入ジョブ数 8 8 8 8 8 4 1 1 1 1 1 1
SPECfp base値→
各経過時間(秒)↓
74.5 73.4 69.7 72.0 85.0 56.0 25.0 24.4 20.1 23.6 20.1 24.5
bwaves
3208 3206 3224 3206 2507 1499 397 400 429 398 356 394
gamess 790 829 841 877 808 787 861 904 867 949 888 844
milc 1981 1985 2251 1987 2173 1121 552 546 825 566 847 542
zeusmp 991 990 1037 992 779 610 418 421 526 434 524 462
gromacs 348 367 374 384 325 328 326 341 350 360 339 324
cactusADM 1186 1190 1315 1192 929 684 105 107 284 110 305 160
leslie3d 2471 2479 2836 2482 1840 1175 466 472 487 485 464 477
namd 447 471 484 496 444 444 444 467 480 493 481 444
dealII 652 663 685 682 628 461 373 385 394 405 668 368
soplex 1776 1778 1804 1782 1587 1022 567 562 592 599 611 562
povray 193 203 198 214 201 193 195 206 206 216 216 195
calculix 385 397 543 415 363 338 330 344 490 362 524 324
GemsFDTD 3041 3050 3055 3053 2210 1528 477 480 579 485 448 455
tonto 660 664 667 685 615 501 490 510 439 531 433 467
lbm 4177 4030 4292 4036 2743 2071 566 567 1792 509 1397 577
wrf 1753 1757 1763 1768 1309 875 496 506 489 523 473 482
sphinx3 2215 2232 2219 2240 2215 1534 655 693 694 720 662 647

 

★ (単体コア性能)では、1ジョブだけ流し、終了までの経過時間により、単体コアの性能を評価。
★ (並行処理性能)では、搭載するコア数と同数のジョブを流し、終了までの経過時間により、システムのスループット性能を評価。

⇒ 各アプリ別で、(単体コア性能)と(並行処理性能)の比が小さい場合はスループット性能が高く、比が大きい場合はスループット性能が低い。
  (シリアル処理で100秒の計算が、8並行処理で100秒なら、スループットは8倍で理想的)
  (シリアル処理で100秒の計算が、8並行処理で400秒なら、スループットは2倍で非効率)
⇒ XeonとOpteronを比較するとアプリケーション毎に性能が大きく異なり、プロセッサの適否を判断。
  (gamess、namd、gromacsなどはXeon、Opteron共に高性能、leslie3d、GemsFDTDなどはOpteronのみが高性能)
⇒ 並列計算の内部は、シリアル処理部、並行処理部、通信処理部から構成され、通信処理部を除いた部分まで評価可能。

※ 公開されているSPEC CFP2006、SPEC CFP2006 Ratesよりデータを抜粋しています。
※ SPEC CFP2006のジョブは1GB以下のメモリで動作しています。
※ インテルプロセッサにてFSBが未表記の場合はFSB1333MHzです。FSB1600MHzの場合は(F1600)、FSB1066MHzの場合は(F1066)と略記しています。

「アプリケーション特性」に即した計算機アーキテクチャ評価を表に展開

アプリケーション特性 計算機
アーキテクチャ
総合
評価
ジョブ
投入方法
評価 コメント
コメント CPU処理 メモリI/O
CPUの処理は複雑
速度はCPUクロックに比例
スループットはコア数に比例
データ入出力は少い

GAMESS、gromacs、namd
などはこのタイプの計算
複雑 45nm Q/C Xeon 単一 CPUは高速
並行 コア間のメモリ競合小 
CPU間のメモリ競合小 
45nm D/C Xeon 単一 CPUは高速
並行 コア間のメモリ競合小 
CPU間のメモリ競合小 
65nm Q/C Xeon 単一 CPUは少し低速 (CPU律速)
並行 コア間のメモリ競合小 
CPU間のメモリ競合小 
CPUの処理は単純
速度はCPUクロックに依存
データ入出力が多い
スループットは
FSB/メモリ帯域に依存
(メモリボトルネック)

CFDはメモリの影響中
GemsFDTDはメモリの影響大
単純 45nm Q/C Xeon 単一 CPUは高速
並行 X コア間のメモリ競合大 (コア間メモリ競合が律速)
CPU間のメモリ競合小 (コア間メモリ競合が律速 (2CPU2コア分の性能))
(チップセット性能が顕在化、メモリクロック効果は潜在的)
45nm D/C Xeon 単一 CPUは高速
並行 X コア間のメモリ競合大
CPU間のメモリ競合小 (コア間メモリ競合が律速 (2CPU2コア分の性能))
(チップセット性能が顕在化、メモリクロック効果は潜在的)
65nm Q/C Xeon 単一 CPUは少し低速
並行 × コア間のメモリ競合大
CPU間のメモリ競合小 (コア間メモリ競合が律速 (2CPU2コア分の性能))

 

計算機選定ベンチマークの基本はSPEC CFP2006の検討から

SPEC CFP2006について

「SPEC CFP2006」は計算機の機種選定において強力な判断材料を提供するベンチマークテストです。SPEC CFP2006は17種類の浮動小数点演算アプリケーションを用いて計算機のベンチマークを行っています。このベンチマークにより計算機の「速度」と「スループット」の測定結果を、それぞれ「平均値」と「個別値」として公開しています。さらに、計算機、OS、開発環境、コンパイル方法などの詳細な情報が公開されており、公平性と透明性に優れた利用しやすいベンマチークテストです。計算機の高度化によりメーカー単独での網羅的なベンチマークテストは困難ですが、公平性と透明性に優れたSPEC CFP2006の結果は横断的な利用が容易なため、偏りが少なく、かつ深く踏み込んだ計算機評価が可能となります。

「速度」と「スループット」

SPEC CFP2006では「速度」と「スループット」の2種類を測定しています。「SPECfp 2006」は「速度」の測定で、シリアルジョブを1ジョブ投入し経過時間を測定しています。「SPECfp rate2006」は「スループット」の測定で、シリアルジョブを複数ジョブ (搭載コア数と同数) 同時投入し並行処理の経過時間を測定しています。計算機選定ではこの「速度」と「スループット」の双方を評価して、真の性能を導き出すことが大切です。【資料: SPEC CFP2006ドキュメントへリンク

※「並行処理」 (スループット) と「並列計算」との関係
「並行処理」はそのまま実行されることもありますが、「並列計算」の一部として実行されることもあります。一般的に並列処理では、前処理/後処理、通信処理、並行処理が繰り返して実行されています。このなかで純粋に並列動作している箇所は「並行処理」部だけで、残りは非並列処理です。SPEC CFP2006ではこの「並行処理」 (スループット) を切り出した形で評価しています。また、前処理/後処理部は「速度」として評価されています。しかし通信処理の部分が評価されていない点には注意が必要です。

「平均値」と「個別値」

SPEC CFP2006での速度とスループットの値は、17種類のアプリケーションの結果を幾何平均した「平均値」と、個別のアプリケーションの経過時間の生の値「個別値」の双方が公開されており、目的に応じて使い分けができます。

計算機選定には「平均値」の利用を推奨

計算機の選定において、速度とスループットの「平均値」を基準とするか、あるいはアプリケーション毎の「個別値」を基準とするのかは判断に悩みます。そこで公開されているデータを調べたところ、「個別値」での性能は「アプリケーション特性」と「計算機アーキテクチャ特性」の影響により大きく変動していました。そのためピーク値だけに着目して計算機を選定すると、動作条件がピーク性能を発揮する領域から外れた場合に期待性能との乖離が大きくなることが予想されます。これに対して計算機の基本性能を忠実に反映させることを目的に設計された平均値は、この乖離を小さく抑えることができる優れた指標です。

個別のアプリケーションの経過時間「個別値」は計算機の深い検討に有用な指標

SPEC CFP2006による計算機選定の基本は平均値の利用です。しかし、ボトルネックの調査や、用途をピンポイントで絞った専用計算機の選定では、「個別値」の検討も大切な作業です。個別値は計算機を深く検討する際に有用な指標です。

「アプリケーション特性」を2つに区分して全体像を捉える

下の大きな表は、公開されている「SPECfp rate base2006: スループット」と「SPECfp base2006: 速度」の結果から、特定の計算機の評価に有用なデータを抜粋したものです。しかしこの表では、複数の要素が影響しているため理解が容易ではありません。そこで理解を助けるため「アプリケーション特性」に着目し、アプリケーションを「CPU処理が複雑 = メモリI/Oが少ない計算タイプ」と、「CPU処理が単純 = メモリI/Oが多い計算タイプ」の2種類に区分してみると、全体像が捉えやすくなります。

CPU処理が複雑 = メモリI/Oが少ない計算タイプ

GAMESS、gromacs、namdなどはこのタイプの計算になります。CPU処理が複雑なため、結果的にメモリI/Oが少なく、メモリボトルネックが発生しにくいタイプの計算です。シリアル処理の経過時間と、並行処理の経過時間との差は僅差です。CPUコア性能が高くクロック速度も高速な45nm Xeonはシリアル計算でも並行計算でも高性能を発揮しています。CPUコア性能が並でクロック速度も低いOpteronはシリアル計算速度が並となり、並行計算速度もシリアル計算速度の影響で並の性能となっています。

CPU処理が単純 = メモリI/Oが多い計算タイプ

流体計算や電磁界解析などはこのタイプの計算になります。CPU処理が単純なため、結果的にメモリI/Oが多く、メモリボトルネックが発生しやすいタイプの計算です。シリアル処理の経過時間と、並行処理の経過時間との差は非常に大きいです。

HPC-ProSupportの提供

HPCテクノロジーズは、お客様のHPC利用を総合的にサポートする「HPC-ProSupport」を精力的に行っています。「HPC-ProSupport」サービスでは、お客様の課題のヒアリングから始まり、アプリケーションの調査とテスト、計算機の調査とテスト、システムの設計、費用の積算、導入事務作業のサポート、システムの製造・設置・調整、導入後の保守・修理、技術サポートまで、お客様のHPC利用を総合的にサポートいたします。ここではそのサービスの一部をご紹介します。

課題のヒアリング

「HPC-ProSupport」の基本はお客様のご希望を詳細に伺うことです。急速に技術進歩するHPC分野においては、それまで難しいとされていた計算が、ある日を境として実現されることも少なくありません。あるいは方法を工夫することで、お客様のご希望を容易に実現させることが可能な場合もあります。是非とも最初にお客様のご希望をお聞かせください。

技術的なご質問にはベテラン技術スタッフが対応

HPCクラスタ構築に関して、一般のPCメーカーやシステムベンダーに問い合わせても、一般論に終始することが多く、満足のできる相談にならないことが予想されます。HPCクラスタを利用されるお客様の専門性が高いため、ご相談を承る技術スタッフにも一定水準以上のHPCクラスタとHPCに関する経験値や予備知識が求められます。弊社では、経験豊富な技術スタッフが直接電話や電子メールにてお客様の課題をヒアリングさせていただき、ご相談に対応させていただきます。

システム設計の基本は調査とテスト

お客様が希望されるアプリケーションの特性と、計算機とのマッチングは大切な作業です。システム設計に際しては、利用状況や運用方法まで踏み込んだマッチング調査を行います。さらに机上の調査では不十分な場合は実機を用いてのテストも行います。

専用のベンチマークセンターの開設

techcenter動作検証を行うため、弊社内には専用のベンチマークセンター「HPC計算機テストセンター」を設置しています。このベンチマークセンターでは、お客様のアプリケーションの動作確認だけでなく、各種商用アプリケーションなどの試験動作も実施しています。右写真はテストセンターで常時稼動しているInfiniBand接続のXeonクラスタです。是非ともご活用をお願いします。

要所を押さえたシステム設計

技術スタッフによるお客様の課題のヒアリングや調査、ベンチマークテストなどによって得られた情報と、過去からの経験などを総合的に検討し、お客様に最適なシステム設計を行います。

システム価格の積算も同時提供

システム設計に併せて費用積算も行います。積算はお客様のご予算に応じて複数の組み合わせを提案し、客様に最適なシステムを選択してただけるようにしています。また、お客様にご満足していただけるような価格の実現にも努力いたします。

スムーズで適切な導入手続を実施

ルールを守ったシステム導入では多くの書類が求められます。弊社では、これまで官公庁や研究所様への豊富な導入経験から得られた業務テンプレートが準備されており、高度な事務スキルを備えた技術事務担当者が、必要な書類やカタログ類などを迅速かつ確実に準備し提出いたします。このサービスによりお客様は迅速かつ安心してシステムを導入していただけます。

「All Dell」化を推奨

alldell弊社のHPC製品はシステム主要部にDell純正品を利用する「All Dell」の考え方でシステム構築を行っています。計算機本体、ファイルサーバ、ストレージ、モニタ、ネットワーク用スイッチ、ラック、UPS、ケーブル類の一部などをDell製品で統一することで、システム全体が高度な一貫性を持ち、長期間の継続運用を可能としています。これはDellの「スケーラブルエンタープライズ」という、拡張性と継続的なシステム運用を考慮した設計思想を持っているからです。「All Dell」の考え方に基づきハードウェアを選定することで、計算機環境の拡張・維持・管理が無駄なく合理的に実現でき、長期にわたる安定したシステム運用が可能となります。さらに製品には標準で3年間、最長で5年間のオンサイト保守サービスと修理パーツ保証を付属させ、保証体制の充実も図られています。

既設システムの改良やシステム増強にも対応

「HPC-ProSupport」のシステムコンサルティングでは、既設HPCクラスタの改良作業や増強にも対応しています。具体的には、演算ノード、管理ノード、ファイルサーバ、ネットワーク、ジョブ管理システム、ライセンス管理システム、開発環境、アプリケーションなどの追加、改善、最適化などのシステム改良作業の調査、設計、提案を一貫して行うことができます。しかもこれらは、ハードウェアを提供し単純に接続するだけの作業ては大きく異なり、システム運用レベルの整合性、アプリケーション動作レベルの整合性、ジョブ管理レベルの整合性、などに配慮したシステムインテグレーションサービスを行います。

完成度の高いシステム導入

clusterHPCクラスタの完成度が高いと障害も少なく、高い利用効率を実現します。さらに、3年間のオンサイト保守サービスにより、万一の障害でも迅速確実に復旧します。もちろん必要に応じて最長5年間までの保守サービスの延長を廉価に承り、システムの長期安定稼動を実現します。

システム導入時のカスタム調整、利用方法説明

HPC計算機分野での経験が豊富な弊社からのシステム導入では、導入作業の際のカスタム調整、親身な利用方法の説明、システムカットオーバー後のアフターケアなどの充実も賞賛されています。標準設定されたHPC計算機を、実際にお客様の環境に接続し動作させる場合にはカスタム調整が必要です。既存のネットワークやファイルサーバ、ライセンスサーバとの接続、既存アプリケーションとのマッチング、ジョブスケジューラのカスタマイズ、OS設定のカスタマイズなど調整箇所は多岐に渡ります。さらにご希望を伺いながら利用方法の説明を行います。

責任あるアフターケア

「HPC-ProSupport」の真骨頂としてシステム全体に対する責任あるアフターケアがあります。ハードウェアやミドルウェア、アプリケーションなどに表層的な問題を見出せないにもかかわらず、システムを利用されるお客様の側では不都合な思いをされている場合があります。例えばストレージの応答速度が低下することがあるとか、ハードウェアの修理を終えたらシステムが不安定になったとか、ジョブスケジューラの動作が希望した動作とズレているとか、アプリケーションの追加で困っているなど、お客様がお困りになっている状況は多岐にわたります。弊社ではこのような状況でも責任あるアフターケアの実施に心がけています。

「HPC-ProSupport」で実現する安定したHPC利用環境

このようにHPCの利用環境をトータルにサポートする「HPC-ProSupport」により、お客様のHPC利用環境は常に安定した動作を実現します。