お問い合わせ | 導入事例 | HPC計算機 | 管理サーバ/ファイルサーバ | オプション | OS/開発環境 | アプリ | システム構築 | サポート | FAQ | ベンチ | 技術情報 | 購入案内
⇒ プロセッサ番号一覧表
S.B. Xeon Rack Server
DPeR210II 1S 32GB 2HD 価格
DPeR620 2S 768GB 10HD 1U 価格
DPeR720 2S 768GB 16HD 2U 価格
DPeR820 4S 1536GB 16D 2U 価格
S.B. Xeon Tower Server
DPeT620 2S 768GB 32HD 5U 価格
S.B Xeon WorkStation
DPrT1600 1S 16GB 2HD 価格
S.B. Xeon Blade Server
Blade Enclosure DPeM1000e 価格
DPeM620 2S 512GB 2HD 価格
 
Xeon Rack Server
DPeR410 2S 96GB 4HD 1U 価格
DPeR610 2S 192GB 8HD 1U 価格
DPeR710 2S 288GB 8HD 2U 価格
DPeR910 4S 2TB 16HD 4U 価格
Xeon Tower Server
DPeT410 2S 96GB 6HD 価格
DPeT610 2S 192GB 8HD 価格
DPeT710 2S 192GB 16HD 価格
Xeon WorkStation
DPrT3500 1S 24GB 3HD 価格
DPrT5500 2S 48GB 4HD 価格
DPrT7500 2S 192GB 4HD 価格
Opteron Rack Server
DPeR715 2S 512GB 6HD 2U 価格
DPeR815 4S 1024GB 6HD 2U 価格
Xeon/Opteron Blade Server
Blade Enclosure DPeM1000e 価格
DPeM610 2S 192GB 2HD 価格
DPeM610X 2S 192GB GPGPU 価格
DPeM710 2S 288GB 4HD 価格
DPeM915 4S Opteron 512GB 価格
GPGPU System
Tesla C2050 WS (T7500)
Tesla S2050 Cluster (R410/R610)
Tesla M2050 HD Cluster (C410x)
Tesla M2050 Blade (M610X)
Host/File Server (Rack)
FS R410 2S 2TBx4HD 1U 価格
FS R610 2S 1TBx6HD 1U 価格
FS R710 2S 1TBx8HD 2U 価格
FS R510 2S 2TBx12HD 2U 価格
Host/File Server (Tower)
FS T410 2S 2TBx6HD 価格
FS T610 2S 2TBx8HD 価格
FS T710 2S 1TBx16HD 価格
Storage Rack Enclosure
DPvMD1200 DAS 12x3TB HDD 価格
DPvMD1220 DAS 24x1TB HDD 価格
DPvMD32xx RAID 12HD/24HD 価格
DPvMD32xxi RAID 12HD/24HD 価格
⇒ 研究室のストレージ構築法
⇒ インテルコンパイラ価格表

HPC-ProServer DPeT110 II

第2世代Core (Sandy Bridge) を1基搭載したエントリ級のタワーサーバ
Xeon E3-1200番台プロセッサを搭載
DDR3 1333MHzメモリを採用し21GB/sのメモリ帯域幅
ECC付きメモリを最大32GBまで搭載できる
2TBディスクを最大4基搭載でき8TBのディスク容量を実現
大口径低回転ファンを採用し静粛性に配慮
RedHat6.1を標準搭載、用途によってCentOS 5.6オプション搭載
開発環境設定、ネットワーク設定
ジョブスケジューラ設定、ファイサーバ接続設定サービスをオプション化
3年間の翌営業日オンサイト部品交換サポートを無償実施
3年間のHPC技術支援を無償で実施

製品特長 | 基本性能 | システム構築 | 価格 | 仕様 | サポート | カタログ


HPC-ProServer DPeT110 II

第2世代Intel Core Sandy Bridge Microarchitectureを採用した
1-socket Xeon E3-1200番台4-coreプロセッサを搭載する
エントリー級のタワー型HPCサーバ

Sandy Bridge 1-socet Xeon E3-1200番台 4-coreプロセッサを搭載する
HPC-ProServer DPeT110 IIの概要

 「HPC-ProServer DPeT110 II」 (以下DPeT110 IIと略) は第2世代Intel Core Sandy Bridge Microarchitectureを採用した1-socket Xeon E3-1200番台4-coreプロセッサを搭載するエントリー級のタワー型HPCサーバです。

 DPeT110 IIのHPC計算としての主な特徴は次のようなものです。

・ Sandy Bridge Microarchitecture 1-socket Xeon E3-1200番台4-coreプロセッサを搭載
・ AVXによる256bitモードで約100GFLOPSを達成
・ SSEによる128bitモードで約50GFLOPSを達成、下位互換性がある
・ メモリ帯域幅は21GB/sを実現
・ メモリ容量は最大32GB (ECC)を搭載可能
・ ディスク容量は最大8TBまで拡張可能

新しいアーキテクチャが性能を出すためには時間がかかる

 しかし、Sandy Bridgeは発売されてから日が浅いため、実際のアプリケーションではこの動作条件を整えることが難く、期待値の半分しか性能が得られない場合があります。その例をLinpack HPLベンチマークとSPECfpベンチマークの比較で観察できます。

 Linpack HPLのように単純で動作条件を整えやすいベンチマークテストなら、AVXによる256bitモードの性能を発揮させやすいようです。ところがSPECfpのように実際に使われている複雑なアプリケーションを用いたベンチマークテストでは、AVXによる256bitモードの性能を発揮させ難く、従来のSSEによる128bitモードの性能しか得られない場合がまだ多いようです。

 実際のアプリケーションがSandy Bridgeの性能を発揮させられるようになるためには、ハードウェアが完成度を高めるだけでは不十分です。そらに開発環境の熟成、アプリケーションの最適化など、多くの要素がAVXに最適化される必要があります。しかし、それにはまだ時間がかかりそうです。

4種類の選択肢
1S Sandy Bridge Xeon、2S Sandy Bridge Xeon
2S Westmere Xeon、4S Magny-Coures Opteron

 それでは全ての環境が整うまでは、Sandy Bridge 1-socket Xeon HPC Serverの導入を見送り、既存のNehalem 2-socket Xeon 6-core HPC Serverや、Magny-Coures 4-socket Opteron 12-core HPC Serverを導入した方が良いのでしょうか。

 あるいは、今年末に発売が予定されているSandy Bridge 2-socket Xeon 8-core HPC Serverを待てばよいのでしょうか。この計算機はクロック速度が高く、コア数も多いため、AVXの性能を利用できなくても、すなわちSSEによる128bitモードでも、高い性能が得られるうえ、さらにAVXの性能を発揮させられるアプリケーションを利用した場合は、性能の増加分をボーナスとして利用できるからです。

1S Sandy Bridge Xeonには大切な役割がある

 このように考えるとSandy Bridge 1-socket Xeon 4-core HPC Server DPeT-110 IIは、HPC分野では利用価値が無いように思えます。しかしそれは違います。2ソケット機に先駆けて製品化された1ソケット機には大切な役割があります。

HPC計算機を本格導入する前のプロトタイピングが大切

 マイクロプロセッサのアーキテクチャは数年に一度のサイクルで更新され、性能が段違いに向上します。この10年間でプロセッサの性能は40倍から80倍に向上し、システムの性能は150倍に向上し、さらに300倍に向上する勢いです。

・ 2000年NetBurst 登場 (1.5GHz, 2命令/CPU, 3GFLOPS/CPU, 3GFLOPS/System) 
・ 2006年Intel Core 登場 (3GHz, 8命令/CPU, 24GFLOPS/CPU, 48GFLOPS/System)
・ 2011年Sandy Bridge 登場 (3.5GHz, 32命令/CPU, 112GFLOPS/CPU, 112GFLOPS/System)

・ 2011年Sandy Bridge 2-s. Xeon 8-c. (3.5GHz, 64命令/CPU, 224GFLOPS/CPU, 448GFLOPS/Sys.)
・ 2012年Sandy Bridge 4-s. Xeon 12-c. (3.0GHz, 96命令/CPU, 288GFLOPS/CPU, 1152GFLOPS/Sys.)

クロック速度はそのままで同時実行可能な命令数を増やす 

 CPUの発熱の問題によってCPUの動作クロック速度を高くすることができなくなりました。そこでマイクロアーキテクチャの改良の方針は、CPUの中で同時に処理できる命令数を増やすことと、システムに搭載できるCPUの数を増やすことに向かいました。

 改良の結果、この10年間で2命令同時処理から96命令同時処理まで処理性能が向上し、さらに384命令同時処理に向けて改良が進みます。

・ 2000年NetBusrt 1-socket Pentium4 1-core 2命令同時処理
・ 2010年Core 2-socket Xeon 6-core 48命令同時処理
・ 2011年Sandy Bridg 2-socket Xeon 6-core 96命令同時処理
・ 2012年Sandy Bridg 4-socket Xeon 12-core 384命令同時処理

 並列度を向上させることで、CPUのクロック速度を上げず、消費電力を10年前と同じに抑えたまま、性能を2桁も向上させています。

5年毎に訪れるアーキテクチャの更新

 10年で2桁もの性能向上を実現するための代償は、5年毎に訪れるアーキテクチャの更新に集約されています。商用プロセッサですから下位互換は保障されています。しかし、アーキテクチャが更新されたことによる性能向上という果実を受け取るためには、使用しているアプリケーションソフトを新しいアーキテクチャに対応させる必要があります。

 この移行の過程は平坦ではありません。例えばNetBurst MicroarchitectureからCore Microarchitectureへ移行した際には、望ましい性能が出るまでに3年の歳月がかかっていました。その間にMicroarchitectureのマイナーチェンジがあり、開発環境や数値演算ライブラリは何度もバージョンアップしています。これに合わせてユーザのアプリケーションの最適化も行われていました。

 もちろんインテルアーキテクチャのプロセッサは下位互換が保障されているので、アーキテクチャが更新されても、アプリケーションはそのまま利用し続けることができます。しかしそれは下位互換の範囲で利用することになり、アーキテクチャの更新による性能向上の効果はありません。

 新しいマイクロアーキテクチャによって得られる高い性を利用するためには、アプリケーションを新しいアーキテクチャに最適化させなけばなりません。この最適化の作業は個々のアプリケーションによって簡単だったり難しかったりします。

 何もしなくても高い性能が得られる場合があります。開発環境を更新しアプりケーションを再コンパイルするだけで高い性能が出る場合もあります。あるいは高い性能が出るまでに長い時間がかかる場合もあります。

------------------------------------------------------------------------------

作成中

早い段階で新しいアーキテクチャと
アプリケーションとの相性を調べることは価値がある

 新しいアーキテクチャを搭載した本格的な計算機システムを導入する前に、新しいアーキテクチャとアプリケーションとの網羅的な相性テストをしておくことは大きな意味があります。

どのアプリケーションはそのままで性能が出るのか
並列処理と平行処理での性能の出方はどうか
コンパイラをバージョンアップすると性能は向上するのか
コンパイラをバージョンアップすることの弊害はどこで出るのか
新しいOSと既存のコンパイラとの相性はどうか
新しいOSと既存の並列環境との相性はどうか
新しいOSとジョブスケジューラとの相性はどうか

など、チェックすべき点は山積しています。