TopBenchmark Tests > Tensorflow Benchmarks

Tensorflow Benchmarks

Google社がディープラーニング向けに開発したフレームワーク「Tensorflow」の公式サイトで公開されているベンチマークテスト (https://www.tensorflow.org/performance/benchmarks) を 実機を用いて実施した結果を公開します。ベンチマークの値(total images/sec)の大きいものが、性能が高いことを示します。

NVIDIA Tesla V100 PCIe 32G Tensorflow v1.13.0
 
 
 
 
 
 
 
 
 
 
NVIDIA GeForce RTX 2080Ti Tensorflow v1.12.0
NVIDIA GeForce GTX 1080Ti 4枚構成, Tensorflow v1.12.0
NVIDIA GeForce RTX 2080, Tensorflow v1.11.0
NVIDIA TITAN V, Tensorflow v1.10
NVIDIA GeForce GTX 1080Ti, Tensorflow v1.10
AMD Radeon Vega Frontier Edition (HPC-ProServer DPrT7910)

本テストでは、GPUのクロックをマニュアルで落として実行しています。GPUクロックは、rocm-smi --setsclk 3 で 1269MHzとしました。仕様上のGPU Boost時のクロックは、1600MHzです。GPUクロックをautoの設定にした場合、サーバーの安定動作を確認できませんでしたので、以下のデータはあくまで参考資料としてください。

NVIDIA Geforce GTX 1080Ti (HPC-ProServer DPeR740)

System : HPC-ProServer DPR740

CPU : (2) Intel Xeon Gold 6138 2.0GHz 20C/40T

GPU : (2) NVIDIA Geforce GTX 1080Ti 

Mem : 1.5B (24) 64GB 2666MT/s DDR4 

OS : CentOS 7.4.1708 (tensorflow : version 1.5, source build)

CUDA : 9.0 (cudnn 7.0.5)

Driver : 384.81

Disk : local HDD

Data : ImageNet (synthetic data)

Date : 2018-01

batch_size : 64

total images/sec

batch_size : 32

total images/sec

batch_size : 512   total images/sec

NVIDIA Geforce GTX 1080Ti (HPC-ProServer DPeR730)

System : HPC-ProServer DPeR730

CPU : (2) Intel Xeon E5-2690 v4 2.6GHz 14C/28T

GPU : (2) NVIDIA Geforce GTX 1080Ti 

Mem : 64GB 2400MT/s DDR4

OS : CentOS 7.3 (tensorflow : version 1.3, source build)

CUDA : 8.0 (cudnn 7.0)

Driver : 384.59

Disk : local HDD

Data : ImageNet (synthetic data)

Date : 2017-08

batch_size : 64

total images/sec

batch_size : 32

total images/sec

batch_size : 512   total images/sec

NVIDIA Geforce GTX 1080Ti (HPC-ProServer DPrT7910)

System : HPC-ProServer DPrT7910

CPU : (2) Intel Xeon E5-2680 v3 2.5GHz 12C/24T

GPU : (2) NVIDIA Geforce GTX 1080Ti 

Mem : 64GB 2133MHz DDR4

OS : CentOS 7.3 (tensorflow : version 1.2 , virtualenv installation)

CUDA : 8.0 (cudnn 5.1.1)

Driver : 381.22

Disk : local HDD

Data : ImageNet (synthetic data)

Date : 2017-07

batch_size : 64

total images/sec

total images/sec

batch_size : 32

batch_size : 512   total images/sec

GPUを使わずにCPUのみで実行する場合は、data format の問題(CPU BiasOp only supports NHWC)で、Trivialでの評価としました。

CPUのみ(GPU非使用)の結果

Trivial batch_size : 64

​1ノード内

© 2006-2019 HPC Technologies Co., Ltd. All rights reserved.