Nvidia RTX2080 Ti 是否值得入手？看看性能评测就明白了 - 文章 - 开发者社区

picture.image

要说当前做深度学习加速哪家强，Nvidia GPU 毫无疑问属于核弹级别的存在，今年发布的 RTX 2070 2080 2080Ti 系列 GPU 均采用了全新的图灵架构（Turing），峰值性能和每瓦性能都有进一步提升。与上一代 Pascal 显卡详细参数对比如下表所示：

picture.image

如此强劲的显卡是否值得入手一块呢？

picture.image

本文将分别在 Turing 2080 Ti 和 Pascal 1080 Ti 上用 TensorFlow 运行若干深度学习模型训练任务，对两种型号 GPU 性能进行评测。

硬件

软件

评测方法

评测结果

picture.image

对于单精度 ResNet-152 训练任务，2080 Ti 相比 1080 Ti 有 1.41 倍加速；

picture.image

对于半精度 ResNet-152 训练任务，2080 Ti 相比 1080 Ti 有 1.65 倍加速；

picture.image

对于单精度多个模型（ResNet-50/152, Inception V3/V4, VGG16, AlexNet, SSD）训练任务加速情况；具体两种 GPU 上能实现每秒多少张图见下表：

picture.image

除了绝对性能，我们还关注单位价格加速比情况（土豪请忽略），见下表：

picture.image

注意上表中第二三列单位为每秒每美元处理图片数（img/s/ $）。由于 2080 T i 相比 1080 T i 绝对性能提升幅度仅 27 ）。由于 2080 Ti 相比 1080 Ti 绝对性能提升幅度仅 27%~65%，但价格从 699$ 涨到 1199$，涨价幅度 71%，导致 RTX2080 Ti 性价比低于 1080 Ti。

结论

复现步骤

我们已将评测代码公开在 github 上，你可以在自己机器上复现这些结果（不限于本文使用的 GPU 型号），你可以将结果发送至 s@lambdalabs.com。


        
git clone https://github.com/lambdal/lambda-tensorflow-benchmark.git --recursive


        
cd lambda-tensorflow-benchmark
./benchmark.sh gpu_index num_iterations

将 gpu_index 替换为你机器上 GPU 编号（默认使用 0 号），将 num_iterations 替换为你希望的重复次数（默认为 10 次）；运行成功后，会在当前目录生成类似“xxx-yyy.logs”的日志目录，下面包含各种网络评测的日志文件。


        
./report.sh <cpu>-<gpu>.logs num_iterations

将 -.logs 替换为你实际目录，num_iterations 值要和第二步一致。

评测不同模型使用的 batch size 如下表：

picture.image

下一步计划

picture.image