pytorch框架對RTX 2080Ti RTX 3090的支持與性能測試

本文轉載自查看原文 2020-11-19 17:51 3735 硬件/ 深度學習/ pytorch/ DL算法與網絡框架

時間點：2020-11-18

一、背景

2020年9月nvidia發布了30系列的顯卡。比起20系列網上的評價是：性能翻倍，價格減半。
最近正好本人手上有RTX 2080Ti 和 RTX 3090，所以本人專門對其在深度學習上的性能進行了測試。
當前（2020-11-18）網上對3090與2080Ti在深度學習上的性能差異的測試數據比較少，大部分測試的對比每秒處理圖片數，本人感覺這種測試有些不公平，3090顯存24G，2080Ti顯存11G，3090注定其顯存能裝載的圖片數一定比2080Ti翻倍。所以本人的測試重點是在2者顯存都沒占滿（小網絡的情況下），其運行性能的差異。求證3090在CUDA Cores，Boost Clock與Memory Interface Width等參數（除了顯存）提升所帶來的性能提升。

二、測試環境

硬件：RTX 2080Ti & RTX 3090
nvidia-driver:
455.45.01(2020-11-17發布最新版，支持2080ti, 3090)
455.38(支持2080ti, 3090)
455.23.04 455.38(只支持30系列的穩定版)
450.80.02(不支持30系列的穩定版)
pytorch: 官網pytorch 1.6.0, 官網pytorch 1.7.0, 源碼編譯pytorch 1.8.0a0+4883d39（cuda11.1+cudnn8.0.5+mkl）
操作系統：nvidia-docker ubuntu18.04(cuda10.2, cuda11.0, cuda11.1三個版本)

三、參數對比

3090 功耗暴增，網上有少boom的案例，大家硬件選型務必小心。
3090 官網建議用 PCIE4 插槽，但市場上的主板支持PCIE4插槽少之又少。難道PCIE3就不能用了嗎？非也，網上也有測評，性能影響不大，個位數。
3090 占用3-slot

四、測試結果

某網絡：是本人使用的一個網絡模型（小網絡）
Conv1d, Conv2d來源於 https://github.com/pytorch/pytorch/issues/47039
可得出: rtx3090比rtx2080ti快20%左右。
2021-02-01 更新：滿負載情況下，完成同樣任務。rtx3090比rtx2080ti快40%。

五、結論

tx2080ti: 用pytorch1.6.0版本
rtx3090: 用pytorch1.7.0版本
pytorch1.8(源碼編譯)：性能最差。（無法解釋😲，github上說cudnn8.0.5對30系列顯卡性能會提升，都是騙人的😭.... 編譯環境如下，如有高人明白請幫忙指明，在此謝過！）
pytorch1.7.1: 同pytorch1.8(源碼編譯)
pytorch對30系列的顯卡還在支持中，期待其更新版本。有網友測試了，tf在3090上確實能實現比2080Ti翻倍的性能，希望pytorch加油
新東西別太早嘗試，其生態不一定完善，需要時間。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 RTX3090環境安裝及性能測試體驗 Cinema 4D R20 在2080TI NVLINK上使用渲染器Redshift去水印滴滴雲RTX2080ti嘗鮮，雲端游戲卡搞起！ Ubuntu18.04+RTX3090+pytorch1.7 安裝Yolact無法編譯DCNv2解決方法 Ubuntu 18.04 RTX2080(ti) + tensorflow-gpu + cuda9.0 + gcc5 兼容性問題解決 Ubuntu20.04+GeForce RTX 2080 SUPER+cuda11.1+cudnn8.0.4+openCV4.4.0編譯 Ubuntu18.04.2下安裝 RTX2080 Nvidia顯卡驅動 RTX3060顯卡安裝深度學習框架Pytorch踩坑實錄及解決過程（基於Ubuntu18） Locust性能測試框架，從入門到精通【chainer框架】【pytorch框架】