pytorch框架對RTX 2080Ti RTX 3090的支持與性能測試


時間點:2020-11-18

一、背景

2020年9月nvidia發布了30系列的顯卡。比起20系列網上的評價是:性能翻倍,價格減半。
最近正好本人手上有RTX 2080Ti 和 RTX 3090,所以本人專門對其在深度學習上的性能進行了測試。
當前(2020-11-18)網上對3090與2080Ti在深度學習上的性能差異的測試數據比較少,大部分測試的對比每秒處理圖片數,本人感覺這種測試有些不公平,3090顯存24G,2080Ti顯存11G,3090注定其顯存能裝載的圖片數一定比2080Ti翻倍。所以本人的測試重點是在2者顯存都沒占滿(小網絡的情況下),其運行性能的差異。求證3090在CUDA Cores,Boost Clock與Memory Interface Width等參數(除了顯存)提升所帶來的性能提升。

二、測試環境

  • 硬件:RTX 2080Ti & RTX 3090
  • nvidia-driver:
    455.45.01(2020-11-17發布最新版,支持2080ti, 3090)
    455.38(支持2080ti, 3090)
    455.23.04 455.38(只支持30系列的穩定版)
    450.80.02(不支持30系列的穩定版)
  • pytorch: 官網pytorch 1.6.0, 官網pytorch 1.7.0, 源碼編譯pytorch 1.8.0a0+4883d39(cuda11.1+cudnn8.0.5+mkl)
  • 操作系統:nvidia-docker ubuntu18.04(cuda10.2, cuda11.0, cuda11.1三個版本)

三、參數對比

  • 3090 功耗暴增,網上有少boom的案例,大家硬件選型務必小心。
  • 3090 官網建議用 PCIE4 插槽,但市場上的主板支持PCIE4插槽少之又少。難道PCIE3就不能用了嗎?非也,網上也有測評,性能影響不大,個位數。
  • 3090 占用3-slot

四、測試結果

某網絡:是本人使用的一個網絡模型(小網絡)
Conv1d, Conv2d來源於 https://github.com/pytorch/pytorch/issues/47039
可得出: rtx3090比rtx2080ti快20%左右。
2021-02-01 更新:滿負載情況下,完成同樣任務。rtx3090比rtx2080ti快40%。

五、結論

  • tx2080ti: 用pytorch1.6.0版本
  • rtx3090: 用pytorch1.7.0版本
  • pytorch1.8(源碼編譯):性能最差。(無法解釋😲,github上說cudnn8.0.5對30系列顯卡性能會提升,都是騙人的😭.... 編譯環境如下,如有高人明白請幫忙指明,在此謝過!)
  • pytorch1.7.1: 同pytorch1.8(源碼編譯)
  • pytorch對30系列的顯卡還在支持中,期待其更新版本。有網友測試了,tf在3090上確實能實現比2080Ti翻倍的性能,希望pytorch加油
  • 新東西別太早嘗試,其生態不一定完善,需要時間。
     
     
     


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM