游戲顯卡中RTX2080Ti可以說是業界翹楚了,雖然不是專門為深度學習而設計,但是在深度學習上的性能表現也是不錯滴。而雲端深度學習卡一般都是以Tesla系列為主,雖然號稱專業的深度學習卡,但是某些型號也是很渣。

不知道有沒有人想過把2080ti也扔到雲端,然后可以按需付費,或者進行月租。肯定有吧,而且現在也有人做了。

滴滴雲正在公測G4雲服務(就是2080ti)。之前我做過GPU服務器的比較,滴滴雲的性價比是非常高,質量基本也是有保障。很幸運我也拿到了免費測試的機會(真香)。

下面就分享下在滴滴雲的2080ti 跑DeepFaceLab的體驗。同時也可以回答下部分群友的問題。具體而完整的安裝過程我會在另一篇文章中說明,本文主要就是看看跑DFL性能如何。
測試系統為: Windows Server 2019
測試的DFL版本為:20200315
測試素材:軟件自帶

登陸系統,安裝完驅動后可以通過設備管理器或者GPU-Z或者任務管理器看到看到顯卡型號為NVIDIA Ge Force RTX2080Ti,顯存11GB

通過娛樂大師可以看到這台雲端電腦的基本配置。其他配置我不關心,我就抓兩個核心,顯存11G,內存16G。下面就直接跑軟件了,分別測試了,提取,模型,合成這幾個環節的速度,大家可以對比一下自己的顯卡,有2080ti的也可以看看有啥差別。
提取環節:

提取dst 頭像的時候花了25分鍾,每秒鍾只處理了1張圖片,這個性能讓我陷入深深的懷疑,我懷疑這個階段主要用的不是GPU而是CPU,否則沒有理由2080ti不如我的1070吧?
訓練環節。
這個環節沒其他的,就是看單次迭代速度。

訓練Quick96模型, 單次迭代時間為94ms


訓練SAEHD模型,默認參數,單次迭代時間為249ms左右


訓練SAEHD模型,結構archi為dfhd,其他默認,單次迭代時間為650ms左右。

訓練SAEHD模型,像素Resolution 為192,其他默認,單次迭代時間為500ms左右。

訓練SAEHD模型,像素Resolution 為256 ,bs=4,其他默認,單次迭代時間為600ms左右。
合成環節:

使用時間5分16秒,每秒處理4.85張圖片。
下面以訓練環節,做一個簡單的橫向對比。

Colab上P100默認參數時的數據,單次迭代299ms。


1070默認參數下的數據,單次迭代時間449ms。
2080ti 上面已經給出了,單次迭代時間為249ms的樣子。
2080ti吊打1070這是必然,快得不是一丁半點。同時2080ti 還略強於P100。K80,P4,P40,T4這些也只能是弟弟了。雖然是游戲卡,但是干起來還是挺猛。
所以不管是雲端還是本地,只要錢管夠,買2080ti跑換臉還是非常不錯的選擇。做其他深度學習的研究也不錯。如果不想本地燒顯卡,占用游戲時間,或者想做一些雲端服務搞APP之類,那么搞個雲端的最爽了。只需要通過遠程桌面連接,操作和本地沒啥差別,無論何時何都可以輕松接入。