[AI開發]深度學習如何選擇GPU?


機器推理在深度學習的影響下,准確性越來越高、速度越來越快。深度學習對人工智能行業發展的貢獻巨大,這得益於現階段硬件計算能力的提升、互聯網海量訓練數據的出現。本篇文章主要介紹深度學習過程中如何選擇合適的GPU顯卡,如果你是深度學習新手,希望這篇文章對你有幫助。

推理用到的硬件分兩種,一種是專業AI硬件公司出的AI芯片,一種就是我們平時熟知的GPU顯卡了,前者不太適合入門學習,而后者無論從入門難度還是性價比上講,對於新手來說都是優先的選擇。而GPU顯卡主流廠商大概兩家,一個Nvidia,一個AMD,前者出的卡我們一般稱之為N卡,后者稱之為A卡。目前不管是普通消費市場(比如玩游戲)還是做機器推理的,N卡都占主流,生態也更好一些,因此,如果沒有特殊原因,建議新手優先選擇N卡入手。我個人不太推薦使用非主流的產品、技術,因為他們大多數不太成熟,使用過程中困難重重,甚至最終官方夭折。本篇文章所有內容全部基於Nvidia顯卡。

==Update==

經過實際經驗證明,Geforce還是用來調試開發比較好,真正上線的卡還是選擇官方推薦的Tesla等,具體原因誰用誰知道。。

 

Nvidia顯卡分類

Nvidia顯卡主要分3大類:

1)Geforce系列

這個系列是銷量最多、大眾最為熟悉的顯卡,一般用來打游戲。價格便宜,最新出來的旗艦卡RTX 2080Ti京東售價大概1w左右,根據不同的品牌,價格有所波動。低配置的便宜的一千就能買到。游戲發燒友花1w買這種顯卡還是很常見的。這個系列顯卡官方定位是消費級,就是讓你用來打游戲的。但是它在深度學習上的表現也非常不錯,很多人用來做推理、訓練,單張卡的性能跟深度學習專業卡Tesla系列比起來其實差不太多,但是性價比卻高很多。比如已經停產的GTX 1080顯卡的參數基本和深度學習入門級顯卡Tesla P4一樣,用來做訓練和推理的效果比Tesla P4還要好,可是GTX 1080一張卡才賣5000~6000左右,而Tesla P4要賣到1.4w。英偉達官方禁止使用GTX系列顯卡用於深度學習等用途,一經使用,自動過保。那么,既然性能差不多,為什么價格差這么遠呢?原因后面講到。

2)Quadro系列

Quadro系列顯卡一般用於特定行業,比如設計、建築等,圖像處理專業顯卡,比如CAD、Maya等軟件,一般人很少用到,價格相對來講也稍微貴一些,這里不多說了。

3)Tesla系列

Tesla系列顯卡定位並行計算,一般用於數據中心,具體點,比如用於深度學習,做訓練、推理等。阿里雲、Amazon雲有非常多的GPU服務器,基本都采用Tesla系列顯卡。這個系列顯卡有個特別明顯的特征,那就是貴。Tesla系列入門級顯卡 Tesla P4,前面提到過,用來做深度學習的效果比GTX 1080還差,但是價格是后者的3倍多。像其他更高級別的Tesla V100、Tesla P100 價格高達8w、4w,這種價位的顯卡雖然性能強勁,但是一般人是買不起的,只有企業數據中心才會部署這種顯卡。那么前面提到過,既然對於搞深度學習而言,Tesla系列顯卡相比GeForce而言性價比並不高,那為什么英偉達還會推出Tesla這個系列呢? 主要原因有以下4個:

(1)我們前面討論的性能對比全部都是基於單塊顯卡而言的,而Tesla系列顯卡針對GPU集群做了優化,像那種4卡、8卡、甚至16卡服務器,Tesla多塊顯卡合起來的性能不會受很大影響,但是Geforce這種游戲卡性能損失嚴重。這也是Tesla主推並行計算的優勢之一。

(2)數據中心的GPU顯卡都是大批量部署的,有多台服務器,每台服務器有多塊GPU顯卡,而Tesla系列顯卡功耗優化非常明顯,Tesla P4單塊卡的最大功耗只有75W,而與它參數配置差不多的GTX 1080的功耗高達175W。可以想象,Tesla系列顯卡更適合大規模部署,長遠來看,成本小得多。功耗低其中的一個原因是,Tesla系列顯卡基本都是被動散熱,不提供風扇,這個更適合數據中心機房工作環境:服務器設備統一散熱,機房恆溫條件。這本身跟它的定位一致。

(3)再一個,類似Geforce這種消費級的顯卡更新換代太快,GTX 1080顯卡生命周期不到2年就停產了,類似手機這種電子設備,你產品都還沒做出來,擬采購的GPU可能就買不到貨了。

(4)消費級顯卡畢竟用於個人用途,性能方面不可能無限提升,用於並行計算的Tesla顯卡高配版在性能(參數配置)上可能比消費級顯卡高配版要高得多。

注意國內能買到的顯卡一般由第三方代理商銷售,比如七彩虹、華碩、麗台等等顯卡廠商,這些廠商會在Nvidia的核心顯卡芯片之上做一些改造,比如散熱模式、外觀或者其他修改,因此同一型號的同一款卡的價格可能會因不同廠家而不同。

GPU幾個比較重要的參數

GPU有非常多的參數,在做深度學習挑選顯卡的時候,主要看以下幾個:

GPU架構:不同款的GPU可能采用不同設計架構,比如Geforce 10系列的 GTX 1080/1080Ti采用的是Pascal架構,而Geforce 20系列的 RTX 2080/2080Ti采用的是Turing架構。不同架構的GPU,即使其他參數差不多,性能差別可能非常大。

CUDA核心數量:這是一個非常重要的參數,一般你在搜索顯卡參數時,這個參數一般寫在前面。CUDA核心數量越大越好,前面提到的消費級顯卡Geforce GTX 1080和Tesla入門級顯卡 P4的CUDA核心數量一樣,都是2560個。而Geforce RTX 2080Ti的CUDA核心數高達4352個。

顯存位寬:代表GPU芯片每個時鍾周期內能從GPU顯存中讀取的數據大小,這個值越大代表GPU芯片和顯存之間數據交換的速度越快,性能越好。Geforce GTX 1080的顯存位寬為256bit,Geforce RTX 2080Ti顯存位寬為352bit。

GPU工作頻率:這個很好理解,代表GPU每秒鍾工作次數,單位為MHz,跟CPU的頻率類似。該值越大代表性能越好。

顯存帶寬:代表GPU芯片每秒與顯存交換的數據大小,這個值等於 顯存位寬*工作頻率,單位為GB/秒,該值越大,代表GPU性能越好。Geforce GTX 1080的顯存帶寬為320GB/秒,而它的升級版Geforce RTX 2080的帶寬為448GB/秒。

顯存容量:這個東西跟內存一樣,不是越大越好,夠用就行。Geforce GTX 1080的顯存為8GB,而該系列的旗艦版Geforce GTX 1080Ti的顯存為11GB。Tesla系列顯卡由於特殊的應用場景,有些型號的卡顯存高達16G/24G不等。

功耗:GPU能耗,像Geforce這種消費級的顯卡一般功耗非常高,Geforce GTX 1080的最大功耗為175W,Tesla P4的最大功耗為75W。像那種數據中心大規模級別的GPU部署,低功耗的顯卡一年電費能省很多。

注意上面提到的顯卡名稱后面加Ti和不加Ti完全是兩款不同的卡,加Ti的性能比不加Ti的參數配置高很多。比如 Geforce GTX 1080Ti 比 Geforce GTX 1080性能更強勁。

如何選擇合適你的顯卡?

如果是個人學習使用,推薦購買Geforce系列的顯卡,然后根據個人預算,如果在1W左右,可以選擇最新出來的Geforce RTX 2080Ti,如果費用不夠,可以購買Geforce RTX 2080/2070,價格在5000/3000左右。千萬不要買入門級的Tesla P4,價格在1.4W左右。RTX 2080Ti經過實際測試,YoloV3目標檢測模型能跑20路1080P高清實時流。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM