NVIDIA GPU 系列架構詳解 (轉)


(2016年6月27日更新)Real心塞,最近出了基於PASCAL架構的GTX1070[6]/1080[7],這性價比簡直逆天了…啥980/980ti都不用買了…買一塊Titan X還不如買兩塊1080…


(原文如下)

1.選擇怎樣的GPU型號

這 幾年主要有AMD和NVIDIA在做顯卡,到目前為止,NVIDIA公司推出過的GeForce系列卡就有幾百張[1],雖然不少都已經被淘汰了,但如何 選擇適合的卡來做算法也是一個值得思考的問題,Tim Dettmers[2]的文章給出了很多有用的建議,根據自己的理解和使用經歷(其實只用過GTX 970…)我也給出一些建議。

1

圖1 GPU選擇

上面並沒有考慮筆記本的顯卡,做算法加速的話還是選台式機的比較好。性價比最高的我覺得是GTX 980ti,從參數或者一些用戶測評來看,性能並沒有輸給TITAN X多少,但價格卻便宜不少。從圖1可以看出,價位差不多的顯卡都會有自己擅長的地方,根據自己的需求選擇即可。要處理的數據量比較小就選擇頻率高的,要處 理的數據量大就選顯存大core數比較多的,有double的精度要求就最好選擇kepler架構的。tesla的M40是專門為深度學習制作的,如果只 有深度學習的訓練,這張卡雖然貴,企業或者機構購買還是比較合適的(百度的深度學習研究院就用的這一款[3]),相對於K40單精度浮點運算性能是 4.29Tflops,M40可以達到7Tflops。QUADRO系列比較少被人提起,它的M6000價格比K80還貴,性能參數上也並沒有好多少。

在挑選的時候要注意的幾個參數是處理器核心(core)、工作頻率、顯存位寬、單卡or雙卡。有的人覺得位寬最重要,也有人覺得核心數量最重要,我 覺得對深度學習計算而言處理器核心數和顯存大小比較重要。這些參數越多越高是好,但是程序相應的也要寫好,如果無法讓所有的core都工作,資源就被浪費 了。而且在購入顯卡的時候,如果一台主機插多張顯卡,要注意電源的選擇。

2.一些常見的名稱含義

上面聊過了選擇什么樣的gpu,這一部分介紹一些常見名詞。隨着一代一代的顯卡性能的更新,從硬件設計上或者命名方式上有很多的變化與更新,其中比較常見的有以下一些內容。

  • gpu架構:Tesla、Fermi、Kepler、Maxwell、Pascal
  • 芯片型號:GT200、GK210、GM104、GF104等
  • 顯卡系列:GeForce、Quadro、Tesla
  • GeForce顯卡型號:G/GS、GT、GTS、GTX

gpu架構指的是硬件的設計方式,例如流處理器簇中有多少個core、是否有L1 or L2緩存、是否有雙精度計算單元等等。每一代的架構是一種思想,如何去更好完成並行的思想,而芯片就是對上述思想的實現,芯片型號GT200中第二個字母 代表是哪一代架構,有時會有100和200代的芯片,它們基本設計思路是跟這一代的架構一致,只是在細節上做了一些改變,例如GK210比GK110的寄 存器就多一倍。有時候一張顯卡里面可能有兩張芯片,Tesla k80用了兩塊GK210芯片。這里第一代的gpu架構的命名也是Tesla,但現在基本已經沒有這種設計的卡了,下文如果提到了會用Tesla架構和 Tesla系列來進行區分。

而顯卡系列在本質上並沒有什么區別,只是NVIDIA希望區分成三種選擇,GeFore用於家庭娛樂,Quadro用於工作站,而Tesla系列用 於服務器。Tesla的k型號卡為了高性能科學計算而設計,比較突出的優點是雙精度浮點運算能力高並且支持ECC內存,但是雙精度能力好在深度學習訓練上 並沒有什么卵用,所以Tesla系列又推出了M型號來做專門的訓練深度學習網絡的顯卡。需要注意的是Tesla系列沒有顯示輸出接口,它專注於數據計算而 不是圖形顯示。

最后一個GeForce的顯卡型號是不同的硬件定制,越往后性能越好,時鍾頻率越高顯存越大,即G/GS<GT<GTS<GTX。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM