計算顯卡對比


科學計算顯卡的幾個主要性能指標:
1、運算能力:FLOPS 每秒浮點運算次數,TFLOPS表示每秒萬億(10^12)次浮點計算;
2、計算性能: 
3、顯存大小:顯存大小也決定了實驗中能夠使用的樣本數量和模型復雜度。
4. cuda 核心數量
 
1、CUDA compute capability對比(computer capability 並不代表顯卡的計算能力,主版本號說明GPU的架構,副版本號相當於更新的版本)
    GTX Titan x :5.2
    GTX 980      :5.2
 Tesla P100 :
    Tesla K80    :3.7
    Tesla K40    :3.5
    K4200         : 3.0
 
2、計算性能(TFLOPS) 比較
                                單精度single        雙精度double
 
    GTX Titan x :     7                            0.2 
    GTX 980      :      4.6                        0.15
      Tesla P100 :      10.6                     5.3
    Tesla K80    :      8.73                      2.91 
    Tesla K40    :      4.29                      1.43
    K4200         :       2.0
 
    單精度能夠保證小數點后6到7位計算准確(2^23),雙精度則是14到15位(2^52)
 
3、顯存大小
 
    GTX Titan x :12Gb
    GTX 980      :4Gb
     Tesla P100 :  16G
    Tesla K80    :24Gb
    Tesla K40    :12Gb
    K4200         :4Gb
 
4. cuda 核心數量
    GTX Titan x 
    GTX 980    
    Tesla P100 : 3584
    Tesla K80    : 4992
    Tesla K40    : 2880
    K4200      
 
5、價格比較(網上商城京東淘寶報價)
    GTX Titan x :8000+-
    GTX 980      :6000+-
    Tesla P100    : 45000++ 
    Tesla K80    :33000+-
    Tesla K40    :25000+-
    K4200         :6000+-
 

1、GTX 系列顯卡優缺點:

    優點:單精度計算能力強大,顯存最大12Gb,性價比高
 
    缺點:雙精度計算能力弱,沒有計算糾錯ECC 內存,對於超高精度計算不利
 
2、Tesla 或 quadro顯卡優缺點:
    優點:雙精度計算能力最強,擁有ECC內存增強計算准確率,
 
    缺點:單精度計算能力差,價格較高
 
總結:單從性能上選擇,Tesla K80是最強大的,但也最貴;綜合性價比來考慮 GTX Titan X 最好。
 
 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM