科學計算顯卡的幾個主要性能指標:
1、運算能力:FLOPS 每秒浮點運算次數,TFLOPS表示每秒萬億(10^12)次浮點計算;
2、計算性能:
3、顯存大小:顯存大小也決定了實驗中能夠使用的樣本數量和模型復雜度。
4. cuda 核心數量
1、CUDA compute capability對比(computer capability 並不代表顯卡的計算能力,主版本號說明GPU的架構,副版本號相當於更新的版本)
GTX Titan x :5.2
GTX 980 :5.2
Tesla P100 :
Tesla K80 :3.7
Tesla K40 :3.5
K4200 : 3.0
2、計算性能(TFLOPS) 比較
單精度single 雙精度double
GTX Titan x : 7 0.2
GTX 980 : 4.6 0.15
Tesla P100 : 10.6 5.3
Tesla K80 : 8.73 2.91
Tesla K40 : 4.29 1.43
K4200 : 2.0
單精度能夠保證小數點后6到7位計算准確(2^23),雙精度則是14到15位(2^52)
3、顯存大小
GTX Titan x :12Gb
GTX 980 :4Gb
Tesla P100 : 16G
Tesla K80 :24Gb
Tesla K40 :12Gb
K4200 :4Gb
4. cuda 核心數量
GTX Titan x
GTX 980
Tesla P100 : 3584
Tesla K80 : 4992
Tesla K40 : 2880
K4200
5、價格比較(網上商城京東淘寶報價)
GTX Titan x :8000+-
GTX 980 :6000+-
Tesla P100 : 45000++
Tesla K80 :33000+-
Tesla K40 :25000+-
K4200 :6000+-
1、GTX 系列顯卡優缺點:
優點:單精度計算能力強大,顯存最大12Gb,性價比高
缺點:雙精度計算能力弱,沒有計算糾錯ECC 內存,對於超高精度計算不利
2、Tesla 或 quadro顯卡優缺點:
優點:雙精度計算能力最強,擁有ECC內存增強計算准確率,
缺點:單精度計算能力差,價格較高
總結:單從性能上選擇,Tesla K80是最強大的,但也最貴;綜合性價比來考慮 GTX Titan X 最好。
