CUDA概念
- sp:小核(流處理器)最基本的處理單元
- sm:大核(流多處理器)
- wrap:GPU執行程序的調度單位
- grid:有多個block
- block:有多個thread
- thread
利用圖形API和CUDA進行GPU通用計算的性能差別
- 需要將問題轉化成圖形學,而CUDA使用C語言編寫,適合做通用計算
GPU指令和CPU指令 最大區別:CPU需要運行OS,不但要處理中斷,還要負責存儲器空間分配回收,GPU不需要做這些,所以GPU很空閑
GPU架構缺點:精度問題,編程模式不太靈活
CPU切換線程成本高
優化方法
- 對於block和thread分配問題:一個block要有32個thread
