【CUDA學習】GPU硬件結構

本文轉載自查看原文 2013-07-25 19:24 13855 CUDA

GPU的硬件結構，也不是具體的硬件結構，就是與CUDA相關的幾個概念：thread，block，grid，warp，sp，sm。

sp: 最基本的處理單元，streaming processor 最后具體的指令和任務都是在sp上處理的。GPU進行並行計算，也就是很多個sp同時做處理

sm:多個sp加上其他的一些資源組成一個sm, streaming multiprocessor. 其他資源也就是存儲資源，共享內存，寄儲器等。

warp:GPU執行程序時的調度單位，目前cuda的warp的大小為32，同在一個warp的線程，以不同數據資源執行相同的指令。

grid、block、thread：在利用cuda進行編程時，一個grid分為多個block，而一個block分為多個thread.其中任務划分到是否影響最后的執行效果。划分的依據是任務特性和

GPU本身的硬件特性。

下面幾張硬件結構簡圖便於理解(圖片來源於網上）

以上兩圖可以清晰地表示出sm與sp的關系。

此圖反應了warp作為調度單位的作用，每次GPU調度一個warp里的32個線程執行同一條指令，其中各個線程對應的數據資源不同。

上圖是一個warp排程的例子。

一個sm只會執行一個block里的warp，當該block里warp執行完才會執行其他block里的warp。

進行划分時，最好保證每個block里的warp比較合理，那樣可以一個sm可以交替執行里面的warp，從而提高效率，此外，在分配block時，要根據GPU的sm個數，分配出合理的

block數，讓GPU的sm都利用起來，提利用率。分配時，也要考慮到同一個線程block的資源問題，不要出現對應的資源不夠。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 GPU 的硬件基本概念，Cuda和Opencl名詞關系對應 CUDA學習（一）之使用GPU輸出HelloWorld 從0開始學習《GPU高性能運算之CUDA》——1 從0開始學習《GPU高性能運算之CUDA》——2 從0開始學習《GPU高性能運算之CUDA》——3 CUDA學習筆記（一）：淺析GPU計算——CPU和GPU的選擇 CUDA學習（三）之使用GPU進行兩個數組相加 CUDA學習記錄第一篇--CPU及GPU基礎【CUDA學習】結構體指針復制 GPU（CUDA）學習日記（十一）------ 深入理解CUDA線程層次以及關於設置線程數的思考