GPU入門


 

 

CPUGPU區別,CPU像是一頭牛,GPU像是一萬只小雞。

        

         關於CPU設計理念:基於低延時性設計

 

 

   ALUCPU有強大的ALU(算術運算單元),它可以在很少的時鍾周期內完成算術計算。

   當今的CPU可以達到64bit 雙精度。執行雙精度浮點源算的加法和乘法只需要13個時鍾周期。

   CPU的時鍾周期的頻率是非常高的,達到1.5323gigahertz(千兆HZ, 109次方).

   Cache大的緩存也可以降低延時。保存很多的數據放在緩存里面,當需要訪問的這些數據,只要在之前訪問過的,如今直接在緩存里面取即可。

   Control復雜的邏輯控制單元。

   當程序含有多個分支的時候,它通過提供分支預測的能力來降低延時。

   數據轉發。 當一些指令依賴前面的指令結果時,數據轉發的邏輯控制單元決定這些指令在pipeline中的位置並且盡可能快的轉發一個指令的結果給后續的指令。這些動作需要很多的對比電路單元和轉發電路單元。

 

結論:CPU運算速度更快,指令周期短,即便是雙精度的浮點數乘法也只需要1~3個時鍾周期。

        

      GPU的設計理念:基於吞吐量。

 

 

ALUCacheGPU的特點是有很多的ALU和很少的cache. 緩存的目的不是保存后面需要訪問的數據的,這點和CPU不同,而是為thread提高服務的。如果有很多線程需要訪問同一個相同的數據,緩存會合並這些訪問,然后再去訪問dram(因為需要訪問的數據保存在dram中而不是cache里面),獲取數據后cache會轉發這個數據給對應的線程,這個時候是數據轉發的角色。但是由於需要訪問dram,自然會帶來延時的問題。

Control:控制單元(左邊黃色區域塊)可以把多個的訪問合並成少的訪問。

GPU的雖然有dram延時,卻有非常多的ALU和非常多的thread. 為了平衡內存延時的問題,我們可以中充分利用多的ALU的特性達到一個非常大的吞吐量的效果。盡可能多的分配多的Threads.通常來看GPU ALU會有非常重的pipeline就是因為這樣。

        

結論:GPU可以達到很好的吞吐量。

 

對比:CPU擅長邏輯控制,串行的運算。和通用類型數據運算不同,GPU擅長的是大規模並發計算,這也正是密碼破解等所需要的。所以GPU除了圖像處理,也越來越多的參與到計算當中來。

 

 

 

CPUGPU區別,CPU像是一頭牛,GPU像是一萬只小雞。

        

         關於CPU設計理念:基於低延時性設計

 

   ALUCPU有強大的ALU(算術運算單元),它可以在很少的時鍾周期內完成算術計算。

   當今的CPU可以達到64bit 雙精度。執行雙精度浮點源算的加法和乘法只需要13個時鍾周期。

   CPU的時鍾周期的頻率是非常高的,達到1.5323gigahertz(千兆HZ, 109次方).

   Cache大的緩存也可以降低延時。保存很多的數據放在緩存里面,當需要訪問的這些數據,只要在之前訪問過的,如今直接在緩存里面取即可。

   Control復雜的邏輯控制單元。

   當程序含有多個分支的時候,它通過提供分支預測的能力來降低延時。

   數據轉發。 當一些指令依賴前面的指令結果時,數據轉發的邏輯控制單元決定這些指令在pipeline中的位置並且盡可能快的轉發一個指令的結果給后續的指令。這些動作需要很多的對比電路單元和轉發電路單元。

 

結論:CPU運算速度更快,指令周期短,即便是雙精度的浮點數乘法也只需要1~3個時鍾周期。

        

      GPU的設計理念:基於吞吐量。

 

ALUCacheGPU的特點是有很多的ALU和很少的cache. 緩存的目的不是保存后面需要訪問的數據的,這點和CPU不同,而是為thread提高服務的。如果有很多線程需要訪問同一個相同的數據,緩存會合並這些訪問,然后再去訪問dram(因為需要訪問的數據保存在dram中而不是cache里面),獲取數據后cache會轉發這個數據給對應的線程,這個時候是數據轉發的角色。但是由於需要訪問dram,自然會帶來延時的問題。

Control:控制單元(左邊黃色區域塊)可以把多個的訪問合並成少的訪問。

GPU的雖然有dram延時,卻有非常多的ALU和非常多的thread. 為了平衡內存延時的問題,我們可以中充分利用多的ALU的特性達到一個非常大的吞吐量的效果。盡可能多的分配多的Threads.通常來看GPU ALU會有非常重的pipeline就是因為這樣。

        

結論:GPU可以達到很好的吞吐量。

 

對比:CPU擅長邏輯控制,串行的運算。和通用類型數據運算不同,GPU擅長的是大規模並發計算,這也正是密碼破解等所需要的。所以GPU除了圖像處理,也越來越多的參與到計算當中來。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM