顯卡性能參數的直觀理解


GPU渲染一幀需要用到紋理的畫面大致流程是:

  1. CPU把紋理、頂點屬性、着色器等相關數據上傳到GPU的顯存中
  2. GPU中的流處理器/計算單元(sm/cu),從顯存中取出頂點屬性數據進行頂點着色器的計算
  3. GPU中的流處理器/計算單元(sm/cu)和紋理映射單元,從顯存中取中紋理,進行像素着色器的相關計算和處理
  4. GPU中進行光柵化和抗鋸齒,把像素輸出到屏幕

GPU的性能參數主要有以下幾個
a. 與主板連接的接口一般為PICE
b. 顯存大小, 顯存位寬, 顯存帶寬
c. 流處理器sm(AMD叫計算單元cu)個數
d. 紋理映射單元個數
e. 渲染輸出單元(光柵操作管道)數

在上述過程中對應關系如下
一, CPU到GPU的數據傳輸速度是由顯卡與主板的連接接口決定,一般是PCIe 3.0 對應 GPU-Z中的Bus interface, 一般不會成為速度的瓶頸。這部分傳輸的是指令、紋理、頂點屬性等數據,傳輸完成后保存在顯卡的顯存中。獨顯顯存一般夠用。核顯使用內存作為顯存。
二、 在頂點着色器階段,是流處理器執行頂點着色器的相關運算。這個過程是並行計算的,流處理器個數越多,能同時運行的頂點着色器越多。此時需要用到頂點屬性數據,需要從顯存中讀這部分數據,讀數據的速度是由顯存帶寬決定的。
顯存帶寬 = 顯存顆粒數 * 顯存頻率 * 顯存位寬
這個參數是影響顯卡速度的重要參數
三、 像素着色器階段,流處理器執行像素着色運算,在這個過程中,紋理映射單元從顯存中取出紋理數據,進行相關的紋理采樣。這個過程有三個重要的參數,流處理器數,顯存帶寬,紋理映射單元數。大家在渲染時一般都要用到大量的紋理,所以紋理映射單元數很可能成為一個速度瓶頸。這地方對應的參數是紋理填充率。
紋理填充率=核心頻率 * 像素渲染管線數 * 紋理映射單元數。
四、 光柵化和抗鋸齒,此階段, 渲染輸出單元(Render outputs)(ROP)對像素着色器計算的結果進行處理的輸出,rop的數量決定了光柵化速度的快慢,此時對應的參數是像素填充速率 (pixel fill rate).
像素填充速率 = 核心頻率 * 渲染輸出單元數

綜合分析,主要影響顯卡性能參數是

  • 顯存帶寬
  • 流處理器個數(計算單元數)
  • 紋理填充率
  • 像素填充速率


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM