Unity中的渲染管線流程
下圖是《Unity Shader 入門精要》一書中的渲染流程圖;
ApplicationStage階段:准備場景信息(視景體,攝像機參數)、粗粒度剔除、定義每個模型的渲染命令(材質,shader)——由開發者定義,不做討論;
GemetryStage階段:頂點着色器、曲面細分着色器、幾何着色器、裁剪、屏幕映射;
RasterizerStage階段:三角形設置遍歷,片元着色器、逐片元操作;
每個階段具體操作如下圖(虛線框是可選階段):
模型空間——矩陣變換——齊次裁剪空間——透視除法——NDC標准設備坐標——屏幕映射
齊次裁剪空間是視景體空間(台體);
CVV:標准視體-也就是NDC坐標系對應的空間;
透視除法:頂點坐標除以w分量,將當前z深度所在的截面縮放為(2,2,2)的截面坐標;所以w分量記錄了z深度信息;
硬件做透視除法獲得NDC歸一化設備坐標——再經過屏幕映射獲得屏幕坐標系下頂點坐標;
Unity使用OpenGL的NDC,z分量在[-1,1];
OpenGL和DirectX差異
NDC空間——OpenGL為[-1,1],DirectX為[0,1],深度z范圍不同;
窗口坐標系——DirectX左上角原點,OpenGL左下角原點;
投影平面——DirectX投影平面就是視景體近截面,OpenGL有視平面;
左右手坐標系——DirectX左手,OpenGL右手,叉乘順序;
問題:
為什么片元不叫像素?
片元是很多狀態的集合,記錄了該像素的屏幕坐標,深度信息,法線,UV等;
DrawCall為什么會影響性能?
DrawCall是CPU向GPU添加渲染命令的過程,過程會由CPU向GPU發送數據(模型信息),DrawCall的次數越多CPU消耗性能就越大,DrawCall次數過多會導致每一幀CPU來不及發送全部數據給GPU渲染;
GPU有一個命令緩存區(Command Buffer),CPU的渲染命令都會存儲在這里,GPU從命令緩存區依次執行渲染命令;
兩種渲染命令:渲染模型(CPU提交模型信息也就是DrawCall)和改變渲染狀態(着色器紋理狀態改變,更耗時);
一般情況都是GPU渲染完成等待CPU發渲染命令;