矩陣:行主序、列主序、行向量、列向量 - 知乎 (zhihu.com)
看龍書的時候發現一個矩陣在傳入Shader之前都要轉置一下,很好奇為什么要有一步這樣的操作。

行主序和列主序
行主序指矩陣在內存中逐行存儲,列主序指矩陣在內存中逐列存儲。
行主序矩陣內存布局:

列主序矩陣內存布局:

行向量和列向量
行向量指的是把向量當成一個一行n列的矩陣,列向量指的是把向量當成一個n行一列的矩陣。
左乘和右乘
矩陣“左乘”:矩陣和向量相乘時放在左邊。
矩陣“右乘”:矩陣和向量相乘時放在右邊。
對於同一個矩陣和同一個向量,“左乘”和“右乘”的結果是不一樣的,這是因為矩陣不滿足交換律。
總結
HLSL中默認是使用列主序存儲矩陣的,也就是矩陣的每一列存儲在一個常量寄存器中,此時使用矩陣“右乘”效率更高,因為一個float4和一個4x4的矩陣相乘只需要四個點乘就能計算出結果:

如果使用“左乘”,結果就是:

HLSL中可以通過 #pragmapack_matrix指令或者row_major、column_major keyword來修改矩陣的存儲方式。在Shader執行之前會加載矩陣的數據,行主序還是列主序的設置只會影響Shader讀取輸入的矩陣數據,矩陣讀取到Shader后矩陣是行主序還是列主序就不會有其他影響(只會影響計算的效率),比如通過代碼獲取某個元素的值,我們要獲取第一行第三列的值,都是通過_m02來獲取。
但是為了使效率最高,對於列主序存儲的矩陣我們要“右乘”,對於行主序存儲的矩陣我們要“左乘”。
因為DirectXMath中使用行主序矩陣,向量和矩陣相乘使用“左乘”,要想在Shader中讀取正確的矩陣,我們就要轉置一下,比如一個平移變換,在DirectXMath中是這樣:

矩陣“左乘”表示平移變換:

那在HLSL中使用的是列主序矩陣,為了效率我們使用“右乘”,要表示相同的平移變換,就要傳入上面矩陣的轉置矩陣:

所以在把DirectXMath的矩陣傳入HLSL時需要傳入原矩陣的轉置。
Reference: