Pytorch---多維數組運算過程的索引處理


背景:對 python 不熟悉,能看懂代碼,也能實現一些簡單的功能,但是對 python 的核心思想和編程技巧不熟,所以使 Pytorch 寫 loss 的時候遇到很多麻煩,尤其是在 batch_size > 1 的時候,做矩陣乘法之類的運算會覺得特別不順手。所幸,在邊查邊寫的過程中,理解了 python 中多維運算的實現規則。

 

1、python 的基本索引規則

  從 0 開始

  對於給定的范圍,如 b =  a[m:n], 那么 b 為由 (n-m)個數據組成的新數組,由 a[m],a[m+1],...,a[n-1] 構成。(若 n<m, 得到空)

  

2、單個 tensor 運算,使用 dim 參數

  torch 中對 tensor 的操作方法,若不加 dim 參數表示對整體的 tensr 進行操作,若增加 dim 參則表示按維操作。

  例: a = [[1,2],[3,4],[5,6]] (torch.tensor)

  torch.mean(a) => 3.5

  torch.mean(a,dim=0) => [1.5, 3.5, 5.5]

  torch.mean(a,dim=1) => [[3],[4]]

  torch.mean(a,dim=0) => [3,4]

  torch.mean(a,dim=1) => [1.5, 3.5, 5.5]  

  注: torch.mean() 是一個降維的操作,所以不會出現在取均值后保持跟原 Tensor 同維的情況。 dim 參數存在時降一維,不存在時得到的是整個 Tensor 的均值。

 

3、兩個 tensor 運算,構造對應形狀

  以乘法為例:

  3.1 矩陣乘向量

    a = [[1,2],[3,4],[5,6]]

    b = [1,1]

    計算乘法  c = a@b

    若 a 拓展為 (N,3,2) N 為 batch_size, 計算 c2 = a@b

    若 a,b 同時拓展, 變成(N, 2),那么需要做一個變換 b = b.view(N,2,1),計算 c3 = a@b

  3.2 矩陣乘矩陣

    a = [[1,2],[3,4],[5,6]]

    b =[ [1,1],[1,1]]

    計算乘法  c = a@b

    若 a 拓展為 (N,3,2) N 為 batch_size, 計算 c2 = a@b

    若 a,b 同時拓展, 變成(N, 2, 2),計算 c3 = a@b

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM