Pytorch中的自動求導函數backward()所需參數含義 - 碼上歡樂

相關內容簡體繁體

Pytorch中的自動求導函數backward()所需參數含義

本文轉載自查看原文 2018-12-23 17:40 9162 Pytorch/ 深度學習

摘要：一個神經網絡有N個樣本，經過這個網絡把N個樣本分為M類，那么此時backward參數的維度應該是【N X M】

正常來說backward（）函數是要傳入參數的，一直沒弄明白backward需要傳入的參數具體含義，但是沒關系，生命在與折騰，咱們來折騰一下，嘿嘿。

首先，如果out.backward()中的out是一個標量的話（相當於一個神經網絡有一個樣本，這個樣本有兩個屬性，神經網絡有一個輸出）那么此時我的backward函數是不需要輸入任何參數的。

運行結果：

不難看出，我們構建了這樣的一個函數：

所以其求導也很容易看出：

這是對其進行標量自動求導的結果

如果out.backward()中的out是一個向量（或者理解成1xN的矩陣）的話，我們對向量進行自動求導，看看會發生什么？

先構建這樣的一個模型（相當於一個神經網絡有一個樣本，這個樣本有兩個屬性，神經網絡有兩個輸出）：

模型也很簡單，不難看出out求導出來的雅克比應該是：

，因為a1 = 2，a2 = 4，所以上面的矩陣應該是

運行的結果：

嗯，的確是8和96，但是仔細想一想，和咱們想要的雅克比矩陣的形式也不一樣啊。難道是backward自動把0給省略了？

咱們繼續試試，這次在上一個模型的基礎上進行小修改，如下：

可以看出這個模型的雅克比應該是：

運行一下，看是不是：

等等，什么鬼？正常來說不應該是 [ [ 8 , 2 ] , [ 2 , 96 ] ]么？

我是誰？我再哪？

為什么就給我2個數，而且是 8 + 2 = 10 ，96 + 2 = 98 。難道都是加的 2 ？

想一想，剛才咱們backward中傳的參數是 [ [ 1 , 1 ] ]，難道安裝這個關系對應求和了？

咱們換個參數來試一試，程序中只更改傳入的參數為[ [ 1 , 2 ] ]：

運行一下：

嗯，這回可以理解了，我們傳入的參數，是對原來模型正常求導出來的雅克比矩陣進行線性操作，可以把我們傳進的參數（設為arg）看成一個列向量，那么我們得到的結果就是(注意這里是矩陣乘法，為了好表示我用了*):

( Jacobi * arg )^T

在這個題里，我們得到的實際是：

看起來一切完美的解釋了，但是就在我剛剛打字的一刻，我意識到官方文檔中說k.backward()傳入的參數應該和k具有相同的維度，所以如果按上述去解釋是解釋不通的。

哪里出問題了呢？

仔細看了一下，原來是這樣的：在對雅克比矩陣進行線性操作的時候，應該把我們傳進的參數（設為arg）看成一個行向量（不是列向量），那么我們得到的結果就是(注意這里是矩陣乘法，為了好表示我用了*):

( arg * Jacobi )^T

即

這回我們就解釋的通了。

現在我們來輸出一下雅克比矩陣吧，為了不引起歧義，我們讓雅克比矩陣的每個數值都不一樣（一開始分析錯了就是因為雅克比矩陣中有相同的數據），所以模型小改動如下：

如果沒問題的話咱們的雅克比矩陣應該是 [ [ 8 , 2 ] , [ 4 , 96 ] ]

好了，下面是見證奇跡的時刻了,不要眨眼睛奧，千萬不要眨眼睛......

3

2

1

砰............

好了，現在總結一下：因為經過了復雜的神經網絡之后，out中每個數值都是由很多輸入樣本的屬性（也就是輸入數據）線性或者非線性組合而成的，那么out中的每個數值和輸入數據的每個數值都有關聯，也就是說【out】中的每個數都可以對【a】中每個數求導，那么我們backward（）的參數[k₁,k₂,k₃....k_n]的含義就是：

　　　

也可以理解成每個out分量對a_n求導時的權重。

現在，如果out是一個矩陣呢？

下面的例子也可以理解為：相當於一個神經網絡有兩個樣本，每個樣本有兩個屬性，神經網絡有兩個輸出.

如果前面的例子理解了，那么這個也很好理解，backward輸入的參數k是一個2x1的矩陣，2代表的就是樣本數量，就是在前面的基礎上，再對每個樣本進行加權求和。

結果是：

如果有興趣，也可以拓展一下多個樣本的多分類問題，猜一下k的維度應該是【輸入樣本的個數 X 分類的個數】

好啦，糾結我好久的pytorch自動求導原理算是徹底搞懂啦~~~

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 PyTorch中backward()函數的gradient參數作用 ARTS-S pytorch中backward函數的gradient參數作用 pytorch的backward函數求導原理與代碼細節闡述 PyTorch中的backward [轉] pytorch中的backward pytorch autograd backward函數中 retain_graph參數的作用，簡單例子分析，以及create_graph參數的作用用PyTorch自動求導 Pytorch學習之梯度計算backward函數 pytorch的backward pytorch中參數dim的含義(正負，零，不傳)

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM