廢話少說,直接開干!
Sigmoid
函數形式
求導過程

如果求導已經還給數學老師了的話,可以參考鏈式法則版本:Sigmoid 函數的求導過程
Tanh
函數形式

求導過程

鏈式法則求導:Tanh 激活函數及求導過程
ReLU
太簡單,跳過
SoftMax
SoftMax常被用作多分類輸出層的激活函數,用來將輸出結果轉化為概率。SoftMax數學特性很好,因為其與交叉熵損失(log損失)函數一起求導,求導結果剛好等於預測值減去label。
SoftMax函數形式

交叉熵損失函數形式

其中
為可能的類別數,
為樣本標簽,通常是一個大小為N維的one-hot向量,即
,只有
,其余位置值為零。
所以損失函數又可以表示為下面的形式
SoftMax函數的輸入是一個向量

經過SoftMax函數后,輸出另一個向量,且向量中所有值的和為1

我們的目標是求 損失函數
對向量
的導數,即
.
根據鏈式法則有:

其中
是一個標量,標量對向量求導結果還是一個向量,求導公式如下:

和
都是向量,向量對向量求導,結果為雅可比矩陣,求導公式如下:

逐步求導:
1、求
由
,可知最終的Loss只跟
有關。
2、求
向量對向量求導的公式剛剛已經做過介紹,是一個雅可比矩陣
由於
只有第j列不為0,由矩陣乘法,其實我們只要求第j行,也即
,
,其中
。
(1)當
時
![[公式]](/image/aHR0cHM6Ly93d3cuemhpaHUuY29tL2VxdWF0aW9uP3RleD0lNUNmcmFjJTdCJTVDcGFydGlhbCU3QmFfaiU3RCU3RCU3QiU1Q3BhcnRpYWwlN0J6X2olN0QlN0QrJTNEKyU1Q2ZyYWMlN0JlJTVFJTdCel9qJTdEJTVDc3VtXyU3QmslN0QlNUUlN0JuJTdEJTdCZSU1RSU3QnpfayU3RCU3RC1lJTVFJTdCel9qJTdEZSU1RSU3QnpfaiU3RCU3RCU3QiUyOCU1Q3N1bV8lN0JrJTdEJTVFJTdCbiU3RCU3QmUlNUUlN0J6X2slN0QlN0QlMjklNUUyJTdEKyUzRCthX2otYV9qJTVFMg==.png)
![[公式]](/image/aHR0cHM6Ly93d3cuemhpaHUuY29tL2VxdWF0aW9uP3RleD0lNUNmcmFjJTdCJTVDcGFydGlhbCU3QkwlN0QlN0QlN0IlNUNwYXJ0aWFsJTdCel9qJTdEJTdEKyUzRCslMjhhX2otYV9qJTVFMiUyOSUyQS0lNUNmcmFjJTdCMSU3RCU3QmFfaiU3RCslM0QrYV9qLTE=.png)
(2)當
時

![[公式]](/image/aHR0cHM6Ly93d3cuemhpaHUuY29tL2VxdWF0aW9uP3RleD0lNUNmcmFjJTdCJTVDcGFydGlhbCU3QkwlN0QlN0QlN0IlNUNwYXJ0aWFsJTdCel9pJTdEJTdEKyUzRCstYV9qYV9pJTJBLSU1Q2ZyYWMlN0IxJTdEJTdCYV9qJTdEJTNEYV9p.png)
綜上所述

推薦一個好用的 LaTeX 公式編輯器:https://www.latexlive.com/##
