二分類神經網絡公式推導過程 - 碼上歡樂

相關內容簡體繁體

二分類神經網絡公式推導過程

本文轉載自查看原文 2018-06-27 15:07 2698 機器學習

簡介：本文主要介紹了簡單二分神經網絡的公式推導過程。

歡迎探討，如有錯誤敬請指正

如需轉載，請注明出處 http://www.cnblogs.com/nullzx/

1. 數據表示說明

定義一個名為n的列表

n[i]表示第i層的節點數 i從0開始

L = len(n)-1表示神經網絡的層數，網絡的層數從第0層開始

W[i]的維度為（n[i], n[i-1]） i從1開始

b[i]的維度為（n[i], 1） i從1開始

2. 正向傳播

X表示訓練樣本矩陣，每個訓練樣本有d個特征，有m個訓練樣本，所以X的維度是（d, m）即n[0] = d

表示第i層的激活函數

維度（n[i], m）一個樣本對應一列

維度（n[i], m）一個樣本對應一列

3. 交叉熵損失函數的推導過程

“*”表示對應元素相乘，表示第i個樣本的真實值，表示第i個樣本的預測值，也就是神經網絡最后一層的輸出。

對於二分類的神經網絡來說，最后一層的激活函數一般都是sigmoid函數

sigmoid函數由下列公式定義

從圖中可知，最后一層的輸出為0~1之間,可以看做概率。我們可以把二分神經網絡看成一個概率模型，輸入為一些特征，輸出為概率，而且滿足二項分布

表示真實值為1時，神經網絡預測准確的概率

表示真實值為0時，神經網絡預測准確的概率，我們可以將上面的分段函數寫成一個表達式

所以上式表示了神經網絡預測准確的概率。

當前有m個樣本，那么like表示了這m個樣本同時預測准確的概率

我們的目的就是讓like取最大值，由於對數函數ln(x)是一個單調函數，所以當like函數取最大值時，ln(like)一定取得最大值

ln(like)取得最大值等價於下面的值取得最小。

而這個就是損失函數，初始化時w和b隨機，我們通過隨機梯度下降法，得到w和b使得損失函數最小。

另一方面，我們還可以通過信息論的角度推導交叉熵

4. 反向傳播（隨機梯度下降法）

L表示最后一層,從最后一層開始，由損失函數逐步向后求導

一般情況下

sigmoid的導數可以用自身表示:

所以

一定是維度（1, m）一個樣本對應一列（也就是一個數值），

假設已經知道了，它的維度是（n[i], m），則可以推出三點：

1），它的維度是(n[i], m) 乘以(n[i-1], m)T

2），它的維度是(n[i], 1)

3）

它的維度是(n[i+1], n[i]).T乘以（n[i+1], m）

同理還可以繼續推出

*表示對應元素相乘，而就是激活函數的求導,這樣就可以繼續向下求導了

5. 參數更新

k表示學習速度

維度（n[i], m）一個樣本對應一列

維度（n[i], 1）一個樣本對應一行

維度（n[i], n[i-1]）

維度（n[i], m）

6. 通過具體的例子解釋反向傳播的公式

對於上圖神經網絡的而言的一個訓練樣本而言,在求導的過程中我們應該把看成一個有關的超多元函數

的維度（1,1）

的維度（1,1）

就是一個數

我們從最后一層開始反向傳播

維度（1,1）

注意最后推導出來的結果是兩個矩陣的乘法

維度（1,3）

維度（1,1）

繼續向前一層進行反向傳播

所以維度（3,1），還因為，所以

維度（3,1）

因為

展開可得

現在將成本函數看成由這12個自變量的函數(為啥是12個，因為每一個都是一個1行4列的向量)

成本函數對着12個參數求導就形成了一個矩陣

這矩陣正好可以表示成

維度（3,1）乘維度(4,1)^T形成一個(3,4)的矩陣

現在將成本函數看成由這4個自變量的函數(為啥是4個，因為是一個4行1列的向量)

成本函數對着4個參數求導就形成了一個四行一列的向量

這個矩陣恰好可以表示成

通用形式：

同理有了就可以推出進而可以推出和

對於m個樣本而言，我們求得的某個參數的導數是m樣本分別對這個參數求導的平均值。至此反向傳播過程推導推導完畢。

7. 參考內容

[1]. 淺談神經網絡算法

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 使用神經網絡做二分類預測以CNN（卷積神經網絡）為例做情感分類（二分類）神經網絡前向傳播和反向傳播公式詳細推導 BP神經網絡公式推導及實現(MNIST) 二分類練習推導一個最簡單的BP神經網絡訓練過程【個人作業/數學推導】前饋神經網絡-反向傳播(Back Propagation)公式推導走讀《神經網絡的梯度推導與代碼驗證》之CNN（卷積神經網絡）前向和反向傳播過程的代碼驗證二分類問題神經網絡的分類及其應用

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM