相關內容簡體繁體

神經網絡梯度下降的推導

本文轉載自查看原文 2020-06-04 22:28 1071 深度學習/ A---深度學習筆記

https://blog.csdn.net/u012328159/article/details/80081962

https://mp.weixin.qq.com/s?__biz=MzUxMDg4ODg0OQ==&mid=2247484013&idx=1&sn=2f1ec616d9521b801ef318308aa66e57&chksm=f97d5c93ce0ad585343a415be0b346fe18c960a41f45bfe69d0db4128b95b97d76d3c23ed293&mpshare=1&scene=23&srcid=&sharer_sharetime=1591403700835&sharer_shareid=9ed15fc26b568c844598f8638f4c17a4#rd

公式細節推導

Ag課程的總結（單層神經網絡）

Ag課程的總結（深層神經網絡）

已知 \(AL\) 和 \(J\)，先求出 \(dAL\)：

\(dAL = -(np.divide(Y, AL) - np.divide(1-Y, 1-AL)) \)

---> \(dZL = dAL * sigmod'(Z^{[L]}) = dAL*s*(1-s) \)

---> \(dWL=\frac{1}{m}dZL·A^{[L-1]T}\)

---> \(dbL=\frac{1}{m}np.sum(dZL, axis=1, keepdims=True) \)

---> \(dA^{[L-1]} = W^{[L]T}·dZ^{[L]}\)

===>

\(dZ^{[l]} = dA^{[l]} * g'(Z^{[l]})\) （\(l \in [L-1 , 1]\) ，\(relu'(Z^{[l]}) = np.int64(A^{[l]} > 0)\) ）

---> \(dW^{[l]} = \frac{1}{m}dZ^{[l]}·A^{[l-1]T}\)

---> \(db^{[l]}=\frac{1}{m}np.sum(dZ^{[l]}, axis=1, keepdims=True) \)

---> \(dA^{[l-1]} = dZ^{[l]}·W^{[l]} = W^{[l]T}·dZ^{[l]}\)

……

……

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [轉]BP神經網絡梯度下降算法有關一些求導的概念與神經網絡梯度下降神經網絡系列之二 -- 反向傳播與梯度下降神經網絡基礎-梯度下降和BP算法【零基礎】神經網絡優化之動量梯度下降梯度下降算法原理神經網絡（Gradient Descent）神經網絡與深度學習（2）：梯度下降算法和隨機梯度下降算法《神經網絡的梯度推導與代碼驗證》之CNN（卷積神經網絡）的前向傳播和反向梯度推導機器學習（一）：梯度下降、神經網絡、BP神經網絡《神經網絡的梯度推導與代碼驗證》之vanilla RNN的前向傳播和反向梯度推導

粵ICP備18138465號 © 2018-2025 CODEPRJ.COM