反向求导

本文转载自查看原文 2021-08-30 19:46 106

在上一节中，我们大致对神经网络的梯度更新有了了解，其中最核心的部分就是求出损失函数对权重

其中，

𝑦 𝑜 𝑢 𝑡 \sim (𝑤 3 11 𝑤 2 11 + 𝑤 3 21 𝑤 2 12) 𝑤 1 11 𝑥 1,

用矩阵表示为：

\partial 𝐿 \partial 𝑊 1 = ⎡⎣⎢⎢⎢⎢⎢⎢⎢ \partial 𝑦 𝑜 𝑢 𝑡 \partial 𝑤 1 11

因此，整个反向传播的过程如下：

首先计算：

然后计算：

最后计算：

为了方便计算，反向传播通过使用计算图的形式在 Tensorflow，PyTorch 等深度学习框架中实现，将上述过程绘制成计算图如下：

根据计算图，可以轻而易举地计算出损失函数对每个变量的导数。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 softmax函数，对数似然代价函数及求导反向传播单层和双层神经网络反向传播公式推导(从矩阵求导的角度) 求导公式求导积分泰勒展开神经网络求导向量对向量求导基本求导法则与导数公式向量求导几则公式备忘「多项式求导」 softmax求导的过程