深度卷积网络原理—实例讲解梯度下降法参数更新过程

本文转载自查看原文 2018-10-03 17:01 2312

首先，先回顾梯度下降公式：（下面利用均方差MSE损失来进行演示）

梯度下降的训练公式：

接下来，按照上面的公式进行求最大值的案例讲解

令，学习速率为0.1，初始化参数w₁=0，w₂=0，b=0

样本一：x₁=0.1，x₂=0.8

输出：

OUT=w₁x₁ + w₂x₂ + b =0*0.1 + 0*0.8 + 0 = 0

期望输出=0.8

损失：

LOSS=(OUT-期望输出)²=(0 - 0.8)²=0.64

回顾此前的公式：

因此，新的权重：

继续看下一组样本：

输入：x₁=0.5，x₂=0.3

输出：

期望输出=0.5

损失：

LOSS=(OUT-期望输出)²= (0.2064-0.5)²= 0.0862

得到新权重：

训练几百个样本后，参数w₁=0.5，w₂=0.5，b=0.166667

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 梯度下降算法原理讲解梯度下降法和随机梯度下降法梯度下降法和随机梯度下降法梯度下降法分析梯度下降法小结梯度下降法梯度下降法小结梯度下降法和牛顿下降法深度学习（二）BP求解过程和梯度下降梯度下降法和随机梯度下降法的区别