一、loss固定的原因:
当输入变量都比较大时,反向传播时梯度值较小使loss无法收敛。
二、学习率过大,损失值上升。
由于平方损失函数是一个二次函数,所以当学习率大时步长大,导致神经网络越迭代损失值越大。
一、loss固定的原因:
当输入变量都比较大时,反向传播时梯度值较小使loss无法收敛。
二、学习率过大,损失值上升。
由于平方损失函数是一个二次函数,所以当学习率大时步长大,导致神经网络越迭代损失值越大。
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。