梯度积累优化

本文转载自查看原文 2020-03-19 09:09 616 Python

由于显卡限制batch size，通过梯度累积优化弥补。

在训练的时候先累积多个batch的梯度，然后进行反向传播。

网络中的bn层会对梯度累积造成一定的影响。

pytorch网络，如果bn层对整体模型影响不大，可以在训练时也用model.eval()冻结bn层。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 基于梯度的优化方法优化算法—梯度下降梯度下降优化算法『TensorFlow』梯度优化相关梯度优化、LR【原理+推导】梯度下降算法及优化方法梯度下降优化算法综述随机梯度下降优化算法-----批量梯度下降，随机梯度下降，小批量梯度下降 MYSQL千万级数据量的优化方法积累 MYSQL千万级数据量的优化方法积累