https://blog.csdn.net/u012436149/article/details/66971822
简单总结其用途
(1)requires_grad=Fasle时不需要更新梯度, 适用于冻结某些层的梯度;
(2)volatile=True相当于requires_grad=False,适用于推断阶段,不需要反向传播。这个现在已经取消了,使用with torch.no_grad()来替代
https://blog.csdn.net/u012436149/article/details/66971822
简单总结其用途
(1)requires_grad=Fasle时不需要更新梯度, 适用于冻结某些层的梯度;
(2)volatile=True相当于requires_grad=False,适用于推断阶段,不需要反向传播。这个现在已经取消了,使用with torch.no_grad()来替代
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。