网络训练loss为nan的解决的办法。


1、检查输入数据和target中是否有 nan 值。

  np.any(np.isnan(x))

  np.any(np.isnan(target))

2、减小loss

3、rnn中发生梯度爆炸,检查参数值和参数梯度,截断梯度。 

3.1 检查梯度是否更新
for params in model.named_parameters():
[name, param] = params

if param.grad is not None:
print(name, end='\t')
print('weight:{}'.format(param.data.mean()), end='\t')
print('grad:{}'.format(param.grad.data.mean()))

3.2 截断梯度
torch.nn.utils.clip_grad_norm_(model.parameters(), 0.25)


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM