网络训练loss为nan的解决的办法。

本文转载自查看原文 2018-11-02 14:00 3832

1、检查输入数据和target中是否有 nan 值。

　　np.any(np.isnan(x))

　　np.any(np.isnan(target))

2、减小loss

3、rnn中发生梯度爆炸，检查参数值和参数梯度，截断梯度。　

3.1 检查梯度是否更新
for params in model.named_parameters():
    [name, param] = params

    if param.grad is not None:
        print(name, end='\t')
        print('weight:{}'.format(param.data.mean()), end='\t')
        print('grad:{}'.format(param.grad.data.mean()))

3.2 截断梯度
torch.nn.utils.clip_grad_norm_(model.parameters(), 0.25)

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 tensorflow 训练的时候loss=nan tensorflow 训练网络loss突然出现nan的情况 keras训练cnn模型时loss为nan 如何解决loss NAN的问题使用caffe训练时Loss变为nan的原因总结 loss 为nan的问题解决训练深度学习网络时候，出现Nan是什么原因，怎么才能避免？——我自己是因为data有nan的坏数据，clear下解决神经网络训练中的train loss, test loss问题【网络训练】网络训练时loss不下降的原因解决tensorflow在训练的时候权重是nan问题