網絡訓練loss為nan的解決的辦法。

本文轉載自查看原文 2018-11-02 14:00 3832

1、檢查輸入數據和target中是否有 nan 值。

　　np.any(np.isnan(x))

　　np.any(np.isnan(target))

2、減小loss

3、rnn中發生梯度爆炸，檢查參數值和參數梯度，截斷梯度。　

3.1 檢查梯度是否更新
for params in model.named_parameters():
    [name, param] = params

    if param.grad is not None:
        print(name, end='\t')
        print('weight:{}'.format(param.data.mean()), end='\t')
        print('grad:{}'.format(param.grad.data.mean()))

3.2 截斷梯度
torch.nn.utils.clip_grad_norm_(model.parameters(), 0.25)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 tensorflow 訓練的時候loss=nan tensorflow 訓練網絡loss突然出現nan的情況 keras訓練cnn模型時loss為nan 如何解決loss NAN的問題使用caffe訓練時Loss變為nan的原因總結 loss 為nan的問題解決訓練深度學習網絡時候，出現Nan是什么原因，怎么才能避免？——我自己是因為data有nan的壞數據，clear下解決神經網絡訓練中的train loss, test loss問題【網絡訓練】網絡訓練時loss不下降的原因解決tensorflow在訓練的時候權重是nan問題