keras寫的代碼訓練過程中loss出現Nan

本文轉載自查看原文 2019-10-08 10:29 836 應用keras/ TensorFlow在地球物理上出現的坑

損失函數是通過keras已經封裝好的函數進行的線性組合, 如下:

def spares_mse_mae_2scc(y_true, y_pred):
return mean_squared_error(y_true, y_pred) + categorical_crossentropy(y_true, y_pred) + 2 * mean_absolute_error(y_true, y_pred)

在訓練的過程中出現Nan, 發現是因為使用categorical_crossentropy(交叉熵)函數是0出現在了log的位置, 是的出現log(0)的情況出現.

可能的原因:

1　　學習率的原因, 可以適當降低學習率,並設置學習率衰減;

2　　BatchNormlization原因, 可能在正則化的過程中出現大量的0.

3　　數據不干凈

我所遇到的問題基本排除上面三種, 我的解決方法:

def mse_mae_2bcc(y_true, y_pred):
return mean_squared_error(y_true, y_pred) + binary_crossentropy(y_true, y_pred) + 2 * mean_absolute_error(y_true, y_pred)

這樣定義損失函數就可以直接避免這個問題, 原因還不太清楚, 有時間推導一下在補充.

參考:

1.　　https://stackoverflow.com/questions/33712178/tensorflow-nan-bug

2.　　https://oldpan.me/archives/careful-train-loss-nan-inf

3.　　https://blog.csdn.net/hahajinbu/article/details/84035486

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Pytorch 訓練過程中出現的問題 keras訓練cnn模型時loss為nan tensorflow訓練過程中內存溢出 tensorflow 訓練網絡loss突然出現nan的情況用caffe訓練openpose過程中，出現異常寫給程序員的機器學習入門 (四) - 訓練過程中常用的技巧深度學習模型訓練過程關於LSTM的輸入和訓練過程的理解 Tensorflow 保存和載入訓練過程 YOLOv3訓練過程筆記