在訓練CNN時，loss穩定在log(類別數)

本文轉載自查看原文 2018-05-08 16:15 1609 機器學習/深度學習

參見知乎問題！

https://www.zhihu.com/question/275774218

很多框架都會有一個問題，當卷積 weight NaN 之后，卷積的 output 會變成 NaN。然后過了一個 FC，就變成正常的數字了，但是這時候所有 channel 的 output 值相同。

建議打印中間卷積層 output 以檢查是否是這個情況。

我以前也碰到過這個問題，0.69， 2.302表明網絡就是在隨機的猜。我遇到過下面兩種原因

1.可能是你的代碼有bug，尤其注意一下讀數據和讀label有沒有搞錯，以及data augmentation的有沒有寫出大問題。

2.你有沒有加weight decay,這點很關鍵。你可以看看你網絡學出的weight尤其是bias，是不是很大（比如100,-80啊這種）, 尤其是最后的fc層。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 keras訓練cnn模型時loss為nan 訓練時的Iteration、batchsize、epoch和loss的關系 Caffe訓練時Loss=87.3365問題【網絡訓練】網絡訓練時loss不下降的原因將caffe訓練時loss的變化曲線用matlab繪制出來使用caffe訓練時Loss變為nan的原因總結 python 拆分多類別數據集使用sklearn來處理類別數據訓練優化：降低loss tensorflow 訓練的時候loss=nan