【網絡訓練】網絡訓練時loss不下降的原因

本文轉載自查看原文 2019-04-03 17:06 4562 網絡訓練問題

1. 網絡訓練時train loss與test loss的結果分析:

(1) train loss不斷下降，test loss不斷下降 可能發生的原因： 網絡還在學習中，loss在穩步下降。
 (2) train loss不斷下降，test loss趨於不變 可能發生的原因： 網絡出現過擬合的現象，因此在訓練集上表現為網絡仍在學習，但是test loss趨於不變說明網絡泛化能力差。
 (3) train loss趨於不變，test loss不斷下降 可能發生的原因： 數據集100%是有問題的。
 (4) train loss趨於不變，test loss趨於不變 可能發生的原因： loss開始在某一值附近不斷振盪，說明網絡學習遇到瓶頸，此時應該減小學習率或者減小batch size的大小。
 (5) train loss不斷上升，test loss不斷上升 可能發生的原因： 網絡結構的設計有問題； 訓練時超參數的設置有問題； 數據集沒有經過清洗。

2. 出現loss不下降的問題時檢查:

（1）數據

數據本身以及label是否有異常
數據是否過於臟亂，沒有經過清洗
數據輸入是否有問題，比如圖片與label是否一致
數據經過預處理后，是否丟失特征或者因預處理而出現別的問題
數據量是否過少，網絡出現過擬合的現象

（2）超參數的設置

學習率的設置是否有問題：學習率過小可能會導致loss下降緩慢，學習率過大可能會導致loss振盪不下降
batch size設置是否有問題： batch size如果設置過小，在數據不太好的情況下也會出現loss振盪的現象

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 神經網絡訓練loss值不下降原因集合基於Triplet loss函數訓練人臉識別深度網絡（Open Face）在訓練CNN時，loss穩定在log(類別數) tensorflow,model,object_detection,訓練loss先下降后遞增，到幾百萬，解決tensorflow,model,object,detection,loss,incease 在訓練過程中loss出現NaN的原因以及可以采取的方法 keras 訓練保存網絡圖，查看loss，acc，單張圖片推理，保存中間feature map圖，查看參數神經網絡訓練時出現nan錯誤 TF模型訓練中注意Loss和F1的變化情況 caffe繪制訓練過程的loss和accuracy曲線神經網絡及其訓練