深度學習 | 什么是收斂?



上次開會,被當眾處刑說我的resnet34 epoch15時不收斂
於是想要深究到底什么是不收斂?

  1. 理解

打個簡單的比方,訓練網絡,就好比解方程,為了得到這個方程的極值點,訓練的過程就好比是找准一個方向,不斷的朝這個方向靠近,使得方程的值不斷減小,最終達到極值點,而不收斂,就是,不論你怎么跑,方程的解都不減小.即達不到最后的極值點.在loss上就表現為穩定性的比較大.跟迭代不收斂或者系統不穩定差不多,上下波動不能趨近一個定值。

  1. 可能原因

網絡不收斂直觀體現是loss函數無法下降,本質上是網絡或者訓練方法有問題,包括bachsize尺寸,是否數據歸一化,學習率設計,初始化權重等,這些都需要檢查一下


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM