深度學習 | 什么是收斂？

本文轉載自查看原文 2020-08-10 17:19 1614 深度學習

上次開會，被當眾處刑說我的resnet34 epoch15時不收斂
於是想要深究到底什么是不收斂？

理解

打個簡單的比方,訓練網絡,就好比解方程,為了得到這個方程的極值點,訓練的過程就好比是找准一個方向,不斷的朝這個方向靠近,使得方程的值不斷減小,最終達到極值點,而不收斂,就是,不論你怎么跑,方程的解都不減小.即達不到最后的極值點.在loss上就表現為穩定性的比較大.跟迭代不收斂或者系統不穩定差不多，上下波動不能趨近一個定值。

可能原因

網絡不收斂直觀體現是loss函數無法下降，本質上是網絡或者訓練方法有問題，包括bachsize尺寸，是否數據歸一化，學習率設計，初始化權重等，這些都需要檢查一下

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 收斂區間與收斂域深度學習學習筆記深度學習之遷移學習網絡收斂比深度學習“深度學習”-概念篇搭建深度學習環境為什么GEMM是深度學習的核心深度學習Inception 深度學習概述深度學習繪圖工具