一、loss固定的原因:
當輸入變量都比較大時,反向傳播時梯度值較小使loss無法收斂。
二、學習率過大,損失值上升。
由於平方損失函數是一個二次函數,所以當學習率大時步長大,導致神經網絡越迭代損失值越大。
一、loss固定的原因:
當輸入變量都比較大時,反向傳播時梯度值較小使loss無法收斂。
二、學習率過大,損失值上升。
由於平方損失函數是一個二次函數,所以當學習率大時步長大,導致神經網絡越迭代損失值越大。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。