1. Learning rate不合適,如果太大,會造成不收斂,如果太小,會造成收斂速度非常慢;
2. Batch size太大,陷入到局部最優;
3. 網絡太簡單,一般情況下,網絡的層數和節點數量越大,擬合能力就越強,如果層數和節點不夠多,無法擬合復雜的數據,也會造成不收斂.
1. Learning rate不合適,如果太大,會造成不收斂,如果太小,會造成收斂速度非常慢;
2. Batch size太大,陷入到局部最優;
3. 網絡太簡單,一般情況下,網絡的層數和節點數量越大,擬合能力就越強,如果層數和節點不夠多,無法擬合復雜的數據,也會造成不收斂.
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。