1. Learning rate不合适,如果太大,会造成不收敛,如果太小,会造成收敛速度非常慢;
2. Batch size太大,陷入到局部最优;
3. 网络太简单,一般情况下,网络的层数和节点数量越大,拟合能力就越强,如果层数和节点不够多,无法拟合复杂的数据,也会造成不收敛.
1. Learning rate不合适,如果太大,会造成不收敛,如果太小,会造成收敛速度非常慢;
2. Batch size太大,陷入到局部最优;
3. 网络太简单,一般情况下,网络的层数和节点数量越大,拟合能力就越强,如果层数和节点不够多,无法拟合复杂的数据,也会造成不收敛.
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。