https://blog.ailemon.me/2019/02/26/solution-to-loss-doesnt-drop-in-nn-train/
1.模型結構和特征工程存在問題
2.權重初始化方案有問題
3.正則化過度
4.選擇合適的激活函數、損失函數
5.選擇合適的優化器和學習速率
6.訓練時間不足
7.模型訓練遇到瓶頸
8.batch size過大
9.數據集未打亂
10.數據集有問題
11.未進行歸一化
12.特征工程中對數據特征的選取有問題