什么是欠擬合
訓練樣本被提取的特征比較少,導致訓練出來的模型不能很好地匹配,表現得很差,甚至樣本本身都無法高效的識別
什么是過擬合
所建的機器學習模型或者是深度學習模型在訓練樣本中表現得過於優越,導致在驗證數據集以及測試數據集中表現不佳。過擬合就是學到了很多沒必要的特征,遇到了新樣本這些錯誤的特征就沒有什么用了。所以過擬合就是表現為訓練的時候效果很好(因為神經網絡已經學到了很多有用沒用的特征),但是在測試樣本上的效果就很差(有的特征完全沒用啊,完全就是為了降低loss而得出來的特征)。至於為什么會產生過擬合,一般是因為參數過多,為了降低loss(神經網絡的任務就是為了最小化loss),后者樣本過少。總之就是參數/樣本的比太大。
判斷方法
從訓練集中隨機選一部分作為一個驗證集,采用K折交叉驗證的方式,用訓練集訓練的同時在驗證集上測試算法效果。下圖的橫坐標用擬合函數多項式的階數籠統地表征模型擬合能力:
在缺少有效預防欠擬合和過擬合措施的情況下,隨着模型擬合能力的增強,錯誤率在訓練集上逐漸減小,而在驗證集上先減小后增大;Error = Bias + Variance
- 當兩者的誤差率都較大時,處於欠擬合狀態(high bias, low variance);
- 當驗證集誤差率達到最低點時,說明擬合效果最好;
- 由最低點增大時,處與過擬合狀態(high variance, low bias)。
參考
https://blog.csdn.net/weixin_42575020/article/details/82949285