[深度概念]·K-Fold 交叉驗證 (Cross-Validation)的理解與應用


K-Fold 交叉驗證 (Cross-Validation)的理解與應用

我的網站

1.K-Fold 交叉驗證概念

在機器學習建模過程中,通行的做法通常是將數據分為訓練集和測試集。測試集是與訓練獨立的數據,完全不參與訓練,用於最終模型的評估。在訓練過程中,經常會出現過擬合的問題,就是模型可以很好的匹配訓練數據,卻不能很好在預測訓練集外的數據。如果此時就使用測試數據來調整模型參數,就相當於在訓練時已知部分測試數據的信息,會影響最終評估結果的准確性。通常的做法是在訓練數據再中分出一部分做為驗證(Validation)數據,用來評估模型的訓練效果。

驗證數據取自訓練數據,但不參與訓練,這樣可以相對客觀的評估模型對於訓練集之外數據的匹配程度。模型在驗證數據中的評估常用的是交叉驗證,又稱循環驗證。它將原始數據分成K組(K-Fold),將每個子集數據分別做一次驗證集,其余的K-1組子集數據作為訓練集,這樣會得到K個模型。這K個模型分別在驗證集中評估結果,最后的誤差MSE(Mean Squared Error)加和平均就得到交叉驗證誤差。交叉驗證有效利用了有限的數據,並且評估結果能夠盡可能接近模型在測試集上的表現,可以做為模型優化的指標使用。

2.舉例說明

下面舉一個具體的例子來說明K-Fold的過程,比如如下的數據

[0.1, 0.2, 0.3, 0.4, 0.5, 0.6]

 

分為K=3組后

Fold1: [0.5, 0.2]
Fold2: [0.1, 0.3]
Fold3: [0.4, 0.6]

 

交叉驗證的時會使用如下三個模型,分別進行訓練和測試,每個測試集誤差MSE加和平均就得到了交叉驗證的總評分

Model1: Trained on Fold1 + Fold2, Tested on Fold3
Model2: Trained on Fold2 + Fold3, Tested on Fold1
Model3: Trained on Fold1 + Fold3, Tested on Fold2

 

3.應用講解

 

1、 將全部訓練集S分成k個不相交的子集,假設S中的訓練樣例個數為m,那么每一個子集有m/k個訓練樣例,相應的子集稱作{clip_image024}。

2、 每次從模型集合M中拿出來一個clip_image010[3],然后在訓練子集中選擇出k-1個

{clip_image026}(也就是每次只留下一個clip_image028),使用這k-1個子集訓練clip_image010[4]后,得到假設函數clip_image030。最后使用剩下的一份clip_image028[1]作測試,得到經驗錯誤clip_image032

3、 由於我們每次留下一個clip_image028[2](j從1到k),因此會得到k個經驗錯誤,那么對於一個clip_image010[5],它的經驗錯誤是這k個經驗錯誤的平均。

4、 選出平均經驗錯誤率最小的clip_image010[6],然后使用全部的S再做一次訓練,得到最后的clip_image012[4]

 

核心內容:

通過上述1,2,3步進行模型性能的測試,取平均值作為某個模型的性能指標

根據性能指標來挑選出最優模型,再進行上述第4步重新進行訓練,獲得最終模型

疑問解答:

1.為什么不直接拆分訓練集與數據集,來驗證模型性能,反而采用多次划分的形式,豈不是太麻煩了?

我們為了防止在訓練過程中,出現過擬合的問題,通行的做法通常是將數據分為訓練集和測試集。測試集是與訓練獨立的數據,完全不參與訓練,用於最終模型的評估。這樣的直接划分會導致一個問題就是測試集不會參與訓練,這樣在小的數據集上會浪費掉這部分數據,無法使模型達到最優(數據決定了程性能上限,模型與算法會逼近這個上限)。但是我們又不能划分測試集,因為需要驗證網絡泛化性能。采用K-Fold 多次划分的形式就可以利用全部數據集。最后采用平均的方法合理表示模型性能。

2.為什么還要進行所有數據集重新訓練,是否太浪費時間?

我們通過K-Fold 多次划分的形式進行訓練是為了獲取某個模型的性能指標,單一K-Fold訓練的模型無法表示總體性能,但是我們可以通過K-Fold訓練的訓練記錄下來較為優異的超參數,然后再以最優模型最優參數進行重新訓練,將會取得更優結果。

3.何時使用K-Fold

我的看法,數據總量較小時,其他方法無法繼續提升性能,可以嘗試K-Fold。其他情況就不太建議了,例如數據量很大,就沒必要更多訓練數據,同時訓練成本也要擴大K倍(主要指的訓練時間)。

4.參考

1.K-Fold 交叉驗證 (Cross-Validation)

2.規則化和模型選擇(Regularization and model selection)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM