對訓練集、驗證集和測試集的一點理解


(以神經網絡為例)

數據量較小(1w條以下),一般的划分是,訓練集:驗證集:測試集=8:1:1(有的地方說是6:2:2??),訓練集:測試集=2:1~4:1(總之測試集不要超過30%)

訓練集:訓練參數,此處的參數是指普通參數,即在神經網絡中能夠被梯度下降算法所更新的,如權值

驗證集:用於調超參數,監控模型是否發生過擬合,能夠被多次使用,進行人工調參。此處的超參數,如神經網絡中的網絡層數、網絡節點數、迭代次數、學習率

測試集:評估最終模型泛化能力,被一次使用。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM