(以神經網絡為例)
數據量較小(1w條以下),一般的划分是,訓練集:驗證集:測試集=8:1:1(有的地方說是6:2:2??),訓練集:測試集=2:1~4:1(總之測試集不要超過30%)
訓練集:訓練參數,此處的參數是指普通參數,即在神經網絡中能夠被梯度下降算法所更新的,如權值
驗證集:用於調超參數,監控模型是否發生過擬合,能夠被多次使用,進行人工調參。此處的超參數,如神經網絡中的網絡層數、網絡節點數、迭代次數、學習率
測試集:評估最終模型泛化能力,被一次使用。
(以神經網絡為例)
數據量較小(1w條以下),一般的划分是,訓練集:驗證集:測試集=8:1:1(有的地方說是6:2:2??),訓練集:測試集=2:1~4:1(總之測試集不要超過30%)
訓練集:訓練參數,此處的參數是指普通參數,即在神經網絡中能夠被梯度下降算法所更新的,如權值
驗證集:用於調超參數,監控模型是否發生過擬合,能夠被多次使用,進行人工調參。此處的超參數,如神經網絡中的網絡層數、網絡節點數、迭代次數、學習率
測試集:評估最終模型泛化能力,被一次使用。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。