機器學習中訓練集、驗證集、測試集的定義和作用

本文轉載自查看原文 2017-09-27 11:37 1439 機器學習

下面是一些定義及作用：
Training set: A set of examples used for learning, which is to fit the parameters [i.e., weights] of the classifier.
訓練集是用來學習的樣本集，通過匹配一些參數來建立一個分類器
Validation set: A set of examples used to tune the parameters [i.e., architecture, not weights] of a classifier, for example to choose the number of hidden units in a neural network.
驗證集是用來調整分類器的參數的樣本集，比如在神經網絡中選擇隱藏單元數。驗證集還用來確定網絡結構或者控制模型復雜程度的參數
Test set: A set of examples used only to assess the performance [generalization] of a fully specified classifier.
測試集純粹是為了測試已經訓練好的模型的分類能力的樣本集。
 
一般驗證集在交叉驗證里應用的比較多：
    利用交叉驗證方法選擇模型思路是：使用訓練集(trainset)數據所有候選模型進行參數估計，使用驗證集(validationset)為檢驗樣本，然后計算預測均方誤差，比較各個模型的預測均方誤差，選擇預測均方誤差最小的擬合模型為選擇模型。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習入門06 - 訓練集和測試集 (Training and Test Sets) 深度學習入門--訓練集、測試集和驗證集制作訓練集和驗證集、測試集關於訓練集,驗證集,測試集的划分機器學習中各種熵的定義及理解機器學習中各種熵的定義及理解機器學習-Python中訓練模型的保存和再使用交叉驗證與訓練集、驗證集、測試集機器學習之模型訓練（二）皮馬印第安人糖尿病數據集 MIT一牛人對數學在機器學習中的作用給的評述