學習曲線函數:
from sklearn.learning_curve import learning_curve
調用格式:
learning_curve(estimator, X, y, train_sizes=array([0.1, 0.325, 0.55, 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)
# exploit 開發,開拓 incremental 增加的 dispatch 派遣,分派 verbose 冗長的
參數:
- estimator:分類器
- X:訓練向量
- y:目標相對於X分類或者回歸
- train_sizes:訓練樣本相對的或絕對的數字,這些量的樣本將會生成learning curve。
- cv:確定交叉驗證的分離策略(None:使用默認的3-fold cross-validation;integer:確定幾折交叉驗證)
- verbose:整型,可選擇的。控制冗余:越高,有越多的信息。
返回值:
train_sizes_abs:生成learning curve的訓練集的樣本數。重復的輸入會被刪除。
train_scores:在訓練集上的分數
test_scores:在測試集上的分數