sklearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None, cv=None, n_jobs=1, verbose=0, fit_params=None, pre_dispatch=‘2*n_jobs’)
參數
estimator:數據對象
X:數據
y:預測數據
soring:調用的方法
cv:交叉驗證生成器或可迭代的次數
n_jobs:同時工作的cpu個數(-1代表全部)
verbose:詳細程度
fit_params:傳遞給估計器的擬合方法的參數
pre_dispatch:控制並行執行期間調度的作業數量。減少這個數量對於避免在CPU發送更多作業時CPU內存消耗的擴大是有用的。該參數可以是:
- 沒有,在這種情況下,所有的工作立即創建並產生。將其用於輕量級和快速運行的作業,以避免由於按需產生作業而導致延遲
- 一個int,給出所產生的總工作的確切數量
- 一個字符串,給出一個表達式作為n_jobs的函數,如'2 * n_jobs'
返回
交叉驗證每次運行的評分數組
例子
from sklearn import datasets, linear_model from sklearn.cross_validation import cross_val_score diabetes = datasets.load_diabetes() X = diabetes.data[:150] y = diabetes.target[:150] lasso = linear_model.Lasso() print(cross_val_score(lasso, X, y)) # [ 0.33150734 0.08022311 0.03531764]