在訓練集和測試集數據預處理時,需要對數據進行標准化
訓練集使用fit_transform
測試集使用transform
例如:
StandardScaler類是一個用來講數據進行歸一化和標准化的類
1 from sklearn.preprocessing import StandardScaler 2 ss_x = StandardScaler() 3 x_train = ss_x.fit_transform(x_train) 4 x_test = ss_x.transform(x_test)
transform和fit_transform的區別
標准化公式
fit_transform方法是fit和transform的結合,fit_transform(X_train) 意思是找出X_train的
和
,並應用在X_train上。
這時對於X_test,我們就可以直接使用transform方法。因為此時StandardScaler已經保存了X_train的
和
。


這時對於X_test,我們就可以直接使用transform方法。因為此時StandardScaler已經保存了X_train的


參考鏈接: