Python-數據標准化-transform和fit_transform的區別


在訓練集和測試集數據預處理時,需要對數據進行標准化

訓練集使用fit_transform

測試集使用transform

例如:

StandardScaler類是一個用來講數據進行歸一化和標准化的類

1 from sklearn.preprocessing import StandardScaler 2 ss_x = StandardScaler() 3 x_train = ss_x.fit_transform(x_train) 4 x_test = ss_x.transform(x_test)

transform和fit_transform的區別

標准化公式

fit_transform方法是fit和transform的結合,fit_transform(X_train) 意思是找出X_train的\mu\sigma,並應用在X_train上。
這時對於X_test,我們就可以直接使用transform方法。因為此時StandardScaler已經保存了X_train的
\mu\sigma
參考鏈接:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM