sklearn中數據縮放用到的fit_transform()、transform()、fit()方法的區別與聯系

本文轉載自查看原文 2020-10-22 02:21 553 數據科學/ 機器學習/ Python

看了一堆搜索排名靠前的中文博客，感覺沒有一個解釋能讓人醍醐灌頂的，故搜索英文網頁並記之。

謝絕轉載。

首先對於數據標准化一般是這么做的：

其中 $μ$

$μ$

1 # Feature Scaling
2 from sklearn.preprocessing import StandardScaler
3 sc = StandardScaler()
4 X_train = sc.fit_transform(X_train)
5 X_test = sc.transform(X_test)

注意這里fit_transform()是用在訓練集上的，也就是說，fit_transform()先計算了訓練集數據的均值μ和標准差σ，並以此對訓練集進行標准化。

參考：

https://datascience.stackexchange.com/questions/12321/whats-the-difference-between-fit-and-fit-transform-in-scikit-learn-models

https://www.kaggle.com/questions-and-answers/58368

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 sklearn fit, fit_transform, transform的區別 sklearn中standardscaler中fit_transform()和transform()有什么區別，應該怎么使用？ sklearn中各算法類的fit，fit_transform和transform函數 transform、transition和animation的區別和聯系 over fit與underfit的區別與解決方法 java中&和&&的區別和聯系使用sklearn的pca模塊fit數據報錯“ValueError: array must not contain infs or NaNs” keras模型中的model.fit()和model.fit_generator()的區別 SQL中INEXISTS和IN 的區別和聯系『Sklearn』數據划分方法