sklearn
面向機器學習的python開源框架。
sklearn官方網站
sklearn中文網
sklearn.preprocessing.StandardScaler
通過去除均值並縮放到單位方差來標准化特征。
公式如下:
$z = \frac{x-\mu}{\sigma}$
其中,$\mu$是訓練樣本的平均值,$\sigma$是訓練樣本的標准差。
from sklearn.preprocessing import StandardScaler
StandardScaler(copy=True, with_mean=True, with_std=True)
- 參數:
copy: 布爾值,默認為True.
如果為False,則就地縮放,不生成新對象。
with_mean: 布爾值,默認為True.
如果為True, 則在縮放之前嘗試將數據居中。
with_std: 布爾值,默認為True.
如果為True, 則將數據縮放到單位方差。
- 屬性:
scale_: ndarray or None
每個特征的數據相對縮放。
mean_: ndarray or None
訓練集中每個特征的平均值。
var_: ndarray of None
訓練集中每個特征的方差。
n_samples_seen_: int or array
為每個特征處理的樣本數。沒有缺失值的話為整數,否則為數組。
- 方法:
fit(self, X, y=None)
計算均值和std用於以后的縮放。
fit_transform(self, X, y=None, **fit_params)
計算均值和std,然后對其進行轉換。
參數:
X: numpy數組,訓練集。
y: numpy數組,目標值。
**fit_params: dict, 其他擬合參數。
返回值:
numpy數組,轉換后的數組。
get_params(self, deep=True)*
獲取此估計量的參數。
inverse_transform(self, X, copy=None)
將數據按比例縮放到原始形式
partial_fit(self, X, y=None)
在線計算X上的平均值和std, 以便以后縮放。
set_params(self, **params)
設置此估算器的參數。
transform(self, X, copy=None)
通過居中和縮放來執行標准化。