sklearn中的StandardScaler


sklearn

面向機器學習的python開源框架。
sklearn官方網站
sklearn中文網


sklearn.preprocessing.StandardScaler

  通過去除均值並縮放到單位方差來標准化特征。
  公式如下:
    $z = \frac{x-\mu}{\sigma}$
   其中,$\mu$是訓練樣本的平均值,$\sigma$是訓練樣本的標准差。

from sklearn.preprocessing import StandardScaler
StandardScaler(copy=True, with_mean=True, with_std=True)


  • 參數:
      copy: 布爾值,默認為True.
        如果為False,則就地縮放,不生成新對象。
      with_mean: 布爾值,默認為True.
        如果為True, 則在縮放之前嘗試將數據居中。
      with_std: 布爾值,默認為True.
        如果為True, 則將數據縮放到單位方差。

  • 屬性:
      scale_: ndarray or None
        每個特征的數據相對縮放。
      mean_: ndarray or None
        訓練集中每個特征的平均值。
      var_: ndarray of None
        訓練集中每個特征的方差。
      n_samples_seen_: int or array
        為每個特征處理的樣本數。沒有缺失值的話為整數,否則為數組。

  • 方法
      fit(self, X, y=None)
        計算均值和std用於以后的縮放。
      fit_transform(self, X, y=None, **fit_params)
        計算均值和std,然后對其進行轉換。
        參數:
          X: numpy數組,訓練集。
          y: numpy數組,目標值。
          **fit_params: dict, 其他擬合參數。
        返回值:
          numpy數組,轉換后的數組。
      get_params(self, deep=True)*
        獲取此估計量的參數。
      inverse_transform(self, X, copy=None)
        將數據按比例縮放到原始形式
      partial_fit(self, X, y=None)
        在線計算X上的平均值和std, 以便以后縮放。
      set_params(self, **params)
        設置此估算器的參數。
      transform(self, X, copy=None)
        通過居中和縮放來執行標准化。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM