sklearn.feature_selection.VarianceThreshold 方差閾值法(過濾法的一種)


sklearn.feature_selection.VarianceThreshold 方差閾值法,用於特征選擇,過濾器法的一種,去掉那些方差沒有達到閾值的特征。默認情況下,刪除零方差的特征

函數用法:

class sklearn.feature_selection.VarianceThreshold(threshold=0.0)

參數:

thresholdfloat,閾值,訓練集方差低於此閾值的要素將被刪除。默認設置是使所有要素的方差均非零,即刪除所有樣本中具有相同值的要素

屬性:

variances_:array, shape (n_features,)即是每個特征的方差是多少,返回的是數組

from sklearn.feature_selection import VarianceThreshold      
X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
selector = VarianceThreshold()
selector.fit_transform(X)
'''
array([[2, 0],
       [1, 4],
       [1, 1]])
'''
selector.variances_
#array([0.        , 0.22222222, 2.88888889, 0.        ])

方法:

  1. fit(X [,y])適合SelectFromModel元變壓器。
  2. fit_transform(X [,y])適合數據,然后對其進行轉換。
  3. get_params([deep])獲取此估計量的參數。
  4. get_support([index])獲取所選特征的掩碼或整數索引
  5. inverse_transform(X)反向轉換操作
  6. partial_fit(X [,y])僅將SelectFromModel元變壓器安裝一次。
  7. set_params(**參數)設置此估算器的參數。
  8. transform(X)將X縮小為選定的特征。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM