特征歸一化的方法線性歸一化零均值歸一化

本文轉載自查看原文 2018-10-27 21:54 1446 機器學習

常用歸一化方法

1）. 線性歸一化，線性歸一化會把輸入數據都轉換到[0 1]的范圍，公式如下

該方法實現對原始數據的等比例縮放，其中Xnorm為歸一化后的數據，X為原始數據，Xmax、Xmin分別為原始數據集的最大值和最小值。

優點：通過利用變量取值的最大值和最小值將原始數據轉換為界於某一特定范圍的數據，從而消除量綱和數量級的影響

缺點：由於極值化方法在對變量無量綱化過程中僅僅與該變量的最大值和最小值這兩個極端值有關，而與其他取值無關，這使得該方法在改變各變量權重時過分依賴兩個極端取值。零均值歸一化：

2）. 0均值標准化，0均值歸一化方法將原始數據集歸一化為均值為0、方差1的數據集，歸一化公式如下：

其中，μ、σ分別為原始數據集的均值和方法。該種歸一化方式要求原始數據的分布可以近似為高斯分布，否則歸一化的效果會變得很糟糕。

優點：去量綱化

缺點：這種歸一化方式要求原始數據的分布可以近似為高斯分布，否則歸一化的效果會變得很糟糕。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習做特征歸一化和特征化的原因特征歸一化、特征映射、正則化 scikit-learn中自帶的均值方差歸一化函數特征工程之歸一化及標准化第9章優化方法和歸一化歸一化方法 Normalization Method 數據歸一化和兩種常用的歸一化方法數據預處理之中心化（零均值化）與標准化（歸一化）數據分析：歸一化、標准化和中心化/零均值化數據預處理之中心化（零均值化）與標准化（歸一化）