常用歸一化方法
1). 線性歸一化,線性歸一化會把輸入數據都轉換到[0 1]的范圍,公式如下
該方法實現對原始數據的等比例縮放,其中Xnorm為歸一化后的數據,X為原始數據,Xmax、Xmin分別為原始數據集的最大值和最小值。
優點:通過利用變量取值的最大值和最小值將原始數據轉換為界於某一特定范圍的數據,從 而消除量綱和數量級的影響
缺點:由於極值化方法在對變量無量綱化過程中僅僅與該變量的最大值和最小值這兩個極端 值有關,而與其他取值無關,這使得該方法在改變各變量權重時過分依賴兩個極端取值。 零均值歸一化:
2). 0均值標准化,0均值歸一化方法將原始數據集歸一化為均值為0、方差1的數據集,歸一化公式如下:
其中,μ、σ分別為原始數據集的均值和方法。該種歸一化方式要求原始數據的分布可以近似為高斯分布,否則歸一化的效果會變得很糟糕。
優點:去量綱化
缺點:這種歸一化方式要求原始數據的分布可以近似為高斯分布,否則歸一化的效果會變得 很糟糕。