一、定義
歸一化方法有兩種形式,一種是把數變為(0,1)之間的小數,一種是把有量綱表達式變為無量綱表達式。主要是為了數據處理方便提出來的,把數據映射到0~1范圍之內處理,更加便捷快速。
二、目的
不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數據分析的結果,為了消除指標之間的量綱影響,需要進行數據標准化處理,以解決數據指標之間的可比性。其具體針對的是奇異樣本數據,奇異樣本數據指的是相對於其他輸入樣本特別大或特別小的樣本矢量,如[0.34,0.51,0.44,222][0.34,0.51,0.44,128]中最后一列元素就是奇異樣本數據。
三、常見標准化方法
1.最大-最小標准化映射到區間[0,1]
2.Z-score標准化結果聚集在0附近方差為1
四、矩陣的歸一化
矩陣的列歸一化,就是將矩陣每一列的值,除以每一列所有元素平方和的絕對值,這樣做的結果就是,矩陣每一列元素的平方和為1了。
五、python歸一化
其中參數axis=0表示列也是跨行的意思axis=1表示行也是跨列的意思
fromsklearn.preprocessingimportnormalize
data=np.array([
[1000,10,0.5],
[765,5,0.35],
[800,7,0.09],])
data=normalize(data,axis=0,norm='max')
print(data)
>>[[1.1.1.]
[0.7650.50.7]
[0.80.70.18]]
參考:
https://blog.csdn.net/acdreamers/article/details/44664205 歸一化含義
https://blog.csdn.net/lyhope9/article/details/82778459python 處理歸一化