——by ChanZiyang
1 什么是中心化?
在數據處理的過程中,我們經常看到"中心化"這個字眼。那么什么是中心化呢?
數據中心化或者去均值(Zero-centered或者Mean-subtraction)。其目的是讓數據通過中心化處理,得到均值為0的數據。同時中心化后的數據對向量來說也容易描述,因為是以原點為基准的。
2 中心化公式
數據中心化的數學公式如下:
其中,x表示原始數據,x'表示中心化后的數據,μ表示原始數據的平均值。
3 樣例
這里,Data1是二維的原始數據,Average是其平均值,Data2是中心化后的數據。
圖中右上角藍色部分表示的是原始數據。左下角紅色部分是中心化后的數據。
於是,我們可以看出,數據中心化的過程就是一個將數據平移到原點附近的過程,平移后的中心點就是原點,此時數據在原點周圍分布。
4 Matlab代碼
clear data1 = [1.24,1.27;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90; 1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; average= mean(data1); %按行取均值 data2 = bsxfun(@minus, data1,average); %去均值 figure(1); plot(data1(:,1), data1(:,2),'o',data2(:,1), data2(:,2),'o'); %繪制數據分布圖 xlabel('x軸');ylabel('y軸'); grid on;%顯示網格線 axis on;%顯示坐標軸