數據中心化


——by ChanZiyang

 

1 什么是中心化?

在數據處理的過程中,我們經常看到"中心化"這個字眼。那么什么是中心化呢?

數據中心化或者去均值(Zero-centered或者Mean-subtraction)。其目的是讓數據通過中心化處理,得到均值為0的數據。同時中心化后的數據對向量來說也容易描述,因為是以原點為基准的。

 

2 中心化公式

數據中心化的數學公式如下:

其中,x表示原始數據,x'表示中心化后的數據,μ表示原始數據的平均值。

 

3 樣例

這里,Data1是二維的原始數據,Average是其平均值,Data2是中心化后的數據。

圖中右上角藍色部分表示的是原始數據。左下角紅色部分是中心化后的數據。

於是,我們可以看出,數據中心化的過程就是一個將數據平移到原點附近的過程,平移后的中心點就是原點,此時數據在原點周圍分布。

 

4 Matlab代碼 

clear 
data1 = [1.24,1.27;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90; 
1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; 
average= mean(data1); %按行取均值 
data2 = bsxfun(@minus, data1,average); %去均值 
figure(1); 
plot(data1(:,1), data1(:,2),'o',data2(:,1), data2(:,2),'o'); %繪制數據分布圖 
xlabel('x軸');ylabel('y軸'); 
grid on;%顯示網格線 
axis on;%顯示坐標軸 

 

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM