數據分布形態:峰度與偏度


1.什么是峰度與偏度?

峰度(kurtosis)是描述分布形態的陡緩程度。表征概率密度函數分布曲線在平均值處峰值高低的特征數。用bk表示。直觀看來,峰度反映了數據尾部 厚度
在相同的標准差下,峰度系數越大,分布就有更多的極端值,那么其余值必然要更加集中在眾數周圍,其分布必然就更加陡峭。
 
偏度(skewness),表征概率分布密度曲線 相對於平均值不對稱程度的特征數(因此它與方差有些類似)。用bs表示。直觀看來就是密度函數曲線尾部的相對 長度。所以哪邊尾巴長就往哪邊偏,左偏就是左尾長,右偏就是右尾長。
 
二者的比較基准是正態分布。 正態分布的峰度為3,偏度為0。
 
bk<3稱分布具有不足的峰度(數據峰度在正態分布峰度內),bk>3稱分布具有過度的峰度(超出正態峰度)。 若知道分布有可能在峰度上偏離正態分布時,可用峰度來檢驗分布的正態性。
 
bs<0稱分布具有負偏離,也稱左偏態,此時數據位於均值左邊的比位於右邊的少,直觀表現為左邊的尾部相對於與右邊的尾部要長,因為有少數變量值很小,使曲線左側尾部拖得很長;bs>0稱分布具有正偏離,也稱右偏態,此時數據位於均值右邊的比位於左邊的少,直觀表現為右邊的尾部相對於與左邊的尾部要長,因為有少數變量值很大,使曲線右側尾部拖得很長;而bs接近0則可認為分布是對稱的。 若知道分布有可能在偏度上偏離正態分布時,可用偏離來檢驗分布的正態性。 
當某一數據的分布與標准正態分布的峰度相比較時,峰度就有了正峰度和負峰度的表現。
 
2.它們有什么用?
檢驗數據分布的正態性:(還有很多種方法)
若知道分布有可能在峰度上偏離正態分布時,可用峰度來檢驗分布的正態性。
若知道分布有可能在偏度上偏離正態分布時,可用偏離來檢驗分布的正態性。
 
3.眾數、中位數、算術平均數在各分布形態中的關系?
右偏時 一般有,算術平均數>中位數>眾數,左偏時相反,即眾數>中位數>平均數。正態分布三者相等。
即在 一般情況下,根 據次數分布的偏斜情況 , 算術平均數或大於眾 數 , 或小於眾數 , 而中位數總居於兩者之間 。
 
而在一些特別情況下,上述說法也不是絕對正確,如徐景范在《中位數、算術平均數、眾數之我見》和王學民在《偏度和峰度概念的認識誤區》中都有提到特例的情形。
 
細思之下發現,當數據只考慮數據和數據出現頻率的情形的時,其分布形態不用考慮特殊的情形,肯定滿足一般情況下的三數關系。且上例中列舉的例子有一個問題的是,所給出的數據直方圖不在同一個量綱。因此,考慮不同組數據峰度或偏度比較是,必然注意到量綱的統一性。
 
 
 
 
 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM