偏度(skewness)
偏度是統計數據分布偏斜方向和程度的度量,是統計數據分布非對稱程度的數字特征。
定義上偏度是樣本的標准三階中心矩(standardized 3rd central moment)。
\[Skew(X)=E[(\frac{X-\mu}{\sigma})^3]=\frac{k_3}{\sigma^3}=\frac{k_3}{k_2^{\frac{3}{2}}} \]
偏度用於衡量數據的對稱性。若偏度為負,則數據均值左側的離散度比右側強;若偏度為正,則數據均值左側的離散度比右側弱。對於正態分布(或嚴格對稱分布)偏度等於 0。
如果Skewness>0,代表波形有右側長尾;如果Skewness<0 代表波形有左側長尾。
峰度(kurtosis)
峰度又稱峰態系數。表征概率密度分布曲線在平均值處峰值高低的特征數。直觀看來,峰度反映了峰部的尖度。
定義上峰度是樣本的標准四階中心矩(standardized 4rd central moment)。
隨機變量的峰度計算方法為隨機變量的四階中心矩與方差平方的比值。
\[Kurt(X)=E[(\frac{X-\mu}{\sigma})^4]=\frac{E[(X-\mu)^4]}{(E[(X-\mu)^2])^2} \]
峰度是描述總體中所有取值分布形態陡緩程度的統計量。
這個統計量需要與正態分布相比較,峰度為0表示該總體數據分布與正態分布的陡緩程度相同;峰度大於0表示該總體數據分布與正態分布相比較為陡峭,為尖頂峰;峰度小於0表示該總體數據分布與正態分布相比較為平坦,為平頂峰。峰度的絕對值數值越大表示其分布形態的陡緩程度與正態分布的差異程度越大。
【參考】