數據描述性統計度量主要包括:集中趨勢和離散趨勢
1、集中趨勢
集中趨勢的度量主要包括:均值、眾數、中位數
均值擴展:
(1) 帶權平均值:
權重反應的是樣本在總體樣本中的意義、重要性或出現的頻率。
帶權平均值主要用於應對不同樣本的權重不一樣。
(2) 截尾平均值:
截尾均值是指丟棄極端樣本值后的均值。主要用於抵消少數極端值的影響。
應對於不同的數據類型時,均值、中位數和眾數所能表示的集中趨勢度量可靠性不同:
小技巧:對於適度傾斜(非對稱)的單峰數值數據,平均數減眾數約等於三倍的平均數減中位數。
2、離散趨勢
離散趨勢的度量主要包括:極差、方差、標准差
方差計算簡化公式:
標准差的意義:為彌補方差數值與樣本的單位不同而造成的無法准確表示相差數值的遺憾,如,當樣本單位為m時,方差數值的單位為m2,而標准差與樣本單位相同。
3、常用來直觀描述數據的圖形
數據通常不能直觀的被人所感知,通過將數據可視化為圖形時,可使人更容易理解和察覺數據隱含的意義。
常用統計圖對比:
(1) 直方圖
(2) 箱線圖
(3) 莖葉圖
莖葉圖可以在保留全部數據信息的情況下,直觀地顯示出數據的分布情冴
(4) 線圖
線圖即為曲線圖和折線圖
(5) 柱形圖(條形圖)
顯示一段時間內的數據變化或者顯示各項數據在同一情況下的比較情況
柱形圖與直方圖的對比:
(5) 餅圖
顯示一段時間內的數據變化或者顯示各項數據在同一情況下的比較情況