箱型圖
如圖所示, 中間粗體黑色是 中位數, 顧名思義就是中間數, 長方型 底對應數的25%, 75%的數值(經過提序的) , 兩條 直線表示最小值,和最大值, 外面圓點表示異常值.
長方型被中位兩部份, 離中位近 說明 25%數都接近中位數, 離中位遠 說明 另外25%數都不太靠近中位數
舉例說明
1,2,2,3,3,7,8,8,8,9,10,21 這對數據 共12位.
中位數是 1,2,2,3,3,7,8,8,8,9,10,21 取(第6,第7位) (7+8)/2 =7.5 如果中位數正好中間那個值,直接取
Q1=1,2,2,3,3,7,8,8,8,9,10,21 因為偶數 (奇數直接取) , ( n+1)/4= 13/4=3.25
(取第3個,第4個, 2*0.25+3*.0.75=2.75 (前面0.25占比)
Q3=1,2,2,3,3,7,8,8,8,9,10,21 因為偶數 (奇數直接取) , 3( n+1)/4= 3*13/4=9.75
(取第9個,第10) 8*0.75+9*.0.25=8.25 (前面0.75占比)
四分位差(IQR) Q3-Q1=8.25-2.75 =5.5
異常性 最小的 Q1- 1.5*IQR= 2.75-1.5*5.5=-5.5
最大的 Q3+1.5*iQR= 8.25+1.5*5.5=16.5 其中(1,2,2,3,3,7,8,8,8,9,10,21 ) 21有異常
R驗證
x<-c(1,2,2,3,3,7,8,8,8,9,10,21) boxplot(x,yaxt="n") axis(2,seq(1,100,1),las=2) quantile(x)