統計分析 - 箱型圖


箱型圖

 

 

 

 

 如圖所示,  中間粗體黑色是 中位數,  顧名思義就是中間數,  長方型 底對應數的25%, 75%的數值(經過提序的)  , 兩條 直線表示最小值,和最大值, 外面圓點表示異常值.

 

 

長方型被中位兩部份, 離中位近 說明 25%數都接近中位數, 離中位遠 說明 另外25%數都不太靠近中位數

舉例說明

  1,2,2,3,3,7,8,8,8,9,10,21   這對數據 共12位.  

 

中位數是    1,2,2,3,3,7,8,8,8,9,10,21    取(第6,第7位)  (7+8)/2 =7.5  如果中位數正好中間那個值,直接取

Q1=1,2,2,3,3,7,8,8,8,9,10,21  因為偶數 (奇數直接取) , ( n+1)/4= 13/4=3.25     

                                            (取第3個,第4個,  2*0.25+3*.0.75=2.75      (前面0.25占比)

 

Q3=1,2,2,3,3,7,8,8,8,9,10,21  因為偶數 (奇數直接取) , 3( n+1)/4= 3*13/4=9.75    

                                            (取第9個,第10)        8*0.75+9*.0.25=8.25    (前面0.75占比)

 

四分位差(IQR)  Q3-Q1=8.25-2.75 =5.5

異常性 最小的  Q1- 1.5*IQR= 2.75-1.5*5.5=-5.5   

           最大的 Q3+1.5*iQR= 8.25+1.5*5.5=16.5   其中(1,2,2,3,3,7,8,8,8,9,10,21 )   21有異常

 

R驗證

 x<-c(1,2,2,3,3,7,8,8,8,9,10,21)
 boxplot(x,yaxt="n")
 axis(2,seq(1,100,1),las=2)
 quantile(x)

  

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM