统计分析 - 箱型图


箱型图

 

 

 

 

 如图所示,  中间粗体黑色是 中位数,  顾名思义就是中间数,  长方型 底对应数的25%, 75%的数值(经过提序的)  , 两条 直线表示最小值,和最大值, 外面圆点表示异常值.

 

 

长方型被中位两部份, 离中位近 说明 25%数都接近中位数, 离中位远 说明 另外25%数都不太靠近中位数

举例说明

  1,2,2,3,3,7,8,8,8,9,10,21   这对数据 共12位.  

 

中位数是    1,2,2,3,3,7,8,8,8,9,10,21    取(第6,第7位)  (7+8)/2 =7.5  如果中位数正好中间那个值,直接取

Q1=1,2,2,3,3,7,8,8,8,9,10,21  因为偶数 (奇数直接取) , ( n+1)/4= 13/4=3.25     

                                            (取第3个,第4个,  2*0.25+3*.0.75=2.75      (前面0.25占比)

 

Q3=1,2,2,3,3,7,8,8,8,9,10,21  因为偶数 (奇数直接取) , 3( n+1)/4= 3*13/4=9.75    

                                            (取第9个,第10)        8*0.75+9*.0.25=8.25    (前面0.75占比)

 

四分位差(IQR)  Q3-Q1=8.25-2.75 =5.5

异常性 最小的  Q1- 1.5*IQR= 2.75-1.5*5.5=-5.5   

           最大的 Q3+1.5*iQR= 8.25+1.5*5.5=16.5   其中(1,2,2,3,3,7,8,8,8,9,10,21 )   21有异常

 

R验证

 x<-c(1,2,2,3,3,7,8,8,8,9,10,21)
 boxplot(x,yaxt="n")
 axis(2,seq(1,100,1),las=2)
 quantile(x)

  

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM