箱型图
如图所示, 中间粗体黑色是 中位数, 顾名思义就是中间数, 长方型 底对应数的25%, 75%的数值(经过提序的) , 两条 直线表示最小值,和最大值, 外面圆点表示异常值.
长方型被中位两部份, 离中位近 说明 25%数都接近中位数, 离中位远 说明 另外25%数都不太靠近中位数
举例说明
1,2,2,3,3,7,8,8,8,9,10,21 这对数据 共12位.
中位数是 1,2,2,3,3,7,8,8,8,9,10,21 取(第6,第7位) (7+8)/2 =7.5 如果中位数正好中间那个值,直接取
Q1=1,2,2,3,3,7,8,8,8,9,10,21 因为偶数 (奇数直接取) , ( n+1)/4= 13/4=3.25
(取第3个,第4个, 2*0.25+3*.0.75=2.75 (前面0.25占比)
Q3=1,2,2,3,3,7,8,8,8,9,10,21 因为偶数 (奇数直接取) , 3( n+1)/4= 3*13/4=9.75
(取第9个,第10) 8*0.75+9*.0.25=8.25 (前面0.75占比)
四分位差(IQR) Q3-Q1=8.25-2.75 =5.5
异常性 最小的 Q1- 1.5*IQR= 2.75-1.5*5.5=-5.5
最大的 Q3+1.5*iQR= 8.25+1.5*5.5=16.5 其中(1,2,2,3,3,7,8,8,8,9,10,21 ) 21有异常
R验证
x<-c(1,2,2,3,3,7,8,8,8,9,10,21) boxplot(x,yaxt="n") axis(2,seq(1,100,1),las=2) quantile(x)