畫箱圖的函數:
boxplot()##help(boxplot)查詢具體用法
圖例的解釋:
如下圖,是兩個簡單的箱圖。
- 中間的箱子的上下邊,分別是第三,一個四分位數。
- 中間的黑線是第二四分位數(中位數)。
- 設r是變量的四分位距,箱圖上方的小橫線是小於或等於第三個四分位數+1.5*r的最大觀測值。同時下方的小橫線是,大於等於第一個四分位數減去1.5*r的最大的觀測值。
- 圖中的小白圈,代表很大可能性上是離群點(outlier).(在其他圖中也適用)
總結:
箱圖給出了大量的信息,不僅給出了變量的中心趨勢,也給出了變量的發散情況和離群值。