介紹
莖葉圖(Stem-and-Leaf display)又稱“枝葉圖”,由統計學家約翰托奇( Arthur Bowley)設計,它的思路是將數組中的數按位數進行比較,將數的大小基本不變或變化不大的位作為一個主干(莖),將變化大的位的數作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個主干后面的幾個數,每個數具體是多少。
三列數
莖葉圖有三列數:左邊的一列數統計數,它是上(或下)向中心累積的值,中心的數(帶括號)表示最多數組的個數;中間的一列表示莖,也就是變化不大的位數;右邊的是數組中的變化位,它是按照一定的間隔將數組中的每個變化的數一一列出來,像一條枝上抽出的葉子一樣,所以人們形象地叫它莖葉圖。
特殊工具
莖葉圖是一個與直方圖相類似的特殊工具,但又與直方圖不同,莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息。將莖葉圖莖和葉逆時針方向旋轉90度,實際上就是一個直方圖,可以從中統計出次數,計算出各數據段的頻率或百分比。從而可以看出分布是否與正態分布或單峰偏態分布逼近。
特征
1、用莖葉圖表示數據有兩個優點:一是從統計圖上沒有原始數據信息的損失,所有數據信息都可以從莖葉圖中得到;二是莖葉圖中的數據可以隨時記錄,隨時添加,方便記錄與表示。
2、莖葉圖只便於表示兩位有效數字的數據,而且莖葉圖只方便記錄兩組的數據,兩個以上的數據雖然能夠記錄,但是沒有表示兩個記錄那么直觀、清晰。
舉例
下面有一堆數據共30個
89 79 57 46 1 24 71 5 6 9 10 15 16 19 22 31 40 41 52 55 60 61 65 69 70 75 85 91 92 94
畫出的莖葉圖如下:
莖|葉
0 |1 5 6 9
1 |0 5 6 9
2 | 2 4
3 | 1
4 | 0 1 6
5 | 2 5 7
6 | 0 1 5 9
7 | 0159
8 | 5 9
9 | 1 2 4
比如第二行的數字如下:
1 | 0 5 6 9
則代表數據集中有10,15,16,19四個數字
可以這樣理解莖+葉=實際的數值,如 1|0569 中莖值為1,頁值為 0,5,6,9 共四個頁值.
其真實數值計算方式:莖值連接葉值 .莖值:1葉值0連接起來就是10.
一個莖可以有很多葉也可以不出現葉.
R語言舉例 > x = c(12.00, 0.40, 5.00, 2.00, 50.00, 8.00, 3.00, 1.00, 4.00, 0.25) > stem(x)