先啰嗦兩句,在質量管理七大原則中,講究詢證決策,說人話就是“說話辦事得有證據”。
質量數據便是可以很好的輔助決策的客觀依據。但簡單粗糙未經整理的原生態數據顯然是沒辦法完成它這個使命的。所以如何整理質量數據進而清晰准確表達質量信息,可以說是質量人的一項基本生存技能。
而數據整理和表達的一個經典模型,便是直方圖。
一、直方圖是什么
直方圖用一系列寬度相等、高度不等的長方形來表示數據,其寬度代表組距,高度代表指定組距內的數據數(頻數)。
它由英國擁有諸多頭銜的天才學者卡爾卡爾·皮爾遜(Karl Pearson,1857—1936,右邊這個帥男人,英國著名統計學家、應用數學家、歷史學家、哲學家、倫理學家、民俗學家、宗教學家、優生學家、頭骨測量專家……名號比龍媽還多……)提出,並由在日本質量學者總結納入經典QC七大工具中。
直方圖可使我們比較容易直接看到數據的分布形狀、離散程度和位置狀況:
- 觀察數據分布的類型,分析是否服從正態分布,有無異常;
- 判斷數據分布范圍是否滿足規格范圍的要求;
- 與產品規格界限做比較,判斷分布中心是否偏離規格中心,以確定是否需要調整及調整量;
但需要注意的是,雖然在過程能力分析中,我們常常利用直方圖整理數據用以分析其分布狀態,但有時根據觀測數據所繪制的直方圖呈非正態的異常分布。這說明過程已出現了異常。在這種狀態下,是不能計算過程能力指數的,必須先排查異常原因,予以排查糾正后,再重新收集數據並分析。
為什么不能計算,因為不受控了啊,計算Cp/Cpk的前提是過程處於統計受控狀態。🙃
另外注意直方圖不等同於柱狀圖,或者通俗說直方圖是特定規則生成的柱狀圖,不要將二者混為一談。(小聲逼逼,我寫這邊文章前收集了些資料,很多作者將Excel直接生成的柱狀圖稱作直方圖還出教程,害人不淺吶)
二、直方圖怎么做
1、前置條件
用於繪制直方圖的數據量n最好在100以上,如確實達不到,至少也應大於50。
2、數據源
假設對某產品的某質量特性進行測量,共得到如下60個數據。
138 | 138 | 138 | 145 | 134 | 130 | 139 | 131 | 134 | 137 |
142 | 139 | 137 | 141 | 132 | 135 | 140 | 127 | 136 | 132 |
148 | 144 | 137 | 135 | 135 | 135 | 141 | 136 | 137 | 131 |
145 | 138 | 133 | 131 | 134 | 134 | 138 | 128 | 133 | 139 |
140 | 139 | 140 | 136 | 132 | 136 | 137 | 138 | 121 | 136 |
141 | 136 | 130 | 131 | 134 | 131 | 137 | 132 | 129 | 135 |
3、確定數據極差R
顯而易見,最大值Max=148,最小值Min=121,極差R=148-121=27。
4、確定組數K
組數也就是直方圖上柱子的數量。合理的選擇分組數對於正確的使用直方圖非常重要。
分組過多會使柱子的高度參差波動,直方圖將是鋸齒型,甚至出現空檔,不易顯示其分布規律,而且計算量也會增加。分組過少則會掩蓋了組內數據可能的異常波動,直方圖過於寬平,對分布狀態反應不靈敏。
一般在6~20組之間較為合適。具體可以參照以下兩種方法,任選其一即可:
A、中國質量協會注冊質量經理手冊中,推薦使用n的平方根。本例中,K= 60的平方根 = 7.7 ≈ 8。
B、日常中也常用斯特奇斯(Sturges)提出的經驗公式K=1+lgn/lg2。按該公式,本例 K = 6.9 ≈ 7。
本次采用經驗公式,取組數為7。
5、確定組距H
有了組數,還要確定組距也就是柱子的寬度,這樣方能計算每根柱子該包含哪些數據。
組距的確定方法為 H=R/K=(148-121)/7=4
注意組距要取測量單位的整數倍,否則生成的直方圖會有鋸齒形的錯誤分布。如果計算出的組距不是測量單位的整數倍,則要上下調整圓整。當H向上圓整時,實際分組數K將比原選定的分組數小,當H向下圓整時,實際分組數將比原選定的分組數大,這並不影響直方圖形態和分析結論。
6、確定各組的界限
即每根柱子的起點和終點值。
一般第一組起點為:Min-最小測定單位/2。
本例中最小測定單位為1(因為你沒看到小數),所以起點為121-0.5=120.5。根據組距4,快速確定各組界限為:
下限值 | 上限值 | |
第一組 | 120.5 | 124.5 |
第二組 | 124.5 | 128.5 |
第三組 | 128.5 | 132.5 |
第四組 | 132.5 | 136.5 |
第五組 | 136.5 | 140.5 |
第六組 | 140.5 | 144.5 |
第七組 | 144.5 | 148.5 |
問:為什么要減去最小測定的單位/2?
答:因為不能讓測量的數和柱子的邊界相同啊,如果相同,放在哪個柱子上呢。
7、確定各組的頻數
也就是落在各組的數據的數量是多少。
各位就各顯神通去數吧,下篇文章簡單講下用Excel frequency函數和countifs函數快速確定頻數的方法。Minitab的做法暫不涉及了(別問為什么,問就是寫了這么多,懶了🤪)。
下限值 | 上限值 | 頻數 | |
第一組 | 120.5 | 124.5 | 1 |
第二組 | 124.5 | 128.5 | 2 |
第三組 | 128.5 | 132.5 | 12 |
第四組 | 132.5 | 136.5 | 18 |
第五組 | 136.5 | 140.5 | 19 |
第六組 | 140.5 | 144.5 | 5 |
第七組 | 144.5 | 148.5 | 3 |
8、畫圖
終於到最后一步了。以組距為底長,以頻數為高做圖。
因為直方圖除了看分布以外,還可確定分布的范圍是否在接受范圍(公差范圍)內,所以還需標注公差范圍(T)、樣本容量(n)、樣本平均值(x)、樣本標准偏差值(s)和x的位置等(我承認我又偷懶了,不標了,各位正式做圖的時候不能省略)。
另外為了圖表美觀,建議寬高比為2:3,強迫症患者歡迎取0.618。
到此結束,拜拜~