直方圖簡介及詳細繪制步驟


先啰嗦兩句,在質量管理七大原則中,講究詢證決策,說人話就是“說話辦事得有證據”。

質量數據便是可以很好的輔助決策的客觀依據。但簡單粗糙未經整理的原生態數據顯然是沒辦法完成它這個使命的。所以如何整理質量數據進而清晰准確表達質量信息,可以說是質量人的一項基本生存技能。

而數據整理和表達的一個經典模型,便是直方圖。

一、直方圖是什么

直方圖用一系列寬度相等、高度不等的長方形來表示數據,Karl Pearson其寬度代表組距,高度代表指定組距內的數據數(頻數)。

它由英國擁有諸多頭銜的天才學者卡爾卡爾·皮爾遜(Karl Pearson,1857—1936,右邊這個帥男人,英國著名統計學家、應用數學家、歷史學家、哲學家、倫理學家、民俗學家、宗教學家、優生學家、頭骨測量專家……名號比龍媽還多……)提出,並由在日本質量學者總結納入經典QC七大工具中。

直方圖可使我們比較容易直接看到數據的分布形狀、離散程度和位置狀況:

  • 觀察數據分布的類型,分析是否服從正態分布,有無異常;
  • 判斷數據分布范圍是否滿足規格范圍的要求;
  • 與產品規格界限做比較,判斷分布中心是否偏離規格中心,以確定是否需要調整及調整量;

但需要注意的是,雖然在過程能力分析中,我們常常利用直方圖整理數據用以分析其分布狀態,但有時根據觀測數據所繪制的直方圖呈非正態的異常分布。這說明過程已出現了異常。在這種狀態下,是不能計算過程能力指數的,必須先排查異常原因,予以排查糾正后,再重新收集數據並分析。

為什么不能計算,因為不受控了啊,計算Cp/Cpk的前提是過程處於統計受控狀態。🙃

另外注意直方圖不等同於柱狀圖,或者通俗說直方圖是特定規則生成的柱狀圖,不要將二者混為一談。(小聲逼逼,我寫這邊文章前收集了些資料,很多作者將Excel直接生成的柱狀圖稱作直方圖還出教程,害人不淺吶)

 


二、直方圖怎么做

1、前置條件

用於繪制直方圖的數據量n最好在100以上,如確實達不到,至少也應大於50。

2、數據源

假設對某產品的某質量特性進行測量,共得到如下60個數據。

138 138 138 145 134 130 139 131  134  137 
142 139 137 141 132 135  140 127  136  132 
148 144 137 135 135 135 141  136  137  131 
145 138 133 131 134 134 138  128  133  139 
140 139 140 136 132 136 137  138  121  136 
141 136 130 131 134 131 137 132  129  135 

 

3、確定數據極差R

顯而易見,最大值Max=148,最小值Min=121,極差R=148-121=27。

4、確定組數K

組數也就是直方圖上柱子的數量。合理的選擇分組數對於正確的使用直方圖非常重要。

分組過多會使柱子的高度參差波動,直方圖將是鋸齒型,甚至出現空檔,不易顯示其分布規律,而且計算量也會增加。分組過少則會掩蓋了組內數據可能的異常波動,直方圖過於寬平,對分布狀態反應不靈敏。

一般在6~20組之間較為合適。具體可以參照以下兩種方法,任選其一即可:

  A、中國質量協會注冊質量經理手冊中,推薦使用n的平方根。本例中,K= 60的平方根 = 7.7 ≈ 8。

  B、日常中也常用斯特奇斯(Sturges)提出的經驗公式K=1+lgn/lg2。按該公式,本例 K = 6.9 ≈ 7。

本次采用經驗公式,取組數為7。

5、確定組距H

有了組數,還要確定組距也就是柱子的寬度,這樣方能計算每根柱子該包含哪些數據。

組距的確定方法為 H=R/K=(148-121)/7=4

注意組距要取測量單位的整數倍,否則生成的直方圖會有鋸齒形的錯誤分布。如果計算出的組距不是測量單位的整數倍,則要上下調整圓整。當H向上圓整時,實際分組數K將比原選定的分組數小,當H向下圓整時,實際分組數將比原選定的分組數大,這並不影響直方圖形態和分析結論。

6、確定各組的界限

即每根柱子的起點和終點值。

一般第一組起點為:Min-最小測定單位/2。

本例中最小測定單位為1(因為你沒看到小數),所以起點為121-0.5=120.5。根據組距4,快速確定各組界限為:

  下限值 上限值
第一組 120.5 124.5
第二組 124.5 128.5
第三組 128.5 132.5
第四組 132.5 136.5
第五組 136.5 140.5
第六組 140.5 144.5
第七組 144.5 148.5

 

問:為什么要減去最小測定的單位/2?

答:因為不能讓測量的數和柱子的邊界相同啊,如果相同,放在哪個柱子上呢。

7、確定各組的頻數

也就是落在各組的數據的數量是多少。

各位就各顯神通去數吧,下篇文章簡單講下用Excel frequency函數和countifs函數快速確定頻數的方法。Minitab的做法暫不涉及了(別問為什么,問就是寫了這么多,懶了🤪)。

  下限值 上限值 頻數
第一組 120.5 124.5 1
第二組 124.5 128.5 2
第三組 128.5 132.5 12
第四組 132.5 136.5 18
第五組 136.5 140.5 19
第六組 140.5 144.5 5
第七組 144.5 148.5 3

 

8、畫圖

終於到最后一步了。以組距為底長,以頻數為高做圖。

因為直方圖除了看分布以外,還可確定分布的范圍是否在接受范圍(公差范圍)內,所以還需標注公差范圍(T)、樣本容量(n)、樣本平均值(x)、樣本標准偏差值(s)和x的位置等(我承認我又偷懶了,不標了,各位正式做圖的時候不能省略)。

另外為了圖表美觀,建議寬高比為2:3,強迫症患者歡迎取0.618。

 

 

到此結束,拜拜~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM