統計學——直方圖解析


直方圖(Histogram),又稱質量分布圖,是一種統計報告圖, 由一系列高度不等的縱向條紋或線段表示數據分布的情況。 一般用 橫軸表示數據類型,縱軸表示分布情況。
 
直方圖是數值數據分布的精確圖形表示。 這是一個連續變量(定量變量)的概率分布的估計,並且被卡爾·皮爾遜(Karl Pearson)首先引入。 它是一種條形圖。 為了構建直方圖,第一步是將值的范圍分段,即將整個值的范圍分成一系列間隔,然后計算每個間隔中有多少值。 這些值通常被指定為連續的,不重疊的變量間隔。 間隔必須相鄰,並且通常是(但不是必須的)相等的大小。
 
直方圖也可以被歸一化以顯示“相對”頻率。 然后,它顯示了屬於幾個類別中的每個案例的比例,其高度等於1。

 

步驟:
  (1)收集數據。作直方圖的數據一般應大於50個。
  (2)確定數據的極差(R)。用數據的最大值減去最小值 求得。
  (3)確定組距(h)。先確定直方圖的組數,然后以此組數去除極差,可得直方圖每組的寬度,即組距。組數的確定要適當。組數太少,會引起較大計算誤差;組數太多,會影響數據分組規律的明顯性,且計算工作量加大。
  (4)確定各組的界限值。為避免出現數據值與組界限值重合而造成頻數據計算困難,組的界限值單位應取最小測量單位的1/2。分組時應把數據表中最大值和最小值包括在內。
  第一組下限值為:最小值-0.5;
  第一組上限值為:第一組下限值加組距;
  第二組下限值就是第一組的上限值;
  第二組上限值就是第二組的下限值加組距;
  第三組以后,依此類推定出各組的組界。
  (5)編制頻數分布表。把多個組上下界限值分別填入頻數分布表內,並把數據表中的各個數據列入相應的組,統計各組頻數據(f )。
  (6)按數據值比例畫出橫坐標。
  (7)按頻數值比例畫縱坐標。以觀測值數目或百分數表示。
  (8)畫直方圖。按縱坐標畫出每個長方形的高度,它代表取落在此長方形中的數據數。(注意:每個長方形的寬度都是相等的。)在直方圖上應標注出公差范圍(T)、樣本容量(n)、樣本平均值(x)、樣本標准偏差值(s)和x的位置等。
 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM