計算頻數:
給定一個序列t:
hist = {}
for x in t:
hist[x] = hist.get(x,0)+1
得到的結果是一個將值映射到其頻數的字典。將其除以n即可把頻數轉換成頻率,這稱為歸一化:
n = float(len(t))
pmf = {}
for x, freq in hist.items():
pmf[x] = freq/n
繪制直方圖:
Vals, freqs = hist.Render()
rectangles = pyplot.bar(vals, freqs)
pyplot.show()
繪制概率質量函數:
采用柱狀圖,可以用pyplot.bar或myplot.Hist。如果Pmf中的值不多,柱狀圖就比較合適
采用折線圖,可以用pyplot.plot或者myplot.Pmf。如果Pmf中的值較多,且比較平滑,折線圖就比較合適。
*百分比差異圖
直觀顯示兩組數據的分布差異,詳見教材。
摘自《統計思維-程序員數學之概率統計》P15-P23