Excel繪制累積分布函數CDF(Cumulative Distribution Function)
https://www.pianshen.com/article/95711145637/
一、累積分布函數(Cumulative Distribution Function)
累積分布函數(Cumulative Distribution Function),又叫分布函數,是概率密度函數的積分,能完整描述一個實隨機變量X的概率分布。
一般以大寫CDF標記,與概率密度函數probability density function(小寫pdf)相對。
累計分布函數的特性:
①因為累計分布函數是計算x點左側的點的數量,所以累計分布函數CDF是單調遞增的。
②CDF並沒有直方圖變化劇烈,但是CDF包含了相同的信息,並且減少了噪聲。
③由於CDF不存在裝箱(分段),因此比直方圖能更好的展現數據。
④所有的CDF中,在x趨近最小值時,CDF趨近於0,當x趨近最大值時,CDF趨近與1(100%)
⑤對於給定的數據集,CDF是唯一的
在分析變量的分布情況時,累計分布函數非常有用。雖然excel沒有CDF的繪圖功能,但是了解CDF繪圖的原理后,就能利用散點圖功能繪制CDF。
二、繪制方法:
有如下數據,欲繪制變量X的累計分布函數。

三、步驟:
- 將變量X從小到大進行排序
- 計算變量X的分位數值。另取一列命名為“CDF“,查看有多少行數據(此處為底部數據行序號-1),比如200行數據,則在C2單元格中輸入“=1/200“,在C3單元格中輸入 “=C2+1/200“,將選中C3單元格雙擊,將函數運用於余下單元格,計算變量X的分位數。
- 繪圖,選中變量X和CDF兩列,選擇“插入-散點圖“,如下所示:

4. 調整X軸范圍,如果有outlier,可以調整變量X的范圍,不顯示outlier

完畢。
