0x00 概述
主要介紹以下三種相互關聯的概率分布:
# 離散型隨機變量的概率分布:二項分布,柏松分布 # 連續性隨機變量的概率分布:正態分布。
0x01 二項分布
滿足條件:
''' 1)每次試驗中事件只有兩種結果:事件發生或者不發生,如硬幣正面或反面,患病或沒患病; 2)每次試驗中事件發生的概率是相同的,每次拋硬幣正面和反面的概率都為0.5;每次投籃命中率都為0.6等等。 3)n次試驗的事件相互之間獨立。 '''
特征:
''' 1,當p較小且n不大時,分布是偏倚的。但隨着n的增大,分布逐漸趨於對稱。 2,當p約等於1-p,且n趨近於無窮大時,二項分布的極限分布為正態分布。當p很小,且n很大時,二項分布的極限分布為柏松分布 '''
概率分布函數為:
也為
若隨機變量滿x(或者k)=0,1,2,3,....滿足該分布函數,則稱隨機變量x(或者k)服從參數為n和p的二項分布,記為:x(k)~B(n, p)。
''' 應用:判斷n次獨立重復事件中成功或者失敗次數為k的概率,其中成功的概率為p,失敗的概率為1-p。 '''
0x02 柏松分布
由二項分布推導而來。柏松分布是二項分布的極限情況,即二項分布的伯努利試驗中,如果試驗次數n很大,二項分布的概率p很小,且乘積λ= np比較適中,則事件出現的次數的概率可以用泊松分布來逼近。
推導例子:如下圖,
滿足條件:
''' a, 事件發生為小概率事件 b, 事件獨立發生 c, 事件發生的概率穩定 '''
特征:
1,柏松分布的一大特征為平均數等於方差等於lamda,即 。
2,是柏松分布的唯一參數,當大於等於20時,接近於正態分布,可以用正態分布來處理柏松分布問題。
概率分布函數為:
若隨機變量滿x(或者k)=0,1,2,3,....滿足該分布函數,則稱隨機變量x(或者k)服從參數為lamda的柏松分布,記為:x(k)~P()。
''' 應用:觀察事物平均發生次的條件下,實際發生k次的概率P。 '''
0x03 正態分布
正態分布是一種重要的連續隨機變量的概率分布。中心極限定理表明,在觀測數據非常大的時候,具有獨立分布的獨立隨機變量的觀測樣本的平均值是收斂於正態分布的。
不少隨機變量的概率分布在一定條件下以正太分布為極限分布,如二項分布和柏松分布(見上文)。
滿足條件:
''' 隨機變量受到若干獨立因素共同影響,且每個因素不能產生支配性的作用。 '''
特征:
''' 1,正態分布是關於x = μ對稱的。 2,正態分布曲線有兩個拐點,分別在離均值一個標准差的位置,為x=μ-σ和x=μ+σ。 3,對於任意的正態偏差X,Z = ( X - μ ) / σ是一個標准正態偏差。 4,對於特定的期望值和方差,正態分布是具有最大熵的連續分布。 5,由於對於離期望值好幾個標准差范圍之外的取值,它們的概率趨近於0。 6,正態分布概率的覆蓋范圍遵循68-95-99.7的規定,這個規定又稱為3-sigma規定。也就是說在距離均值一個標准差的范圍內的取值的概率大概是68%,在兩個標准差范圍大概是95,在三個標准差范圍大概是99.7%。 '''
概率分布函數為:
應用:
''' ⒈ 估計頻數分布 一個服從正態分布的變量只要知道其均數與標准差就可根據公式即可估計任意取值范圍內頻數比例。 ⒉ 制定參考值范圍 ⑴正態分布法 適用於服從正態(或近似正態)分布指標以及可以通過轉換后服從正態分布的指標。 ⑵百分位數法 常用於偏態分布的指標。表3-1中兩種方法的單雙側界值都應熟練掌握。 ⒊ 質量控制:為了控制實驗中的測量(或實驗)誤差,常以 作為上、下警戒值,以 作為上、下控制值。這樣做的依據是:正常情況下測量(或實驗)誤差服從正態分布。 ⒋ 正態分布是許多統計方法的理論基礎。檢驗、方差分析、相關和回歸分析等多種統計方法均要求分析的指標服從正態分布。許多統計方法雖然不要求分析指標服從正態分布,但相應的統計量在大樣本時近似正態分布,因而大樣本時這些統計推斷方法也是以正態分布為理論基礎的。 '''
0x04 轉載