統計與分布之伯努利分布與二項分布


目錄

前文列表

計數原理
組合與排列
統計與分布之高斯分布
統計與分布之泊松分布

伯努利分布

伯努利分布(Bernoulli Distribution),是一種離散分布,又稱為 “0-1 分布” 或 “兩點分布”。例如拋硬幣的正面或反面,物品有缺陷或沒缺陷,病人康復或未康復,此類滿足「只有兩種可能,試驗結果相互獨立且對立」的隨機變量通常稱為伯努利隨機變量。

對於伯努利隨機變量 X,如果使用 1 表示成功,其概率為 p(0<p<1);使用 0 表示失敗,其概率為 q=1-p。則可以稱伯努利隨機變量 X 服從參數為 p 的伯努利分布,其分布律為:

這里寫圖片描述

對於伯努利分布來說,其離散型隨機變量期望為:

E(x) = ∑x∗p(x) = 1∗p+0∗(1−p) = p

方差為:

D(x) = E(x^2)−(E^2)(x) = 12∗p−p2 = p(1−p)

二項分布

二項分布(Binomial Distribution)也是一種離散型概率分布,又稱為「n 重伯努利分布」。

首先看「n 重伯努利試驗」的定義:如果隨機變量序列 Xn(n=1, 2, …) 中的隨機變量均服從與參數為 p 的伯努利分布,那么隨機變量序列 Xn 就形成了參數為 p 的 n 重伯努利試驗。例如,假定重復拋擲一枚均勻硬幣 n 次,如果在第 i 次拋擲中出現正面,令 Xi=1;如果出現反面,則令 Xi=0。那么,隨機變量 Xn(n=1, 2, …) 就形成了參數為 1/2 的 n 重伯努利試驗。

可見,n 重伯努利試驗需滿足下列條件:

  • 每次試驗只有兩種結果,即 X=1,或 X=0
  • 各次試驗中的事件互相獨立,且 X=1 和 X=0 的概率分別為 p(0<p<1)q=1-p

n 重伯努利試驗的結果就是 n 重伯努利分布,即二項分布。反之,當 Xn(n=1) 時,二項分布的結果服從於伯努利分布。因為二項分布實際上是進行了 n 次的伯努利分布,所以二項分布的離散型隨機變量期望為 E(x)=np,方差為 D(x)=np(1-p) 。

需要注意的是,滿足二項分布的樣本空間有一個非常重要的性質,假設進行 n 次獨立試驗,滿足二項分布(每次試驗成功的概率為 p,失敗的概率為 1−p),那么成功的次數 X 就是一個參數為 n 和 p 的二項隨機變量,即滿足下述公式

P(X=k) = C(n, k) * p^k * (1-p)^(n-k)
  • X=k,試驗 n 次,成功的次數恰好有 k 次的隨機變量(事件)
  • C(n, k),表示從集合 n 中取出 k 個元素的組合數,結果為 n!/(k!*(n-k)!)

例如,小明參加雅思考試,每次考試的通過率 1/3,不通過率為 q=2/3。如果小明連續參加考試 4 次,那么恰好有兩次通過的概率是多少?
解析:因為每次考試只有兩種結果,通過或不通過,符合條件 (1);每次考試結果互相獨立,且概率不變,符合條件 (2)。滿足二項分布樣本,代入公式求解得概率為:C(4, 2)*(1/2)^2*(2/3)^(4-2) ≈ 8/27

二項分布概率直方圖

這里寫圖片描述

圖形特性:

  • 當 p=q 時,圖形是對稱的
  • 當 p≠q 時,圖形呈偏態,p<qp>q 的偏斜方向相反
  • 當 (n+1)p 不為整數時,二項概率 P(X=k) 在 k=(n+1)*p 時達到最大值
  • 當 (n+1)p 為整數時,二項概率 P(X=k) 在 k=(n+1)*p 和 k=(n+1)*p-1 時達到最大值

NOTE:當 n 很大時,即使 p≠q,二項分布概率直方圖的偏態也會逐漸降低,最終成為正態分布。也就是說,二項分布的極限情形即為正態分布,故當 n 很大時,二項分布的概率可用正態分布的概率作為近似值。那么 n 需要多大才可謂之大呢?
一般規定,當 p<qnp≥5,或 p>qnq≥5 時,這時的 n 就足夠大了,可以用正態分布的概率作為近似值。則正態分布參數 μ=np,σ^2=np(1-p)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM