超幾何分布和二項分布


前言

二項分布與超幾何分布是兩個非常重要的、應用廣泛的概率模型,實際中的許多問題都可以利用這兩個概率模型來解決.在實際應用中,理解並區分兩個概率模型是至關重要的.下面舉例進行對比辨析.

一、概念辨析

  • 超幾何分布

一般的,在含有\(M\)件次品的\(N\)件產品中,任取\(n\)件,其中恰有\(X\)件次品,則事件\(\{X=k\}\)發生的概率為\(P(X=k)=\cfrac{C_M^k\cdot C_{N-M}^{n-k}}{C_N^n}\),(\(k=0,1,2,\cdots,m\)),其中\(m=min\{M,n\}\),且\(n\leq N\)\(M\leq N\)\(n\)\(M\)\(N\in N^*\),稱這樣的分布列為超幾何分布列,如果隨機變量\(X\)的分布列具有下表的形式,則稱隨機變量\(X\)服從超幾何分布。

如果\(X\)服從參數為\(n\)\(M\)\(N\)的超幾何分布,記作\(X\sim H(n,M,N)\),其數學期望\(E(X)=\cfrac{nM}{N}\)

  • 二項分布

一般的,在\(n\)次獨立重復試驗中,設事件\(A\)發生的次數為\(X\),每次試驗中事件\(A\)發生的概率為\(p\),則事件\(A\)恰好發生\(k\)次的概率為\(P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k}\),(\(k=0,1,2,\cdots,n\)),此時稱隨機變量\(X\)服從二項分布,記為\(X\sim B(n,p)\),並稱\(p\)為成功概率,稱\(1-p\)為失敗概率,當然成功和失敗只是抽象的說法。

解釋:二項展開式\([p+(1-p)]^n=1^n=1\)中,事件\(A\)發生\(k\)次,即對應展開式中的含\(p^k\)的項,其為\(C_n^k\cdot p^k\cdot C_{n-k}^{n-k}\cdot (1-p)^{n-k}\),即\(P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k}\)

若隨機變量\(X\)服從二項分布,記為\(X\sim B(n,p)\),則\(E(X)=np\)\(D(X)=np(1-p)\)

二、案例剖析

引例

袋中有8個白球、2個黑球,從中隨機地連續抽取3次,每次取1個球.求:

(1)有放回抽樣時,取到黑球的個數\(X\)的分布列;

(2)不放回抽樣時,取到黑球的個數\(Y\)的分布列.

解:(1)有放回抽樣時,取到的黑球數\(X\)可能的取值為0,1,2,3.

又由於每次取到黑球的概率均為\(\cfrac{2}{10}=\cfrac{1}{5}\),3次取球可以看成3次獨立重復試驗,

故隨機變量服從二項分布\(X\sim B\left(3,\cfrac{1}{5}\right)\),則有

\(P(X=0)=C_3^0(\cfrac{1}{5})^0(\cfrac{4}{5})^3=\cfrac{64}{125}\)

\(P(X=1)=C_3^1(\cfrac{1}{5})^1(\cfrac{4}{5})^2=\cfrac{48}{125}\)

\(P(X=2)=C_3^2(\cfrac{1}{5})^2(\cfrac{4}{5})^1=\cfrac{12}{125}\)

\(P(X=3)=C_3^3(\cfrac{1}{5})^3(\cfrac{4}{5})^0=\cfrac{1}{125}\)

則隨機變量\(X\)的分布列如圖所示。

<img src="https://images2018.cnblogs.com/blog/992978/201804/992978-20180403162251168-1958930523.png" width=25% height=25% / >

(2)不放回抽樣時,取到的黑球數\(Y\)可能的取值為0,1,2.

且有\(Y\sim H\left(10,3,2\right)\) \(\hspace{2cm}\) \(Y\sim H\left(N,n,M\right)\)

\(P(Y=0)=\cfrac{C_2^0C_8^3}{C_{10}^3}=\cfrac{7}{15}\)

\(P(Y=1)=\cfrac{C_2^1C_8^2}{C_{10}^3}=\cfrac{7}{15}\)

\(P(Y=2)=\cfrac{C_2^2C_8^1}{C_{10}^3}=\cfrac{1}{15}\)

則隨機變量\(Y\)的分布列如圖所示。

【感悟反思】:1、注意這兩個概率模型的區別和聯系,二項分布的典型例子就是一個熟練射手的\(n\)次射擊;超幾何分布的典型例子就是抽次品。

2、通過此例可以看出:有放回抽樣時,每次抽取時的總體沒有改變,因而每次抽到某物的概率都是相同的,可以看成是獨立重復試驗,此種抽樣是二項分布模型.而不放回抽樣時,取出一個則總體中就少一個,因此每次取到某物的概率是不同的,此種抽樣為超幾何分布模型.因此,二項分布模型和超幾何分布模型最主要的區別在於是有放回抽樣還是不放回抽樣.所以,在解有關二項分布和超幾何分布問題時,仔細閱讀、辨析題目條件是非常重要的.

三、如何區分

  • 超幾何分布的特征:

①考查對象分兩類,當然在具體題目中可能需要我們將數據人為分為兩類。

②已知各類對象的個數;

③從中抽取若干個個體,考查某類個體的個數\(X\)的概率分布;

④主要用於抽檢產品、摸不同類別的小球等概率模型,其實質是古典概型。

  • 二項分布的特征:

①每次試驗中,事件發生的概率是相同的;

②各次試驗中的事件是相互獨立的;

③每次試驗只有兩種結果:事件要么發生,要么不發生;

④隨機變量是這\(n\)次獨立重復試驗中事件發生的次數。

區別 :①超幾何分布需要知道總體的容量,而二項分布不需要;

②超幾何分布是不放回抽取,而二項分布是有放回抽取(獨立重復);

③由解題的實際經驗可得,題目中給定了概率的,基於概率計算的往往是二項分布;題目中給定了數字,基於數字計算概率的往往是超幾何分布。

聯系 : 超幾何分布和二項分布都是離散型分布,當總體的容量非常大時,超幾何分布近似於二項分布。

四、實例總結

  • 超幾何分布的常見實例

①10件產品中含有3件次品,從中任意取4件產品,所取出的次品件數服從超幾何分布;

②袋中有8紅球4白球,從中任意摸出5個球,摸出紅球個數服從超幾何分布;

③某班45個學生,女生20人,現從中選7人做代表,代表中所含女生的人數服從超幾何分布;

④15張卡片中含有5件寫有“獎”字,從中任意取3件產品,所取出的卡片中含有獎字的卡片張數服從超幾何分布;

⑤10位代表中有5位支持候選人\(A\),隨機采訪3人,其中支持候選人\(A\)的人數服從超幾何分布;

⑥盤中裝有10個粽子,豆沙粽2個,肉粽3個,白粽5個,從中任選3個,取到的豆沙粽的個數服從超幾何分布;

注意:在具體題目中,可能需要將上述的三類數據轉化為兩類數據:豆沙粽子和非豆沙粽子。

  • 二項分布的常見實例

①一個狙擊手連續射擊10次,每次中10環的概率都是0.98,則其擊中10環的次數服從二項分布;

②10個狙擊手各射擊1次,每人擊中10環的概率都是0.95,則其擊中10環的人數服從二項分布;

③拋擲\(n\)枚相同的骰子,\(X\)為出現點數為1的骰子數;則\(X\sim B(n,\cfrac{1}{6})\)

\(n\)個新生嬰兒,\(X\)為男嬰的個數,則\(X\sim B(n,\cfrac{1}{2})\)

⑤某產品的次品率為\(p\)\(X\)\(n\)個產品中的次品數,\(X\sim B(n,p)\)

⑥女性患色盲的概率為\(0.25\%\)\(X\)為任取\(n\)個女人中患色盲的人數,\(X\sim B(n,0.25\%)\)

⑦吊燈上並聯着5個燈泡,每個正常工作的概率都是0.7,則正常工作的燈泡數\(X\sim B(5,0.7)\)

⑧用戶購買100件某產品,該產品的質量指標值位於\((187.7,212.2)\)之間的概率都是\(0.6826\)\(X\)表示質量指標值位於\((187.7,212.2)\)之間的產品件數,則\(X\sim (100,0.6826)\)

⑨從該市學生中隨機選取5名學生,記\(\xi\)為身高在\((1.50,1.70)\)的學生人數,且身高在\((1.50,1.70)\)的頻率為\(0.7\),則\(\xi\sim (5,0.7)\)

五、典例剖析

例01 【2018陝西省第三次質量檢測數學理科第19題】

2018年春節期間,為了解市民對西安地鐵運營狀況的滿意度,分別從不同地鐵站點隨機抽取若干市民對其評分(滿分為100分,評分均為整數),繪制頻率分布直方圖,並將分數從低到高分為四個等級:

(1)若市民的滿意度評分相互獨立,以滿意度樣本估計全市市民滿意度。現從全市市民中隨機抽取了4人,估計這4人中至少有2人非常滿意的概率;

(2)在等級為不滿意市民中,老年人占比\(\cfrac{1}{3}\),現從該等級市民中按年齡分層抽取了15人了解不滿意的原因,並從中選取3人擔任整改督導員,記\(X\)為老年督導員的人數,求\(X\)的分布列和數學期望\(E(X)\).

(3)相關部門對西安地鐵運營狀況進行評估,評估的硬指標是:市民對西安地鐵運營狀況的滿意指數不低於0.8,否則需要整改,根據你所學的統計知識,判斷地鐵運營狀況能否通過評估,並說明理由。

(備注:滿意指數=\(\cfrac{滿意程度的平均分}{100}\))

【分析】:(1)首先由頻率分布直方圖計算得到\(a=0.025\),市民非常滿意的概率為\(0.025\times 10=0.25=\cfrac{1}{4}\)

注解:由題目可知市民的滿意度評分相互獨立,隨機抽取4人做調查,到此我們就可以理解相當於做了4次獨立重復試驗,每次試驗滿意概率為\(\cfrac{1}{4}\),不滿意概率為\(\cfrac{3}{4}\),這樣就只能考慮二項分布而不是超幾何分布了。

令滿意人數為\(X\),則\(X\sim B(4,\cfrac{1}{4})\),且\(P(X=k)=C_4^k\cdot (\cfrac{1}{4})^k\cdot (\cfrac{3}{4})^{4-k}\)\(k=0,1,2,3,4\)

故所求的概率即\(P=P(X=2)+P(X=3)+P(X=4)=\cfrac{67}{256}\)

\(P=1-P(X=0)-P(X=1)=1-C_4^0\cdot (\cfrac{1}{4})^0\cdot (\cfrac{3}{4})^{4}-C_4^1\cdot (\cfrac{1}{4})^1\cdot (\cfrac{3}{4})^{3}=\cfrac{67}{256}\).

(2)抽取的15中,老年人占\(15\times \cfrac{1}{3}=5\),其他人占10人,從中抽取3人擔任督導員,是無放回抽取,故容易理解是超幾何分布。

\(X\sim H\left(15,5,3\right)\)\(P(X=k)=\cfrac{C_5^kC_{10}^{3-k}}{C_{15}^3},k=0,1,2,3\)

\(P(X=0)=\cfrac{C_5^0C_{10}^{3}}{C_{15}^3}=\cfrac{24}{91}\)\(P(X=1)=\cfrac{C_5^1C_{10}^{2}}{C_{15}^3}=\cfrac{45}{91}\)

\(P(X=2)=\cfrac{C_5^2C_{10}^{1}}{C_{15}^3}=\cfrac{20}{91}\)\(P(X=3)=\cfrac{C_5^3C_{10}^{0}}{C_{15}^3}=\cfrac{2}{91}\)

分布列從略。

\(EX=0\times \cfrac{24}{91}+1\times\cfrac{45}{91}+2\times\cfrac{20}{91}+3\times\cfrac{2}{91}=1\)

(3)由頻率分布直方圖求平均數,得到,

\((45\times 0.002+55\times 0.004+65\times 0.014+75\times 0.02+85\times 0.035+95\times 0.025)\times 10=80.7\)

即市民滿意度的平均分為\(80.7\),滿意度指數為\(\cfrac{80.7}{100}=0.807>0.8\)

即地鐵運營狀況能夠通過驗收。

例02 【2019屆鳳中理科月考1第18題】

高一某班有\(6\)\(4\)女參加心理社,在這\(10\)名同學中,有\(4\)名同學初中畢業於同一個學校,其余\(6\)名同學都畢業於其他\(6\)所不同的學校,現從這\(10\)名同學中隨機抽取\(4\)名同學參加某活動(每位同學被選到的概率都相同)。

(1)求選出的\(4\)名同學初中畢業於不同學校的概率;

分析:從\(10\)名同學中任取\(4\)名同學,共有\(C_{10}^4\)種等可能的結果,故屬於古典概型,

令“選出的4人初中畢業於不同學校”為事件\(A\)

【法1】直接法,從正面求解,選出的4人的畢業學校全不相同,

\(P(A)=\cfrac{C_{4}^0 \cdot C_{6}^4+C_{4}^1 \cdot C_{6}^3 }{C_{10}^4}=\cfrac{80+15}{210}=\cfrac{19}{42}\)

【法2】間接法,從反面求解,選出的4人的畢業學校不全相同,

\(P(A)=1-\cfrac{C_{4}^4 \cdot C_{6}^0+C_{4}^3 \cdot C_{6}^1+C_{4}^2 \cdot C_{6}^2 }{C_{10}^4}=\cfrac{19}{42}\)

(2)設\(X\)為選出的\(4\)名同學中的女同學,求隨機變量\(X\)的分布列和數學期望;

分析:隨機變量\(X\)的所有可能取值為\(0,1,2,3,4\),則其服從超結合分布,

\(P(X=k)=\cfrac{C_{4}^k \cdot C_{6}^{4-k}}{C_{10}^4}\),(\(k=0,1,2,3,4\))

則有\(P(X=0)=\cfrac{C_{4}^0 \cdot C_{6}^4}{C_{10}^4}=\cfrac{15}{210}=\cfrac{1}{14}\)

\(P(X=1)=\cfrac{C_{4}^1 \cdot C_{6}^3}{C_{10}^4}=\cfrac{4\times 20}{210}=\cfrac{8}{21}\)

\(P(X=2)=\cfrac{C_{4}^2 \cdot C_{6}^2}{C_{10}^4}=\cfrac{6\times 15}{210}=\cfrac{3}{7}\)

\(P(X=3)=\cfrac{C_{4}^3 \cdot C_{6}^1}{C_{10}^4}=\cfrac{24}{210}=\cfrac{4}{35}\)

\(P(X=4)=\cfrac{C_{4}^4 \cdot C_{6}^0}{C_{10}^4}=\cfrac{1}{210}\)

故分布列如下,現略;

期望\(EX=0\times \cfrac{1}{14}+1\times \cfrac{8}{21}+2\times \cfrac{3}{7}+3\times \cfrac{4}{35}+4\times \cfrac{1}{210}=\cfrac{8}{5}\)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM