前言
為什么要研究離散型隨機變量和其分布列?
相關概念
- 隨機變量
隨着試驗結果變化而變化的變量稱為隨機變量。常用字母\(X\),\(Y\),\(\xi\),\(\eta\)等表示。
- 離散型隨機變量
所有取值可以一一列出的隨機變量稱為離散型隨機變量。
- 連續型隨機變量
所有取值在某個區間的隨機變量稱為連續型隨機變量,比如某種電子產品的使用壽命\(X\),可以取\([0,b]\)或\([0,+\infty)\)內的一切值。
- 離散型隨機變量的分布列
一般地,若離散型隨機變量\(X\)可能取的不同值為\(x_1\),\(x_2\),\(\cdots\),\(x_i\),\(\cdots\),\(x_n\),\(X\)取每一個值\(x_i(i=1,2,…,n)\)的概率為\(P(X=x_i)=p_i\),則表
稱為離散型隨機變量\(X\)的概率分布列,簡稱為\(X\)的分布列,有時為了簡單起見,也用等式\(P(X=x_i)=p_i\),\(i=1,2,\cdots,n\)表示\(X\)的分布列。
- 離散型隨機變量的均值
稱為離散型隨機變量\(X\)的均值或數學期望,其刻畫的是離散型隨機變量\(X\)取值的平均水平。
它和\(\bar{x}=\cfrac{x_1+x_2+\cdots+x_n}{n}\)是一致的嗎?
一致的,上述的概念實質是\(x_i\)加權平均值。
- 離散型隨機變量的方差
為隨機變量\(X\)的方差,它刻畫了隨機變量\(X\)與其均值\(E(X)\)的平均偏離程度,其算術平方根\(\sqrt{D(X)}\)為隨機變量\(X\)的標准差.
它和\(s^2=\cfrac{1}{n}[(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots+(x_{n}-\bar{x})^2]\)的定義是一致的嗎?一致的,上述的概念實質是\((x_i-E(X))^2\)的加權平均值。
相關性質
- 離散型隨機變量的均值
對比:如果數據\(x_1\),\(x_2\),\(\cdots\),\(x_n\)的平均數為\(\bar{x}\),則數據\(ax_1+b\),\(ax_2+b\),\(\cdots\),\(ax_n+b\)的平均數為\(a\bar{x}+b\);
- 離散型隨機變量的方差
對比:如果數據\(x_1\),\(x_2\),\(\cdots\),\(x_n\)的方差為\(s^2\),則數據\(ax_1+b\),\(ax_2+b\),\(\cdots\),\(ax_n+b\)的方差為\(a^2\cdot s^2\);
常見分布列
- 兩點分布
若隨機變量的分布列為
則稱\(X\)服從兩點分布,也稱為“0-1”分布,並稱\(p=P(X=1)\)為成功概率,當然其中的“成功”只是個抽象的說法。兩點分布是二項分布的特例,在二項分布中,當\(n=1\)時,即為兩點分布;此時\(E(X)=1\times p=p\),\(D(X)=1\cdot p\cdot (1-p)=p(1-p)\);
- 超幾何分布
一般的,在含有\(M\)件次品的\(N\)件產品中,任取\(n\)件,其中恰有\(X\)件次品,則\(P(X=k)=\cfrac{C_M^k\cdot C_{N-M}^{n-k}}{C_N^n}\),(\(k=0,1,2,\cdots,m\)),其中\(m=min\{M,n\}\),且\(n\leq N\),\(M\leq N\),\(n\),\(M\),\(N\in N^*\),稱這樣的分布列為超幾何分布列,如果隨機變量\(X\)的分布列具有下表的形式,則稱隨機變量\(X\)服從超幾何分布。
如果\(X\)服從參數為\(n\),\(M\),\(N\),記作\(X\sim H(n,M,N)\),(超幾何分布),其數學期望\(E(X)=\cfrac{nM}{N}\)。
- 二項分布
一般的,在\(n\)次獨立重復試驗中,設事件\(A\)發生的次數為\(X\),每次試驗中事件\(A\)發生的概率為\(p\),則事件\(A\)恰好發生\(k\)次的概率為\(P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k}\),(\(k=0,1,2,\cdots,n\)),此時稱隨機變量\(X\)服從二項分布,記為\(X\sim B(n,p)\),並稱\(p\)為成功概率。
解釋:二項展開式\([p+(1-p)]^n\)中,事件\(A\)發生\(k\)次,即對應展開式中的含\(p^k\)的項,其為\(C_n^k\cdot p^k\cdot C_{n-k}^{n-k}\cdot (1-p)^{n-k}\),即\(P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k}\),
若隨機變量\(X\)服從二項分布,記為\(X\sim B(n,p)\),則\(E(X)=np\),\(D(X)=np(1-p)\);
典例剖析
- 考點:離散型隨機變量的分布列的應用
甲乙兩名學生參加考試,隨機變量\(x\)代表通過的學生數,其分布列為

那么這兩個人各自通過考試的概率的最小值為【】
分析:先令甲乙分別通過考試為為事件\(A\)和\(B\),這兩個人各自通過考試的概率,即意味着我們需要分別求解\(P(A)\)和\(P(B)\),
再分析給定的分布列,當\(x=0\)時,即兩個人都沒有通過考試,當\(x=2\)時,即兩個人都通過了考試。故求解如下:
解:令甲乙分別通過考試為為事件\(A\)和\(B\),則事件\(A\)和\(B\),\(\bar{A}\)和\(B\),\(A\)和\(\bar{B}\),\(\bar{A}\)和\(\bar{B}\)之間都是相互獨立的,
故有\([1-P(A)][1-P(B)]=\cfrac{1}{3}\),\(P(A)\cdot P(B)=\cfrac{1}{6}\),解方程得到
\(P(A)=\cfrac{1}{2}\),\(P(B)=\cfrac{1}{3}\),或\(P(A)=\cfrac{1}{3}\),\(P(B)=\cfrac{1}{2}\),
故這兩個人各自通過考試的概率的最小值為\(\cfrac{1}{3}\),故選\(B\)。
- 考點:離散型隨機變量的均值應用
分析:這種解法的算理是錯誤的,因為每一種時間的概率不是相等的,如時間為25分鍾的概率為0.2,時間為35分鍾的概率為0.4,故這種算法錯誤。
已知2件次品和3件正品混放在一起,現需要通過檢測將其區分,每次隨機檢測一件產品,檢測后不放回,直到檢測出2件次品或檢測出3件正品時檢測結束。
(1)求第一次檢測出的是次品且第二次檢測出的是正品的概率。
(2)已知每檢測一件產品需要費用100元,設\(X\)表示直到檢測出2件次品或者檢測出3件正品時所需要的檢測費(單位:元),求\(X\)的分布列和數學期望。
方法1:利用排列數公式和古典概型求解;
(1)\(P=\cfrac{A_2^1A_3^1}{A_5^2}=\cfrac{3}{10}\)
(2)先設檢測過的產品數為\(x\),則由題目可知\(x=2,3,4\)
其中\(x=2\)時對應“次次”一種;
其中\(x=3\)時對應“正次次、次正次、正正正”三種;
其中\(x=4\)時對應“正次正次、正正次次、次正正次、次正正正、正正次正、正次正正”六種;
故\(X\)的所有可能取值為\(200,300,400\),(注意:由於是無放回的,故有順序,故用排列而不是組合)
\(P(X=200)=\cfrac{A_2^2}{A_5^2}=\cfrac{1}{10}\),
\(P(X=300)=\cfrac{A_3^3+C_2^1\cdot C_3^1\cdot C_1^1+C_3^1\cdot A_2^2}{A_5^3}=\cfrac{3}{10}\),
\(P(X=400)=1-P(X=200)-P(X=300)=\cfrac{6}{10}\),
故\(X\)的分布列為
\(E(X)=200\times \cfrac{1}{10}+300\times \cfrac{3}{10}+400\times \cfrac{6}{10}=350\)
方法2:利用相互獨立事件求解;
(1)第一次檢測出的是次品且第二次檢測出的是正品的概率為\(P=\cfrac{2}{5}\times \cfrac{3}{4}=\cfrac{3}{10}\)
(2)先設檢測過的產品數為\(x\),則由題目可知\(x=2,3,4\)
其中\(x=2\)時對應“次次”一種;
其中\(x=3\)時對應“正次次、次正次、正正正”三種;
其中\(x=4\)時對應“正次正次、正正次次、次正正次、次正正正、正正次正、正次正正”六種;
故\(X\)的所有可能取值為\(200,300,400\),
且\(P(X=200)=\cfrac{2}{5}\times \cfrac{1}{4}=\cfrac{1}{10}\),
\(P(X=300)=\cfrac{3}{5}\times \cfrac{2}{4}\times \cfrac{1}{3}+\cfrac{2}{5}\times \cfrac{3}{4}\times \cfrac{1}{3}+\cfrac{3}{5}\times \cfrac{2}{4}\times \cfrac{1}{3}=\cfrac{3}{10}\),
\(P(X=400)=1-P(X=200)-P(X=300)=\cfrac{6}{10}\)
詳解:\(P(X=400)=\cfrac{3}{5}\times \cfrac{2}{4}\times \cfrac{2}{3}\times \cfrac{1}{2}+\cfrac{2}{5}\times \cfrac{3}{4}\times \cfrac{2}{3}\times \cfrac{1}{2}+\cfrac{3}{5}\times \cfrac{2}{4}\times \cfrac{2}{3}\times \cfrac{1}{2}+\cfrac{2}{5}\times \cfrac{3}{4}\times \cfrac{2}{3}\times \cfrac{1}{2}+\cfrac{3}{5}\times \cfrac{2}{4}\times \cfrac{2}{3}\times \cfrac{1}{2}+\cfrac{3}{5}\times \cfrac{2}{4}\times \cfrac{2}{3}\times \cfrac{1}{2}=\cfrac{6}{10}\)
故\(X\)的分布列為
\(E(X)=200\times \cfrac{1}{10}+300\times \cfrac{3}{10}+400\times \cfrac{6}{10}=350\);
(1).求這一技術難題被攻克的概率。
分析:“這一技術難題被攻克”,意味着至少有一人攻克了技術難題,其對立面是“無人攻克”,
【法1】:間接法,正難則反,從對立事件入手分析求解,
\(P=1-(1-\cfrac{1}{4})\cdot (1-\cfrac{2}{5})\cdot (1-\cfrac{3}{4})=\cfrac{71}{80}\)
【法2】:直接法,仿上分析求解。
(2).若該技術難題未被攻克,上級不做任何獎勵;若該技術難題被攻克,上級會獎勵\(6\)萬元。獎勵規則如下:若只有一人攻克,則此人獲得全部獎金\(6\)萬元;若只有\(2\)人攻克,則此二人均分獎金,每人\(3\)萬元;若三人均攻克,則每人\(2\)萬元。在這一技術難題被攻克的前提下,設甲拿到的獎金數為\(X\),求\(X\)的分布列和數學期望。
分析:對甲而言,技術難題的攻克,可能僅僅甲沒有攻克而乙丙至少有一人攻克;或僅僅甲一人攻克;或甲和其他兩人攻克;或甲和其他三人攻克,
故\(X\)的所有可能取值為\(0\),\(2\),\(3\),\(6\),
\(P(X=0)=\cfrac{\frac{3}{4}\times [1-(1-\frac{2}{5})(1-\frac{3}{4})]}{\frac{71}{80}}=\cfrac{51}{71}\);\(X=0\)意味着“甲沒有攻克而乙丙至少有一人攻克”;
\(P(X=2)=\cfrac{\frac{1}{4}\times \frac{2}{5}\times \frac{3}{4}}{\frac{71}{80}}=\cfrac{6}{71}\);\(X=2\)意味着“甲乙丙三人都攻克”;
\(P(X=3)=\cfrac{\frac{1}{4}(\frac{3}{5}\times \frac{3}{4}+\frac{2}{5}\times \frac{1}{4})}{\frac{71}{80}}=\cfrac{11}{71}\);\(X=3\)意味着“甲乙攻克丙沒有攻克,或者甲丙攻克而乙沒有攻克”;
\(P(X=6)=\cfrac{\frac{1}{4}\times \frac{3}{5}\times \frac{1}{4}}{\frac{71}{80}}=\cfrac{3}{71}\);\(X=6\)意味着“只有甲攻克而乙丙都沒有攻克”;
故\(X\)的分布列,略;
\(E(X)=0\times \cfrac{51}{71}+2\times \cfrac{6}{71}+3\times\cfrac{11}{71}+6\times \cfrac{3}{71}=\cfrac{63}{71}\)(萬元)。