聲明
本文基於人教版高中數學選修 2-3,本中隨機變量均為離散型隨機變量。
本文中 \(\displaystyle\sum_x\) 為 \(\displaystyle\sum_{x \in Range(X)}\)(\(Range(X)\) 表示隨機變量 \(X\) 可能的取值的集合)的簡寫。
期望
期望的線性性質
\[\boxed{E(aX+b) = aE(X)+b} \]
課本上就有,證明略。
公式 1
\[\boxed{E(X+Y)=E(X)+E(Y)} \]
證明
\[\begin{aligned} E(X+Y) &=\sum_{x} \sum_{y}(x+y) P(X=x, Y=y) \\ &=\sum_{x} \sum_{y} x P(X=x, Y=y)+\sum_{x} \sum_{y} y P(X=x, Y=y) \\ &=\sum_{x} x \sum_{y} P(X=x, Y=y)+\sum_{y} y \sum_{x} P(X=x, Y=y) \\ &=\sum_{x} x P(X=x)+\sum_{y} y P(Y=y) \\ &=E(X)+E(Y) \end{aligned} \]
公式 2
在 \(X,Y\) 相互獨立的情況下,有
\[\boxed{E(XY)=E(X)E(Y)} \]
證明
由 \(X,Y\) 相互獨立知 \(P(X=x,Y=y)=P(X=x)P(Y=y)\)
所以
\[\begin{aligned} E(XY) &=\sum_{x} \sum_{y} xy P(X=x, Y=y) \\ &=\sum_{x} \sum_{y} xy P(X=x)P(Y=y) \\ &=\sum_{x} x P(X=x)\sum_{y} yP(Y=y) \\ &=\sum_{x} x P(X=x)E(Y) \\ &=E(Y)\sum_{x} x P(X=x) \\ &=E(X)E(Y) \end{aligned} \]
方差
定義
\[\boxed{D(X)=\sum_x (x-E(X))^2 P(X=x)} \]
換種寫法
\[\boxed{D(X)=E(x-E(X))^2} \]
再換種寫法
\[\begin{aligned} D(X) &= E[X-E(X)]^2 \\ &=E[X^2-2X\cdot E(X)+(E(X))^2] \\ &=E(X^2)-2E(X)E(X)+(E(X))^2 \\ &=E(X^2)-(E(X))^2 \end{aligned} \]
即
\[\boxed{D(X)=E(X^2)-(E(X))^2 } \]
公式 1
\[\boxed{D(aX+b) = a^2D(X)} \]
課本上就有,證明略。
公式 2
在 \(X,Y\) 相互獨立的情況下,有
\[\boxed{D(X+Y)=D(X)+D(Y)} \]
證明
\[\begin{aligned} D(X+Y) &= E{(X+Y)^2 - (E(X+Y))^2} \\ &= E{(X^2+Y^2+2XY) - (E(X)+E(Y))^2} \\ &= E(X^2 - E^2(X)) + E(Y^2 - E^2(Y))+ E(2XY) - 2E(X) E(Y) \\ &= D(X) + D(Y) + 0 \end{aligned} \]
即:\(D(X+Y) = D(X) + D(Y)\)
超幾何分布
定義
\(N\) 個物品中有 \(M\) 個次品,超幾何分布描述了在這 \(N\) 個樣本中選 \(n\) 個,其中有 \(k\) 個次品的概率。
\[P(X = k) = \frac{C_M^k C_{N - M}^{n - k}}{C_N^n} \]
若隨機變量 \(X\) 服從參數為 \(n, M, N\) 的超幾何分布,則記為
\[x \sim H(n, M, N) \]
期望
若 \(x \sim H(n, M, N)\),則
\[\boxed{E(X) = \frac{nM}{N}} \]
證明
引理 1
由組合數公式可以得到 \(k \cdot C_M^k = M \cdot C_{M - 1}^{k - 1}\)
引理 2
由組合數公式可以得到 \(C_{N}^n = \dfrac Nn \cdot C_{N - 1}^{n - 1}\)
引理 3
由超幾何分布概率和為 \(1\),即 \(\displaystyle \sum_{k=0}^m P(X=k) = \sum_{k = 0}^m \frac{C_M^k C_{N - M}^{n - k}}{C_N^n} = 1\)
可得 \(\displaystyle\sum_{k = 0}^m C_M^k C_{N - M}^{n - k} = C_N^n\)
推導過程
\[\begin{aligned} E(x) &= \sum_{k = 0}^m k * \frac{C_M^k * C_{N - M}^{n - k}}{C_N^n} \\ &=\frac{1}{C_N^n} \sum_{k = 0}^m k C_M^K * C_{N - M}^{n - k}\\ &=\frac{1}{C_N^n} \sum_{k = 1}^m M C_{M - 1}^{k - 1} C_{N - M}^{n - k}\\ &=\frac{M}{C_N^n} \sum_{k = 1}^m C_{M - 1}^{k - 1}C_{N - M}^{n - k}\\ &=\frac{M}{C_N^n} C_{N - 1}^{n - 1} \\ &=\frac{nM}{N} \end{aligned} \]
方差
\[D(x) = {n(\frac{M}{N})(1-\frac{M}{N})(N-n) \over (N-1)} \]
二項分布
定義
二項分布(Binomial distribution)是 \(n\) 個 獨立重復試驗中成功的次數的離散概率分布,其中每次試驗的成功概率為 \(p\)。這樣的單次成功/失敗試驗又稱為 伯努利試驗。
實際上,當 \(n = 1\) 時,二項分布就是兩點分布。
一般地,如果隨機變量 \(X\) 服從參數 \(n\) 和 \(p\) 的二項分布,我們記 \(x \sim b(n, p)\) 或 \(X \sim B(n, p)\). \(n\) 次試驗中正好得到 \(k\) 次成功的概率為
\[P(x = k) = C_n^k \ p^k \ (1-p)^{n- k} \]
期望
若 \(X\sim B(n,p)\),則
\[\boxed{E(x) = np} \]
證明
簡單的證明
記
\[x_i = \begin{cases} 1 & \text{第 $i$ 次試驗成功}\\ 0 & \text{第 $i$ 次試驗不成功} \end{cases} \]
顯然 \(E(x_i)=p\)
由於 \(X=x_1+x_2+\cdots+x_n\),根據期望的線性性質,
\(E(X) = E(x_1) + E(x_2) + \cdots + E(x_n) = np\)
復雜的證明
記 \(q = 1-p\),那么
\[\begin{aligned} E(X) &= \sum_{k=0}^n k P(X=k)\\ &= \sum_{k=0}^n k C_{n}^{k}p^kq^{n-k} \\ &= \sum_{k=1}^n k C_{n}^{k}p^kq^{n-k} \\ &= p\sum_{k=1}^n nC_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)}\\ &= np\sum_{k=1}^n C_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)} \\ &= np\cdot (p+q)^{n-1} \qquad \text{(二項式定理)}\\ &= np \end{aligned} \]
方差
\[\boxed{D(x) = np(1 - p)} \]
證明
簡單的方法
類似於期望的那種證明方法。
復雜的方法
\[\begin{aligned} D(X) &=\sum_{k=0}^{n}\left[k-E(X)\right]^{2} \cdot p_{k}=\sum_{k=0}^{n}(k-n p)^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\ &=\sum_{k=0}^{n} k^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n}-2 n p k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n} n^{2} p^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\ &=\sum_{k=0}^{n}(k-1) \cdot k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n} k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}-2 n p \sum_{k=0}^{n} k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\ &+n^{2} p^{2} \sum_{k=0}^{n} \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\ &=\sum_{k=1}^{n}(k-1) \cdot k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+n p-2 n p \cdot n p+n^{2} p^{2} \\ &=n \sum_{k=2}^{n}(k-1) \cdot \mathrm{C}_{n-1}^{k-1} p^{k} q^{n-k}+n p-n^{2} p^{2} \\ &=n(n-1) p^{2} \sum_{k=2}^{n} \mathrm{C}_{n-2}^{k-2} p^{k-2} q^{(n-2)-(k-2)}+n p-n^{2} p^{2} \quad(\text{令} k-2=i) \\ &=n(n-1) p^{2} \sum_{i=0}^{n-2} \mathrm{C}_{n-2}^{i} p^{i} q^{(n-2)-i}+n p-n^{2} p^{2} \\ &=n(n-1) p^{2}+n p-n^{2} p^{2} \\ &=n p q \end{aligned} \]