拋硬幣直到連續若干次正面

本文轉載自查看原文 2012-10-19 17:29 2838 概率統計/ 遞推/ 概率

1. 問題描述

連續拋一枚硬幣，連續出現若干次正面即停止，求所拋總次數的期望。

2. 求解期望

記硬幣出現正面的概率為$p$，停止條件中連續出現正面的次數為$n$，所拋總次數的期望為$\mu_n$。考慮如下情形：首次出現連續$n-1$次正面，此時所拋總次數的期望為$\mu_{n-1}$。再拋一次，結果有且只有一下兩種：

A. 出現正面，則滿足停止條件，所拋總次數的期望為$\mu_{n-1}+1$
B. 出現反面，則立即回到初始狀態，相當於從0開始再拋出$n$次連續正面，因此總次數的期望為$\mu_{n-1}+1+\mu_n$。A、B兩種情況的概率分別為$p,1-p$。因此有

$$\begin{equation} \label{munAB} \mu_n=p(\mu_{n-1}+1)+(1-p)(\mu_{n-1}+1+\mu_n) \end{equation}$$

得

$$\begin{equation} \label{munDev} \mu_n=\frac{1}{p}(\mu_{n-1}+1) \end{equation}$$

展開，得通項公式

$$\begin{equation} \label{} \end{equation}$$

$$\begin{equation} \label{munGen} \mu_n=\frac{s(1-s^n)}{1-s}, \quad s=\frac{1}{p} \end{equation}$$

特別的，對於一枚均勻硬幣，$p=1/2$，因此$\mu_n=2^{n+1}-2$。

3. 概率計算

進一步考慮該問題，嘗試求解連續拋出$n$次正面時，所拋總次數為$m$的概率$P(n,m)$。顯然，

$$P(n,m)=0 \quad m<n \\ P(0,m)=\left\{ \begin{array}{P0m} 1 & m=0 \\ 0 & m \ge 1 \end{array} \right. $$

依然考慮第2節中的兩種情況。

對於A，在首次連續出現$n-1$次正面的情況下，再拋一次出現正面，滿足停止條件，因此需要前面總共拋了$m-1$次，這一概率為$P(n-1,m-1)$。
對於B，設首次連續出現$n-1$次正面時，已經拋了$k$次，再拋一次出現反面，立即回到初始狀態，因此，要滿足總次數為$m$，需要在后續的步驟里，恰好用$m-k-1$次拋出$n$次連續正面。因此B情況下的條件概率為$\sum_{k}P(n-1,k)P(n,m-k-1)$。

由全概率公式，得

$$\begin{equation} \label{PnmDev} P(n,m)=pP(n-1,m-1)+(1-p)\sum_{k}P(n-1,k)P(n,m-k-1) \end{equation}$$

實際上，可以由$P(n,m)$的遞推式($\ref{PnmDev}$)得出$\mu_n$的遞推式($\ref{munDev}$)。依據期望的定義

$$\mu_n=\sum_{m}mP(n,m) \\ =p\sum_{m}mP(n-1,m-1)+(1-p)\sum_{m}\sum_{k}mP(n-1,k)P(n,m-k-1) $$

第一項中的求和式可以寫成

$$\sum_{m-1}(m-1+1)P(n-1,m-1)=\sum_{m-1}(m-1)P(n-1,m-1)+\sum_{m-1}P(n-1,m-1) \\ =\mu_{n-1}+1$$

第二項中的求和式可以寫成

$$\sum_{m}\sum_{k}(k+1+m-k-1)P(n-1,k)P(n,m-k-1) \\ =\sum_k kP(n-1,k)\sum_m P(n,m-k-1) + \sum_k P(n-1,k)\sum_m P(n,m-k-1) + \sum_k \sum_m (m-k-1)P(n-1,k)P(n,m-k-1) \\ = \mu_{n-1}+1+\mu_{n}$$

可證。

4. 數值結果

根據$P(n,m)$的遞推式($\ref{PnmDev}$)，寫出對應的Matlab程序如下。

N = 6;    % numbers of continuous positive in stop conditions
M = 3000; % total times when stop condition satisfied
p = 1/2;  % probability of positive

% Initial Conditions. P is a matrix in size of N+1,M+1 and the element 
% with index n+1,m+1 stands for P(n,m) because there are no index 0. P = zeros(N+1,M+1);
P(1,1) = 1;
% Iteration
for nn = 1:N
    for mm = 1:M
        tmp = 0;
        for kk = nn-1:mm-nn-1
             tmp = tmp + P(nn-1+1,kk+1)*P(nn+1,mm-kk-1+1);
        end
        P(nn+1,mm+1) = P(nn-1+1,mm-1+1)*p + tmp*(1-p);
    end
end
P=P(2:end,2:end)';  % get rid of P(0,m) & P(n,0)
semilogy(P); % no plot of P(0,m)
disp(['Check the sum of probability:']);
disp(sum(P));
disp(['Compute the expectation of total times:']);
disp((1:M)*P);

為了產生直觀的印象，對$p=1/2$的情況計算前面幾項的結果。計算$N=3,M=16$，作出$P(n,m)$的半對數圖如下。

為了驗證$\sum_{m}P(n,m)=1$，以及根據此概率求期望$\sum_{m}mP(n,m)$，將$N,M$增大至$6,5000$。程序輸出為

Check the sum of probability:
    1.0000    1.0000    1.0000    1.0000    1.0000    1.0000

Compute the expectation of total times:
    2.0000    6.0000   14.0000   30.0000   62.0000  126.0000

顯然，驗證了概率之和為1。另外，容易驗證所求出的期望與$\mu_n$的通項公式($\ref{munGen}$)給出的結果是一致的。

5. 模擬驗證

使用Mote Carlo模擬的方法對這一問題進行仿真，代碼如下

len = 2e8;   % length of random numbers
N = (1:6)';  % numbers of continuous positive in stop conditions

for pp = 1:length(N)
    res = rand(len,1)>0.5;    % uniform distribution, >0.5 stands for positive
    
    currTotalTime = 0; % total times when stop condition satisfied
    contPosCntr = 0;   % continuous positive appears
    numExper = 0;
    totalTimeRcd = nan(len,1);
    for ii = 1:len
        currTotalTime = currTotalTime+1;
        if (res(ii))
            contPosCntr = contPosCntr+1;
        else
            contPosCntr = 0;
        end

        if (contPosCntr>=N(pp))
            numExper = numExper+1;
            totalTimeRcd(numExper) = currTotalTime;
            contPosCntr = 0;
            currTotalTime = 0;
        end
    end

    meanT = mean(totalTimeRcd(1:numExper));
end

結果如下：

N=1: 2.000015
N=2: 6.000249
N=3: 14.001627
N=4: 29.985933
N=5: 62.000438
N=6: 126.052749

與理論結果一致。

6. 附注

該問題還有其他表現形式，如：

有一個通關游戲，設每關所需的時間固定為1，而通關概率為p。如果某關失敗，則必須重新從第一關打起。問通關的平均時間。

這類問題本質上是一致的，都可以歸結為在一系列連續實驗中，首次連續出現n次成功的平均時間。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 拋硬幣直到連續若干次正面的概率模擬拋硬幣（C語言實現） python實現簡單隨機模擬——拋呀拋硬幣貝葉斯分析：拋硬幣的概率真的是1/2嗎將硬幣分成兩堆，每堆正面朝上的硬幣個數相同用 Python 和 C++ 實現拋硬幣實驗數據的統計用java通過鍵盤輸入若干個int，直到輸入#結束 2、牛牛想對一個數做若干次變換，直到這個數只剩下一位數字。變換的規則是：將這個數變成所有位數上的數字的乘積。比如285經過一次變換后轉化成2*8*5=80. 問題是，要做多少次變換，使得這個數變成個位 [面試題]12枚硬幣，其中有一枚硬幣重量與其他硬幣不同，請問最多稱3次如何求出問題硬幣筆試題--給定若干種硬幣的面值和一個總金額，寫一個函數計算不同的組合種類數量，要求每種面值硬幣組合的金額都是給定的金額。每種面值的硬幣數量都無上限。