《概率統計》1.理論基石:條件概率、獨立性與貝葉斯


從概率到條件概率

對於概率,相信大家都不會陌生,在各階段的數學課上,它都是高頻出現的常客,最簡單的概率場景比如擲骰子:第一次擲出的點數為 5 的概率為多大?你會毫不猶豫的說出答案:1/6。

這太簡單了。接下來我增加一個限定條件:已知在拋出骰子是奇數的情況下,拋擲點數為 5 的可能性有多大?

發現了沒有,在第二個問題中我就沒有直接地只問投擲出 5 這個事件的概率,而是增加了一個前提條件:這次拋擲出的點數為奇數。

生活中這類場景更多,我們一般不會直接去推斷一個事件發生的可能性,因為這樣實際意義並不明顯,而且也不容易推斷出結果。比如我問你今天下雨的概率是多大?你可能是一頭霧水,什么地點?什么月份?當日雲層的厚度?這些條件都沒有提供,這樣是無法給出一個有意義、有價值的合理推斷的。

而且在實際情況下,一個事件一般而言也不會是孤立的發生,它會伴隨着其他事情一同出現,單獨談一個事件的概率,一般而言也是不存在的。

因此,在實際的應用中,我們更關心的是條件概率,也就是在給定部分信息的基礎上對試驗結果的推斷。這些給定的信息就是我們附加的條件,是我們研究時關注的重點。這里,我們來具體描述一下條件概率:

假設我們知道給定事件 B 已經發生,在此基礎上希望知道另一個事件 A 發生的可能性,此時我們就需要構造出 條件概率,它需要先顧及事件 B 已經發生的信息,然后再求出事件 A 發生的概率。

這個條件概率描述的就是在給定事件 B 發生的情況下,事件 A 發生的概率,我們專門把它記作:P(A|B)。

那我們回到投擲骰子的問題中來,在投出奇數點數骰子的前提下,投出 5 的概率有多大?奇數點數一共有 {1,3,5} 三種,其中出現 5 的概率是 1/3。很明顯,和單獨問投出點數是 5 的概率計算結果是不同的。

條件概率表達式

先看一張圖:

我們做一個實驗,實驗的結果要么發生事件A、要么發生事件B,當然結果也可能既是事件A、又是事件B,這兩個事件之間存在交集。

然后我們做了N次實驗,其中有M1次發生了事件A、M2次發生事件B,M次兩個事件都發生。所以實際上總次數N=M1+M2-M,但是現在我問你,單純的事件A和事件B發生的概率是多少?你肯定會脫口而出:分別是M1/N、M2/N。那么再代入到條件概率中來,已知在事件B發生的前提下,事件A發生 的概率是多少呢?

首先我們要求的是事件A發生的前提是事件B發生,所以我們是在B發生的前提下計算A發生的概率,那么樣本總數就不再是N了,而是M2。而在事件B發生的前提下事件A再發生,那不就是兩者同時發生嗎?所以顯然總共出現了M次,那么答案就很明顯了。

在事件B發生的前提下,事件A發生的概率就是P(A|B) = M / M2

我們說上面的M和M2指的是發生的次數,我們可以進一步推導:

對於M / M2,我給分子分母同時除以一個初始的樣本總數N,所以P(A|B) = (M / N) / (M2 / N) = P(AB) / P(B)

因此我們得到了一個更具有一般性的結論,那就是在B發生的前提下A發生的概率等於AB同時發生的概率除以B發生的概率。

兩個事件的獨立性

在上面的例子中,我們看到事件A的無條件概率P(A)和在事件B發生的前提下A發生的概率P(A|B)一般是不一樣的,這也是普遍存在的一種情況。但是兩者之間的關系還是能說明一些問題的:

  • P(A) < P(A|B):它反映了事件B如果發生了,那么事件A更有可能發生。還是擲骰子,A表示出現數字5的概率、B表示出現奇數的概率。如果事件B發生,那么代表點數是奇數,相當於將樣本范圍進一步縮小了。

  • P(A) = P(A|B):它反映了事件B的發生跟事件A是否發生沒有任何關系,我們計算A發生的概率,可以無視事件B。比如:明天京東上某個商品是否降價和廣州是否下雨之間沒有關系,廣州下不下雨對商品降價無影響。

    此時我們稱A和B是獨立事件,我們由P(A|B)=P(AB)/P(B)可以得到,P(AB)=P(A|B)·P(B),即A和B同時發生的概率等於B發生的概率乘上在B發生的前提下A發生的概率或者等於A發生的概率乘上在A發生的前提下B發生的概率,這兩者是一樣的。但如果A和B之間是獨立的,那么A和B同時發生的概率就等於A發生的概率乘上B發生的概率。

  • P(A) > P(A|B):它反映了B發生了會降低A發生的可能性,比如從1到10之間隨機選擇一個數,事件A表示選擇的數字大於等於7,那么無條件概率就是4 / 10 = 0.4;但是B表示抽中的數字小於等於7,如果B發生了那么A再發生的話,數字就只能是7,所以概率變成1 / 7

    因此我們看到P(A)和P(A|B)之間關系的不同,能反映出A和B兩個事件的關系,當然我們這里不考慮那種偶然性,而是考慮一種普遍性。所以即便廣州下雨了、京東的某個商品也降價了,但兩者還是沒有關系,因為我們考慮的是一種具有普遍性的結論。

  • P(A|B) = 0:它反映了事件B一旦發生了,事件A就不可能再發生,這算是P(A) > P(A|B)的特例吧,雖然概率降低了,但是還有可能發生。而P(A|B)=0則是說明了B發生了A就不可能再發生了,所以我們稱此時的A和B為互斥事件

因此針對事件發生的可能性、以及事件之間的關系,我們對事件也有幾個分類:

  • 隨機事件:一個事件可能發生、也可能不發生,那么這個事件就叫做隨機事件。比如:漫展上一個皮膚白皙、長相可愛的人是女性,這就是個隨機事件,因為還有可能是個女裝大佬,這誰說的准呢
  • 不可能事件:一個事件一定不會發生,那么這個事件就叫做不能事件。比如:從1到10中選擇一個大於20的數
  • 必然事件:一個事件一定會發生,那么這個事件就叫做必然事件。比如:太陽從東方升起
  • 互斥事件:不可能同時發生的兩個事件就是互斥事件。即:A發生B不發生、B發生A不發生、A和B都不發生
  • 對立事件:不可能同時發生、但是一定會發生其中一個的兩個事件就是互斥事件。即:A發生B不發生,B發生A不發生,只有這兩種情況。

全概率公式

假設有n個事件B1、B2、B3...Bn,它們之間兩兩互斥、且至少發生一個,那么對於任意的事件A,都有如下關系:

P(A) = P(B1)P(A|B1) + P(B2)P(A|B2)+...+P(Bn)P(A|Bn)

我們來解釋一下:首先我們說n個事件是兩兩互斥,且至少發生一個。那么我們先假設只有一個事件B1,如果是只是一個事件B1、且B1必發生,那么有P(A)=P(B1)P(A|B1)顯然是沒問題的,因為B1一定發生,所以就不考慮了。

然后擴展到n個事件,我們說是兩兩互斥、且必發生一個,那么肯定有P(B1) + P(B2) + P(B3) + ... +P(Bn)=1 

P(A) = P(A · 1)

P(A) = P(AB1 + AB2 + AB3 + ... ABn)

因為事件B1、B2、B3...Bn兩兩互斥,所以AB1、AB2、AB3...ABn也是兩兩互斥,那么有:

P(A) = P(AB1) + P(AB2) + P(AB3) + ... + P(ABn)

我們是對於任意事件A,所以A和B1、B2、B3...Bn之間的關系是不清楚的,所以得到:

P(A) = P(B1)P(A|B1) + P(B2)P(A|B2)+...+P(Bn)P(A|Bn)

所以P(A) = P(B1)P(A|B1) + P(B2)P(A|B2)+...+P(Bn)P(A|Bn)我們就稱之為全概率公式

全概率公式的實際價值就在於,我們想計算事件A的概率是比較困難的。但如果條件概率P(A|Bn)是已知的,則變得很好計算,因此此時全概率公式就成了計算P(A)的很好途徑。

聚焦貝葉斯公式

我們之前說了:P(AB) = P(A)P(B|A) = P(B)P(A|B),那么在了解完全概率公式之后,我們可以將兩者組合起來,得到如下的式子:

於是我們就得到了大名鼎鼎的貝葉斯公式,我們先不管下面的那一大長串,我們上面的很好理解。然后下面的一大長串,就是將分母的P(A)用全概率公式進行了替換。而分子上則不再是B,而是Bi。其中Bi則指的是下面B1、B2、B3...Bn之一,因為我們使用貝葉斯的場景一般都是:導致這個結果的原因可能有多種,但不知具體是哪一種,所以用貝葉斯來分析每一種的概率有多大,我們后面會舉例說明。

可能這個式子看起來平淡無奇,但里面包含了很多內容,我們來分析一下:

首先貝葉斯公式最根本的數學基礎就是它將P(A|B)和P(B|A)聯系了起來。

我們說P(A|B)P(B)和P(B|A)P(A)兩者是相等的,它們都等於P(AB),里面的內涵是什么,我們往下看。

這個簡單的等式的內涵就在於:由因到果、由果推因。

現實中,我們可以把A看成是結果,B1、B2、B3...Bn看成是導致這個結果的原因

那么我們說的全概率公式,就是由各種原因推理出結果事件發生的概率,由因到果

但是,更重要、更實際的應用場景是,我們在日常生活中常常是觀察到某種現象,然后去反推造成這種現象的各種原因的概率。簡單點說,就是由果推因

貝葉斯公式P(Bi|A)=...,最終求得的就是條件概率。在結果事件A發生的前提下,我們推斷結果事件A的發生(在眾多原因B1、B2、B3...Bn中)是由原因Bi(i=0,1,2...n)造成的概率有多大,以支撐我們后續判斷。

那么我們說單純的概率:P(Bi)叫做先驗概率,指的是在沒有別的前提信息情況下的概率值,這個值一般需要借助我們的經驗估計得到。

而P(Bi|A)叫做后驗概率,它表示在得到某個信息之后事件出現的概率值,可以說后驗概率是先驗概率在獲取了新信息之后的一種修正。

應用舉例

貝葉斯應用

比如,貝葉斯公式應用的一個常見例子就是 X 光片的病理推斷案例,在某個病人的 X 光片中,醫生看到了一個陰影,這就是結果事件 A,我們希望對造成這個結果的三種可能原因(原因 B1:惡性腫瘤;原因 B2:良性腫瘤;原因 B3:其他原因)進行分析判斷,推斷分屬於各個原因的概率

例如,我們想求出原因是惡性腫瘤的概率,也就是求條件概率:P(B1|A) 的值。而我們只要知道在這三種原因下出現陰影的概率,也就是 P(A|B1),P(A|B2),P(A|B3),以及三種原因的先驗概率:P(B1),P(B2),P(B3),就能通過貝葉斯公式:

來進行計算。我們說導致X光片中出現陰影的原因有三種,但是不知道是三種的哪一種,所以使用貝葉斯來推斷是第一種惡性腫瘤的原因的可能性有多大。所以貝葉斯定義就是P(B|A)P(A) = P(A|B)P(B)全概率公式P(A)=P(B1)P(A|B1) + P(B2)P(A|B2)+...+P(Bn)P(A|Bn)兩者的組合,把等式P(B|A)P(A) = P(A|B)P(B)左邊的P(A)移到右邊分母上,再用全概率公式P(A) = P(B1)P(A|B1) + P(B2)P(A|B2)+...+P(Bn)P(A|Bn)進行替換即可得到貝葉斯公式。只不過前面的不再是P(B|A),而是P(Bi|A),Bi為B1、B2...Bn之一。

條件概率應用

這個應用沒有涉及到貝葉斯,只是單純地考察P(A|B)P(B)=P(B|A)P(A)

已知:新垣結衣明天有百分之60的概率不結婚,如果結婚了那么有百分之50的概率和我結婚。

  • 問題一:明天新垣結衣和我結婚的概率是多少?
  • 問題二:已知明天我沒和新垣結衣結婚,那么新垣結衣明天結婚的概率是多少?

解答問題一:

很簡單,和我結婚的前提,是明天新垣結衣得結婚才行。結婚的概率是4/10,百分之五十的概率和我結婚,所以概率是1/5

解答問題二:

明天我沒和新垣結衣結婚有兩種可能,第一:新垣結衣沒結婚,第二:結婚了但是和別人結婚了。我們要求出新垣結衣結婚的概率,假設事件A:新垣結衣明天結婚,事件B:新垣結衣沒和我結婚。顯然B已經發生了,我們目的是求出在B發生的情況下A發生的概率

P(A|B)就是我們要求的概率,顯然有:P(A|B) = P(AB) / P(B),對於P(AB)顯然等於4/10 * 1/2 == 1/5,而P(B)表示新垣結衣不和我結婚,那么有兩種情況,不結婚(6/10),和別人結婚(2/10),相加是8/10= 4/5,所以P(A|B) = 1/5 / 4/5 = 1/4,因此明天新垣結衣結婚的概率是1/4


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM