三門問題(Monty Hall problem),是一個源自博弈論的數學游戲問題,大致出自美國的電視游戲節目Let's Make a Deal。問題的名字來自該節目的主持人蒙提·霍爾(Monty Hall)。
游戲規則
游戲參賽者會看見三扇關閉了的門,其中一扇的后面有一輛汽車,選中后面有車的那扇門就可以贏得該汽車,而另外兩扇門后面則各藏有一只山羊。當參賽者選定了一扇門,但未去開啟它的時候,節目主持人會開啟剩下兩扇門的其中一扇,露出其中一只山羊。主持人其后會問參賽者要不要換另一扇仍然關上的門。問題是:換另一扇門會否增加參賽者贏得汽車的機會率?
我們假設三扇門為A、B、C。那么對於參賽者而言,剛開始做出選擇的時候P(A)=P(B)=P(C)=1/3。
現在我們假設選定一個門A,那么剩下的B、C門會被主持人打開一個,P(D)為打開B或C們的概率為1/2。
現在主持人會問是否換一扇門。如果堅持不換,堅持打開A門。P(A|D)=P(AD)/P(D)=1/3。參賽者選擇的還是最初的門,在這里主持人是否開啟一扇門,對最初的1/3概率沒有影響。
如果不堅持選擇A門,那么BC兩扇門中存在汽車的可能性為P(E)=2/3,且其中一扇門被主持人打開,確定沒有汽車只有山羊。假設換一扇門打開的概率為P(E|D)=P(ED)/P(D)=2/3
有一人認為在主持人選了一個門之后 另外兩個門概率對我們來說是二分之一。這種想法是有問題的。如果選擇堅持A,那么主持人的選擇對我們獲得汽車的概率是沒有影響的,我們還是之前的三分之一概率。如果選擇換一扇門選擇另一個門C,二分之一是針對只有2扇門的情況下的概率,但是在此之前發生了一個B門被主持人打開的事件。B也是樣本元素之一。整個樣本元素的數量為3。所以不堅持A的話。必須將B也考慮進去,BC有車的概率為三分之二。
貝葉斯定理由英國數學家貝葉斯 ( Thomas Bayes 1702-1761 ) 發展,用來描述兩個條件概率之間的關系,比如 P(A|B) 和 P(B|A)。按照乘法法則,可以立刻導出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可變形為:P(B|A) = P(A|B)*P(B) / P(A)。
這個問題用貝葉斯定理來理解就有點繞比較簡單了。
先來看看貝葉斯公式
我們首先設定以下三個隨機事件:
A:所選的X號門后是汽車。
B:換門后,當前門后是汽車
C:你選擇了X號門,而主持人打開了y號門並且y號門后面是山羊。
如果堅持不換門的情況下,我們的目標是P(A|C),即在得到主持人信息之后1號門后是汽車的概率。在主持人提供信息之前,我們有P(A)=1/3。
D發生的幾率,仔細想想是1/2,因為主持人會隨機的打開一扇門后有羊的門。
這個地方的1/2 ×2/3=1/2 × 1/3 +1/2 × 1/3
換門的話,我們的目標是P(B|C), 此時P(C)的概率就變成了1,是必然事件了
根據貝葉斯公式就可求得結果是2/3
這游戲相當於你和主持人博弈,你只能選一扇門,主持人就選剩下的兩扇門。顯然主持人的勝率是2/3。這個勝率和主持人是否打開一扇門沒有關系,和主持人是否知道門里有沒有獎也沒有關系,都是你自己先選的啊!
現在給你一個機會,用你手里的一扇門交換主持人手里的兩扇門,你換不換?
人們根據不確定性信息作出推理和決策需要對各種結論的概率作出估計。Monty Hall與貝葉斯定理不僅包含了概率學和邏輯學,還包含了心理學,但研究的角度是不同的。心理學研究人們主觀概率估計的認知加工過程規律。這一領域的探討對揭示人們對概率信息的認知加工過程與規律、指導人們進行有效的學習和判斷決策都具有十分重要的理論意義和實踐意義。在機器學習中包含了各種對數據的判斷與決策。因此貝葉斯定理在機器學習中也起着至關重要的作用。
我覺得貝葉斯定理給我的啟示就是:不要主觀的去對一個問題進行定義,需要結合影響這個問題的其他事件一起來看待。理性且全面的認知一個問題。