貝葉斯公式由英國數學家貝葉斯 ( Thomas Bayes 1702-1761 ) 發展,用來描述兩個條件概率之間的關系。貝葉斯原本是個神父,他為了證明上帝的存在而發明了著名的貝葉斯公式。然而他本人並不知道他所發明的公式及其背后的思想對當今社會產生重大變革,最典型的的莫過於當今炙手可熱的“人工智能+”時代下,是人工智能的分支:機器學習,所必備的方法之一。
上圖就是著名的貝葉斯公式,估計很多人和筆者一樣看到數學公式就頭疼,我們把翻譯一下就很簡單了。
-
P(A丨B)表達為:B這樣的情況,A的可能性
-
P(B丨A)同理:A這樣的情況,B的可能性
-
P(A)是A發生的可能性
-
P(B)是B發生的可能性,其中P(B)=P(B丨A)P(A)+P(B丨A')P(A')......這個叫做全概率公式(請參見浙大版《概率論與數理統計》P17)
-
用數學語言翻譯就是:后驗概率=先驗概率*調整因子
下面我們用實例來看看貝葉斯公式是怎么使用的:
假設有兩個班級其中1班有男生30人,女生20人;2班有男生25人、女生25人。體育老師抓到一個抽煙的男生,該男生打死也不告訴體育老師是那個班的。問題來了體育老師怎么判斷該男生來自那個班?
很不巧我們的體育老師是個使用貝葉斯公式的高手(貌似體育老師的數學都是這么牛,畢竟筆者曾經所就讀中學有個教得很好的數學老師以前就是體育老師)因此這點小問題可難不倒我們偉大的體育老師。
-
先將1班和2班標記為事件A1和事件A2,男生標記為事件B
-
那么我們所求的就是P(A1丨B)和P(A2丨B)
因為只有2個班那么我們先驗概率P(A1)=P(A2)=50%;來自1班男生的概率P(B丨A1)=3/5:來自2班男生的概率P(B丨A2)=1/2
那么我們求出P(B)就可以代入公式得到結果:
P(B)=P(B丨A1)P(A1)+P(B丨A2)P(A2)=0.55
P(A1丨B)=P(B丨A1)P(A1)/P(B)=0.6*0.5/0.55=55%
P(A2丨B)=P(B丨A2)P(A2)/P(B)=0.5*0.5/0.55=45%
由結果我們可以得出:該男生來自1班的概率從50%(先驗概率)上升到55%(后驗概率)來自2班下降了5%
如果這時候生物老師走過來說了一句:2個班的男生沒有幾個留長頭發。這時候有了新信息的加入,那么我們剛才計算的后驗概率就變成了先驗概率,繼續代入公式來不斷修正結果,這就是貝葉斯公式的強大之處。
這也是人類對人工智能的恐懼來源之一。
因為人工智能機器人沒有感情,它只會根據人類輸入的大數據通過貝葉斯公式不斷修正結果而做出最有利的判斷。當然我們的體育老師是個有感情的人類,它會把該男生抓去給2個班的班主任,不會像機器人一樣那個概率高就選那個。不過我相信會有更好的公式出現,去模擬人類的情感。從而在藝術,情感上遠超人類,而不是在邏輯上。這才是未來人工智能和平發展的趨勢。