關於博弈論中的一硬幣正反問題的分析


  前兩天在看一個納什均衡的詞語時在網上搜索發現一個問題如下

你正在圖書館坐着,一位陌生美女主動過來和你搭訕,並要求和你一起玩個數學游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。”那么該不該和這位姑娘玩這個游戲呢?這基本是廢話,當然該。問題是,這個游戲公平嗎?

  我們分析的主要不是為了答不答應玩的問題,這個當然是要玩了,難得有美女主動搭訕。

  在分析這個問題之前先說一下納什,一個數學天才,獲得諾貝兒經濟學獎,納什均衡這一詞語普遍存在於博弈論,經濟學等著作中。他的一生都是一個傳奇,今年的關注是由於網上的提示,今年5月23日納什夫婦死於車禍,但他的理論和他為社會做出的巨大貢獻永遠流傳於世。

  先現看一下網上的(我認為模棱兩可)分析,上面的收益如下

(美女\男子) 正 反
正 (-3,+3) (+2,-2)
反 (+2,-2) (-1,+1)

  先來一下不靠普的想法,也就是用我們平時學的概率來分析,出現正正,正反,反正,反反都為1/4的概率,所以男子收益E(男)=3*1/4+1*1/4+(-2)*1/2=0,這樣子來看很公平的游戲啊。兩方不輸不贏。
  再來分析一下,這里就是為什么說這個問題與納什均衡有關了,美女會這樣子想,如果男子出正反是隨機的,那么她肯定會出反面,因為這樣平均下來她每次都會贏1/2的收益啊。看看上面的圖,出正面會輸1/2的收益。所以這個不是簡單的概率,是又方都要采用策略的游戲。
  網上的答案最多的是這樣的,美女的策略如下,設出正面的概率為y,那么反面則為1-y,為了使收益最大化,則使男子出正面與出反面的美女的收益相等,得出現在式子:(就是這句奇葩的話,評什么說這樣就最大化,后面我想清楚了以后,這樣子有好處,但不是最大化,后面慢慢道來)

y*-3+(1-y)*2=y*2+(1-y)*-1;

y=3/8;

 

所以結果即是美女自己按着出正,反比例為3/8則不會輸,每次收益為:-3*3/8+5/8*2=1/8
到這里網上的解法就算完成了。

  下面的我花了一段時間來分析得出來結果,當然不在於結果。在於過程,3/8這個方案確實是相當不錯的方案,但是還有更深入的,中間的方案的調整,我記得網上的文章最后提到會不會被美女的方案針對呢?其實這個題中存在一些針對性的方案,而且利益最大化的針對方案。

  當我看到這個答案我一頭霧水,憑什么說相等就一定是最優的,利益就一定最大化?為什么男子一直出正面與一直出反面時美女的收益相等就最好,如果男子是隨機出的呢?有趣的正是這里,雙方都不會隨機出,這個是一個雙方都要在不斷調整方案的游戲。現在我們不考慮美女3/8的策略,我們設屌絲男的策略為出正的概率為x,反為1-x,美女出正為y,反為1-y,那么我們可以站在美女的角度得到美女的收益期望

E(女)=xy*-3 + (1-x)y(2) + x(1-y)(2) + (1-x)(1-y)(-1)
=-8xy+3y+3x-1

到這里時我想到的是線性規划,要求E(女)最大化,在x[0,1] y [0,1] 范圍內,以前做線性規划就是把圖形畫出來,以前都基本都是直線。所以先畫出-8xy+3y+3x-1=0的圖形,找到大於0的區域,只要在這個區域內美女都是有收益的。最近了解了一點R語言,所以用R試着畫了一下,圖1

<圖1>

 

通過圖形,加上選幾個點試的方法可以確定,在中間區域美女都是可以有正收益的,但是在這些區域中也是有條件的,有的在屌絲男出正多的時候,有的是在屌絲男出反多的時候,關鍵是存在一部分區域是不管屌絲男出正的概率為多少美女都有收益的部分,如圖2

<圖2>
圖中兩條豎線范圍就是不管屌絲男用什么策略,不管是全出正,全出反,一半正,一半反,或者是1/3正,3/8正等美女都會有收益。所以美女的策略就是自己在這個范圍內,這個范圍很好求,通過y=0與y=1求出1/3與2/5,所以美女的策略就是讓自己出正面的概率在1/3與2/5之間,這樣美女永遠都不會輸,那同剛才3/8有什么區別?有區別,現在我們只是看到了在這個范圍內,不管屌絲男出正的概率在[0,1]之間都美女收益都是大於0的。現在我們就應該來找最值了,有沒有一個最大的值,我們分別取y為1/3,2/5可以得出美女收益期望分別如圖3,圖4


<圖3>


<圖4>

兩個圖所表現的是在屌絲男[0,1] 范圍內 美女的收益,可以看出來都大於0,只是有大有小,所以這里美女的策略就是當屌絲男出正面概率向1靠近時,美女出正面的概率向1/3靠近,當屌絲男出正面概率向0靠近時,美女出正的概率向2/5靠近。這樣收益是最大的。當然這種方式確實太復雜,美女要不停的計算,所以這里3/8就出來了,下面說一下3/8的來源

  其實上面只要美女在1/3與2/5之間都不會存在大的問題,關鍵是收益雖然說的大於等於0,但是還是有可能等於0.比如美女用1/3策略,那么屌絲男用0,則美女收益為0,如果美女用2/5策略,屌絲男用1,美女也不會有收益。有沒有一種方式屌絲男沒有辦法針對呢?有,就是讓我們圖3,圖4的線條水平,這樣不管屌絲男怎么改變策略,美女的收益期望是恆定且大於0的,即上面算出來的3/8.如果屌絲男隨機出其實可以選擇1/3策略,這樣收益才是最大的,可以達到1/6。
  到這里也基本上是我所有的分析與計算了,自己了更了解這個題里面的針對,策略,分平等一些語言了。不僅僅是知道答案是3/8,為什么要這樣,可不可以不這樣。當然也只能說那個是一種比較好的策略。是我我有可能選擇1/3,是在大多數情況下收益最大的。
總結:
  1.納什均衡,其實這個是比較難理解的,本文只是這個相關的一個應用。
  2.納什相關的一個電影《美麗心靈》,抽時間看一下,得過很多獎的。昨天都搜出來了,沒時間看,今天可以把這個看了。
  3.數學,經濟學等其實很有意思,有些時候他們是用一句話來表達,但是那個可能比一段程序更為美妙。比如:壟斷的產品的產量都是不足的;比如:卡特爾是不穩定的。短短的一句話可能比幾十行代碼還要美妙。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM