【耶魯大學】博弈論筆記


第一節課

博弈的要素:

 

  1. 參與人
  2. 選擇的策略(策略的集合)
  3.  策略組合
  4. 收益

這是第一次接觸正式的博弈論知識
策略形式書面定義為:行為影響結果,然而結果不僅取決你的行為,還取決與其他人的行為。
課本
杜塔的《策略與博弈》,喬爾·沃森的《策略》還有另外一本《戰略思想》

第一個游戲

囚徒困境
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
現場的大部分學生都選擇α,小部分選擇β
博弈論不能幫助我們選擇人生目標,只能幫我們到達目標。換言之,人生的目標還是靠我們自己內心的認知和眼光大小
定義:
如果選擇α得到的結果嚴格優於β,那么相對β是一個嚴格優勢策略,重點在於:無論別人選什么,不要選擇嚴格劣勢策略
why?
學上A:因為每個人都會選擇優勢策略,而導致結果變糟,使總結果變糟
學生B:“你永遠不會贏”
學生C:收益降低。

協和謬誤
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
惡魔飯桶和憤怒天使的博弈
假設我們是惡魔飯桶:
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
這里我還是選擇α,因為對於我們是優勢策略。
假設相反,我們是憤怒天使:
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
對我們來說選擇α並不優於β,但是我們還是選擇α,因為對於對方來說選擇α是優勢策略,所以對方大概率會選擇α。
結論:分析博弈的最好方法,也就是策略分析的核心是:換位思考
社會調查:
70%選擇α
30%選擇β
學生A:選擇β會使平均分升高。
學生B:長期博弈選β,收益大於α。

第二個游戲
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
ex,total = 5
5, 25, 60
ave = 30
win = 25
money = 5-0.05=4.95
多個玩家勝利,大家平分獎金
第一節課的五個結論

  1. 不要選擇劣勢策略
  2. 耶魯大學的學生很自私
  3. 理性選擇導致次優的結果
  4. 你無法得到想要的
  5. 學會換位思考

第二節課

博弈論於現實世界是緊密聯系的

  • 囚徒博弈
  • 集體作業(大家都想偷懶)
  • 企業價格戰
  • 共同的資源(碳排放、公海捕魚、)

跳出思維定勢:制定協議(改變收益)
博弈的要素
組成:

  • 參與人
  • 策略集合
  • 收益

游戲1
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
收益分配為
在這里插入圖片描述
這里的I和II都沒有優勢策略
游戲2
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

大多數學生選擇防守平坦的路

但是這個並不是一個合理的答案。

學生原因:人為中心地認為侵略者會選擇平坦的那條路,以維持士兵數量的最大化。

我們要從對面的角度進行思考,對於侵略者(漢尼拔)而言

 

 

 

弱優於:它意味着選擇平坦之途較選擇崎嶇之途而言至少要同樣的好,可能還稍微好些

 回歸上期的數學游戲

大概有9個人選擇了32,33,34。

有一個人選擇了30,原因是

 

而大家會選筆比那小的,所以他就選擇了一個更小的。

老師解釋選擇33的原因是,如果大家在【1,100】中隨機選擇,平均數會是50左右,50的2/3就是33.

然而學生並不會隨機選擇,所以最終數字會比33小,然后大概有12個人選擇了22,因為33的2/3==22

 .

 

選擇直接剔除策略:“沒有人會選擇大於50的數”

 如果每個人都選擇100的話,最后的數為67,但是實時上不會,所以直接剔除掉67-100的數字。得出“沒人會選擇67以上的數”可以推出下一個結論“大於45的數會被剔除”。

意識到別人不會選擇劣勢策略之后,我們本身也不應該選擇劣勢策略。

 然后剔除劣勢策略,也就是再×2/3,然后得出30到45的數也被剔除,然后....

 

:我知道一件事,你也知道這件事,你知道我知道這件事,我也知道你知道這件事,以此類推,一個無限的循環 。

 

最后地,最優策略就是1,然后大部分同學選擇了1,最后的結果是9.(平均數為13又1/3,2/3為9)有9個人選擇了9

 這個游戲的最終結果逐年下降。

最后強調一下共同知識:讓兩個上台,分別給兩個帶上帽子。他們知道對方帽子的顏色,但是不知道自己帽子的顏色,所以盡管他們知道至少有一人帶着粉色的帽子,這個是相互知識。相互知識並不是公共知識。

共同知識並不只是我餓知道什么,還有我是否知道別人知道我知道別人知道。。。。以此類推


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM