第一節課
博弈的要素:
- 參與人
- 選擇的策略(策略的集合)
- 策略組合
- 收益
這是第一次接觸正式的博弈論知識
策略形式書面定義為:行為影響結果,然而結果不僅取決你的行為,還取決與其他人的行為。
課本
杜塔的《策略與博弈》,喬爾·沃森的《策略》還有另外一本《戰略思想》
第一個游戲
囚徒困境






現場的大部分學生都選擇α,小部分選擇β
博弈論不能幫助我們選擇人生目標,只能幫我們到達目標。換言之,人生的目標還是靠我們自己內心的認知和眼光大小
定義:
如果選擇α得到的結果嚴格優於β,那么相對β是一個嚴格優勢策略,重點在於:無論別人選什么,不要選擇嚴格劣勢策略
why?
學上A:因為每個人都會選擇優勢策略,而導致結果變糟,使總結果變糟
學生B:“你永遠不會贏”
學生C:收益降低。
協和謬誤



惡魔飯桶和憤怒天使的博弈
假設我們是惡魔飯桶:



這里我還是選擇α,因為對於我們是優勢策略。
假設相反,我們是憤怒天使:


對我們來說選擇α並不優於β,但是我們還是選擇α,因為對於對方來說選擇α是優勢策略,所以對方大概率會選擇α。
結論:分析博弈的最好方法,也就是策略分析的核心是:換位思考
社會調查:
70%選擇α
30%選擇β
學生A:選擇β會使平均分升高。
學生B:長期博弈選β,收益大於α。
第二個游戲






ex,total = 5
5, 25, 60
ave = 30
win = 25
money = 5-0.05=4.95
多個玩家勝利,大家平分獎金
第一節課的五個結論
- 不要選擇劣勢策略
- 耶魯大學的學生很自私
- 理性選擇導致次優的結果
- 你無法得到想要的
- 學會換位思考
博弈論於現實世界是緊密聯系的
- 囚徒博弈
- 集體作業(大家都想偷懶)
- 企業價格戰
- 共同的資源(碳排放、公海捕魚、)
跳出思維定勢:制定協議(改變收益)
博弈的要素
組成:
- 參與人
- 策略集合
- 收益
游戲1


收益分配為
這里的I和II都沒有優勢策略
游戲2



















大多數學生選擇防守平坦的路
但是這個並不是一個合理的答案。
學生原因:人為中心地認為侵略者會選擇平坦的那條路,以維持士兵數量的最大化。
我們要從對面的角度進行思考,對於侵略者(漢尼拔)而言


弱優於:它意味着選擇平坦之途較選擇崎嶇之途而言至少要同樣的好,可能還稍微好些
回歸上期的數學游戲
大概有9個人選擇了32,33,34。
有一個人選擇了30,原因是

而大家會選筆比那小的,所以他就選擇了一個更小的。
老師解釋選擇33的原因是,如果大家在【1,100】中隨機選擇,平均數會是50左右,50的2/3就是33.
然而學生並不會隨機選擇,所以最終數字會比33小,然后大概有12個人選擇了22,因為33的2/3==22

.
選擇直接剔除策略:“沒有人會選擇大於50的數”
如果每個人都選擇100的話,最后的數為67,但是實時上不會,所以直接剔除掉67-100的數字。得出“沒人會選擇67以上的數”可以推出下一個結論“大於45的數會被剔除”。
意識到別人不會選擇劣勢策略之后,我們本身也不應該選擇劣勢策略。
然后剔除劣勢策略,也就是再×2/3,然后得出30到45的數也被剔除,然后....
:我知道一件事,你也知道這件事,你知道我知道這件事,我也知道你知道這件事,以此類推,一個無限的循環 。
最后地,最優策略就是1,然后大部分同學選擇了1,最后的結果是9.(平均數為13又1/3,2/3為9)有9個人選擇了9
這個游戲的最終結果逐年下降。
最后強調一下共同知識:讓兩個上台,分別給兩個帶上帽子。他們知道對方帽子的顏色,但是不知道自己帽子的顏色,所以盡管他們知道至少有一人帶着粉色的帽子,這個是相互知識。相互知識並不是公共知識。
共同知識並不只是我餓知道什么,還有我是否知道別人知道我知道別人知道。。。。以此類推
