1 策略型博弈
策略型博弈是決策者之間相互作用的模型。正是因為相互作用,我們稱決策者為局中人。每個局中人有一個可選行動的集合。模型中的每個局中人受到所有局中人行動的影響,而不僅是受到她自己行動的影響,從而獲得局中人之間的相互作用。尤其是,每個局中人對於行動剖面一-所有局中人行動的列表(參見17.4節中關於剖面的討論)---都有自己的偏好。
定義2.1(具有序數偏好的策略型博弈)(具有序數偏好的)策略型博弈由如下要素組成:
- 局中人集合
- 對於每個局中人,有一個行動集合
- 對於每一個局中人,有關於行動剖面集合的偏好
2.2 囚徒困境
2.2.1 合作項目
你和朋友合作-一個項目。你們每個人可以要么努力工作要么游手好閑。如果你的朋友努力工作,而你樂意游手好閑(如果你也努力工作的話,項目的結局將會好--些,可是其價值的增量對你來講不值得付出額外的努力)。你喜歡你們倆都努力工作的結局甚於你們倆都游手好閑(在這種情況下,什么都沒有完成),對於你,最差的結局是你工作很努力而你的朋友卻游手好閑(你痛恨被“剝削")。如果你的朋友有相同的偏好,那么模擬你所面對情形的博弈將在圖2.2中給出,如你所看到,這個博弈與“囚徒困境”的不同僅在於行動的名稱。
我們並沒有斷言,兩個人從事一個合作項目的情況必定具有“囚徒困境”的結構,只有當局中人的偏好與“囚徒困境”中一樣時才是!例如,如果在其他人努力工作時每個人都喜歡努力工作甚於游手好閑,那么“囚徒困境”就不模擬這種情況:局中人的偏好與圖2.2中給出的偏好不同。
努力工作 | 游手好閑 | |
努力工作 | 2,2 | 3,0 |
游手好閑 | 0,3 | 1,1 |
2.2.2 雙寡頭壟斷
左圖的博弈與“囚徒困境”的不同之處不僅在於局中人行動的名稱,還在於其中兩個局中人的偏好上有所不同。
右圖的博弈與“囚徒困境”的不同之處僅在於局中人行動的名稱。
隨機 | 堅持 | |
隨機 | 1/2(H+L),1/2(H+L) | L,H |
堅持 | H,L | S,S |
S>L
2.4 例證:匹配硬幣(無沖突博弈)
2.6 納什均衡
我們研究的求解理論有兩個部分。首先,在給定關於其他局中人行動的信念下,每個局中人按照理性選擇模型來選擇自己的行動。其次,每個局中人關於其他局中人行動的信念是正確的。這兩個部分包含在下面的定義中:
2.7 納什均衡例子
囚徒困境
a.
沉默 | 告密 | |
沉默 | 4,4 | 3,3 |
告密 | 3,3 | 2,2 |
不是囚徒困境
b. 當a<1時,是“囚徒困境”
不是“囚徒困境”時,納什均衡為(沉默,沉默)
2.7.8 嚴格和非嚴格均衡
2.8 最優反應函數
2.8.1 定義
2.8.2 使用最優反應函數定義納什均衡
我們可以另外定義納什均衡是這樣的行動剖面:每一個局中人的行動是關於其他局中人行動的最優反應。也就是說,我們有如下結果:
2.9 劣行動
2.9.1 嚴優
在任何博弈中,假如不管其他局中人如何做,局中人的一個行動比另--個行動總是優越些,那么這個行動“嚴優”於另一個行動。
嚴劣行動不是對於其他局中人的任何行動的-一個最優反應:無論其他局中人做什么,總有某些行動比“嚴劣行動”更好一些。因為局中人的納什均衡是關於其他局中人的納什均衡行動的最優反應,所以有:
嚴劣行動不使用於任何納什均衡。
2.9.2 弱優
在任何博弈中,一個局中人的行動“弱優”於另一個行動,如果不管其他局中人怎樣做,第一個行動至少像第二個行動一樣好,並且對於其他局中人的某些行動,第一個行動好於第二個行動。
在嚴格納什均衡(2.7.8節)中,沒有一個局中人的均衡行動是弱劣的:對於每一個局中人,每個非均衡行動的盈利小於她的均衡盈利,所以沒有一個非均衡行動弱優於她的均衡行動。
在非嚴格納什均衡中的行動可能是弱劣的嗎?答案是肯定的。
對於左側局中人的弱劣行動為T
納什均衡為(M,L)不是嚴格納什均衡。u(M,L)=u(M,C)
2.9.3 例證:選舉
兩個候選人A和B競選一份公職。共有奇數個市民投票,每個人可以投票給任何一位候選人。(棄權是不可能的。)獲得多數票的候選人獲勝。(由於市民數是奇數,因此不可能是平局。)大多數市民樂意A獲勝。
下面的策略型博弈是針對這種情況下的市民投票決策所建立的模型。
局中人 市民
行動 每個局中人的行動集包含 了投票給A和投票給B。
偏好 對於大多數人投票給A的所有行動剖面,所有局中人都認為它們沒有什么差別;同樣,對於大多數人投票給B的所有行動剖面,所有局中人也都認為它們之間沒有什么差別。一些局中人(大多數)喜歡第一種類型的行動剖面甚於第二種類型,而另一些人則有相反的偏好。
我們斷言,市民投票給她不太喜歡的候選人弱劣於投票給她最喜歡的候選人。假如市民i喜歡候選人A ;並且,除i以外的其他所有市民的選票固定不變。如果市民i將她投給B的選票轉而投給A,那么,考慮到其他市民的投票,要么結局不發生變化,要么使得A勝出而不是B勝出;這樣一個轉變不會使得贏者從A變為B。也就是說,市民i原先投給B的選票轉向投給A,要么對結局沒有影響,要么使她自己境況更好;但不可能使她境況更糟。
博弈中包含這樣的納什均衡,在這些均衡中,一些或者所有市民的行動是弱劣的。例如,所有市民選舉B的行動剖面是一個納什均衡( 沒有一個市民的投票轉移會對結局有任何影響)。
2.10 單一總體中的均衡:對稱博弈和對稱均衡
策略型博弈的納什均衡對應於若干總體的成員之間相互作用的穩定狀態。
這里,我們僅限於每次相互作用包含兩個參與者的情況。定義一個兩人博弈為“對稱的”,如果每個局中人有相同的行動集,以及每個局中人對結局的評價僅依賴於她和對手的行動,不取決於她是局中人1還是局中人2。也就是說,局中人1對於她的行動是a1而其對手的行動是a2的結局(a1,a2)的感受,與局中人2對於她的行動是a1和其對手的行動是a2的結局(a2,a1)的感受是相同的。特別地,局中人的偏好可以用這樣的盈利函數來描述,每當局中人選擇相同的行動時,兩個局中人的盈利是相同的:對於每一個行動a,u1(a,a)=u2(a,a)。
作為一個例子,考慮一個正在接近的行人的模型。在任意給定的遭遇中,每個參與者有兩個可能的行動一朝右或者朝左一當參與者都以同樣的方向行走,她們的境況好於她們以不同的方向行走(在后一種情況,會發生相撞)。這個例子所產生的對稱的策略型博弈在圖2. 24中給出。博弈有兩個對稱的納什均衡,即(左,左)和(右,右)。也就是說,有兩個穩定狀態,其中一個狀態是當遇到另一個行人時,每個行人都沿左邊走,而另一個狀態則是雙方都沿右邊走。
對稱博弈可以沒有對稱的納什均衡。例如,考慮圖2. 25中的博弈。這個博弈有兩個納什均衡(X ,Y)和(Y ,X) ,其中沒有一個是對稱的。你可能想知道在這樣的情形下,是否存在一個在每次相互作用時每個局中人總是不采用相同行動的穩定狀態。這個問題將在4. 7節中進行分析。
納什均衡:(A,A)(A,C) (C,A)
(A,A)對應於穩定狀態