2.2子博弈精煉
現在我們討論一個更加復雜的博弈:和之前的完全且完美博弈相同,完美繼續假設博弈的進行分為一系列階段,下一階段開始前,所有參與者均可觀察到前面所有參與者的行動。與上一節不同的是,在這一節中,每一個階段存在着同時行動。
考慮如下博弈,我們把這類博弈很沒有創意的稱為完全非完美信息兩階段博弈:
- 參與者1,2同時從自己的可行集A1和A2中挑選行動a1和a2
- 參與者3,4在觀察到第一階段結果后,然后同時從各自的可行集A3,A4中選擇行動a3和a4
- 收益為ui(a1,a2,a3,a4) i,j=1,2
許多形況都適用於上面的例子,之后我們會給出兩個例子,下面先給出此類問題的解決方法。
我們依然運用逆向的想法,不過區別在於每一步逆向的過程不再是單人的決策優化,而變成了求解一個真正的博弈問題(在給出參與者1,2的結果中求解參與者3,4的第二階段同時的博弈)。對於第一階段博弈可能結果,其后會對參與者3,4的博弈生成一個唯一的納什均衡,表示為,(a3*(a1,a2),a4*(a1,a2))。
如果參與者1,2預測到了參與者3,4的博弈結果,那么對於參與者1,2他們的博弈將會有以下形式:
1. 參與者1,2同時從自己的可行集A1和A2中挑選行動a1,a2
2. 參與者1,2的收益函數為ui(a1,a2,a3*(a1,a2),a4*(a1,a2)) i,j=1,2
假定為唯一的博弈平衡,那么我們稱為這一兩階段博弈的子博弈精煉解。
下面給出一個例子:銀行擠提問題
規則如下:
兩位投資者每人存入銀行一筆存款D,銀行已將這些存款存入一個長期項目。如果該項目到期前,銀行被迫對投資者變現,則共可收回2r,這里D>2r>D/2,不過如果銀行允許投資項目到期,則項目共可收回2R,這里R>D。
有兩個日期,投資者可以從銀行提款:日期1在銀行的投資項目到期之前,日期2在項目到期之后。
如果兩個投資者都在日期1提款,則每個人都可以獲得r,博弈結束。
如果兩個投資者只有一個在日期1提款,則他可獲得D,另一個人只能獲得2r-D博弈結束。
如果兩個博弈者都不在日期1提款,則決策到第二階段,也就是日期2進行。
如果兩個人都在日期2提款,則每個人都獲得R,博弈結束。
如果兩個人都沒有在日期2提款,則每個人獲得R,博弈結束。
如果只有一人在日期2提款,則他獲得2R-D,另一個人獲得D,博弈結束。
我們會在后面,討論這類博弈的正確表示方法,這里我們暫且用兩個標准式來表示(雖然這樣不夠精確):
1\2 提款 不提
提款 (r,r ) (D,2r-D)
不提 (2r-D,D) (下一階段)
1\2 提款 不提
提款 (R,R ) (2R-D,D)
不提 (D,2R-D) (R , R )
首先我們從后往前來分析此博弈,首先考慮日期2的標准模式博弈。由於 很明顯有“提款”嚴格優於“不提款”,那么這個博弈會有一個唯一的納什均衡。
之后我們簡單的可以把日期2的納什均衡帶入日期1(因為當兩個人都是理性人的時候,一旦選擇進入了第二階段必然會得到唯一的平衡,也就是唯一的收益)。
則我們可以把博弈簡化為:
1\2 提款 不提
提款 (r,r ) (D,2r-D)
不提 (2r-D,D) (R,R)
由於 我們可以很容易求出這個博弈中,得到兩個純戰略平衡:
(1) 兩個投資人都在日期1提款,收益情況為(r,r)
(2) 兩個投資人都在日期2提款,收益情況為(R,R)
前一種情況可以解釋為兩者對對方不信任,所以同時選擇日期1提款,后一種情況為兩者互相信任,在日期2提款,這種情況下,兩者的福利有所提高。
這其實是一種不同於第一章的囚徒困境:這兩個囚徒困境中,都存在對於整體低效率的納什均衡。不過對於第一章中的囚徒困境中,這個納什均衡是唯一的,而對於這個例子中,有一個納什均衡是對於社會低效率的,而另一個納什均衡則是高效的。
所以這個模型無法預測出銀行何時會出現擠提問題,但是可以證明擠提會作為均衡出現。
我們再舉一個完全非完美信息兩階段博弈例子
關稅和國際市場的不完全競爭
兩個完全相同的國家, 1 和 2, 同時選擇它們的關稅稅率,分別記為t1, t2,.
來自country 1的 Firm 1和來自country 2的 firm 2生產同質的產品供給本國消費和出口.
觀察到兩國的稅率后, firm 1 and 2同時選擇用於本國消費和出口的產品數量,分別用(h1, e1)和(h2, e2)表示.
兩個國家的市場價格Pi(Qi)=a–Qi,for i=1, 2.
Q1=h1+e2, Q2=h2+e1.
兩個企業的邊際成本為常數c.
每個企業在向其他國家出口時都要支付關稅.
Country 1 和 2分別是 player 1 和 2
Firm 1 和 2 分別是player 3 和 4