讀書筆記: 博弈論導論 - 15 - 不完整信息的動態博弈 序貫理性
在不完整信息中的序貫理性(Sequential Rationality with Incomplete Information)
本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。
子博弈精煉(subgame perfection)
序貫理性就是要求玩家總是選擇最佳反應。
子博弈精煉是要求玩家在每個信息集上總是選擇最佳反應。
-
在均衡路徑上(on the equilibrium path), 不在均衡路徑上(off the equilibrium path)
\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一個不完整信息博弈的貝葉斯納什均衡。
我們說一個信息集在均衡路徑上(on the equilibrium path),如果給定的\(\sigma^*\)和類型分布,這個信息集有正可能性到達。
我們說一個信息集不在均衡路徑上(off the equilibrium path),如果給定的\(\sigma^*\)和類型分布,這個信息集被到達的可能性為0。 -
信念體系
一個信念體系\(\mu\),在一個擴展形式博弈中,給每個信息集的每個決策點(decision node)都分配了一個概率。
- 貝葉斯規則(Bayes' Rule)
\(\Pr \{A|B \} = \frac{\Pr \{A \land B \} }{\Pr \{A \land B \} + \Pr \{\lnot A \land B \}}\)
精煉貝葉斯均衡(perfect Bayesian equilibrium)的四個需求:
-
需求 15.1
每個玩家在每個信息集上,都將有一個意義明確的信念(關於他的位置)。也就是說博弈將有一個信念體系。 -
需求 15.2
\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一個不完整信息博弈的貝葉斯納什均衡,我們要求在所有信息集上,在均衡路徑上的信念符合貝葉斯規則。 -
需求 15.3
對於不在均衡路徑上的信息集,其信念值可以是任何值。 -
需求 15.4
給定玩家的信念,玩家的策略必須是序貫理性。也就是說在每一個信息集上,玩家將選擇信念對應的最佳反應。 -
精煉貝葉斯均衡(perfect Bayesian equilibrium)
如果滿足需求15.1 ~ 15.4, 一個貝葉斯納什均衡\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)和一個信念體系\(\mu^*\)構成一個精煉貝葉斯均衡。
精煉貝葉斯均衡也是貝葉斯納什均衡和子博弈精煉均衡。
推論 15.1
一個(可能是混合的)策略組合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一個貝葉斯博弈\(\Gamma\)的貝葉斯納什均衡,
如果策略組合\(\sigma^*\)能使所有的信息集都有具有可能性到達,
則策略組合\(\sigma^*\)和(從這個策略組合\(\sigma^*\)和類型的概率分布獲得的)信仰系統\(\mu^*\)一起,
就構成了一個精煉貝葉斯均衡(perfect Bayesian equilibrium)。
序貫均衡(Sequential Equilibrium)
- 一致的策略組合和信念體系
一個策略組合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)和一個信念體系\(\mu^*\)是一致的,
如果存在一系列的非退化的混合策略組合\(\{ \sigma^k \}_{k=1}^{\infty}\)和一系列(根據貝葉斯規則獲得的)信任\(\{ \mu^k \}_{k=1}^{\infty}\),
有\(\lim_{k \to \infty} (\sigma^k, \mu^k) = (\sigma^*, \mu^*)\)。
解釋:
這里的意思是:策略組合和信念體系可以互相迭代求解(也可以理解為一個序貫均衡的求解方式)
策略應該簡單地最大化每個信息集的預期收益。
那些在策略中得到正概率的信息集合的合理信念,應該是信息集合節點上的條件概率分布(根據貝葉斯規則)。
- 序貫均衡(Sequential Equilibrium)
一個策略組合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)和一個信念體系\(\mu^*\)是一個序貫均衡,
如果\((\sigma^*, \mu^*)\)是一個一致的精煉貝葉斯均衡。
解釋:
序貫均衡是一個精煉貝葉斯均衡。
而一個精煉貝葉斯均衡的策略組合和信念體系是一致的(根據一致性推導所得),這個精煉貝葉斯均衡才是一個序貫均衡。
序貫均衡由於難以應用,較少被使用。
參照
- Game Theory An Introduction (by Steven Tadelis)
- 讀書筆記: 博弈論導論 - 01 - 單人決策問題
- 讀書筆記: 博弈論導論 - 02 - 引入不確定性和時間
- 讀書筆記: 博弈論導論 - 03 - 完整信息的靜態博弈 預備知識
- 讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識
- 讀書筆記: 博弈論導論 - 05 - 完整信息的靜態博弈 納什均衡
- 讀書筆記: 博弈論導論 - 06 - 完整信息的靜態博弈 混合的策略
- 讀書筆記: 博弈論導論 - 07 - 完整信息的動態博弈 預備知識
- 讀書筆記: 博弈論導論 - 08 - 完整信息的動態博弈 可信性和序貫理性
- 讀書筆記: 博弈論導論 - 09 - 完整信息的動態博弈 多階段博弈
- 讀書筆記: 博弈論導論 - 10 - 完整信息的動態博弈 重復的博弈
- 讀書筆記: 博弈論導論 - 11 - 完整信息的動態博弈 戰略協議
- 讀書筆記: 博弈論導論 - 12 - 不完整信息的靜態博弈 貝葉斯博弈
- 讀書筆記: 博弈論導論 - 13 - 不完整信息的靜態博弈 拍賣和競標
- 讀書筆記: 博弈論導論 - 14 - 不完整信息的靜態博弈 機制設計
- 讀書筆記: 博弈論導論 - 15 - 不完整信息的動態博弈 序貫理性
- Nash bargaining solution
- Mechanism design
- Sequential equilibrium