讀書筆記: 博弈論導論 - 04 - 完整信息的靜態博弈 理性和公共知識
理性和公共知識
本文是Game Theory An Introduction (by Steven Tadelis) 的學習筆記。
純策略中的優勢(dominance)
- 數學表達: 除了玩家i以外所有玩家的策略集合
\(S\): 所有人的所有策略組合。
\(S_{-i}\): 除了玩家\(i\)以外,所有人的所有策略組合。
\(s\): 所有人的一種策略組合。
\(s_{-i}\): 除了玩家\(i\)以外,所有人的一種策略組合。
引進\(S_{-i}\)和\(s_{-i}\)是為了
- 通過看玩家i以外的所有玩家的策略,來考慮玩家i的策略。
- 或者專門看玩家i策略。
劣勢(被支配)策略(Dominated Strategies)
- 定義 4.1:嚴格劣勢於
對於玩家i,策略\(s'_i\)嚴格劣勢於\(s_i\),則:
斷言 4.1
一個理性玩家不會選擇一個嚴格劣勢策略。
優勢策略(Dominant Strategies)
- 定義 4.2: 嚴格優勢策略(strictly dominant strategy)
策略\(s_i \in S_i\)是一個嚴格優勢策略,如果玩家i的任何其它策略都嚴格劣勢於\(s_i\)。
- 定義 4.3: 嚴格優勢策略均衡(strictly dominant strategy equilibrium)
策略組合\(s^D \in S_i\)是一個嚴格優勢策略均衡,如果其中每一個玩家i的策略都是嚴格優勢策略。
推論 4.1
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優勢策略均衡\(s^D\),則\(s^D\)是唯一的嚴格優勢策略均衡。
斷言 4.2
如果有的話,玩家一定會選擇優勢策略。
策略,策略集合,策略組合和策略均衡
-
策略(strategy)
\(s_i\)是玩家的一個策略。 -
策略集合(strategy set)
\(S_i\)是玩家的所有策略集合。\(s_i \in S_i\)
\(S\)是所有玩家的所有策略的組合的集合。 -
策略組合(strategy profile)
\(s\)是N個玩家的一種策略組合。\(s = (s_1, s_2, \cdots, s_n), s \in S\) -
策略均衡(strategy equilibrium)
\(s\)是任何一種導致合理結果的策略組合。
方法:嚴格劣勢策略的迭代消除
博弈論方法就是一個尋找均衡的過程。
方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本邏輯:
一個理性玩家不會選擇一個嚴格劣勢策略。
如果有的話,玩家一定會選擇優勢策略。
過程:略
- 迭代消除均衡(Iterated elimination equilibrium)
嚴格劣勢策略的迭代消除(IESDS)過程中幸存下來的博弈組合\(s^{ES}\)。
推論 4.2
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一個嚴格優勢策略均衡,則\(S^*\)是唯一的嚴格劣勢策略的迭代消除(IESDS)均衡。
信念(Beliefs),最佳響應(Best Response)和可合理化(Rationalizability)
在已經學習的兩個方法嚴格優勢策略和嚴格劣勢策略的迭代消除(IESDS)之外的情況下,如果玩家i的一個策略\(s_i\)不是一個嚴格劣勢策略,那就意味着在一定條件下(對手的某些策略下),策略\(s_i\)是一個合理的響應。
- 最佳響應(best response)
玩家i的策略\(s_i \in S_i\)是對手策略\(s_{-i} \in S_{-i}\)的最佳響應,則:
-
信念(belief)
一個玩家i的信念就是一個他對手們的可能策略組合\(s_{-i} \in S_{-i}\)。 -
最佳響應對應(best-response correspondence)
最佳響應對應\(BR_i(s_{-i})\),是玩家i,在他的對手們的策略組合\(s_{-i}\)上的所有可能最佳響應的集合。
\(BR_i(s_{-i})\)可以認為是一個函數,其結果是一個集合。 -
不是一個最佳響應(never a best response)
玩家i,對於他的對手們的策略組合\(s_{-i}\)的最佳響應集合\(BR_i(s_{-i})\),如果\(s_{-i}\)不是在信任集合里,則\(s_i \in BR_i(s_{-i})\)都不是最佳響應。
總結
方法
- 嚴格優勢策略
- 嚴格劣勢策略的迭代消除(IESDS)
- 去掉不可信的策略組合(或者保留可信的策略組合)。
推論 4.1
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一個嚴格優勢策略均衡\(s^D\),則\(s^D\)是唯一的嚴格優勢策略均衡。
推論 4.2
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一個嚴格優勢策略博弈,則\(S^*\)是唯一的嚴格劣勢策略的迭代消除(IESDS)均衡。
推論 4.3
對於玩家i,一個嚴格劣勢策略\(s_i\),不可能是任何\(s_{-i} \in S_{-i}\)的最佳響應。
推論 4.4
在一個有限普通形式的博弈中,\(s^*\)是一個嚴格優勢策略,或者是一個唯一的嚴格劣勢策略的迭代消除(IESDS)均衡,
則s_i^*是一個對於任何\(s_{-i} \in S_{-i}\)的最佳響應。
斷言 4.1
一個理性玩家不會選擇一個嚴格劣勢策略。
斷言
如果有的話,玩家一定會選擇優勢策略。
斷言 4.2
一個理性玩家,在認為他的對手選擇策略\(s_{-i} \in S_{-i}\)時,總會選擇\(s_{-i}\)的最想響應。
斷言
一個理性玩家只會選擇(他對手們的策略組合的)最佳響應。
參照
- Game Theory An Introduction (by Steven Tadelis)