矩陣對策問題及其解法


背景

對策論研究具有競爭性質的現象。有權決定自身行為的對策參加者稱為局中人,所有局中人構成集合 \(I\),在一局對策中可供劇中人選擇的一個實際可行的完整的行動方案成為策略,對於任意劇中人 \(i \in I\),都有自己的策略集 \(S_i\)。一局對策中由各劇中人選定的策略構成的策略組稱為局勢 \(s=(s_1,...,s_n)\),而全體局勢集合 \(S=S_1\times ... \times S_n\)

局勢決定了對策的結果,對局勢 \(s \in S\),局中人 \(i\) 可以得到收益 \(H_i(s)\),也稱為局中人 \(i\) 的贏得函數。

矩陣對策即二人有限零和對策,是一類較為簡單的對策模型。

矩陣對策基礎

我們假設,局中人 I 有純策略 \(\alpha_1,...,\alpha_m\),局中人 II 有純策略 \(\beta_1,...,\beta_n\),二者各選擇一個純策略則構成 \(m\times n\) 個純局勢 \((\alpha_i, \beta_j)\),將 \((\alpha_i,\beta_j)\) 下 I 的贏得值記為 \(a_{i,j}\),設矩陣 \(A=[a_{i,j}]\),稱為 I 的贏得矩陣或 II 的支付矩陣。局中人 II 的贏得矩陣就是 \(-A^T\)

最優純策略

若純局勢 \((a_{i^*},b_{j^*})\) 滿足

\[\displaystyle\max_i\min_ja_{i,j} = \min_j\max_ia_{i,j}=a_{i^*,j^*} \]

則稱為矩陣對策 \(\{ S_1,S_2;A \}\) 的最優純策略。顯然,最有純策略在贏得矩陣中對應的元素一定滿足,其是所在行的最小元素,也是所在列的最大元素,即矩陣的鞍點。

混合策略

當純策略不存在時,我們希望給出一個選取不同策略的概率分布。我們記 I,II 的概率分布向量分別為 \(x,y\),所有概率分布向量構成的集合為 \(S_1,S_2\),則局中人 I 的贏得函數為 \(E(x,y)=x^TAy\)。純策略是混合策略的特例。

若混合局勢 \((x^*,y^*)\) 滿足

\[\displaystyle\max_x\min_yE(x,y) = \min_y\max_xE(x,y) = E(x^*,y^*) \]

則稱為矩陣對策 \(\{ S_1,S_2;A \}\) 的最優混合策略。同樣,混合策略 \((x^*,y^*)\) 是最有混合策略的充要條件也是 \((x^*,y^*)\) 是函數 \(E(x,y)\) 的鞍點。

可以證明,任意矩陣對策一定存在混合策略意義下的解。

超優原則

若矩陣 \(A\) 中第 \(i\) 行元素均不小於第 \(j\) 行對應元素,則稱 I 的純策略 \(a_i\) 超優於 \(a_j\)。推廣一下,超優者也可以是若干純策略的線性組合。

如果局中人 I 的純策略 \(a_i\) 被其它純策略或若干純策略的線性組合超優時,可以將 \(a_i\) 刪去而不影響結果,稱為超優原則。超優原則在一些情況下可以簡化計算。

矩陣對策的解法

公式法

公式法用於求解 \(2\times 2\) 矩陣對策問題。

考慮當 \(A\) 沒有鞍點時,如何求解最優混合策略。因為沒有鞍點,所以對於 I 的行動,有

\[a_{11}x_1+a_{21}x_2=a_{12}x_1+a_{22}x_2=v, \quad x_1+x_2=1 \]

對 II 也是同理。在沒有鞍點的條件下方程組一定嚴格非負解。

圖解法

圖解法用於求解 \(2\times n\)\(m\times 2\) 矩陣對策問題。

對於一個 \(2\times n\) 的矩陣對策問題,考慮局中人 I 的混合策略 \((x,1-x)^T, x \in [0,1]\),過數軸上 \((0,0),(1,0)\) 分別作垂線一條,垂線上點的縱坐標值分別表示局中人 I 采取純策略 \(\alpha_1=(1,0)^T, \alpha_2=(0,1)^T\) 時,I 的贏得值。

當局中人 I 選擇每一策略 \((x,1-x)^T\) 時,他最少可能收入為所有局中人 II 選擇確定的若干條直線在 \(x\) 處的縱坐標的最小者。要使得 I 在最壞情況下的收入盡可能多,它應當使得直線 \(x\) 與那若干條直線交出的點的縱坐標最小值最大。這轉化成了一個非常直觀的問題,作出若干條直線,列方程求解交點坐標,原問題得以解決。

現在考慮 \(m\times 2\) 的矩陣對策問題,我們將局中人 I 的 \(m\) 種純策略作出直線,然后考慮每個橫坐標處的交點最大值即可。

先前提到的超優原則在圖解法上的體現則更加直觀。對於 \(2\times n\) 矩陣對策問題,若 II 的純策略 \(\beta_i\) 超優於 \(\beta_j\),則 \(i\) 所對應的線段始終不出現在 \(j\) 的上方。此時它對求解最大的最小值沒有任何影響,因此可以刪去。當然,刪去后雖然最優解的值不變,但可能會導致解集變小。

線性方程組法

線性方程組法是對公式法的推廣 ,即將 \(2\times 2\) 推廣到 \(m \times n\) 的情形,其思路是相同的,在此不作贅述。

線性規划方法

根據

\[\sum_i a_{ij}x_i \ge v, \quad \sum_i x_i =1, \quad x_i \ge 0 \]

以及

\[\sum_j a_{ij} y_j \le v,\quad \sum_j y_j=1, \quad y_j \ge 0 \]

對其進行變換,令 \(x_i'=x_i/v, y_j'=y_j/v\),得線性規划問題 P

\[\min z=\sum_i x_i',\quad \sum_i a_{ij}x_i'\ge 1, \quad x_i'\ge 0 \]

對后者進行變換可得其對偶問題 D。

一般先求問題 D 的解,而問題 P 的解可以從問題 D 的解的最后一個單純形表上得到。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM