混合策略求解


因為看到版上經常有人對此有疑問,特整理一個簡單的方法供大家參考。

百度百科上的定義(感覺比較貼切):

在完全信息博弈中,如果在每個給定信息下,只能選擇一種特定策略,這個策略為純策略(pure strategy)。如果在每個給定信息下只以某種概率選擇不同策略,稱為混合策略(mixed strategy)。混合策略是純策略在空間上的概率分布,純策略是混合策略的特例。純策略的收益可以用效用表示,混合策略的收益只能以預期效用表示。

一般解法(下面我們介紹一種簡便的求解混合策略的方法,它不一定嚴謹,但是管用。 參照網上信息):
以“麥琪的禮物”為例來說明。我們假設丈夫賣表的概率為p,那么不賣表的概率為 1-p,為方便也可將這概率標記在贏利表旁邊(如表1);假設妻子剪發的概率為q,那么不剪發的概率為 1-q,為方便把它們記在贏利表下邊。 

                                                                                                                               麥琪的禮物

    剪發 不剪  
  買表 (0,0) (2,1) p
  不買 (1,2) (0,0) 1-p
    q 1-q  



各參與人在各策略下的預期贏利為: 
    丈夫:買表的預期贏利:0×q+2 ×(1-q)=2-2q           (1) 
        不賣的預期贏利:1×q+0 ×(1-q)=q                       (2) 

    妻子:剪發的預期贏利:0×p+2 ×(1-p)=2-2p              (3) 
        不賣的預期贏利:1×p+0 ×(1-p)=p                          (4) 

    注意,丈夫的某個策略的贏利是該策略對應的行中丈夫的贏利與妻子的概率積之和;而妻子的某個策略的贏利是該策略對應的列中妻子的贏利與丈夫的概率積之和。納什均衡應滿足,①妻子選擇q使丈夫在各策略之間的預期贏利沒有差異,即使式子(1) 
等於式子(2):2-2q=q,可解出q*=2/3;②丈夫選擇q使妻子在各策略之間的預期贏利沒有差異,即使式子(3)等於式子(4):2-2p=p,可解出p* =2/3。 
    由此,納什均衡狀態下丈夫的混合策略是(2/3,1/3),妻子的混合策略也是(2/3,1/3)。混合納什均衡為{(2/3,1/3),(2/3,1/3)}。 


另外,如果開始時不是2*2的博弈,求混合策略應先剔除劣勢策略 。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM