兩人零和博弈的納什均衡


納什均衡簡單的理解:在這種策略下,任何一位玩家都不願意單方面的改變自己的策略。

本系列討論:如何用代碼計算兩人零和博弈的納什均衡

例如這樣一個賭局

規則:兩人各自亮出硬幣的一面。如果兩人都是正面,那么A給B3元,如果兩人都是反面,A給B1元,剩下的情況B給A2元。

這個賭局看似公平,但其實非也。

分析:假設A以p1、p2的概率出正面、反面。

當B出正面時,A的收益為:w1=-3元*p1+2元*p2

當B出反面時,A的收益為:w2=2元*p1-1元*p2

令w1=w2

得p1=3/8,w1=w2=1/8

可見,A可以通過合理的策略獲得優勢。

當然,我們也可以用代碼來解決問題。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM