納什均衡簡單的理解:在這種策略下,任何一位玩家都不願意單方面的改變自己的策略。
本系列討論:如何用代碼計算兩人零和博弈的納什均衡
例如這樣一個賭局
規則:兩人各自亮出硬幣的一面。如果兩人都是正面,那么A給B3元,如果兩人都是反面,A給B1元,剩下的情況B給A2元。
這個賭局看似公平,但其實非也。
分析:假設A以p1、p2的概率出正面、反面。
當B出正面時,A的收益為:w1=-3元*p1+2元*p2
當B出反面時,A的收益為:w2=2元*p1-1元*p2
令w1=w2
得p1=3/8,w1=w2=1/8
可見,A可以通過合理的策略獲得優勢。
當然,我們也可以用代碼來解決問題。
