两人零和博弈的纳什均衡


纳什均衡简单的理解:在这种策略下,任何一位玩家都不愿意单方面的改变自己的策略。

本系列讨论:如何用代码计算两人零和博弈的纳什均衡

例如这样一个赌局

规则:两人各自亮出硬币的一面。如果两人都是正面,那么A给B3元,如果两人都是反面,A给B1元,剩下的情况B给A2元。

这个赌局看似公平,但其实非也。

分析:假设A以p1、p2的概率出正面、反面。

当B出正面时,A的收益为:w1=-3元*p1+2元*p2

当B出反面时,A的收益为:w2=2元*p1-1元*p2

令w1=w2

得p1=3/8,w1=w2=1/8

可见,A可以通过合理的策略获得优势。

当然,我们也可以用代码来解决问题。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM