Nim游戲博弈(收集完全版)

本文轉載自查看原文 2019-10-12 17:23 719

Nim游戲證明參見：

劉汝佳訓練指南P135—寫的很酷！
知乎上SimonS關於Nim博弈的回答！

Nim游戲的概述：

還記得這個游戲嗎？
給出n列珍珠，兩人輪流取珍珠，每次在某一列中取至少1顆珍珠，但不能在兩列中取。最后拿光珍珠的人輸。
后來，在一份資料上看到，這種游戲稱為“拈（Nim）”。據說，它源自中國，經由被販賣到美洲的奴工們外傳。辛苦的工人們，在工作閑暇之余，用石頭玩游戲以排遣寂寞。后來流傳到高級人士，則用便士（Pennies），在酒吧櫃台上玩。
最有名的玩法，是把十二枚便士放成3、4、5三列，拿光銅板的人贏。后來，大家發現，先取的人只要在3那列里取走2枚，變成了1、4、5，就能穩操勝券了，游戲也就變得無趣了。於是大家就增加列數，增加銅板的數量，這樣就讓人們有了毫無規律的感覺，不易於把握。
直到本世紀初，哈佛大學數學系副教授查理士•理昂納德•包頓（Chales Leonard Bouton）提出一篇極詳盡的分析和證明，利用數的二進制表示法，解答了這個游戲的一般法則。
一般規則是規定拿光銅板的人贏。
它的變體是規定拿光銅板的人輸，只要注意某種特殊形態（只有1列不為1），就可以了！
有很多人把這個方法寫成計算機程序，來和人對抗，不知就理的人被騙得團團轉，無不驚嘆計算機的神奇偉大。其實說穿了，只因為它計算比人快，數的轉化為二進制其速度快得非人能比，如此罷了。
（以上來自K12教育論壇）

Nim游戲的數學理論論述：

Nim游戲是博弈論中最經典的模型，它又有着十分簡單的規則和無比優美的結論
Nim游戲是組合游戲(Combinatorial Games)的一種，准確來說，屬於“Impartial Combinatorial Games”（以下簡稱ICG）。滿足以下條件的游戲是ICG（可能不太嚴謹）：1、有兩名選手；2、兩名選手交替對游戲進行移動(move)，每次一步，選手可以在（一般而言）有限的合法移動集合中任選一種進行移動；3、對於游戲的任何一種可能的局面，合法的移動集合只取決於這個局面本身，不取決於輪到哪名選手操作、以前的任何操作、骰子的點數或者其它什么因素； 4、如果輪到某名選手移動，且這個局面的合法的移動集合為空（也就是說此時無法進行移動），則這名選手負。根據這個定義，很多日常的游戲並非ICG。例如象棋就不滿足條件3，因為紅方只能移動紅子，黑方只能移動黑子，合法的移動集合取決於輪到哪名選手操作。

通常的Nim游戲的定義是這樣的：有若干堆石子，每堆石子的數量都是有限的，合法的移動是“選擇一堆石子並拿走若干顆（不能不拿）”，如果輪到某個人時所有的石子堆都已經被拿空了，則判負（因為他此刻沒有任何合法的移動）。
這游戲看上去有點復雜，先從簡單情況開始研究吧。如果輪到你的時候，只剩下一堆石子，那么此時的必勝策略肯定是把這堆石子全部拿完一顆也不給對手剩，然后對手就輸了。如果剩下兩堆不相等的石子，必勝策略是通過取多的一堆的石子將兩堆石子變得相等，以后如果對手在某一堆里拿若干顆，你就可以在另一堆中拿同樣多的顆數，直至勝利。如果你面對的是兩堆相等的石子，那么此時你是沒有任何必勝策略的，反而對手可以遵循上面的策略保證必勝。如果是三堆石子……好像已經很難分析了，看來我們必須要借助一些其它好用的（最好是程式化的）分析方法了，或者說，我們最好能夠設計出一種在有必勝策略時就能找到必勝策略的算法。

定義P-position和N-position，其中P代表Previous，N代表Next。直觀的說，上一次move的人有必勝策略的局面是P-position，也就是“后手可保證必勝”或者“先手必敗”，現在輪到move的人有必勝策略的局面是N-position，也就是“先手可保證必勝”。更嚴謹的定義是：1.無法進行任何移動的局面（也就是terminal position）是P-position；2.可以移動到P-position的局面是N-position；3.所有移動都導致N-position的局面是P-position。
按照這個定義，如果局面不可能重現，或者說positions的集合可以進行拓撲排序，那么每個position或者是P-position或者是N-position，而且可以通過定義計算出來。

以Nim游戲為例來進行一下計算。比如說我剛才說當只有兩堆石子且兩堆石子數量相等時后手有必勝策略，也就是這是一個P-position，下面我們依靠定義證明一下(3,3)是一個P是一個P是一個P-position。首先(3,3)的子局面（也就是通過合法移動可以導致的局面）有(0,3)(1,3)(2,3)（顯然交換石子堆的位置不影響其性質，所以把(x,y)和(y,x)看成同一種局面），只需要計算出這三種局面的性質就可以了。 (0,3)的子局面有(0,0)、(0,1)、(0,2)，其中(0,0)顯然是P-position，所以(0,3)是N-position（只要找到一個是P-position的子局面就能說明是N-position）。(1,3)的后繼中(1,1)是P-position（因為(1,1)的唯一子局面(0,1)是N-position），所以(1,3)也是N-position。同樣可以證明(2,3)是N-position。所以(3,3)的所有子局面都是N-position，它就是P-position。通過一點簡單的數學歸納，可以嚴格的證明“有兩堆石子時的局面是P-position當且僅當這兩堆石子的數目相等”。

根據上面這個過程，可以得到一個遞歸的算法——對於當前的局面，遞歸計算它的所有子局面的性質，如果存在某個子局面是P-position，那么向這個子局面的移動就是必勝策略。當然，可能你已經敏銳地看出有大量的重疊子問題，所以可以用DP或者記憶化搜索的方法以提高效率。但問題是，利用這個算法，對於某個Nim游戲的局面(a1,a2,...,an)來說，要想判斷它的性質以及找出必勝策略，需要計算O(a1*a2*...*an)個局面的性質，不管怎樣記憶化都無法降低這個時間復雜度。所以我們需要更高效的判斷Nim游戲的局面的性質的方法。

直接說結論好了。

(Bouton's Theorem)：對於一個Nim游戲的局面(a1,a2,...,an)，它是P-position當且僅當a1^a2^...^an=0，其中^表示異或(xor)運算。

怎么樣，是不是很神奇？我看到它的時候也覺得很神奇，完全沒有道理的和異或運算扯上了關系。但這個定理的證明卻也不復雜，基本上就是按照兩種position的證明來的。

根據定義，證明一種判斷position的性質的方法的正確性，只需證明三個命題： 1、這個判斷將所有terminal position判為P-position；2、根據這個判斷被判為N-position的局面一定可以移動到某個P-position；3、根據這個判斷被判為P-position的局面無法移動到某個P-position。

第一個命題顯然，terminal position只有一個，就是全0，異或仍然是0。

第二個命題，對於某個局面(a1,a2,...,an)，若a1^a2^...^an!=0，一定存在某個合法的移動，將ai改變成ai'后滿足a1^a2^...^ai'^...^an=0。不妨設a1^a2^...^an=k，則一定存在某個ai，它的二進制表示在k的最高位上是1（否則k的最高位那個1是怎么得到的）。這時ai^k<ai一定成立。則我們可以將ai改變成ai'=ai^k，此時a1^a2^...^ai'^...^an=a1^a2^...^an^k=0。

第三個命題，對於某個局面(a1,a2,...,an)，若a1^a2^...^an=0，一定不存在某個合法的移動，將ai改變成ai'后滿足a1^a2^...^ai'^...^an=0。因為異或運算滿足消去率，由a1^a2^...^an=a1^a2^...^ai'^...^an可以得到ai=ai'。所以將ai改變成ai'不是一個合法的移動。證畢。

根據這個定理，我們可以在O(n)的時間內判斷一個Nim的局面的性質，且如果它是N-position，也可以在O(n)的時間內找到所有的必勝策略。Nim問題就這樣基本上完美的解決了。

（以上來自百度百科）

Nim游戲的形象具體論述：

Nim取子游戲是由兩個人面對若干堆硬幣（或石子）進行的游戲。設有k>=1堆硬幣，各堆分別含有N ₁ ，N ₂ ，……N _K 枚硬幣。游戲的目的就是選擇最后剩下的硬幣。游戲法則如下：

1．兩個游戲人交替進行游戲（游戲人I和游戲人II）；

2．當輪到每個游戲人取子時，選擇這些堆中的一堆，並從所選的堆中取走至少一枚硬幣（游戲人可以取走他所選堆中的全部硬幣）；

3．當所有的堆都變成空堆時，最后取子的游戲人即為勝者。

這個游戲中的變量是堆數k和各堆的硬幣數N ₁ ，N ₂ ，……N _k 。對應的組合問題是，確定游戲人I獲勝還是游戲人II獲勝以及兩個游戲人應該如何取子才能保證自己獲勝（獲勝策略）。

為了進一步理解Nim取子游戲，我們考查某些特殊情況。如果游戲開始時只有一堆硬幣，游戲人I則通過取走所有的硬幣而獲勝。現在設有2堆硬幣，且硬幣數量分別為N ₁ 和N ₂ 。游戲人取得勝利並不在於N1和N2的值具體是多少，而是取決於它們是否相等。設N ₁ ！=N ₂ ，游戲人I從大堆中取走的硬幣使得兩堆硬幣數量相等，於是，游戲人I以后每次取子的數量與游戲人II相等而最終獲勝。但是如果N ₁ = N ₂ ，則：游戲人II只要按着游戲人I取子的數量在另一堆中取相等數量的硬幣，最終獲勝者將會是游戲人II。這樣，兩堆的取子獲勝策略就已經找到了。

現在我們如何從兩堆的取子策略擴展到任意堆數中呢？

首先來回憶一下，每個正整數都有對應的一個二進制數，例如：57 ₍₁₀₎ à 111001 ₍₂₎ ，即：57 ₍₁₀₎ =2 ⁵ +2 ⁴ +2 ³ +2 ⁰ 。於是，我們可以認為每一堆硬幣數由2的冪數的子堆組成。這樣，含有57枚硬幣大堆就能看成是分別由數量為2 ⁵ 、2 ⁴ 、2 ³ 、2 ⁰ 的各個子堆組成。

現在考慮各大堆大小分別為N ₁ ，N ₂ ，……N _k 的一般的Nim取子游戲。將每一個數N _i 表示為其二進制數（數的位數相等，不等時在前面補0）：

N ₁ = a _s …a ₁ a ₀

N ₂ = b _s …b ₁ b ₀

……

N _k = m _s …m ₁ m ₀

如果每一種大小的子堆的個數都是偶數，我們就稱Nim取子游戲是平衡的，而對應位相加是偶數的稱為平衡位，否則稱為非平衡位。因此，Nim取子游戲是平衡的，當且僅當：

a_s+ b_s + … + m_s 是偶數

……

a₁+ b₁+ … + m₁是偶數

a₀+ b₀ + … + m₀是偶數

於是，我們就能得出獲勝策略：

游戲人I能夠在非平衡取子游戲中取勝，而游戲人II能夠在平衡的取子游戲中取勝。

我們以一個兩堆硬幣的Nim取子游戲作為試驗。設游戲開始時游戲處於非平衡狀態。這樣，游戲人I就能通過一種取子方式使得他取子后留給游戲人II的是一個平衡狀態下的游戲，接着無論游戲人II如何取子，再留給游戲人I的一定是一個非平衡狀態游戲，如此反復進行，當游戲人II在最后一次平衡狀態下取子后，游戲人I便能一次性取走所有的硬幣而獲勝。而如果游戲開始時游戲牌平衡狀態，那根據上述方式取子，最終游戲人II能獲勝。

下面應用此獲勝策略來考慮4-堆的Nim取子游戲。其中各堆的大小分別為7，9，12，15枚硬幣。用二進制表示各數分別為：0111，1001，1100和1111。於是可得到如下一表：

	2³ = 8	2² = 4	2¹ = 2	2⁰ = 1
大小為7的堆	0	1	1	1
大小為9的堆	1	0	0	1
大小為12的堆	1	1	0	0
大小為15的堆	1	1	1	1

由Nim取子游戲的平衡條件可知，此游戲是一個非平衡狀態的取子游戲，因此，游戲人I在按獲勝策略進行取子游戲下將一定能夠取得最終的勝利。具體做法有多種，游戲人I可以從大小為12的堆中取走11枚硬幣，使得游戲達到平衡（如下表），

	2³ = 8	2² = 4	2¹ = 2	2⁰ = 1
大小為7的堆	0	1	1	1
大小為9的堆	1	0	0	1
大小為12的堆	0	0	0	1
大小為15的堆	1	1	1	1

之后，無論游戲人II如何取子，游戲人I在取子后仍使得游戲達到平衡。

同樣的道理，游戲人I也可以選擇大小為9的堆並取走5枚硬幣而剩下4枚，或者，游戲人I從大小為15的堆中取走13枚而留下2枚。

歸根結底，Nim取子游戲的關鍵在於游戲開始時游戲處於何種狀態（平衡或非平衡）和第一個游戲人是否能夠按照取子游戲的獲勝策略來進行游戲。

(以上轉自Rainco_shnu的百度空間)

下面寫點自己的東西:

如果Nim游戲中的規則稍微變動一下,每次最多只能取K個,怎么處理?

方法是將每堆石子數mod (k+1).

標簽: 博弈論

/**
     * 拿球問題：拿到最后一個球贏
     *      設：A、B每次最多拿1-5個，只要最后剩6個
     *
     * A贏：
     *      1、A先拿
     *          num%6=m
     *          A先拿m個、以后每次A與B總的拿6個
     *
     *      2、B先拿
     *          B拿k個
     *
     *          num=num-k
     *          調用1
     */

public void APre(int num){
         int k=num%6;
         int tmp=num-k;
         System.out.println("A先拿求個數："+k);
         for(int i=0;i<num/6;i++){
             if(tmp>=6){
                 k=(int)(Math.random()*6);
                  System.out.println("B拿球個數："+k);
                 System.out.println("A拿球個數"+(6-k));
             }
             tmp=tmp-6;
         }
     }
     public void BPre(int num){
        int k=(int)(Math.random()*6);
        System.out.println("B先拿個數："+k);
        APre(num-k);
     }

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【博弈論】Nim游戲博弈論入門之nim游戲 airflow的安裝和使用 - 完全版 Monkey之環境搭建完全版 Word查找和替換通配符(完全版) Linux部署達夢數據庫（完全版）標准音階及常用樂器頻率范圍對照表(完全版) NAT概念解釋(不完全版，但不會搞錯...) WordPress 建站教程：新手搭建 WordPress個人博客圖文教程（完全版）【Leetcode】292. Nim游戲