博弈論的算法總結


  開頭先啰嗦一句:想學好博弈,必然要花費很多的時間,深入學習,不要存在一知半解,應該是一看到題目,就想到博弈的類型。

以及,想不斷重復不斷重復,做大量各大oj網站的題目,最后吃透它。

博弈:

  博弈論又被稱為對策論(Game Theory),既是現代數學的一個新分支,也是運籌學的一個重要學科。

博弈,具體的例子就是下棋,雙方都考慮最有利於自已的步驟,但是最終必有一方輸,一方贏。

  博弈的策略:參與者在行動之前所准備好的一套完整的行動方案,就是想好下完這步棋,對方會如何下,

以及接下來該如何下,最終得出結果。

常見的博弈有以下:

1.博弈:合作博弈和非合作博弈
   合作博弈:指參與者能夠達成一種具有約束力的協議,在協議范圍內選擇有利於雙方的策略
   非合作博弈:指參與者無法達成這樣一種協議
2.博弈:靜態博弈和動態博弈
   靜態博弈:指在博弈中,參與者同時選擇,或雖非同時選擇,但是在邏輯時間
                   上是同時的。(期末老師評分與同學給老師評分)
   動態博弈:指在博弈中,參與者的行動有先后順序,且后行動者能夠觀察
                   到先行動者的行動。(下棋)
3.博弈:完全信息博弈與不完全信息博弈
   完全信息博弈:指在博弈中,每個參與者對其他參與者的類型,策略空間及損益函數都有准確的信息。(賣家與買家)
   不完全信息博弈:總有一些信息不是所有參與者都知道的
4.博弈:零和博弈與非零和博弈
   零和博弈:指博弈前的損益總和與博弈后的損益總和相等
   非零和博弈:指博弈后的損益大於(小於)博弈前的損益總和(正和或負和 )

下面我主要講一些關於算法比賽中用到的博弈類型:

首先你要理解必勝狀態和必敗狀態:

  對下先手來說,

  一個狀態是必敗狀態當且僅當它的所有后繼都是必敗狀態。

  一個狀態是必勝狀態當且僅當它至少有一個后繼是必敗狀態。

  就是說,博弈者,一旦捉住了勝利的把柄,必然最后勝利。

博弈中常常用到的:

  兩個數,不用中間變量實現交換。
  a b;
  a = a^b;
  b = a^b;
  a = a^b;

巴什博弈:

百度百科:

  巴什博弈:只有一堆n個物品,兩個人輪流從這堆物品中取物, 規定每次至少取一個,最多取m個。最后取光者得勝。

  顯然,如果n=m+1,那么由於一次最多只能取m個,所以,無論先取者拿走多少個,后取者都能夠一次拿走剩余的物品,后者取勝。因此我們發現了如何取勝的法則:如果n=(m+1)r+s,(r為任意自然數,s≤m),那么先取者要拿走s個物品,如果后取者拿走k(≤m)個,那么先取者再拿走m+1-k個,結果剩下(m+1)(r-1)個,以后保持這樣的取法,那么先取者肯定獲勝。總之,要保持給對手留下(m+1)的倍數,就能最后獲勝。這個游戲還可以有一種變相的玩法:兩個人輪流報數,每次至少報一個,最多報十個,誰能報到100者勝。對於巴什博弈,那么我們規定,如果最后取光者輸,那么又會如何呢?(n-1)%(m+1)==0則后手勝利

先手會重新決定策略,所以不是簡單的相反行的
例如n=15,m=3
后手 先手 剩余
0 2 13
1 3 9
2 2 5
3 1 1
1 0 0
先手勝利 輸的人最后必定只抓走一個,如果>1個,則必定會留一個給對手
 

請去刷下面的題目,均是巴什博弈

     算博弈題目時,一定要算到一個周期結束,防止出錯,很有可能像HDU2897那樣。中途錯的猝不及防    

  HDU1847 
 
代碼實現如下:
package Combat.com;

import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        while(cin.hasNext())
        {
            int n = cin.nextInt();
            PLG(n);
        }
    }
    static void PLG(int n)
    {
        if(n%3 == 0)
        {
            System.out.println("Cici");
        }
        else
        {
            System.out.println("Kiki");
        }
    }
}

 

代碼實現如下:
import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        while(cin.hasNext())
        {
            int n = cin.nextInt();
            int m = cin.nextInt();
            if(n == 0 && m == 0)
            {
                return;
            }
            PLG(n,m);
        }
    }
    static void PLG(int n,int m)
    {
        if(n%2 == 0 || m % 2 == 0)
        {
            System.out.println("Wonderful!");
        }
        else
        {
            System.out.println("What a pity!");
        }
    }
}

 

代碼實現如下:
package Combat.com;

import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        while(cin.hasNext())
        {
            int m = cin.nextInt();
            int n = cin.nextInt();
            PLG(m,n);
        }
    }
    static void PLG(int m,int n)
    {
        if(m % (n+1) == 0)
        {
            System.out.println("none");
        }
        else
        {
            if(m <= n)
            {
                for(int i = m; i <= n; i++)
                {
                    if(i!= m)
                    {
                        System.out.print(" ");
                    }
                    System.out.print(i);
                }
                System.out.println();
            }
            else
            {
                int flag = 0;
                for(int i = 1; i <= n; i++)
                {
                    if((m-i)%(n+1) == 0)
                    {
                        if(flag == 0)
                        {
                            System.out.print(i);
                        }
                        else
                        {
                            System.out.print(" " + i);
                        }
                        flag++;
                    }
                }
                System.out.println();
            }
        }
    }
}

 

代碼實現如下:
package Combat.com;

import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        int C = cin.nextInt();
        while(C != 0)
        {
            int n = cin.nextInt();
            int m = cin.nextInt();
            PLG(n,m);
            C--;
        }
    }
    static void PLG(int n,int m)
    {
        if(n <= m)
        {
            System.out.println("Grass");
        }
        else
        {
            if(n % (m+1) == 0)
            {
                System.out.println("Rabbit");
            }
            else
            {
                System.out.println("Grass");
            }
        }
    }
}
 
 
代碼實現如下:
package Combat.com;

import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        while(cin.hasNext())
        {
            int n = cin.nextInt();
            int p = cin.nextInt();
            int q = cin.nextInt();
            PLG(n,p,q);
        }
    }
    static void PLG(int n,int p,int q)
    {
        if(n < p+q)
        {
            if(n <= p)
            {
                System.out.println("LOST");
            }
            else
            {
                System.out.println("WIN");
            }
        }
        else if(n%(p+q) == 0)
        {
            System.out.println("WIN");
        }
        else//有坑
        {
            if(n % (p+q) > p)
                System.out.println("WIN");
            else
                System.out.println("LOST");
        }
    }
}

 

威佐夫博弈:

  一定要去百度百科上面,先理解透意思。

  下面是一些威佐夫博弈的總結:

  威佐夫博弈(Wythoff's game):有兩堆各若干個物品,兩個人輪流從某一堆取至少一個或同時從兩堆中取同樣多的物品,規定每次至少取一個,多者不限,最后取光者得勝。
這種情況下是頗為復雜的。我們用(a[k],b[k])(a[k] ≤ b[k] ,k=0,1,2,...,n)(表示兩堆物品的數量並稱其為局勢,如果甲面對(0,0),那么甲已經輸了,這種局勢我們稱為奇異局勢。
前幾個奇異局勢是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。注:k表示奇異局勢的序號, 第一個奇異局勢k=0。
可以看出,a[0]=b[0]=0,a[k]是未在前面出現過的最小自然數,而 b[k]= a[k] + k。
重要結論:(a,b)b>= a的,如果(int)(b-a)*(Math.sqrt(5)+1)/2 == a,那么先手必輸。
如果不等,后者必輸。
 

設當前局勢為(a,b); a <= b
①a==b:同時從兩堆取走a個石子,轉化為(0,0)
②a==a[k]&&b>b[k]:從第二堆取走b−b[k]個石子,轉化為(a,b[k])
③a==a[k]&&b<b[k]:同時從兩堆取走a−a[b−a]個石子,轉化為(a[b−a],b−a+a[b−a])
④a>a[k]&&b==b[k]:從第一堆取走a−a[k]個石子,轉化為(a[k],b)
⑤a<a[k]&&b==b[k]:若a==a[j] (j<k),則從第二堆取走b−b[j]個石子,轉化為(a,b[j]);

  否則必有a==b[j](j<k)a==b[j](j<k),則從第二堆取走b−a[j]b−a[j]個石子,轉化為(a[j],a)

  例如5  8 ,5>a(8-5)=a3=4  8>b(8-5)=b3=7 從兩堆中取走a-a(b-a)=5-4=1個,變成奇異局勢(4,7)。

  例如4 6 ,4>a(6-4)=a2=3  6>b(6-4)=b2=5 從兩堆中取走a-a(b-a)=4-3=1個,變成奇異局勢(3,5)。

  可以理解成變成差為b-a的奇異局勢。

如果a=bk並且b-a!=k,則從b堆中取走b-ak個,變成奇異局勢(ak,bk).

  例如,5 10 ,5=b2 10-5=5!=2 則從10中取走10-a2=10-3=7個,變成奇異局勢(3,5)。

為什么要b-a!=k呢?例如7 10 , 7=a3,10-7=3=k 也可以變成奇異局勢(4,7)。但這已經在4)判斷過了。

  奇異局勢就是當你面臨這種情況的時候,你必然是輸的,反之,你必贏。
  (a,b),a,b兩堆物品的重量,此處是b>a;
  解題的技巧:
  if a > b , 交換兩個值。
  c = b-a;
  c = (int)(c*((根號5)+1)/2)
  if(c == b)  先手必輸
  else 先手必贏
  題目: HDU1527  HDU2177特別要注意HDU2177這道題目。
 
HDU1527的代碼實現如下:
package Combat.com;

import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    static final double mid = (Math.sqrt(5)+1)/2;
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        while(cin.hasNext())
        {
            int a = cin.nextInt();
            int b = cin.nextInt();
            int MAX = Math.max(a, b);
            int MIN = Math.min(a, b);
            int temp = (int) ((MAX-MIN)*mid);
            if(temp == MIN)
            {
                System.out.println("0");
            }
            else
            {
                System.out.println("1");
            }
        }
    }
}

HDU2177的代碼實現如下:巧妙暴力,分情況太麻煩了。

package Combat.com;

import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    static final double MID = (Math.sqrt(5)+1)/2;
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        while(cin.hasNext())
        {
            int a = cin.nextInt();
            int b = cin.nextInt();
            if(a == 0 && b == 0)
            {
                return;
            }
            WTFGame(a,b);
        }
    }
    static void WTFGame(int a,int b)
    {
        int temp = (int) ((b-a)*MID);
        if(temp == a)
        {
            System.out.println("0");
        }
        else
        {
            System.out.println("1");
            for(int i = 1; i <= a; i++)//先取同樣石子
            {
                int n = a-i;
                int m = b-i;
                temp = (int) ((m-n)*MID);
                if(temp == n)
                {
                    System.out.println(n + " " + m);
                }
            }
            for(int i = a-1; i >=0; i--)//從最小堆單取;
            {
                temp = (int) ((b-i)*MID);
                if(temp > i)//因為a越小,temp就越大,永遠不可能等。
                {
                    break;
                }
            }
            for(int i = b-1; i >= 0; i--)//從最大堆單取
            {
                int n = a;
                int m = i;
                if(n > m)
                {
                    int t = a;
                    n = m;
                    m = t;
                    temp = (int)((m-n)*MID);
                    if(temp > n)//這里充當優先,當條件滿足,無需進行下去了。
                    {
                        break;
                    }
                }
                temp = (int) ((m-n)*MID);
                if(temp == n)
                {
                    System.out.println(n + " " + m);
                }
            }
        }
    }
}

 

尼姆博弈(Nimm Game):

尼姆博弈指的是這樣一個博弈游戲:  有任意堆物品,每堆物品的個數是任意的,雙方輪流從中取物品,每一次只能從一堆物品中取部分或全部物品,最少取一件,  取到最后一件物品的人獲勝。

百度百科:

  有三堆各若干個物品,兩個人輪流從某一堆取任意多的物品,規定每次至少取一個,多者不限,最后取光者得勝。
  這種情況最有意思,它與二進制有密切關系,我們用(a,b,c)表示某種局勢,首先(0,0,0)顯然是奇異局勢,無論誰面對奇異局勢,都必然失敗。第二種奇異局勢是  (0,n,n),只要與對手拿走一樣多的物品,最后都將導致(0,0,0)。仔細分析一下,(1,2,3)也是奇異局勢,無論自己如何拿,接下來對手都可以將其變為(0,n,n)  的情形。
計算機算法里面有一種叫做按位模2加,也叫做異或的運算,我們用符號⊕表示這種運算,先看(1,2,3)的按位模2加的結果:
1 =二進制01
2 =二進制10
3 =二進制11 ⊕
———————
0 =二進制00 (注意不進位)
對於奇異局勢(0,n,n)也一樣,結果也是0。
任何奇異局勢(a,b,c)都有a⊕b⊕c =0。
注意到異或運算的交換律和結合律,及a⊕a=0,:
a⊕b⊕(a⊕b)=(a⊕a)⊕(b⊕b)=0⊕0=0。
所以從一個非奇異局勢向一個奇異局勢轉換的方式可以是:
1)使 a = c⊕b
2)使 b = a⊕c
3)使 c = a⊕b

結論就是:把每堆物品數全部異或起來,如果得到的值為0,那么先手必敗,否則先手必勝。

HDU2176

代碼實現如下;

package Combat.com;

import java.util.Arrays;
import java.util.Scanner;

public class Main
{
    static final int MAX = 200005;
    static int array[] = new int[MAX];
    public static void main(String []args)
    {
        Scanner cin = new Scanner(System.in);
        while(cin.hasNext())
        {
            int m = cin.nextInt();
            if(m == 0)
            {
                return;
            }
            int sum = 0;//異或的結果
            for(int i = 0; i < m; i++)
            {
                array[i] = cin.nextInt();
                sum = sum^array[i];
            }
            NIMGame(sum,m);
        }
    }
    static void NIMGame(int sum,int k)
    {
        if(sum == 0)//代表面臨奇異情況,必輸
        {
            System.out.println("No");
            return;
        }
        else
        {
            System.out.println("Yes");
            for(int i = 0; i < k; i++)//勝的第一次取法,
            {
                int s = sum^array[i];//結果s相當於,sum沒與array[i]異或。
                if(s < array[i])
                {
                    System.out.println(array[i] + " " + s);
                }
            }
        }
    }
}

HDU1850  也是一道尼姆博弈題目,解法和上面相同。

HDU1907也是同樣的做法

 

 階梯博弈:

具體意思,參照下面網址:https://www.cnblogs.com/jiangjing/p/3849284.html

  

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM