FireMonkey3D之中國象棋程序設計（六）完善算法

本文轉載自查看原文 2021-12-22 16:38 769

　　聲明：本程序設計參考象棋巫師源碼（開發工具dephi 11，建議用delphi 10.3以上版本）。　　

　　這一章主要完善算法。本章目標：

實現開局庫；
實現PVS(主要變例搜索)；
把根節點的搜索單獨處理，增加搜索的隨機性；
克服由長將引起的置換表的不穩定性。

　　6.1　實現開局庫

　　開局庫幾乎是每個象棋程序必備的部件，它的好處是：

　　(1) 即使再笨的程序，開局庫能使得它們在開局階段看上去不那么業余；

　　(2) 通過隨機選擇走法，讓開局靈活多變，增加對弈的趣味性。

　　我們程序使用開源象棋程序 ElephantEye 的開局庫Book.dat文件，開局庫文件的結構：　　

type BookItem=record
  dwLock:Cardinal;
  wmv, wvl:Word;
end;

　　其中，dwLock 記錄了局面 Zobrist 校驗碼中的 dwLock1，wmv 是走法，wvl 是權重(隨機選擇走法的幾率，僅當兩個相同的 dwLock 有不同的 wmv 時，wvl 的值才有意義)。

　　搜索一個局面時，首先不做Alpha-Beta搜索，而是查找開局庫中有沒有對應的項，有的話就取出所有相同項，從中隨機選擇一個 wmv。ElephantEye 為了壓縮開局庫的容量，所有對稱的局面只用一項，所以當一個局面在開局庫中找不到時，還應該試一下它的對稱局面是否在 BookTable 中。在這里我們將最新的Book.dat文件轉化成了SQLite數據庫文件，這樣就不需要BookItem。在這里說明下，由於我們程序局面記錄使用的是10X9的二維數據，起始是（0,0）。象棋巫師使用的是長度256的一維數組記錄局面，轉換成二維數組時，縱向、橫向均平移了3個單位，在我們程序中相當於從（3,3）點為起始。為了使用象棋巫師的開局庫，我們必須與之兼容，也要轉換成一維數組，開局庫在制作時，wmv 走法也要還原成我們程序的走法，這里我們已經處理好了，直接用就可以。以下函數要做變化(csCommon單元)：

function PtToInteger(p:TPoint):Byte;
begin
  Result:=P.X +P.Y shl 4+51;//加51是為了與象棋巫師對應，相當於將起點定為（3,3）
end;

　　以下為開局庫搜索代碼（我們程序使用了SQLiteTable開源文件，需要附帶SQLite.dll文件，不想附帶DLL文件，可以將其改為FireDAC）：

{加載開局庫}
procedure LoadBook;
begin
  BookDB:=TSQLiteDatabase.Create('book.db3');
  BookDB.ExecSQL('create temp table TBook as select * from Books');//創建內存表
  Randomize;
end;
{查找開局}
function SearchBook:Integer;
var
  i, vl, nBookMoves,mv:Integer;
  mvs,vls:array[Byte]of Integer;
  bMirror:Boolean;
  dwLock:Cardinal;
  posMirror:TPieceMove;
  s,d:TPoint;
begin
  // 搜索開局庫的過程有以下幾個步驟
  // 1. 搜索當前局面
  bMirror:= FALSE;
  dwLock:= pcMove.zobr.dwLock1;
  BookTB:=BookDB.GetTable('select * from TBook where dwLock='+Inttostr(dwLock));
  // 2. 如果沒有找到，那么搜索當前局面的鏡像局面
  if BookTB.RowCount =0 then
  begin
    bMirror:=TRUE;
    pcMove.Mirror(posMirror);
    dwLock:=posMirror.zobr.dwLock1;
    BookTB:=BookDB.GetTable('select * from TBook where dwlock='+Inttostr(dwLock));
  end;
  // 3. 如果鏡像局面也沒找到，則立即返回

  if BookTB.RowCount =0 then
     Exit(0);
  // 4. 把走法和分值寫入到"mvs"和"vls"數組中
  vl:=0;nBookMoves:= 0;
  for i:=0 to BookTB.RowCount-1 do
  begin
    if bMirror then
       mv:=MIRROR_MOVE(BookTB.FI(1))//走法
    else
       mv:=BookTB.FI(1);
    s:=GetSrc(mv);
    d:=GetDest(mv);
    if pcMove.canMove(s,d) then
    begin
      mvs[nBookMoves]:= mv;
      vls[nBookMoves]:= BookTB.FI(2);//權重
      vl:=vl+vls[nBookMoves];
      Inc(nBookMoves);
      if nBookMoves= 256 then  // 防止"book.db3"中含有異常數據
        break;
	
    end;
  BookTB.Next;
  end;
  if vl = 0 then
    Exit(0); // 防止"BOOK.db3"中含有異常數據
  // 5. 根據權重隨機選擇一個走法
  vl:= Random(vl);//這樣權重也是隨機的，有什么區別？
  for i:= 0 to nBookMoves-1 do
  begin
    vl:=vl-vls[i];
    if vl < 0 then
      break;
  end;
  Result:= mvs[i];
end;

　　6.2 根節點的特殊處理

　　現在我們的程序一開局不會總是跳正馬了，根據 ElephantEye 提供的開局庫，它大部分時候走中炮，有時也走仙人指路(進兵)或飛相。可是當它脫離開局庫時，仍然擺脫不了思維的單一性，例如我們第一步走邊兵(開局庫中當然沒有這個局面)，它仍舊只會跳同一邊的正馬。

　　一個解決辦法是：在根節點處，讓一個不是最好的走法也能在一定的幾率取代前一個走法。

　　我們把根節點的搜索函數單獨分離，這樣做有很多好處：

　　(1) 處理思考的隨機性；

　　(2) 沒有必要嘗試 Beta 截斷(根節點處 Beta 始終是 +MATE_VALUE)；

　　(3) 省略了檢查重復局面、獲取置換表、空步裁剪等步驟。

　　代碼如下：

// 根節點的Alpha-Beta搜索過程
function SearchRoot(nDepth:Integer):Integer;
var
  vl, vlBest, mv, nNewDepth:Integer;
  Sort:SortStruct;
  s,d:TPoint;
begin
  vlBest:= -MATE_VALUE;
  Sort.Init(Search.mvResult);
  with pcMove do
  while True do
  begin
    mv:=Sort.Next;
    if mv=0 then Break;
    s:=GetSrc(mv);d:=GetDest(mv);
    if MakeMove(s,d) then
    begin
      nNewDepth:= InCheck.ToInteger+nDepth- 1;// 如果老將被攻擊，就多搜索一層
      if vlBest = -MATE_VALUE then// 主要變例搜索
        vl:= -SearchFull(-MATE_VALUE, MATE_VALUE, nNewDepth, True)
      else
      begin
        vl:= -SearchFull(-vlBest - 1, -vlBest, nNewDepth);
        if vl > vlBest then
          vl:= -SearchFull(-MATE_VALUE, -vlBest, nNewDepth, True);
      end;
      UndoMakeMove;
      if vl > vlBest then
      begin
        vlBest:= vl;
        Search.mvResult:= mv;
        if (vlBest >-WIN_VALUE)and(vlBest < WIN_VALUE) then
        begin
           //// 增加電腦走棋的隨機性
           vlBest:=vlBest + random(RANDOM_MASK) - random(RANDOM_MASK);
           if vlBest=DrawValue then
              vlBest:=vlBest - 1;
        end;
      end;
    end;
  end;
  RecordHash(HASH_PV, vlBest, nDepth, Search.mvResult);
  SetBestMove(Search.mvResult, nDepth);
  Result:=vlBest;
end;

　　6.3 　PVS主要變例搜索

　　經過前面的工作，走法已經得到了很好的排序，好的走法會先被搜索。這是PVS的基礎。

　　　　　　　　　　　　　　　　　　圖a 　　　　　　圖b

　　假設第一個走法是最好的走法，沒有引發剪枝，A點的搜索區間為(0, 100)，走法1得到估值30。由於30 > 0，所以A點的alpha變為30，以后的搜索區間變為(30, 100)，所以B2點的搜索區間為(-100, -30)。

　　可以進一步大膽地考慮，假設第1個走法就是最好的走法，那么后面走法得到的估值不會落在區間(30, 100)。所以從A點的第2個走法開始，要做的就是驗證這種假設，搜索區間為(30, 31)。由於搜索區間很小，搜索速度會很快。返回值vl有3種情況。

　　（1）vl <= 30。說明走法不比第1個走法好，假設成立。

　　（2）vl >= 100。返回值比A點的原有搜索邊界beta還大，應該剪枝，假設成立。

　　（3）30 < vl < 100。走法比第1個走法好，假設不成立。

　　第3種情況時，走法不成立，應該對該走法重新以(30, 100)區間進行搜索。如果得到40，則該走法就是最好的走法，后續搜索又對該走法進行假設驗證，區間為(40, 41)。

　　6.4 長將判負策略

　　由於單方面長將不變作負的規則，以前的版本如果發生這種情況，想當然地給予-MATE_VALUE的值，再根據殺棋步數作調整。但是由於長將判負並不是對某個單純局面的評分，而是跟路線有關的，所以使用置換表時就會產生非常嚴重的后果——某個局面的信息可能來自另一條不同的路線。

　　解決辦法就是：獲取置換表時把“利用長將判負策略搜索到的局面”過濾掉。為此這個版本中我們把長將判負的局面定為BAN_VALUE(MATE_VALUE - 100)，如果某個局面分值在WIN_VALUE(MATE_VALUE - 200)和BAN_VALUE之間，那么這個局面就是“利用長將判負策略搜索到的局面”。

　　我們仍舊把部分“利用長將判負策略搜索到的局面”記錄到置換表，因為這些局面提供的最佳走法是有啟發價值的。反過來說，如果“利用長將判負策略搜索到的局面”沒有最佳走法，那么這種局面就沒有必要記錄到置換表了。經經過這種處理，我們的程序在殺棋階段不再會走出莫名其妙的走法了。

以上程序未經充分測試，發現問題請及時反饋。

本章節源碼百度雲盤（測試程序打包在里面）：

鏈接：中國象棋程序設計（六）置換表

提取碼：1234

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 FireMonkey3D之中國象棋程序（一）界面設計 FireMonkey3D之中國象棋程序（二）制定規則 JavaScript中國象棋程序（1） - 界面設計 JavaScript中國象棋程序（4） - 極大極小搜索算法 HTML5之中國象棋，附帶源碼！ JavaScript中國象棋程序（7） - 置換表 JavaScript中國象棋程序（0） - 前言 python 中國象棋 JavaScript中國象棋程序（2） - 校驗棋子走法 JavaScript中國象棋程序（8） - 進一步優化