FireMonkey3D之中國象棋程序設計(六)完善算法


  聲明:本程序設計參考象棋巫師源碼(開發工具dephi 11,建議用delphi 10.3以上版本)。  

  這一章主要完善算法。本章目標:

  • 實現開局庫;
  • 實現PVS(主要變例搜索);
  • 把根節點的搜索單獨處理,增加搜索的隨機性;
  • 克服由長將引起的置換表的不穩定性。

  6.1 實現開局庫

  開局庫幾乎是每個象棋程序必備的部件,它的好處是:

  (1) 即使再笨的程序,開局庫能使得它們在開局階段看上去不那么業余;

  (2) 通過隨機選擇走法,讓開局靈活多變,增加對弈的趣味性。

  我們程序使用開源象棋程序 ElephantEye 的開局庫Book.dat文件,開局庫文件的結構:  

type BookItem=record
  dwLock:Cardinal;
  wmv, wvl:Word;
end;

  其中,dwLock 記錄了局面 Zobrist 校驗碼中的 dwLock1wmv 是走法,wvl 是權重(隨機選擇走法的幾率,僅當兩個相同的 dwLock 有不同的 wmv 時,wvl 的值才有意義)

  搜索一個局面時,首先不做Alpha-Beta搜索,而是查找開局庫中有沒有對應的項,有的話就取出所有相同項,從中隨機選擇一個 wmvElephantEye 為了壓縮開局庫的容量,所有對稱的局面只用一項,所以當一個局面在開局庫中找不到時,還應該試一下它的對稱局面是否在 BookTable 中。在這里我們將最新的Book.dat文件轉化成了SQLite數據庫文件,這樣就不需要BookItem。在這里說明下,由於我們程序局面記錄使用的是10X9的二維數據,起始是(0,0)。象棋巫師使用的是長度256的一維數組記錄局面,轉換成二維數組時,縱向、橫向均平移了3個單位,在我們程序中相當於從(3,3)點為起始。為了使用象棋巫師的開局庫,我們必須與之兼容,也要轉換成一維數組,開局庫在制作時,wmv 走法也要還原成我們程序的走法,這里我們已經處理好了,直接用就可以。以下函數要做變化(csCommon單元):

function PtToInteger(p:TPoint):Byte;
begin
  Result:=P.X +P.Y shl 4+51;//加51是為了與象棋巫師對應,相當於將起點定為(3,3)
end;

  以下為開局庫搜索代碼(我們程序使用了SQLiteTable開源文件,需要附帶SQLite.dll文件,不想附帶DLL文件,可以將其改為FireDAC):

{加載開局庫}
procedure LoadBook;
begin
  BookDB:=TSQLiteDatabase.Create('book.db3');
  BookDB.ExecSQL('create temp table TBook as select * from Books');//創建內存表
  Randomize;
end;
{查找開局}
function SearchBook:Integer;
var
  i, vl, nBookMoves,mv:Integer;
  mvs,vls:array[Byte]of Integer;
  bMirror:Boolean;
  dwLock:Cardinal;
  posMirror:TPieceMove;
  s,d:TPoint;
begin
  // 搜索開局庫的過程有以下幾個步驟
  // 1. 搜索當前局面
  bMirror:= FALSE;
  dwLock:= pcMove.zobr.dwLock1;
  BookTB:=BookDB.GetTable('select * from TBook where dwLock='+Inttostr(dwLock));
  // 2. 如果沒有找到,那么搜索當前局面的鏡像局面
  if BookTB.RowCount =0 then
  begin
    bMirror:=TRUE;
    pcMove.Mirror(posMirror);
    dwLock:=posMirror.zobr.dwLock1;
    BookTB:=BookDB.GetTable('select * from TBook where dwlock='+Inttostr(dwLock));
  end;
  // 3. 如果鏡像局面也沒找到,則立即返回

  if BookTB.RowCount =0 then
     Exit(0);
  // 4. 把走法和分值寫入到"mvs"和"vls"數組中
  vl:=0;nBookMoves:= 0;
  for i:=0 to BookTB.RowCount-1 do
  begin
    if bMirror then
       mv:=MIRROR_MOVE(BookTB.FI(1))//走法
    else
       mv:=BookTB.FI(1);
    s:=GetSrc(mv);
    d:=GetDest(mv);
    if pcMove.canMove(s,d) then
    begin
      mvs[nBookMoves]:= mv;
      vls[nBookMoves]:= BookTB.FI(2);//權重
      vl:=vl+vls[nBookMoves];
      Inc(nBookMoves);
      if nBookMoves= 256 then  // 防止"book.db3"中含有異常數據
        break;
	
    end;
  BookTB.Next;
  end;
  if vl = 0 then
    Exit(0); // 防止"BOOK.db3"中含有異常數據
  // 5. 根據權重隨機選擇一個走法
  vl:= Random(vl);//這樣權重也是隨機的,有什么區別?
  for i:= 0 to nBookMoves-1 do
  begin
    vl:=vl-vls[i];
    if vl < 0 then
      break;
  end;
  Result:= mvs[i];
end;

  6.2 根節點的特殊處理

  現在我們的程序一開局不會總是跳正馬了,根據 ElephantEye 提供的開局庫,它大部分時候走中炮,有時也走仙人指路(進兵)或飛相。可是當它脫離開局庫時,仍然擺脫不了思維的單一性,例如我們第一步走邊兵(開局庫中當然沒有這個局面),它仍舊只會跳同一邊的正馬。

  一個解決辦法是:在根節點處,讓一個不是最好的走法也能在一定的幾率取代前一個走法。

  我們把根節點的搜索函數單獨分離,這樣做有很多好處:

  (1) 處理思考的隨機性;

  (2) 沒有必要嘗試 Beta 截斷(根節點處 Beta 始終是 +MATE_VALUE)

  (3) 省略了檢查重復局面、獲取置換表、空步裁剪等步驟。

  代碼如下:

// 根節點的Alpha-Beta搜索過程
function SearchRoot(nDepth:Integer):Integer;
var
  vl, vlBest, mv, nNewDepth:Integer;
  Sort:SortStruct;
  s,d:TPoint;
begin
  vlBest:= -MATE_VALUE;
  Sort.Init(Search.mvResult);
  with pcMove do
  while True do
  begin
    mv:=Sort.Next;
    if mv=0 then Break;
    s:=GetSrc(mv);d:=GetDest(mv);
    if MakeMove(s,d) then
    begin
      nNewDepth:= InCheck.ToInteger+nDepth- 1;// 如果老將被攻擊,就多搜索一層
      if vlBest = -MATE_VALUE then// 主要變例搜索
        vl:= -SearchFull(-MATE_VALUE, MATE_VALUE, nNewDepth, True)
      else
      begin
        vl:= -SearchFull(-vlBest - 1, -vlBest, nNewDepth);
        if vl > vlBest then
          vl:= -SearchFull(-MATE_VALUE, -vlBest, nNewDepth, True);
      end;
      UndoMakeMove;
      if vl > vlBest then
      begin
        vlBest:= vl;
        Search.mvResult:= mv;
        if (vlBest >-WIN_VALUE)and(vlBest < WIN_VALUE) then
        begin
           //// 增加電腦走棋的隨機性
           vlBest:=vlBest + random(RANDOM_MASK) - random(RANDOM_MASK);
           if vlBest=DrawValue then
              vlBest:=vlBest - 1;
        end;
      end;
    end;
  end;
  RecordHash(HASH_PV, vlBest, nDepth, Search.mvResult);
  SetBestMove(Search.mvResult, nDepth);
  Result:=vlBest;
end;

  6.3  PVS主要變例搜索

 

  經過前面的工作,走法已經得到了很好的排序,好的走法會先被搜索。這是PVS的基礎。

 

                  圖a                                                                                       圖b

  假設第一個走法是最好的走法,沒有引發剪枝,A點的搜索區間為(0, 100),走法1得到估值30。由於30  > 0,所以A點的alpha變為30,以后的搜索區間變為(30, 100),所以B2點的搜索區間為(-100, -30)。

  可以進一步大膽地考慮,假設第1個走法就是最好的走法,那么后面走法得到的估值不會落在區間(30, 100)。所以從A點的第2個走法開始,要做的就是驗證這種假設,搜索區間為(30, 31)。由於搜索區間很小,搜索速度會很快。返回值vl有3種情況。

  (1)vl <= 30。說明走法不比第1個走法好,假設成立。

  (2)vl >= 100。返回值比A點的原有搜索邊界beta還大,應該剪枝,假設成立。

  (3)30 < vl < 100。走法比第1個走法好,假設不成立。

   第3種情況時,走法不成立,應該對該走法重新以(30, 100)區間進行搜索。如果得到40,則該走法就是最好的走法,后續搜索又對該走法進行假設驗證,區間為(40, 41)。

  6.4 長將判負策略

  由於單方面長將不變作負的規則,以前的版本如果發生這種情況,想當然地給予-MATE_VALUE的值,再根據殺棋步數作調整。但是由於長將判負並不是對某個單純局面的評分,而是跟路線有關的,所以使用置換表時就會產生非常嚴重的后果——某個局面的信息可能來自另一條不同的路線。

  解決辦法就是:獲取置換表時把“利用長將判負策略搜索到的局面”過濾掉。為此這個版本中我們把長將判負的局面定為BAN_VALUE(MATE_VALUE - 100),如果某個局面分值在WIN_VALUE(MATE_VALUE - 200)BAN_VALUE之間,那么這個局面就是“利用長將判負策略搜索到的局面”。

  我們仍舊把部分“利用長將判負策略搜索到的局面”記錄到置換表,因為這些局面提供的最佳走法是有啟發價值的。反過來說,如果“利用長將判負策略搜索到的局面”沒有最佳走法,那么這種局面就沒有必要記錄到置換表了。經經過這種處理,我們的程序在殺棋階段不再會走出莫名其妙的走法了。

以上程序未經充分測試,發現問題請及時反饋。

本章節源碼百度雲盤(測試程序打包在里面):

鏈接:中國象棋程序設計(六)置換表

提取碼:1234

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM