Geatpy遺傳算法在曲線尋優上的初步探究

本文轉載自查看原文 2019-02-02 11:09 2030 python/ 遺傳算法/ 曲線尋優/ GA

園子里關於遺傳算法的教案不少，但基於geatpy框架的並未多見，故分享此文以作參考，還望廣大園友多多指教！

Geatpy出自三所名校聯合團隊之手，是遺傳算法領域的權威框架（python），其效率之高、應用領域之廣遠勝諸多第三方工具，此處不作贅述，直接上鏈接：

官網：http://www.geatpy.com/start

源碼：https://github.com/geatpy-dev/geatpy/tree/master/geatpy

使用Geatpy需要安裝geatpy模塊（pip install geatpy），linux下如果裝完后import時出現報錯，可以下載我帖尾鏈接里的wheel文件進行安裝。

言歸正傳，根據經典的遺傳算法流程，無外乎這幾個步驟：種群初始化 ->（適應度評價 -> 遴選 -> 交叉 -> 變異）<- 循環進化直至終止條件達標。

當然，有關遺傳算法的原理和過程不做深討，本文旨在剖析遺傳算法在陣曲線尋優上的高效應用，我寫了一個簡單示例來幫助大家更好的理解，代碼如下：

# -*- coding: utf-8 -*-
"""punishing.py - 罰函數demo"""

import numpy as np

def punishing(LegV, FitnV):
    FitnV[np.where(LegV == 0)[0]] = 0
    return FitnV

# -*- coding: utf-8 -*-
""" aimfc.py即目標函數，本例通過輸入每一代的染色體，由自定義評價函數計算與目標曲線的面積差，作為目標函數值ObjV來輸出 """

import numpy as np

def MakeObjCurve(width):
    ''' 創建目標曲線，此處定義為一組正弦波拼接序列 '''
    n1 = width//3
    n2 = width - 2*n1
    x1=np.cos(np.arange(0,n1)) * 1
    x2=np.cos(np.arange(0,n1)) * 4
    x3=np.cos(np.arange(0,n2)) * 2
    ObjCurve=np.hstack((x1,x2,x3))
    return ObjCurve

def CalScore(chrom):
    ''' 返回染色體與目標曲線之間的面積的倒數作為評分值 '''
    objCurve = MakeObjCurve(len(chrom))
    area = chrom - objCurve
    area *= 10**5                   #調整系數確保分值不受小數項干擾
    score = 1 / np.dot(area, area)  #計算差值的平方和以簡化求面積過程
    return score

def myEvaFunc(chroms):
    ''' 自定義評價函數，以評分值作為目標函數值 '''
    scores = []
    for chrom in chroms:
        score = CalScore(chrom)
        scores.append(score)
    scores = np.array([scores]).T
    return scores

def aimfuc(Phen, LegV):

    ObjV = myEvaFunc(Phen)
    exIdx = np.argmin(ObjV[:, 0])

    # 懲罰方法2： 標記非可行解在可行性列向量中對應的值為0，並編寫punishing罰函數來修改非可行解的適應度。
    # 也可以不寫punishing，因為Geatpy內置的算法模板及內核已經對LegV標記為0的個體的適應度作出了修改。
    # 使用punishing罰函數實質上是對非可行解個體的適應度作進一步的修改
    LegV[exIdx] = 0 # 對非可行解作出標記，使其在可行性列向量中對應的值為0，此處標記的是得分最小項

    return [ObjV, LegV]

# -*- coding: utf-8 -*-
""" main.py即主函數，本例僅用於演示“已知曲線尋優”的過程 """

import numpy as np
import geatpy as ga
import time
import matplotlib.pyplot as plt

def search_objects(directory):
    directory=os.path.normpath(directory)  #規格化，防止分隔符造成的差異
    if not os.path.isdir(directory):
        raise IOError("The directory '"+"' doesn't exist!")
    objects={}
    for curdir,substrs,files in os.walk(directory):
        for jpeg in (file for file in files if file.endswith('.csv')):
            path=os.path.join(curdir,jpeg)
            label=path.split(os.path.sep)[-2]
            if label not in objects:
                objects[label]=[]
            objects[label].append(path)
    return objects

def sga_mps_real_templet(AIM_M, AIM_F, PUN_M, PUN_F, FieldDRs, problem, maxormin, MAXGEN, NIND, SUBPOP, GGAP, selectStyle, recombinStyle, recopt, pm, distribute, drawing = 1):
    """ 基於多種群獨立進化單目標編程模板(實值編碼)，各種群獨立將父子兩代合並進行選擇，采取精英保留機制 """

    #==========================初始化配置===========================
    GGAP = 0.5 # 因為父子合並后選擇，因此要將代溝設為0.5以維持種群規模
    # 獲取目標函數和罰函數
    aimfuc = getattr(AIM_M, AIM_F) # 獲得目標函數
    if PUN_F is not None:
        punishing = getattr(PUN_M, PUN_F) # 獲得罰函數
    NVAR = FieldDRs[0].shape[1] # 得到控制變量的個數
    # 定義全局進化記錄器，初始值為nan
    pop_trace = (np.zeros((MAXGEN ,2)) * np.nan)
    pop_trace[:, 0] = 0
    # 定義變量記錄器，記錄控制變量值，初始值為nan
    var_trace = (np.zeros((MAXGEN ,NVAR)) * np.nan)
    """=========================開始遺傳算法進化======================="""
    start_time = time.time() # 開始計時
    # 對於各個網格分別進行進化，采用全局進化記錄器記錄最優值
    for index in range(len(FieldDRs)): # 遍歷各個子種群，各子種群獨立進化，互相不競爭
        FieldDR = FieldDRs[index]
        if problem == 'R':
            Chrom = ga.crtrp(NIND, FieldDR) # 生成初始種群
        elif problem == 'I':
            Chrom = ga.crtip(NIND, FieldDR)
        LegV = np.ones((NIND, 1)) # 初始化種群的可行性列向量
        [ObjV, LegV] = aimfuc(Chrom, LegV) # 求初始種群的目標函數值
        repnum = 0 # 初始化重復個體數為0
        ax = None # 存儲上一幀圖形
        gen = 0
        badCounter = 0 # 用於記錄在“遺忘策略下”被忽略的代數
        # 開始進化！！
        while gen < MAXGEN:
            if badCounter >= 10 * MAXGEN: # 若多花了10倍的迭代次數仍沒有可行解出現，則跳出
                break
            # 進行遺傳算子，生成子代
            SelCh = ga.recombin(recombinStyle, Chrom, recopt, SUBPOP) # 重組
            if problem == 'R':
                SelCh = ga.mutbga(SelCh,FieldDR, pm) # 變異
                if repnum > Chrom.shape[0] * 0.01: # 當最優個體重復率高達1%時，進行一次高斯變異
                    SelCh = ga.mutgau(SelCh, FieldDR, pm) # 高斯變異
            elif problem == 'I':
                SelCh = ga.mutint(SelCh, FieldDR, pm)
            LegVSel = np.ones((SelCh.shape[0], 1)) # 初始化育種種群的可行性列向量
            [ObjVSel, LegVSel] = aimfuc(SelCh, LegVSel) # 求育種種群的目標函數值
            # 父子合並
            Chrom = np.vstack([Chrom, SelCh])
            ObjV = np.vstack([ObjV, ObjVSel])
            LegV = np.vstack([LegV, LegVSel])
            FitnV = ga.ranking(maxormin * ObjV, LegV, None, SUBPOP) # 適應度評價
            if PUN_F is not None:
                FitnV = punishing(LegV, FitnV) # 調用懲罰函數
            repnum = len(np.where(ObjV[np.argmax(FitnV)] == ObjV)[0]) # 計算最優個體重復數
            # 記錄進化過程
            bestIdx = np.argmax(FitnV)
            if (LegV[bestIdx] != 0) and ((np.isnan(pop_trace[gen,1])) or ((maxormin == 1) & (pop_trace[gen,1] >= ObjV[bestIdx])) or ((maxormin == -1) & (pop_trace[gen,1] <= ObjV[bestIdx]))):
                feasible = np.where(LegV != 0)[0] # 排除非可行解
                pop_trace[gen,0] += np.sum(ObjV[feasible]) / ObjV[feasible].shape[0] / len(FieldDRs) # 記錄種群個體平均目標函數值
                pop_trace[gen,1] = ObjV[bestIdx] # 記錄當代目標函數的最優值
                var_trace[gen,:] = Chrom[bestIdx, :] # 記錄當代最優的控制變量值
                # 繪制動態圖
                if drawing == 2:
                    ax = ga.sgaplot(pop_trace[:,[1]],'子種群'+str(index+1)+'各代種群最優個體目標函數值', False, ax, gen)
                badCounter = 0 # badCounter計數器清零
            else:
                gen -= 1 # 忽略這一代（遺忘策略）
                badCounter += 1
            if distribute == True: # 若要增強種群的分布性（可能會造成收斂慢）
                idx = np.argsort(ObjV[:, 0], 0)
                dis = np.diff(ObjV[idx,0]) / (np.max(ObjV[idx,0]) - np.min(ObjV[idx,0]) + 1)# 差分計算距離的修正偏移量
                dis = np.hstack([dis, dis[-1]])
                dis = dis + np.min(dis) # 修正偏移量+最小量=修正絕對量
                FitnV[idx, 0] *= np.exp(dis) # 根據相鄰距離修改適應度，突出相鄰距離大的個體，以增加種群的多樣性
            [Chrom, ObjV, LegV] = ga.selecting(selectStyle, Chrom, FitnV, GGAP, SUBPOP, ObjV, LegV) # 選擇
            gen += 1
    end_time = time.time() # 結束計時
    times = end_time - start_time
    # 后處理進化記錄器
    delIdx = np.where(np.isnan(pop_trace))[0]
    pop_trace = np.delete(pop_trace, delIdx, 0)
    var_trace = np.delete(var_trace, delIdx, 0)
    if pop_trace.shape[0] == 0:
        raise RuntimeError('error: no feasible solution. (有效進化代數為0，沒找到可行解。)')
    # 輸出結果
    if maxormin == 1:
        best_gen = np.argmin(pop_trace[:, 1]) # 記錄最優種群是在哪一代
        best_ObjV = np.min(pop_trace[:, 1])
    elif maxormin == -1:
        best_gen = np.argmax(pop_trace[:, 1]) # 記錄最優種群是在哪一代
        best_ObjV = np.max(pop_trace[:, 1])
    print('最優的目標函數值為：%s'%(best_ObjV))
    print('最優的控制變量值為：')
    for i in range(NVAR):
        print(var_trace[best_gen, i])
    print('有效進化代數：%s'%(pop_trace.shape[0]))
    print('最優的一代是第 %s 代'%(best_gen + 1))
    print('時間已過 %s 秒'%(times))
    # 繪圖
    if drawing != 0:
        ga.trcplot(pop_trace, [['種群個體平均目標函數值', '種群最優個體目標函數值']])
    # 返回進化記錄器、變量記錄器以及執行時間
    return [pop_trace, var_trace, times, best_gen]

# 獲取函數接口地址
AIM_M = __import__('aimfuc')
PUN_M = __import__('punishing')
POP_SIZE = 300          # 種群高度
CHROM_LENGTH = 20       # 染色體寬度
max_generation = 150    # 進化代數
chrom_bottom = -4       #染色體數值下限
chrom_top = 4           #染色體數值上限

# 變量設置
x = []; b = []
for i in range(CHROM_LENGTH):
    x.append([chrom_bottom, chrom_top]) # 自變量的范圍
    b.append([0, 0]) # 自變量是否包含下界
ranges=np.vstack(x).T # 生成自變量的范圍矩陣
borders = np.vstack(b).T # 生成自變量的邊界矩陣
precisions = [1]*CHROM_LENGTH # 在二進制/格雷碼編碼中代表自變量的編碼精度，當控制變量是連續型時，根據crtfld參考資料，該變量只表示邊界精度，故設置為一定的正數即可
# 生成網格化后的區域描述器集合
FieldDRs = []
for i in range(1):
    FieldDRs.append(ga.crtfld(ranges, borders, precisions))

# 調用編程模板(設置problem = 'R'處理實數型變量問題，詳見該算法模板的源代碼)
[pop_trace, var_trace, times, best_gen] = sga_mps_real_templet(AIM_M, 'aimfuc', PUN_M, 'punishing',
 FieldDRs, problem = 'R', maxormin = -1, MAXGEN = max_generation, NIND = POP_SIZE, SUBPOP = 1, GGAP = 0.9, \
 selectStyle = 'tour', recombinStyle = 'xovdprs', recopt = 0.9, pm = 0.3, distribute = True, drawing = 1)

bstChrom = var_trace[best_gen]
objCurve = AIM_M.MakeObjCurve(CHROM_LENGTH)

plt.ion()
fig = plt.figure('曲線尋優演示',facecolor='lightgray')
ax1 = fig.add_subplot(2, 1, 1)
ax2 = fig.add_subplot(2, 1, 2)
ax1.set_title("Evaluation Map")
ax1.grid(axis='y', linestyle=':')
for i in range(max_generation):
    if i%5==0:
        ax1.plot(var_trace[i], 'o-')
        ax2.cla()
        ax2.set_title("最優染色體[gen:%i]"%(i+1))
        ax2.plot(var_trace[i], 'o-', c='dodgerblue')
        plt.pause(0.001)
ax2.cla()
ax2.grid(axis='y', linestyle=':')
ax2.plot(objCurve, 'o-', c='orangered', label='目標曲線')
ax2.plot(bstChrom, 'o-', c='dodgerblue', label='最優染色體[gen:%i]'%(best_gen+1))
plt.legend()
plt.ioff()
plt.show()

請注意，此處我已將模板函數單獨放到主函數中以便大家更好的理解，返回值中增加了最優代數以便后續圖例的顯示。

本例采用的進化模板是sga_mps_real_templet，基於多種群進化單目標（實數值），用於實現尋找目標曲線。

目標曲線的定義函數在aimfc.py的MakeObjCurve函數中，本例為3段振幅不同的cos函數拼接而成的模擬曲線，寬度20。

種群初始值設置：種群高度300、染色體寬度20（與目標曲線寬度保持一致）、進化代數150、染色體數值上下限[-4,4]（與目標曲線的上下限保持一致）。

接着我們開始尋優，通過CalScore函數計算每代種群的每條染色體與目標函數之間的差值，經過一定的系數轉換得到評分值（差值越大，評分越低），以單目標（1列）形式輸出，由geatpy的ranking函數來決定適應度評價，然后繼續遴選、交叉、變異，如此循環往復，直至達到近似目標值時終止（本例設定為150代時終止），尋優過程如下圖：

最優的目標函數值為：7.287567405118076e-09
有效進化代數：150
最優的一代是第 148 代
時間已過 1.3259999752044678 秒

可以看到從50代左右優化曲線開始顯著上揚，直到130代左右逐漸平緩，並且耗時非常少，來看尋優結果圖：

可以看到除了第6個點的數值有細微差異之外，其他點幾乎都是吻合的，基本實現了目標曲線的尋求。

之所以拋出本例，最重要的一點在於geatpy遺傳算法不僅能尋求已知的目標函數，還可以通過自定義的評分體系或第三方接口來參與實現尋優過程，只需將CalScore函數稍作改動即可，以上。

【wheel文件】: https://pan.baidu.com/s/1BwLq_m3Dd5RMqatvTYXrAw 提取碼: vgkz

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 遺傳算法解決尋路問題——Python描述遺傳算法遺傳算法簡介遺傳算法-總體框架遺傳算法的幾種改進遺傳算法（Genetic Algorithms）遺傳算法-智能鳥群遺傳算法詳解與實驗遺傳算法（Genetic Algorithm）遺傳算法python實現