快捷導(dǎo)航

使用Python實(shí)現(xiàn)遺傳算法的詳細(xì)步驟

更新時(shí)間：2023年11月03日 11:14:00 作者：程序員奇奇

遺傳算法是模仿自然界生物進(jìn)化機(jī)制發(fā)展起來(lái)的隨機(jī)全局搜索和優(yōu)化方法,它借鑒了達(dá)爾文的進(jìn)化論和孟德?tīng)柕倪z傳學(xué)說(shuō),其本質(zhì)是一種高效、并行、全局搜索的方法,本文給大家介紹了使用Python實(shí)現(xiàn)遺傳算法的詳細(xì)步驟,需要的朋友可以參考下

遺傳算法是模仿自然界生物進(jìn)化機(jī)制發(fā)展起來(lái)的隨機(jī)全局搜索和優(yōu)化方法，它借鑒了達(dá)爾文的進(jìn)化論和孟德?tīng)柕倪z傳學(xué)說(shuō)。其本質(zhì)是一種高效、并行、全局搜索的方法，它能在搜索過(guò)程中自動(dòng)獲取和積累有關(guān)搜索空間的知識(shí)，并自適應(yīng)的控制搜索過(guò)程以求得最優(yōu)解。遺傳算法操作使用適者生存的原則，在潛在的解決方案種群中逐次產(chǎn)生一個(gè)近似最優(yōu)解的方案，在遺傳算法的每一代中，根據(jù)個(gè)體在問(wèn)題域中的適應(yīng)度值和從自然遺傳學(xué)中借鑒來(lái)的再造方法進(jìn)行個(gè)體選擇，產(chǎn)生一個(gè)新的近似解。這個(gè)過(guò)程導(dǎo)致種群中個(gè)體的進(jìn)化，得到的新個(gè)體比原來(lái)個(gè)體更能適應(yīng)環(huán)境，就像自然界中的改造一樣。

遺傳算法具體步驟：

（1）初始化：設(shè)置進(jìn)化代數(shù)計(jì)數(shù)器 t=0、設(shè)置最大進(jìn)化代數(shù) T、交叉概率、變異概率、隨機(jī)生成 M 個(gè)個(gè)體作為初始種群 P

（2）個(gè)體評(píng)價(jià)：計(jì)算種群 P 中各個(gè)個(gè)體的適應(yīng)度

（3）選擇運(yùn)算：將選擇算子作用于群體。以個(gè)體適應(yīng)度為基礎(chǔ)，選擇最優(yōu)個(gè)體直接遺傳到下一代或通過(guò)配對(duì)交叉產(chǎn)生新的個(gè)體再遺傳到下一代

（4）交叉運(yùn)算：在交叉概率的控制下，對(duì)群體中的個(gè)體兩兩進(jìn)行交叉

（5）變異運(yùn)算：在變異概率的控制下，對(duì)群體中的個(gè)體進(jìn)行變異，即對(duì)某一個(gè)體的基因進(jìn)行隨機(jī)調(diào)整

（6）經(jīng)過(guò)選擇、交叉、變異運(yùn)算之后得到下一代群體 P1。

重復(fù)以上（1）-（6），直到遺傳代數(shù)為 T，以進(jìn)化過(guò)程中所得到的具有最優(yōu)適應(yīng)度個(gè)體作為最優(yōu)解輸出，終止計(jì)算。

旅行推銷(xiāo)員問(wèn)題（Travelling Salesman Problem， TSP）：有 n 個(gè)城市，一個(gè)推銷(xiāo)員要從其中某一個(gè)城市出發(fā)，唯一走遍所有的城市，再回到他出發(fā)的城市，求最短的路線。

應(yīng)用遺傳算法求解 TSP 問(wèn)題時(shí)需要進(jìn)行一些約定，基因是一組城市序列，適應(yīng)度是按照這個(gè)基因的城市順序的距離和分之一。

1. 實(shí)驗(yàn)代碼

import random
import math
import matplotlib.pyplot as plt
# 讀取數(shù)據(jù)
f=open("test.txt")
data=f.readlines()
# 將cities初始化為字典，防止下面被當(dāng)成列表
cities={}
for line in data:
    #原始數(shù)據(jù)以\n換行，將其替換掉
    line=line.replace("\n","")
    #最后一行以EOF為標(biāo)志，如果讀到就證明讀完了，退出循環(huán)
    if(line=="EOF"):
        break
    #空格分割城市編號(hào)和城市的坐標(biāo)
    city=line.split(" ")
    map(int,city)
    #將城市數(shù)據(jù)添加到cities中
    cities[eval(city[0])]=[eval(city[1]),eval(city[2])]
 
# 計(jì)算適應(yīng)度，也就是距離分之一，這里用偽歐氏距離
def calcfit(gene):
    sum=0
    #最后要回到初始城市所以從-1，也就是最后一個(gè)城市繞一圈到最后一個(gè)城市
    for i in range(-1,len(gene)-1):
        nowcity=gene[i]
        nextcity=gene[i+1]
        nowloc=cities[nowcity]
        nextloc=cities[nextcity]
        sum+=math.sqrt(((nowloc[0]-nextloc[0])**2+(nowloc[1]-nextloc[1])**2)/10)
 
    return 1/sum
 
# 每個(gè)個(gè)體的類(lèi)，方便根據(jù)基因計(jì)算適應(yīng)度
class Person:
    def __init__(self,gene):
        self.gene=gene
        self.fit=calcfit(gene)
class Group:
    def __init__(self):
        self.GroupSize=100  #種群規(guī)模
        self.GeneSize=48    #基因數(shù)量，也就是城市數(shù)量
        self.initGroup()
        self.upDate()
    #初始化種群，隨機(jī)生成若干個(gè)體
    def initGroup(self):
        self.group=[]
        i=0
        while(i<self.GroupSize):
            i+=1
            #gene如果在for以外生成只會(huì)shuffle一次
            gene=[i+1 for i in range(self.GeneSize)]
            random.shuffle(gene)
            tmpPerson=Person(gene)
            self.group.append(tmpPerson)
 
    #獲取種群中適應(yīng)度最高的個(gè)體
    def getBest(self):
        bestFit=self.group[0].fit
        best=self.group[0]
        for person in self.group:
            if(person.fit>bestFit):
                bestFit=person.fit
                best=person
        return best
    #計(jì)算種群中所有個(gè)體的平均距離
    def getAvg(self):
        sum=0
        for p in self.group:
            sum+=1/p.fit
        return sum/len(self.group)
    #根據(jù)適應(yīng)度，使用輪盤(pán)賭返回一個(gè)個(gè)體，用于遺傳交叉
    def getOne(self):
        #section的簡(jiǎn)稱，區(qū)間
        sec=[0]
        sumsec=0
        for person in self.group:
            sumsec+=person.fit
            sec.append(sumsec)
        p=random.random()*sumsec
        for i in range(len(sec)):
            if(p>sec[i] and p<sec[i+1]):
                #這里注意區(qū)間是比個(gè)體多一個(gè)0的
                return self.group[i]
    #更新種群相關(guān)信息
    def upDate(self):
        self.best=self.getBest()
# 遺傳算法的類(lèi)，定義了遺傳、交叉、變異等操作
class GA:
    def __init__(self):
        self.group=Group()
        self.pCross=0.35    #交叉率
        self.pChange=0.1    #變異率
        self.Gen=1  #代數(shù)
 
    #變異操作
    def change(self,gene):
        #把列表隨機(jī)的一段取出然后再隨機(jī)插入某個(gè)位置
        #length是取出基因的長(zhǎng)度，postake是取出的位置，posins是插入的位置
        geneLenght=len(gene)
        index1 = random.randint(0, geneLenght - 1)
        index2 = random.randint(0, geneLenght - 1)
        newGene = gene[:]       # 產(chǎn)生一個(gè)新的基因序列，以免變異的時(shí)候影響父種群
        newGene[index1], newGene[index2] = newGene[index2], newGene[index1]
        return newGene
 
    #交叉操作
    def cross(self,p1,p2):
        geneLenght=len(p1.gene)
        index1 = random.randint(0, geneLenght - 1)
        index2 = random.randint(index1, geneLenght - 1)
        tempGene = p2.gene[index1:index2]   # 交叉的基因片段
        newGene = []
        p1len = 0
        for g in p1.gene:
              if p1len == index1:
                    newGene.extend(tempGene)     # 插入基因片段
                    p1len += 1
              if g not in tempGene:
                    newGene.append(g)
                    p1len += 1
        return newGene
 
    #獲取下一代
    def nextGen(self):
        self.Gen+=1
        #nextGen代表下一代的所有基因
        nextGen=[]
        #將最優(yōu)秀的基因直接傳遞給下一代
        nextGen.append(self.group.getBest().gene[:])
        while(len(nextGen)<self.group.GroupSize):
            pChange=random.random()
            pCross=random.random()
            p1=self.group.getOne()
            if(pCross<self.pCross):
                p2=self.group.getOne()
                newGene=self.cross(p1,p2)
            else:
                newGene=p1.gene[:]
            if(pChange<self.pChange):
                newGene=self.change(newGene)
            nextGen.append(newGene)
        self.group.group=[]
        for gene in nextGen:
            self.group.group.append(Person(gene))
            self.group.upDate()
 
    #打印當(dāng)前種群的最優(yōu)個(gè)體信息
    def showBest(self):
        print("第{}代\t當(dāng)前最優(yōu){}\t當(dāng)前平均{}\t".format(self.Gen,1/self.group.getBest().fit,self.group.getAvg()))
 
    #n代表代數(shù)，遺傳算法的入口
    def run(self,n):
        Gen=[]  #代數(shù)
        dist=[] #每一代的最優(yōu)距離
        avgDist=[]  #每一代的平均距離
        #上面三個(gè)列表是為了畫(huà)圖
        i=1
        while(i<n):
            self.nextGen()
            self.showBest()
            i+=1
            Gen.append(i)
            dist.append(1/self.group.getBest().fit)
            avgDist.append(self.group.getAvg())
        #繪制進(jìn)化曲線
        plt.plot(Gen,dist,'-r')
        plt.plot(Gen,avgDist,'-b')
        plt.show()
 
ga=GA()
ga.run(3000)
print("進(jìn)行3000代后最優(yōu)解：",1/ga.group.getBest().fit)

2. 實(shí)驗(yàn)結(jié)果

下圖是進(jìn)行一次實(shí)驗(yàn)的結(jié)果截圖，求出的最優(yōu)解是 11271

為避免實(shí)驗(yàn)的偶然性，進(jìn)行 10 次重復(fù)實(shí)驗(yàn)，并求平均值，結(jié)果如下。

上圖橫坐標(biāo)是代數(shù)，縱坐標(biāo)是距離，紅色曲線是每一代的最優(yōu)個(gè)體的距離，藍(lán)色曲線是每一代的平均距離。可以看出兩條線都呈下降趨勢(shì)，也就是說(shuō)都在進(jìn)化。平均距離下降說(shuō)明由于優(yōu)良基因的出現(xiàn)（也就是某一段城市序列），使得這種優(yōu)良的性狀很快傳播到整個(gè)群體。就像自然界中的優(yōu)勝劣汰一樣，具有適應(yīng)環(huán)境的基因才能生存下來(lái)，相應(yīng)的，生存下來(lái)的都是具有優(yōu)良基因的。算法中引入交叉率和變異率的意義就在于既要保證當(dāng)前優(yōu)良基因，又要試圖產(chǎn)生更優(yōu)良的基因。如果所有個(gè)體都交叉，那么有些優(yōu)良的基因片段可能會(huì)丟失；如果都不交叉，那么兩個(gè)優(yōu)秀的基因片段無(wú)法組合為更優(yōu)秀的基因；如果沒(méi)有變異，那就無(wú)法產(chǎn)生更適應(yīng)環(huán)境的個(gè)體。不得不感嘆自然的智慧是如此強(qiáng)大。

上面說(shuō)到的基因片段就是 TSP 中的一小段城市序列，當(dāng)某一段序列的距離和相對(duì)較小時(shí)，就說(shuō)明這段序列是這幾個(gè)城市的相對(duì)較好的遍歷順序。遺傳算法通過(guò)將這些優(yōu)秀的片段組合起來(lái)實(shí)現(xiàn)了 TSP 解的不斷優(yōu)化。而組合的方法正是借鑒自然的智慧，遺傳、變異、適者生存。

3. 實(shí)驗(yàn)總結(jié)

1、如何在算法中實(shí)現(xiàn)“優(yōu)勝劣汰”？

所謂優(yōu)勝劣汰也就是優(yōu)良的基因保留，不適應(yīng)環(huán)境的基因淘汰。在上述 GA 算法中，我使用的是輪盤(pán)賭，也就是在遺傳的步驟中（無(wú)論是否交叉），根據(jù)每個(gè)個(gè)體的適應(yīng)度來(lái)挑選。這樣就能達(dá)到適應(yīng)度高得個(gè)體有更多的后代，也就達(dá)到了優(yōu)勝劣汰的目的。

在具體的實(shí)現(xiàn)過(guò)程中，我犯了個(gè)錯(cuò)誤，起初在遺傳步驟篩選個(gè)體時(shí)，我每選出一個(gè)個(gè)體就將這個(gè)個(gè)體從群體中刪除。現(xiàn)在想想，這種做法十分愚蠢，盡管當(dāng)時(shí)我已經(jīng)實(shí)現(xiàn)了輪盤(pán)賭，但如果選出個(gè)體就刪除，那么就會(huì)導(dǎo)致每個(gè)個(gè)體都會(huì)平等地生育后代，所謂的輪盤(pán)賭也不過(guò)是能讓適應(yīng)度高的先進(jìn)行遺傳。這種做法完全背離了“優(yōu)勝劣汰”的初衷。正確的做法是選完個(gè)體進(jìn)行遺傳后再重新放回群體，這樣才能保證適應(yīng)度高的個(gè)體會(huì)進(jìn)行多次遺傳，產(chǎn)生更多后代，將優(yōu)良的基因更廣泛的播撒，同時(shí)不適應(yīng)的個(gè)體會(huì)產(chǎn)生少量后代或者直接被淘汰。

2 、如何保證進(jìn)化一直是在正向進(jìn)行？

所謂正向進(jìn)行也就是下一代的最優(yōu)個(gè)體一定比上一代更適應(yīng)或者同等適應(yīng)環(huán)境。我采用的方法是最優(yōu)個(gè)體直接進(jìn)入下一代，不參與交叉變異等操作。這樣能夠防止因這些操作而“污染”了當(dāng)前最優(yōu)秀的基因而導(dǎo)致反向進(jìn)化的出現(xiàn)。

我在實(shí)現(xiàn)過(guò)程中還出現(xiàn)了另一點(diǎn)問(wèn)題，是傳引用還是傳值所導(dǎo)致的。對(duì)個(gè)體的基因進(jìn)行交叉和變異時(shí)用的是一個(gè)列表，Python 中傳列表時(shí)傳的實(shí)際上是一個(gè)引用，這樣就導(dǎo)致個(gè)體進(jìn)行交叉和變異后會(huì)改變個(gè)體本身的基因。導(dǎo)致的結(jié)果就是進(jìn)化非常緩慢，并且伴隨反向進(jìn)化。

3、交叉如何實(shí)現(xiàn)？

選定一個(gè)個(gè)體的片段放入另一個(gè)體，并將不重復(fù)的基因的依次放入其他位置。

在實(shí)現(xiàn)這一步時(shí)，因?yàn)閷W(xué)生物時(shí)對(duì)真實(shí)染色體行為的固有認(rèn)識(shí)，“同源染色體交叉互換同源區(qū)段”，導(dǎo)致我錯(cuò)誤實(shí)現(xiàn)該功能。我只將兩個(gè)個(gè)體的相同位置的片段互換來(lái)完成交叉，顯然這樣的做法是錯(cuò)誤的，這會(huì)導(dǎo)致城市的重復(fù)出現(xiàn)。

4、在剛開(kāi)始寫(xiě)這個(gè)算法時(shí)，我是半 OOP，半面向過(guò)程地寫(xiě)。后續(xù)測(cè)試過(guò)程中發(fā)現(xiàn)要改參數(shù)，更新個(gè)體信息時(shí)很麻煩，于是全部改為 OOP，然后方便多了。對(duì)于這種模擬真實(shí)世界的問(wèn)題，OOP 有很大的靈活性和簡(jiǎn)便性。

5、如何防止出現(xiàn)局部最優(yōu)解？

在測(cè)試過(guò)程中發(fā)現(xiàn)偶爾會(huì)出現(xiàn)局部最優(yōu)解，在很長(zhǎng)時(shí)間內(nèi)不會(huì)繼續(xù)進(jìn)化，而此時(shí)的解又離最優(yōu)解較遠(yuǎn)。哪怕是后續(xù)調(diào)整后，盡管離最優(yōu)解近了，但依然是“局部最優(yōu)”，因?yàn)檫€沒(méi)有達(dá)到最優(yōu)。

算法在起初會(huì)收斂得很快，而越往后就會(huì)越來(lái)越慢，甚至根本不動(dòng)。因?yàn)榈胶笃?，所有個(gè)體都有著相對(duì)來(lái)說(shuō)差不多的優(yōu)秀基因，這時(shí)的交叉對(duì)于進(jìn)化的作用就很弱了，進(jìn)化的主要?jiǎng)恿统闪俗儺?，而變異就是一種暴力算法了。運(yùn)氣好的話能很快變異出更好的個(gè)體，運(yùn)氣不好就得一直等。

防止局部最優(yōu)解的解決方法是增大種群規(guī)模，這樣就會(huì)有更多的個(gè)體變異，就會(huì)有更大可能性產(chǎn)生進(jìn)化的個(gè)體。而增大種群規(guī)模的弊端是每一代的計(jì)算時(shí)間會(huì)變長(zhǎng)，也就是說(shuō)這兩者是相互抑制的。巨大的種群規(guī)模雖然最終能避免局部最優(yōu)解，但是每一代的時(shí)間很長(zhǎng)，需要很長(zhǎng)時(shí)間才能求出最優(yōu)解；而較小的種群規(guī)模雖然每一代計(jì)算時(shí)間快，但在若干代后就會(huì)陷入局部最優(yōu)。

猜想一種可能的優(yōu)化方法，在進(jìn)化初期用較小的種群規(guī)模，以此來(lái)加快進(jìn)化速度，當(dāng)適應(yīng)度達(dá)到某一閾值后，增加種群規(guī)模和變異率來(lái)避免局部最優(yōu)解的出現(xiàn)。用這種動(dòng)態(tài)調(diào)整的方法來(lái)權(quán)衡每一代計(jì)算效率和整體計(jì)算效率之間的平衡。

以上就是使用Python實(shí)現(xiàn)遺傳算法的詳細(xì)步驟的詳細(xì)內(nèi)容，更多關(guān)于Python實(shí)現(xiàn)遺傳算法的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: