darknet框架中YOLOv3對數(shù)據(jù)集進行訓練和預測詳解

更新時間：2022年11月25日 16:47:16 作者：月照銀海似蛟龍

這篇文章主要為大家介紹了darknet框架中YOLOv3對數(shù)據(jù)集進行訓練和預測使用詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪

1. 下載darknet源碼
2. 修改darknet的Makefile文件
3. 準備數(shù)據(jù)集
4. 修改voc_label.py
5. 下載預訓練模型
6. 修改./darknet/cfg/voc.data文件
7. 修改./darknet/data/voc.name文件
8. 修改./darknet/cfg/yolov3-voc.cfg文件
9. 開始訓練
10.訓練終止后繼續(xù)訓練方法

1. 下載darknet源碼

在命令窗口（terminal）中進入你想存放darknet源碼的路徑，然后在該路徑下輸入依次輸入以下命令：

git clone https://github.com/pjreddie/darknet
cd darknet

上述命令首先從darknet的源碼地址復制一份源碼到本地，下載下來的是一個名為darknet的文件。然后進入這個名為darknet的文件夾。

2. 修改darknet的Makefile文件

Note：如果不需要darknet在GPU上運行，則略過此步驟，只需執(zhí)行make命令。在命令窗口輸入以下命令打開Makefile文件：

    vi Makefile

將Makefile文件開頭的GPU=0改為GPU=1，如下所示：

GPU=1
CUDNN=0
OPENCV=0
OPENMP=0
DEBUG=0

修改完之后，需要執(zhí)行make命令才可以生效。

make

3. 準備數(shù)據(jù)集

在./darknet/scripts文件夾下創(chuàng)建文件夾，命名為VOCdevkit，然后再在VOCdevkit文件夾下創(chuàng)建一系列文件夾，整個目錄結(jié)構(gòu)如下所示：

VOCdevkit
-VOC2019 # 這個文件夾的年份可以自己取
--Annotations # 在這個文件夾下存放所有的xml文件
--ImageSets
---Main # 在這個文件夾下新建兩個TXT文件
----train.txt
----val.txt
--JPEGImages # 在這個文件夾下存放所有的圖片文件

上述文件及文件夾創(chuàng)建好之后，下面來對我們的數(shù)據(jù)集生成train.txt和val.txt，這兩個文件中存放訓練圖像和測試圖像的文件名（不含.jpg后綴）。新建一個creat_train_val_txt.py文件（名字可以自己隨便?。缓髮⒁韵麓a復制進去（注意相應路徑的修改）

#coding:utf-8
import os
from os import listdir, getcwd
from os.path import join
if __name__ == '__main__':           # 只有在文件作為腳本文件直接執(zhí)行時才執(zhí)行下面代碼  
    source_folder='/home/tukrin/zhl/darknet/scripts/VOCdevkit/VOC2019/JPEGImages/'           #圖片保存的路徑
    dest='/home/tukrin/zhl/darknet/scripts/VOCdevkit/VOC2019/ImageSets/Main/train.txt'          #寫有圖片的名字的路徑
    dest2='/home/tukrin/zhl/darknet/scripts/VOCdevkit/VOC2019/ImageSets/Main/val.txt'           #寫有圖片的名字的路徑
    file_list=os.listdir(source_folder)  #獲取各圖片的名稱       
    train_file=open(dest,'a')     #追加寫打開              
    val_file=open(dest2,'a')       #追加寫打開    
    count = 0              
    for file_obj in file_list:  
        count += 1                
        file_path=os.path.join(source_folder,file_obj) #路徑拼接  指向 圖片文件的路徑
        file_name,file_extend=os.path.splitext(file_obj) #分離文件名與擴展名 file_name為去掉擴展名的圖片名稱 
        # file_num=int(file_name) 
        if(count<800):                     
            train_file.write(file_name+'\n')  #寫入去掉擴展名的文件名名稱  前800個作為 訓練集數(shù)據(jù)
        else :
            val_file.write(file_name+'\n')    #寫入去掉擴展名的文件名名稱   后面的作為  驗證集數(shù)據(jù)
    train_file.close() #關閉文件
val_file.close()   #關閉文件

制作好creat_train_val_txt.py文件后，在命令行執(zhí)行該文件：

python creat_train_val_txt.py

執(zhí)行完畢之后可以看到剛剛我們新建的train.txt和val.txt文件中被寫進了我們的數(shù)據(jù)集圖片的文件名。

4. 修改voc_label.py

打開scripts文件夾下的 voc_label.py 文件，修改信息：#要修改的地方共三處

import xml.etree.ElementTree as ET 
import pickle
import os
from os import listdir, getcwd
from os.path import join
#要修改的地方
sets=[('2019', 'train'), ('2019', 'val')]  # 此處的2019對應前面新建文件夾時的2019，train和val對應兩個TXT文件的文件名
#要修改的地方
classes =["car", "people"] # 此處為數(shù)據(jù)集的類別名稱，一定要與xml文件中的類別名稱一致，有幾類就寫幾類
def convert(size, box):#size是圖片的尺寸 box是矩形的四個點
    dw = 1./size[0] # 歸一化的時候就是使用寬度除以整個image_size的寬度
    dh = 1./size[1] # 歸一化的時候就是使用高度除以整個image_size的高度
    x = (box[0] + box[1])/2.0 # 使用(xmin+xmax)/2得到x的中心點
    y = (box[2] + box[3])/2.0 # 使用(ymin+ymax)/2得到y(tǒng)的中心點
    w = box[1] - box[0] # 然后寬度就是使用xmax-xmin計算得到
    h = box[3] - box[2] # 然后高度就是使用ymax-ymin計算得到
    x = x*dw# 歸一化
    w = w*dw# 歸一化
    y = y*dh# 歸一化
    h = h*dh# 歸一化
    return (x,y,w,h)
def convert_annotation(year, image_id):
    in_file = open('VOCdevkit/VOC%s/Annotations/%s.xml'%(year, image_id))
    out_file = open('VOCdevkit/VOC%s/labels/%s.txt'%(year, image_id), 'w')#此時文件是如何形成的？    open的時候自動建立
    root = tree.getroot()#獲得root節(jié)點  
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
wd = getcwd()
for year, image_set in sets:
    if not os.path.exists('VOCdevkit/VOC%s/labels/'%(year)):#如果沒有存在這個文件
        os.makedirs('VOCdevkit/VOC%s/labels/'%(year))#創(chuàng)建這個路徑 來存放txt標簽
    image_ids = open('VOCdevkit/VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()#此時文件是如何形成的？ 通過另一個腳本文件與圖片名稱生成的
    list_file = open('%s_%s.txt'%(year, image_set), 'w')#這個文件可能是自己建的？ open的時候自動建立
    for image_id in image_ids:
        list_file.write('%s/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n'%(wd, year, image_id))
        convert_annotation(year, image_id)
    list_file.close()
#要修改的地方
os.system("cat 2019_train.txt 2019_val.txt > train.txt") # 此處是將兩個txt連接成一個txt，如果你訓練時不用val.txt中的數(shù)據(jù)，可以注釋掉這句話。
 # os.system("cat 2007_train.txt 2007_val.txt 2007_test.txt 2012_train.txt 2012_val.txt > train.all.txt")# 另外，刪除另外一條os.system(...)語句。

保存修改后，運行該文件：

python voc_label.py

執(zhí)行完畢之后，會生成2018_train.txt、2018_val.txt、train.txt 三個文件，如下圖：

在labels文件夾下會生成圖片對應的txt形式的圖片標注信息

5. 下載預訓練模型

為了加速訓練過程，可以在darknet官網(wǎng)上下載預訓練模型，在該預訓練模型上再進行訓練。在命令窗口輸入以下命令：

wget https://pjreddie.com/media/files/darknet53.conv.74

文件保存在script文件夾下即可

6. 修改./darknet/cfg/voc.data文件

classes= 2  # 你的數(shù)據(jù)集的類別數(shù)
train  =  /home/tukrin/zhl/darknet/scripts/2019_train.txt  # 第4步中生成的txt文件路徑
valid  =  /home/tukrin/zhl/darknet/scripts/2019_val.txt  # 第4步中生成的txt文件路徑
names  =  /home/tukrin/zhl/darknet/data/voc.names # voc.names 的文件路徑
backup =  /home/tukrin/zhl/darknet/backup/  #backup文件夾的路徑 訓練的權重將保存在這

7. 修改./darknet/data/voc.name文件

將voc.name文件做如下修改：

car
people

內(nèi)容為你的數(shù)據(jù)集的類別名稱，注意和xml文件中的類別名稱一致。

8. 修改./darknet/cfg/yolov3-voc.cfg文件

該文件為網(wǎng)絡結(jié)構(gòu)文件。首先修改開頭處如下：

[net]
# Testing
# batch=1
# subdivisions=1
# Training
batch=64
subdivisions=16

即，將訓練模式打開，將測試模式的語句注釋掉。

其中subdivisions為將一個batch（此處為64）分成多大的小batch。如果訓練時提示超出內(nèi)存，則可以相應的改小這兩個參數(shù)的值。

接著視情況修改開頭處的超參數(shù)（學習率，迭代次數(shù)等）：

width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=0
saturation = 1.5
exposure = 1.5
hue=.1
learning_rate=0.001
burn_in=1000
max_batches = 50200 # 迭代次數(shù)
policy=steps
steps=40000,45000 # 在指定迭代次數(shù)時進行學習率衰減
scales=.1,.1  # 學習率衰減率 此處是0.1

然后再該文件的底部部分，找到如下語句進行如下修改：

......
[convolutional]
size=1
stride=1
pad=1
filters=21 ....................# 修改為 3 * （類別數(shù) + 5），此處類別數(shù)為2，所以設置為 3*（2+5）=21
activation=linear
[yolo]
mask = 6,7,8
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=2 .....................# 修改類別數(shù)
num=9
jitter=.3
ignore_thresh = .5
truth_thresh = 1
random=1
......
[convolutional]
size=1
stride=1
pad=1
filters=21 .....................# 同上
activation=linear
[yolo]
mask = 3,4,5
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=2 .....................# 同上
num=9
jitter=.3
ignore_thresh = .5
truth_thresh = 1
random=1
......
[convolutional]
size=1
stride=1
pad=1
filters=21 .....................# 同上
activation=linear
[yolo]
mask = 0,1,2
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=2 .....................# 同上
num=9
jitter=.3
ignore_thresh = .5
truth_thresh = 1
random=1

有三處[yolo]的上面的[convolutional]的filters要改和[yolo]的classes要改開始訓練

9. 開始訓練

在 ./darknet 目錄下，在命令窗口中執(zhí)行以下命令，其中 -gpus 0, 1 用來指定參與訓練的GPU編號，可以省略。填0 或1

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg scripts/darknet53.conv.74 -gpus 0,1

10.訓練終止后繼續(xù)訓練方法

假如訓練由于意外情況，如顯存不夠終止了，可以通過加載中間權重文件，進而繼續(xù)訓練中間權重文件在backup文件夾中

把9步權重文件的路徑換為backup中文件即可

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg backup/yolov3-voc_900.weights -gpus 0,1

backup里文件保存規(guī)則：訓練1000次之前每100次保存一次。所以上面圖片出現(xiàn)了100~900的權重中間文件。訓練1000次之后每10000次保存一次。 yolov3-voc.backup 會保持100整數(shù)倍的訓練結(jié)果。所以在1000次之后想繼續(xù)訓練的話應該加載 yolov3-voc.backup文件。注意此文件不能作為檢查模型使用。

以上就是darknet框架中YOLOv3對數(shù)據(jù)集進行訓練和預測詳解的詳細內(nèi)容，更多關于darknet YOLOv3數(shù)據(jù)集訓練預測的資料請關注腳本之家其它相關文章！

您可能感興趣的文章:

Python 實現(xiàn)順序高斯消元法示例
今天小編就為大家分享一篇Python 實現(xiàn)順序高斯消元法示例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-12-12
理解深度學習之深度學習簡介
這篇文章主要是關于深度學習的簡介，對大家學習了解機器深度學習有一定的幫助，以后會持續(xù)更新本系列，希望能為大家?guī)硪恍┦肇?，讓我們一起來看看下面的文章?/div> 2021-04-04
Python的類成員變量默認初始值的坑及解決
這篇文章主要介紹了Python的類成員變量默認初始值的坑及解決方案，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2022-02-02
Python學習筆記之函數(shù)的參數(shù)和返回值的使用
這篇文章主要介紹了Python學習筆記之函數(shù)的參數(shù)和返回值的使用，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-11-11
Python中關于set的基本用法
這篇文章主要介紹了Python中關于set的基本用法，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-04-04
Python編程基礎之函數(shù)和模塊
這篇文章主要為大家介紹了Python函數(shù)和模塊，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2021-12-12
使用pyhon繪圖比較兩個手機屏幕大小(實例代碼)
這篇文章主要介紹了使用pyhon繪圖比較兩個手機屏幕大小，本文通過實例代碼給大家介紹的非常詳細，具有一定的參考借鑒價值,需要的朋友可以參考下
2020-01-01
python處理csv數(shù)據(jù)的方法
這篇文章主要介紹了python處理csv數(shù)據(jù)的方法,實例分析了Python處理csv數(shù)據(jù)的技巧,需要的朋友可以參考下
2015-03-03
Python爬蟲實現(xiàn)簡單的爬取有道翻譯功能示例
這篇文章主要介紹了Python爬蟲實現(xiàn)簡單的爬取有道翻譯功能,結(jié)合實例形式分析了Python基于urllib庫實現(xiàn)的爬蟲爬取有道翻譯相關定義與數(shù)據(jù)交互功能操作技巧,需要的朋友可以參考下
2018-07-07
利用python/R語言繪制圣誕樹實例代碼
圣誕節(jié)快到了,分別用R和Python繪制了圣誕樹祝你們圣誕節(jié)快樂,所以下面這篇文章主要給大家介紹了關于如何利用python/R繪制圣誕樹的相關資料,需要的朋友可以參考下
2021-12-12