yolov5模型配置yaml文件詳細講解
yolov5的代碼模型構建是通過.yaml文件實現(xiàn)的,初次看上去會一頭霧水,這里記錄一下,也方便自己后面用到的時候查看。
以models/yolov5s.yaml為例
文件內(nèi)容如下:
# Parameters nc: 5 # number of classes depth_multiple: 0.33 # model depth multiple width_multiple: 0.50 # layer channel multiple anchors: - [24,24,29,84,59,42] # P3/8 - [45,146,75,87,157,49] # P4/16 - [310,167,139,341,127,151] # P5/32 # YOLOv5 backbone backbone: # [from, number, module, args] [[-1, 1, Focus, [64, 3]], # 0-P1/2 [-1, 1, Conv, [128, 3, 2]], # 1-P2/4 [-1, 3, C3, [128]], [-1, 1, Conv, [256, 3, 2]], # 3-P3/8 [-1, 9, C3, [256]], [-1, 1, Conv, [512, 3, 2]], # 5-P4/16 [-1, 9, C3, [512]], [-1, 1, Conv, [1024, 3, 2]], # 7-P5/32 [-1, 1, SPP, [1024, [5, 9, 13]]], [-1, 3, C3, [1024, False]], # 9 ] # YOLOv5 head head: [[-1, 1, Conv, [512, 1, 1]], [-1, 1, nn.Upsample, [None, 2, 'nearest']], [[-1, 6], 1, Concat, [1]], # cat backbone P4 [-1, 3, C3, [512, False]], # 13 [-1, 1, Conv, [256, 1, 1]], [-1, 1, nn.Upsample, [None, 2, 'nearest']], [[-1, 4], 1, Concat, [1]], # cat backbone P3 [-1, 3, C3, [256, False]], # 17 (P3/8-small) [-1, 1, Conv, [256, 3, 2]], [[-1, 14], 1, Concat, [1]], # cat head P4 [-1, 3, C3, [512, False]], # 20 (P4/16-medium) [-1, 1, Conv, [512, 3, 2]], [[-1, 10], 1, Concat, [1]], # cat head P5 [-1, 3, C3, [1024, False]], # 23 (P5/32-large) [[17, 20, 23], 1, Detect, [nc, anchors]], # Detect(P3, P4, P5) ]
我們一個一個來解釋:
- 一些基本參數(shù):
- nc 數(shù)據(jù)集中物體的類別數(shù)
- depth_multiple 控制網(wǎng)絡深度的系數(shù)
- width_multiple 控制網(wǎng)絡寬度的系數(shù)
- anchors 給不同尺度特征圖分配的anchors,可以看到包含三個列表,表示給三個尺度分配,這三個尺度在[[17, 20, 23], 1, Detect, [nc, anchors]] 指明,分別是網(wǎng)絡的第17、20和23層。注釋P3/8是指輸入下采樣了23 = 8倍,我們也可以發(fā)現(xiàn)網(wǎng)絡的第17層特征圖為輸入的1/8。
- BackBone:
骨干網(wǎng)絡的定義,是一個列表,每一行表示一層??梢钥吹矫恳恍惺怯?個元素的列表,[from, number, module, args]說明了這個4個元素的意思。- from 表示該層的輸入從哪來。-1表示輸入取自上一層,-2表示上兩層,3表示第3層(從0開始數(shù)),[-1, 4]表示取自上一層和第4層,依次類推。。。網(wǎng)絡層數(shù)的數(shù)法在注釋里已經(jīng)標出來了,從0開始,每一行表示一層,例如0-P1/2表示第0層,特征圖尺寸為輸入的1/21。
- number 表示該層模塊堆疊的次數(shù),對于C3、BottleneckCSP等模塊,表示其子模塊的堆疊,具體細節(jié)可以查看源代碼。當然最終的次數(shù)還要乘上depth_multiple系數(shù)。
- module 表示該層的模塊是啥。Conv就是卷積+BN+激活模塊。所有的模塊在 model/common.py 中都有定義。
- args 表示輸入到模塊的參數(shù)。例如Conv:[128, 3, 2] 表示輸出通道128,卷積核尺寸3,strid=2,當然最終的輸出通道數(shù)還要乘上 width_multiple,對于其他模塊,第一個參數(shù)值一般都是指輸出通道數(shù),具體細節(jié)可以看 model/common.py 中的定義。
- Head
規(guī)則和BackBone一毛一樣,這里再解釋一些最后一層:
[[17, 20, 23], 1, Detect, [nc, anchors]] 表示把第17、20和23三層作為Detect模塊的輸入, [nc, anchors]是初始化Detect模塊的參數(shù)。Detect模塊在model/yolo.py中聲明,相當于從模型中提出想要的層作為輸入,轉換為相應的檢測頭,其輸出用來計算loss。
補充:模型 yaml 文件中第四參數(shù)解釋
這里是對 backbone 和 head 超參數(shù)中第四個參數(shù)的理解
當?shù)谌齻€參數(shù)為 Focus 時,第四個參數(shù)中,第一個值為該模塊中需要用到的通道數(shù),第二個值為卷積核大小;
當?shù)谌齻€參數(shù)為 Conv 時,第四個參數(shù)中,第一個值為該模塊中需要用到的通道數(shù),第二個值為卷積核大小,第三個參數(shù)為步距大小;
當?shù)谌齻€參數(shù)為 BottleneckCSP 時,第四個參數(shù)中,第一個值是該模塊用到的通道數(shù);如果存在第二個參數(shù),第二個參數(shù):是否啟用 shortcut 連接
當?shù)谌齻€參數(shù)為 SPP時,第四個參數(shù)就是 SPP 中需要用到的卷積核大小。
當?shù)谌齻€參數(shù)為 nn.Upsample時,就是 torch 中實現(xiàn)的上采樣函數(shù)。
當?shù)谌齻€參數(shù)為 Concat時,第四個參數(shù)就是 concat 中拼接的維度。
當?shù)谌齻€參數(shù)為 Detect時,第四個參數(shù)中,第一個值為類別個數(shù),第二個值為超參數(shù) anchors 的值。
總結
到此這篇關于yolov5模型配置yaml文件詳細講解的文章就介紹到這了,更多相關yolov5模型配置yaml文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
pytorch 實現(xiàn)刪除tensor中的指定行列
今天小編就為大家分享一篇pytorch 實現(xiàn)刪除tensor中的指定行列,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01基于Python實現(xiàn)拆分和合并GIF動態(tài)圖
這篇文章主要介紹了Python拆分和合并GIF動態(tài)圖,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-10-10Python3爬蟲爬取百姓網(wǎng)列表并保存為json功能示例【基于request、lxml和json模塊】
這篇文章主要介紹了Python3爬蟲爬取百姓網(wǎng)列表并保存為json功能,涉及Python基于request、lxml和json模塊的Request請求與響應數(shù)據(jù)處理相關操作技巧,需要的朋友可以參考下2018-12-12基于pytorch實現(xiàn)對圖片進行數(shù)據(jù)增強
圖像數(shù)據(jù)增強是一種在訓練機器學習和深度學習模型時常用的策略,尤其是在計算機視覺領域,具體而言,它通過創(chuàng)建和原始圖像稍有不同的新圖像來擴大訓練集,本文給大家介紹了如何基于pytorch實現(xiàn)對圖片進行數(shù)據(jù)增強,需要的朋友可以參考下2024-01-01