yolov5模型配置yaml文件詳細(xì)講解_第1頁(yè)
yolov5模型配置yaml文件詳細(xì)講解_第2頁(yè)
yolov5模型配置yaml文件詳細(xì)講解_第3頁(yè)
yolov5模型配置yaml文件詳細(xì)講解_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第yolov5模型配置yaml文件詳細(xì)講解目錄以models/yolov5s.yaml為例我們一個(gè)一個(gè)來解釋:補(bǔ)充:模型yaml文件中第四參數(shù)解釋總結(jié)yolov5的代碼模型構(gòu)建是通過.yaml文件實(shí)現(xiàn)的,初次看上去會(huì)一頭霧水,這里記錄一下,也方便自己后面用到的時(shí)候查看。

以models/yolov5s.yaml為例

文件內(nèi)容如下:

#Parameters

nc:5#numberofclasses

depth_multiple:0.33#modeldepthmultiple

width_multiple:0.50#layerchannelmultiple

anchors:

-[24,24,29,84,59,42]#P3/8

-[45,146,75,87,157,49]#P4/16

-[310,167,139,341,127,151]#P5/32

#YOLOv5backbone

backbone:

#[from,number,module,args]

[[-1,1,Focus,[64,3]],#0-P1/2

[-1,1,Conv,[128,3,2]],#1-P2/4

[-1,3,C3,[128]],

[-1,1,Conv,[256,3,2]],#3-P3/8

[-1,9,C3,[256]],

[-1,1,Conv,[512,3,2]],#5-P4/16

[-1,9,C3,[512]],

[-1,1,Conv,[1024,3,2]],#7-P5/32

[-1,1,SPP,[1024,[5,9,13]]],

[-1,3,C3,[1024,False]],#9

#YOLOv5head

head:

[[-1,1,Conv,[512,1,1]],

[-1,1,nn.Upsample,[None,2,'nearest']],

[[-1,6],1,Concat,[1]],#catbackboneP4

[-1,3,C3,[512,False]],#13

[-1,1,Conv,[256,1,1]],

[-1,1,nn.Upsample,[None,2,'nearest']],

[[-1,4],1,Concat,[1]],#catbackboneP3

[-1,3,C3,[256,False]],#17(P3/8-small)

[-1,1,Conv,[256,3,2]],

[[-1,14],1,Concat,[1]],#catheadP4

[-1,3,C3,[512,False]],#20(P4/16-medium)

[-1,1,Conv,[512,3,2]],

[[-1,10],1,Concat,[1]],#catheadP5

[-1,3,C3,[1024,False]],#23(P5/32-large)

[[17,20,23],1,Detect,[nc,anchors]],#Detect(P3,P4,P5)

我們一個(gè)一個(gè)來解釋:

一些基本參數(shù):nc數(shù)據(jù)集中物體的類別數(shù)depth_multiple控制網(wǎng)絡(luò)深度的系數(shù)width_multiple控制網(wǎng)絡(luò)寬度的系數(shù)anchors給不同尺度特征圖分配的anchors,可以看到包含三個(gè)列表,表示給三個(gè)尺度分配,這三個(gè)尺度在[[17,20,23],1,Detect,[nc,anchors]]指明,分別是網(wǎng)絡(luò)的第17、20和23層。注釋P3/8是指輸入下采樣了23=8倍,我們也可以發(fā)現(xiàn)網(wǎng)絡(luò)的第17層特征圖為輸入的1/8。BackBone:

骨干網(wǎng)絡(luò)的定義,是一個(gè)列表,每一行表示一層??梢钥吹矫恳恍惺怯?個(gè)元素的列表,[from,number,module,args]說明了這個(gè)4個(gè)元素的意思。from表示該層的輸入從哪來。-1表示輸入取自上一層,-2表示上兩層,3表示第3層(從0開始數(shù)),[-1,4]表示取自上一層和第4層,依次類推。。。網(wǎng)絡(luò)層數(shù)的數(shù)法在注釋里已經(jīng)標(biāo)出來了,從0開始,每一行表示一層,例如0-P1/2表示第0層,特征圖尺寸為輸入的1/21。number表示該層模塊堆疊的次數(shù),對(duì)于C3、BottleneckCSP等模塊,表示其子模塊的堆疊,具體細(xì)節(jié)可以查看源代碼。當(dāng)然最終的次數(shù)還要乘上depth_multiple系數(shù)。module表示該層的模塊是啥。Conv就是卷積+BN+激活模塊。所有的模塊在model/common.py中都有定義。args表示輸入到模塊的參數(shù)。例如Conv:[128,3,2]表示輸出通道128,卷積核尺寸3,strid=2,當(dāng)然最終的輸出通道數(shù)還要乘上width_multiple,對(duì)于其他模塊,第一個(gè)參數(shù)值一般都是指輸出通道數(shù),具體細(xì)節(jié)可以看model/common.py中的定義。Head

規(guī)則和BackBone一毛一樣,這里再解釋一些最后一層:

[[17,20,23],1,Detect,[nc,anchors]]表示把第17、20和23三層作為Detect模塊的輸入,[nc,anchors]是初始化Detect模塊的參數(shù)。Detect模塊在model/yolo.py中聲明,相當(dāng)于從模型中提出想要的層作為輸入,轉(zhuǎn)換為相應(yīng)的檢測(cè)頭,其輸出用來計(jì)算loss。

補(bǔ)充:模型yaml文件中第四參數(shù)解釋

這里是對(duì)backbone和head超參數(shù)中第四個(gè)參數(shù)的理解

當(dāng)?shù)谌齻€(gè)參數(shù)為Focus時(shí),第四個(gè)參數(shù)中,第一個(gè)值為該模塊中需要用到的通道數(shù),第二個(gè)值為卷積核大??;

當(dāng)?shù)谌齻€(gè)參數(shù)為Conv時(shí),第四個(gè)參數(shù)中,第一個(gè)值為該模塊中需要用到的通道數(shù),第二個(gè)值為卷積核大小,第三個(gè)參數(shù)為步距大?。?/p>

當(dāng)?shù)谌齻€(gè)參數(shù)為BottleneckCSP時(shí),第四個(gè)參數(shù)中,第一個(gè)值是該模塊用到的通道數(shù);如果存在第二個(gè)參數(shù),第二個(gè)參數(shù):是否啟用shortcut連接

當(dāng)?shù)谌齻€(gè)參數(shù)為SPP時(shí),第四個(gè)參數(shù)就是SPP中需要用到的卷積核大小。

當(dāng)?shù)谌?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論