SAR圖像處理與檢測 課件 第六章 微分幾何理論基礎(chǔ)_第1頁
SAR圖像處理與檢測 課件 第六章 微分幾何理論基礎(chǔ)_第2頁
SAR圖像處理與檢測 課件 第六章 微分幾何理論基礎(chǔ)_第3頁
SAR圖像處理與檢測 課件 第六章 微分幾何理論基礎(chǔ)_第4頁
SAR圖像處理與檢測 課件 第六章 微分幾何理論基礎(chǔ)_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

2025/5/221SAR圖像目標(biāo)檢測的YOLO方法基于YOLOv4的SAR圖像艦船檢測2025/5/222卷積神經(jīng)網(wǎng)絡(luò)基本理論神經(jīng)元是構(gòu)建神經(jīng)網(wǎng)絡(luò)的基本單元,其主要由三部分組成:連接、求和節(jié)點及激活函數(shù)。6.1.1人工神經(jīng)網(wǎng)絡(luò)(1)連接:神經(jīng)元中數(shù)據(jù)的流動方向。(2)求和節(jié)點:對各通道的輸入信號和權(quán)重的乘積結(jié)果進行累加求和。(3)激活函數(shù):一般都是非線性函數(shù),對求和節(jié)點輸出的信號進行非線性映射。2025/5/223卷積神經(jīng)網(wǎng)絡(luò)基本理論2025/5/224卷積神經(jīng)網(wǎng)絡(luò)基本理論人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)由多個神經(jīng)元結(jié)構(gòu)組合而成,一般分為輸入層、隱藏層及輸出層。每一層都包含多個神經(jīng)元,而且每一個神經(jīng)元都擁有輸入和輸出,第l層網(wǎng)絡(luò)神經(jīng)元的輸出是下一層即第l+1層神經(jīng)元的輸入。2025/5/225卷積神經(jīng)網(wǎng)絡(luò)基本理論

2025/5/226卷積神經(jīng)網(wǎng)絡(luò)基本理論對這簡單的三層神經(jīng)網(wǎng)絡(luò)的參數(shù)進行向量化,輸入向量為X,權(quán)重向量為W,及偏置向量為b那么有:2025/5/227卷積神經(jīng)網(wǎng)絡(luò)基本理論由此可見,單層神經(jīng)網(wǎng)絡(luò)的前向傳播算法可以使用如下矩陣形式:

2025/5/228卷積神經(jīng)網(wǎng)絡(luò)基本理論卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的卷積層,其內(nèi)部的卷積操作本質(zhì)上就是對數(shù)字圖像信號進行濾波處理,故而卷積核(ConvolutionKernel,CK)也被稱為濾波器。6.1.2卷積神經(jīng)網(wǎng)絡(luò)

2025/5/229卷積神經(jīng)網(wǎng)絡(luò)基本理論根據(jù)不同的卷積操作,輸出的特征圖尺寸也各不相同,主要分為三種情況。2025/5/2210卷積神經(jīng)網(wǎng)絡(luò)基本理論從圖6.3所示的卷積計算可知,多層卷積計算過程本質(zhì)上就是神經(jīng)元的基本求和過程:2025/5/2211卷積神經(jīng)網(wǎng)絡(luò)基本理論為了提高神經(jīng)網(wǎng)絡(luò)的表達能力,激活函數(shù)一般都是單調(diào)遞增的非線性函數(shù),將輸入數(shù)據(jù)重新映射為一個個非線性值,從而控制輸出數(shù)值的大小。

常用的激活函數(shù)有sigmoid函數(shù)、tanh函數(shù)、softmax函數(shù)、ReLU函數(shù)、LeakyReLU函數(shù)。6.1.3激活函數(shù)及其導(dǎo)數(shù)2025/5/2212卷積神經(jīng)網(wǎng)絡(luò)基本理論sigmod函數(shù)sigmoid函數(shù)表達式如下:sigmoid函數(shù)易趨于飽和導(dǎo)致訓(xùn)練結(jié)果不理想。此外,函數(shù)輸出的非線性值并不是零均值,數(shù)據(jù)存在偏差,導(dǎo)致分布不均勻。2025/5/2213卷積神經(jīng)網(wǎng)絡(luò)基本理論tanh函數(shù)tanh函數(shù)又名為雙曲正切函數(shù):

tanh函數(shù)可以更容易地處理負(fù)數(shù)。同時,tanh函數(shù)的輸出值以0為中心,故數(shù)據(jù)分布均勻,且零均值。2025/5/2214卷積神經(jīng)網(wǎng)絡(luò)基本理論softmax函數(shù)softmax函數(shù)的公式如下:

softmax函數(shù)多用于多分類問題,首先使用指數(shù)函數(shù)將預(yù)測結(jié)果映射到零到正無窮區(qū)間,保證了概率的非負(fù)性;再將所有映射后的結(jié)果累加,并進行歸一化,即可得到每個類別的概率。2025/5/2215卷積神經(jīng)網(wǎng)絡(luò)基本理論ReLU函數(shù)ReLU函數(shù)又名為修正線性單元(RectifiedLinearUnit):ReLU函數(shù)的梯度為0或常數(shù),相較于sigmoid函數(shù)、tanh函數(shù),ReLU函數(shù)不僅收斂速度快,還可以有效緩解梯度消失問題。2025/5/2216卷積神經(jīng)網(wǎng)絡(luò)基本理論LeakyReLU函數(shù)LeakyReLU函數(shù)的公式如下:當(dāng)輸入值小于零時,輸出值不再是零值,而有一個很小的遞增坡度。由于LeakyReLU函數(shù)的導(dǎo)數(shù)無零值,故有效解決了ReLU函數(shù)下權(quán)重?zé)o法更新的狀況。2025/5/2217卷積神經(jīng)網(wǎng)絡(luò)基本理論池化層亦被稱為降采樣層,在多個組合卷積操作之后,往往通過池化操作來降低輸出特征向量的維度,在壓縮數(shù)據(jù)和參數(shù)數(shù)量的同時,也保持了模型對目標(biāo)的平移、旋轉(zhuǎn)、伸縮等特性的不變性,從而增強了所提取特征的魯棒性。池化操作主要有最大池化(MaxPooling)和平均池化(AveragePooling)兩種。6.1.4池化操作2025/5/2218卷積神經(jīng)網(wǎng)絡(luò)基本理論最大池化最大池化如下圖所示,假設(shè)池化層的輸入是4×4的特征圖,使用2×2池化核,并以步長為2對上述特征向量進行池化,相當(dāng)于將特征圖劃分為4個2×2的區(qū)域,在每個區(qū)域內(nèi)選取最大值,最后組合成尺寸更小的特征圖。2025/5/2219卷積神經(jīng)網(wǎng)絡(luò)基本理論平均池化平均池化如下圖所示,同理將每個2×2區(qū)域內(nèi)的數(shù)值累加并取均值。2025/5/2220卷積神經(jīng)網(wǎng)絡(luò)基本理論

6.1.3前向傳播與反向傳播2025/5/2221卷積神經(jīng)網(wǎng)絡(luò)基本理論假設(shè)激活函數(shù)為sigmoid函數(shù),即則有2025/5/2222卷積神經(jīng)網(wǎng)絡(luò)基本理論定義損失函數(shù):綜上,可得

至此,完成了一次前向傳播過程。2025/5/2223卷積神經(jīng)網(wǎng)絡(luò)基本理論

2025/5/2224卷積神經(jīng)網(wǎng)絡(luò)基本理論根據(jù)鏈?zhǔn)酵茖?dǎo)法則,繼續(xù)向后傳播,更新其他節(jié)點上的權(quán)值。根據(jù)上面求得偏導(dǎo),進而更新權(quán)重:2025/5/2225YOLO4模型YOLO4的主干網(wǎng)絡(luò)為CSPDarknet53網(wǎng)絡(luò),即CSPNet與Darknet53網(wǎng)絡(luò)的結(jié)合。Darknet53網(wǎng)絡(luò)一共有5個特征層,均為殘差網(wǎng)絡(luò),每個殘差網(wǎng)絡(luò)都包含不同數(shù)量的殘差塊,從低層到高層分別包含1、2、8、8、4個殘差塊。CSPDarknet53殘差塊的結(jié)構(gòu)與Darknet53殘差塊的結(jié)構(gòu)類似,只不過在堆疊過后還要進行一個1×1的卷積,而另一部分直接和主干部分的輸出拼接。6.2.1YOLO4模型的主干網(wǎng)絡(luò)2025/5/2226YOLO4模型為了解決多尺度的問題,特征金字塔(FPN)開創(chuàng)性地引入一種自上而下路徑的特征融合,即上采樣融合拼接,此方法可以在多個尺度上進行特征融合并分別進行目標(biāo)檢測,可以顯著提升小目標(biāo)檢測的精確度。

PANet在FPN的架構(gòu)基礎(chǔ)上設(shè)計了一條自底向上的連接路徑。PANet通過自上而下的路徑將高層的語義特征向下傳遞,增強了語義信息的提取能力;同時通過自下而上的路徑將低層的定位信息傳遞上去,彌補了FPN的不足。YOLO4模型采用了在性能和實用性方面都具有較好表現(xiàn)的PANet作為檢測頸6.2.1YOLO4模型的檢測頸2025/5/2227YOLO4模型YOLO4模型的檢測頸除了使用了PANet結(jié)構(gòu),還添加了改進型的空間金字塔池化(SpatialPyramidPooling,SPP)模塊。

SPP模塊是三個不同尺寸的最大池化層的堆疊,并分別進行平鋪(Flatten)操作來降維,得到1×C、4×C和16×C(C代表通道數(shù))這三個特征,然后將這三個特征拼接得到維度為(1+4+16)×C的特征。2025/5/2228YOLO4模型

為了能夠充分融合特征,YOLO4模型中的檢測頸還添加了多個五層卷積的卷積層,每個卷積層都包含一個BN層和一個LeakyReLU激活函數(shù)。2025/5/2229YOLO4模型

YOLO4模型的檢測頭由3×3的卷積層和1×1的卷積層組合而成。輸出通道數(shù)為3×(K+4+1),其中K是目標(biāo)類別數(shù)目,本章只進行艦船檢測,目標(biāo)為一類,因此K=1,則預(yù)測通道數(shù)為3×(1+4+1)=18。

在本章中,第1個通道是對艦船類的預(yù)測,中間4個通道是對邊界框位置的預(yù)測,最后一個通道是目標(biāo)的置信度,用來區(qū)分前景背景。6.2.1YOLO4模型的檢測頭2025/5/2230YOLO4模型MosaicYOLO4模型中運用了Mosaic數(shù)據(jù)增強方法。Mosaic方法是通過融合四張圖像來實現(xiàn)。優(yōu)點:一方面,它極大地豐富了檢測目標(biāo)的背景,可以為模型提供更多的背景特征信息;另一方面,在進行批歸一化時會計算所傳入的四張圖像的數(shù)據(jù),BatchSize(批次大小)不需要設(shè)置得很高,降低了對硬件的需求,使得YOLO4模型在單GPU上即可運行。6.2.1YOLO4模型的訓(xùn)練2025/5/2231YOLO4模型Mosaic數(shù)據(jù)增強方法的步驟如下:(1)隨機選取四張SAR圖像作為輸入。(2)分別對這四張圖像進行幾何變換、色域變換(調(diào)整明亮度、飽和度、色調(diào))等操作。(3)將處理過的四張圖像放置在左上、左下、右下、右上四個位置。(4)截取四張圖像部分區(qū)域并將它們拼接成一張圖像。2025/5/2232YOLO4模型在Mosaic幾何變換中,需要特別注意裁剪操作。對于四張待操作圖像,首先,隨機生成其中一張圖像的裁剪坐標(biāo),并根據(jù)坐標(biāo)計算出待裁剪部分的長和寬。其次,基于裁剪坐標(biāo)繪制出裁剪矩形并獲取它與原圖的交集。再次,將圖像的尺寸調(diào)整為YOLO4模型所需的大小。最后,根據(jù)裁剪坐標(biāo)和待裁剪的尺寸,取固定部分填充到新圖像的左上部分,并將其他三張圖像的裁剪部分分別填充到新圖像的左下、右下、右上部分。2025/5/2233YOLO4模型標(biāo)簽平滑為了解決錯誤標(biāo)簽帶來的問題,可以使用標(biāo)簽平滑技術(shù),它能夠有效減輕錯誤標(biāo)簽對模型訓(xùn)練的影響,并且有助于防止過擬合、提高目標(biāo)檢測的精度。

2025/5/2234YOLO4模型

上式等價于:

2025/5/2235YOLO4模型學(xué)習(xí)率余弦退火衰減當(dāng)目標(biāo)函數(shù)達到局部最優(yōu)解時,如果繼續(xù)使用梯度訓(xùn)練算法降低學(xué)習(xí)率就會陷入僵局,只能獲得局部最小值。此時,可以提高學(xué)習(xí)率來跳出局部最優(yōu)的循環(huán)。

2025/5/2236YOLO4模型CIoU目標(biāo)檢測中,通常使用交并比(IntersectionoverUnion,IoU)來篩選預(yù)測框,并計算預(yù)測框與真實框之間的損失值。IoU由預(yù)測框與真實框的交集面積除以并集面積得到,它具有尺度不變的優(yōu)點,但忽略了預(yù)測框間的距離,無法精準(zhǔn)反映框間的重合度大小。完備交并比(CompleteIntersectionoverUnion,CIoU)考慮了預(yù)測框錨點與目標(biāo)間的距離、重合率、尺度,并添加懲罰因子用于估計預(yù)測框長寬比與真實框長寬比,避免了模型訓(xùn)練過程中的發(fā)散問題2025/5/2237YOLO4模型CIoU計算方式:

2025/5/2238YOLO4模型NMS在YOLO模型預(yù)測目標(biāo)檢測的結(jié)果時,面臨著對同一個目標(biāo)可能會生成多個預(yù)測框的問題,這時就需要使用非極大抑制(Non-MaximumSuppression,NMS)。

2025/5/2239實驗結(jié)果及分析CAESAR-Radi數(shù)據(jù)集是中國科學(xué)院王超團隊開放的SAR圖像艦船數(shù)據(jù)集,包含了Sentinel-1及GF-3兩種遙感衛(wèi)星的圖像數(shù)據(jù),且為了降低硬件需求以便于模型訓(xùn)練,將高分辨率的圖像分割成了4300張256像素×256像素的低分辨率SAR圖像切片。6.3.1CAESAR-Radi數(shù)據(jù)集2025/5/2240實驗結(jié)果及分析采用精確率(Precision)、召回率(Recall)及平均精確率(AveragePrecision,AP)這三個指標(biāo)來評價網(wǎng)絡(luò)模型的檢測精度。模型檢測的預(yù)測標(biāo)簽可以分為正負(fù)兩類:6.3.2評價指標(biāo)TP(TruePositive)表示真實標(biāo)簽與預(yù)測標(biāo)簽均為正;FP(FalsePositive)表示真實標(biāo)簽為負(fù)但預(yù)測標(biāo)簽為正;TN(TrueNegative)表示真實標(biāo)簽為正但預(yù)測標(biāo)簽為負(fù);FN(FalseNegative)表示真實標(biāo)簽與預(yù)測標(biāo)簽均為負(fù)。2025/5/2241實驗結(jié)果及分析預(yù)測框匹配真實框示意圖如圖6.20所示,設(shè)置閾值為T(圖中T=0.5)。

當(dāng)IoU大于T時,表示檢測目標(biāo)成功,TP加1;當(dāng)IoU小于T時,表示檢測目標(biāo)失敗,F(xiàn)P加1;如果模型生成的預(yù)測框無法匹配真實框,F(xiàn)N加1。2025/5/2242實驗結(jié)果及分析

精確率代表檢測正確的正樣本數(shù)占所有檢測正樣本數(shù)的比例,精確率越大表示模型的查準(zhǔn)率越大。精確率計算如下:

召回率代表檢測正確的正樣本數(shù)占所有真實正樣本數(shù)的比例,召回率越大表示模型對檢測目標(biāo)的查全率越高。召回率計算如下:2025/5/2243實驗結(jié)果及分析以召回率為橫坐標(biāo)、精確率為縱坐標(biāo)繪制出一條曲線來反映兩者之間的變化關(guān)系。這條曲線與坐標(biāo)軸圍成的面積就是該目標(biāo)的平均精確度。平均精確度能有效衡量模型檢測性能的優(yōu)劣,值越大說明模型的檢測精確率越高。2025/5/2244實驗結(jié)果及分析訓(xùn)練過程中,按照9∶1的比例將CAESAR-Radi數(shù)據(jù)集隨機劃分為訓(xùn)練集與測試集;;學(xué)習(xí)方式使用余弦退火衰減算法,初始學(xué)習(xí)率設(shè)為0.001;每批處理8張SAR圖像,并采用標(biāo)簽平滑來提高模型的魯棒性。6.3.3實驗分析進行輕量化YOLO模型與YOLO4模型、YOLOX模型的對比分析,不同網(wǎng)絡(luò)訓(xùn)練過程圖如右圖所示。2025/5/2245實驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論