SAR圖像處理與檢測(cè) 課件 第六章 微分幾何理論基礎(chǔ)_第1頁(yè)
SAR圖像處理與檢測(cè) 課件 第六章 微分幾何理論基礎(chǔ)_第2頁(yè)
SAR圖像處理與檢測(cè) 課件 第六章 微分幾何理論基礎(chǔ)_第3頁(yè)
SAR圖像處理與檢測(cè) 課件 第六章 微分幾何理論基礎(chǔ)_第4頁(yè)
SAR圖像處理與檢測(cè) 課件 第六章 微分幾何理論基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025/5/221SAR圖像目標(biāo)檢測(cè)的YOLO方法基于YOLOv4的SAR圖像艦船檢測(cè)2025/5/222卷積神經(jīng)網(wǎng)絡(luò)基本理論神經(jīng)元是構(gòu)建神經(jīng)網(wǎng)絡(luò)的基本單元,其主要由三部分組成:連接、求和節(jié)點(diǎn)及激活函數(shù)。6.1.1人工神經(jīng)網(wǎng)絡(luò)(1)連接:神經(jīng)元中數(shù)據(jù)的流動(dòng)方向。(2)求和節(jié)點(diǎn):對(duì)各通道的輸入信號(hào)和權(quán)重的乘積結(jié)果進(jìn)行累加求和。(3)激活函數(shù):一般都是非線性函數(shù),對(duì)求和節(jié)點(diǎn)輸出的信號(hào)進(jìn)行非線性映射。2025/5/223卷積神經(jīng)網(wǎng)絡(luò)基本理論2025/5/224卷積神經(jīng)網(wǎng)絡(luò)基本理論人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)由多個(gè)神經(jīng)元結(jié)構(gòu)組合而成,一般分為輸入層、隱藏層及輸出層。每一層都包含多個(gè)神經(jīng)元,而且每一個(gè)神經(jīng)元都擁有輸入和輸出,第l層網(wǎng)絡(luò)神經(jīng)元的輸出是下一層即第l+1層神經(jīng)元的輸入。2025/5/225卷積神經(jīng)網(wǎng)絡(luò)基本理論

2025/5/226卷積神經(jīng)網(wǎng)絡(luò)基本理論對(duì)這簡(jiǎn)單的三層神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行向量化,輸入向量為X,權(quán)重向量為W,及偏置向量為b那么有:2025/5/227卷積神經(jīng)網(wǎng)絡(luò)基本理論由此可見(jiàn),單層神經(jīng)網(wǎng)絡(luò)的前向傳播算法可以使用如下矩陣形式:

2025/5/228卷積神經(jīng)網(wǎng)絡(luò)基本理論卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的卷積層,其內(nèi)部的卷積操作本質(zhì)上就是對(duì)數(shù)字圖像信號(hào)進(jìn)行濾波處理,故而卷積核(ConvolutionKernel,CK)也被稱(chēng)為濾波器。6.1.2卷積神經(jīng)網(wǎng)絡(luò)

2025/5/229卷積神經(jīng)網(wǎng)絡(luò)基本理論根據(jù)不同的卷積操作,輸出的特征圖尺寸也各不相同,主要分為三種情況。2025/5/2210卷積神經(jīng)網(wǎng)絡(luò)基本理論從圖6.3所示的卷積計(jì)算可知,多層卷積計(jì)算過(guò)程本質(zhì)上就是神經(jīng)元的基本求和過(guò)程:2025/5/2211卷積神經(jīng)網(wǎng)絡(luò)基本理論為了提高神經(jīng)網(wǎng)絡(luò)的表達(dá)能力,激活函數(shù)一般都是單調(diào)遞增的非線性函數(shù),將輸入數(shù)據(jù)重新映射為一個(gè)個(gè)非線性值,從而控制輸出數(shù)值的大小。

常用的激活函數(shù)有sigmoid函數(shù)、tanh函數(shù)、softmax函數(shù)、ReLU函數(shù)、LeakyReLU函數(shù)。6.1.3激活函數(shù)及其導(dǎo)數(shù)2025/5/2212卷積神經(jīng)網(wǎng)絡(luò)基本理論sigmod函數(shù)sigmoid函數(shù)表達(dá)式如下:sigmoid函數(shù)易趨于飽和導(dǎo)致訓(xùn)練結(jié)果不理想。此外,函數(shù)輸出的非線性值并不是零均值,數(shù)據(jù)存在偏差,導(dǎo)致分布不均勻。2025/5/2213卷積神經(jīng)網(wǎng)絡(luò)基本理論tanh函數(shù)tanh函數(shù)又名為雙曲正切函數(shù):

tanh函數(shù)可以更容易地處理負(fù)數(shù)。同時(shí),tanh函數(shù)的輸出值以0為中心,故數(shù)據(jù)分布均勻,且零均值。2025/5/2214卷積神經(jīng)網(wǎng)絡(luò)基本理論softmax函數(shù)softmax函數(shù)的公式如下:

softmax函數(shù)多用于多分類(lèi)問(wèn)題,首先使用指數(shù)函數(shù)將預(yù)測(cè)結(jié)果映射到零到正無(wú)窮區(qū)間,保證了概率的非負(fù)性;再將所有映射后的結(jié)果累加,并進(jìn)行歸一化,即可得到每個(gè)類(lèi)別的概率。2025/5/2215卷積神經(jīng)網(wǎng)絡(luò)基本理論ReLU函數(shù)ReLU函數(shù)又名為修正線性單元(RectifiedLinearUnit):ReLU函數(shù)的梯度為0或常數(shù),相較于sigmoid函數(shù)、tanh函數(shù),ReLU函數(shù)不僅收斂速度快,還可以有效緩解梯度消失問(wèn)題。2025/5/2216卷積神經(jīng)網(wǎng)絡(luò)基本理論LeakyReLU函數(shù)LeakyReLU函數(shù)的公式如下:當(dāng)輸入值小于零時(shí),輸出值不再是零值,而有一個(gè)很小的遞增坡度。由于LeakyReLU函數(shù)的導(dǎo)數(shù)無(wú)零值,故有效解決了ReLU函數(shù)下權(quán)重?zé)o法更新的狀況。2025/5/2217卷積神經(jīng)網(wǎng)絡(luò)基本理論池化層亦被稱(chēng)為降采樣層,在多個(gè)組合卷積操作之后,往往通過(guò)池化操作來(lái)降低輸出特征向量的維度,在壓縮數(shù)據(jù)和參數(shù)數(shù)量的同時(shí),也保持了模型對(duì)目標(biāo)的平移、旋轉(zhuǎn)、伸縮等特性的不變性,從而增強(qiáng)了所提取特征的魯棒性。池化操作主要有最大池化(MaxPooling)和平均池化(AveragePooling)兩種。6.1.4池化操作2025/5/2218卷積神經(jīng)網(wǎng)絡(luò)基本理論最大池化最大池化如下圖所示,假設(shè)池化層的輸入是4×4的特征圖,使用2×2池化核,并以步長(zhǎng)為2對(duì)上述特征向量進(jìn)行池化,相當(dāng)于將特征圖劃分為4個(gè)2×2的區(qū)域,在每個(gè)區(qū)域內(nèi)選取最大值,最后組合成尺寸更小的特征圖。2025/5/2219卷積神經(jīng)網(wǎng)絡(luò)基本理論平均池化平均池化如下圖所示,同理將每個(gè)2×2區(qū)域內(nèi)的數(shù)值累加并取均值。2025/5/2220卷積神經(jīng)網(wǎng)絡(luò)基本理論

6.1.3前向傳播與反向傳播2025/5/2221卷積神經(jīng)網(wǎng)絡(luò)基本理論假設(shè)激活函數(shù)為sigmoid函數(shù),即則有2025/5/2222卷積神經(jīng)網(wǎng)絡(luò)基本理論定義損失函數(shù):綜上,可得

至此,完成了一次前向傳播過(guò)程。2025/5/2223卷積神經(jīng)網(wǎng)絡(luò)基本理論

2025/5/2224卷積神經(jīng)網(wǎng)絡(luò)基本理論根據(jù)鏈?zhǔn)酵茖?dǎo)法則,繼續(xù)向后傳播,更新其他節(jié)點(diǎn)上的權(quán)值。根據(jù)上面求得偏導(dǎo),進(jìn)而更新權(quán)重:2025/5/2225YOLO4模型YOLO4的主干網(wǎng)絡(luò)為CSPDarknet53網(wǎng)絡(luò),即CSPNet與Darknet53網(wǎng)絡(luò)的結(jié)合。Darknet53網(wǎng)絡(luò)一共有5個(gè)特征層,均為殘差網(wǎng)絡(luò),每個(gè)殘差網(wǎng)絡(luò)都包含不同數(shù)量的殘差塊,從低層到高層分別包含1、2、8、8、4個(gè)殘差塊。CSPDarknet53殘差塊的結(jié)構(gòu)與Darknet53殘差塊的結(jié)構(gòu)類(lèi)似,只不過(guò)在堆疊過(guò)后還要進(jìn)行一個(gè)1×1的卷積,而另一部分直接和主干部分的輸出拼接。6.2.1YOLO4模型的主干網(wǎng)絡(luò)2025/5/2226YOLO4模型為了解決多尺度的問(wèn)題,特征金字塔(FPN)開(kāi)創(chuàng)性地引入一種自上而下路徑的特征融合,即上采樣融合拼接,此方法可以在多個(gè)尺度上進(jìn)行特征融合并分別進(jìn)行目標(biāo)檢測(cè),可以顯著提升小目標(biāo)檢測(cè)的精確度。

PANet在FPN的架構(gòu)基礎(chǔ)上設(shè)計(jì)了一條自底向上的連接路徑。PANet通過(guò)自上而下的路徑將高層的語(yǔ)義特征向下傳遞,增強(qiáng)了語(yǔ)義信息的提取能力;同時(shí)通過(guò)自下而上的路徑將低層的定位信息傳遞上去,彌補(bǔ)了FPN的不足。YOLO4模型采用了在性能和實(shí)用性方面都具有較好表現(xiàn)的PANet作為檢測(cè)頸6.2.1YOLO4模型的檢測(cè)頸2025/5/2227YOLO4模型YOLO4模型的檢測(cè)頸除了使用了PANet結(jié)構(gòu),還添加了改進(jìn)型的空間金字塔池化(SpatialPyramidPooling,SPP)模塊。

SPP模塊是三個(gè)不同尺寸的最大池化層的堆疊,并分別進(jìn)行平鋪(Flatten)操作來(lái)降維,得到1×C、4×C和16×C(C代表通道數(shù))這三個(gè)特征,然后將這三個(gè)特征拼接得到維度為(1+4+16)×C的特征。2025/5/2228YOLO4模型

為了能夠充分融合特征,YOLO4模型中的檢測(cè)頸還添加了多個(gè)五層卷積的卷積層,每個(gè)卷積層都包含一個(gè)BN層和一個(gè)LeakyReLU激活函數(shù)。2025/5/2229YOLO4模型

YOLO4模型的檢測(cè)頭由3×3的卷積層和1×1的卷積層組合而成。輸出通道數(shù)為3×(K+4+1),其中K是目標(biāo)類(lèi)別數(shù)目,本章只進(jìn)行艦船檢測(cè),目標(biāo)為一類(lèi),因此K=1,則預(yù)測(cè)通道數(shù)為3×(1+4+1)=18。

在本章中,第1個(gè)通道是對(duì)艦船類(lèi)的預(yù)測(cè),中間4個(gè)通道是對(duì)邊界框位置的預(yù)測(cè),最后一個(gè)通道是目標(biāo)的置信度,用來(lái)區(qū)分前景背景。6.2.1YOLO4模型的檢測(cè)頭2025/5/2230YOLO4模型MosaicYOLO4模型中運(yùn)用了Mosaic數(shù)據(jù)增強(qiáng)方法。Mosaic方法是通過(guò)融合四張圖像來(lái)實(shí)現(xiàn)。優(yōu)點(diǎn):一方面,它極大地豐富了檢測(cè)目標(biāo)的背景,可以為模型提供更多的背景特征信息;另一方面,在進(jìn)行批歸一化時(shí)會(huì)計(jì)算所傳入的四張圖像的數(shù)據(jù),BatchSize(批次大小)不需要設(shè)置得很高,降低了對(duì)硬件的需求,使得YOLO4模型在單GPU上即可運(yùn)行。6.2.1YOLO4模型的訓(xùn)練2025/5/2231YOLO4模型Mosaic數(shù)據(jù)增強(qiáng)方法的步驟如下:(1)隨機(jī)選取四張SAR圖像作為輸入。(2)分別對(duì)這四張圖像進(jìn)行幾何變換、色域變換(調(diào)整明亮度、飽和度、色調(diào))等操作。(3)將處理過(guò)的四張圖像放置在左上、左下、右下、右上四個(gè)位置。(4)截取四張圖像部分區(qū)域并將它們拼接成一張圖像。2025/5/2232YOLO4模型在Mosaic幾何變換中,需要特別注意裁剪操作。對(duì)于四張待操作圖像,首先,隨機(jī)生成其中一張圖像的裁剪坐標(biāo),并根據(jù)坐標(biāo)計(jì)算出待裁剪部分的長(zhǎng)和寬。其次,基于裁剪坐標(biāo)繪制出裁剪矩形并獲取它與原圖的交集。再次,將圖像的尺寸調(diào)整為YOLO4模型所需的大小。最后,根據(jù)裁剪坐標(biāo)和待裁剪的尺寸,取固定部分填充到新圖像的左上部分,并將其他三張圖像的裁剪部分分別填充到新圖像的左下、右下、右上部分。2025/5/2233YOLO4模型標(biāo)簽平滑為了解決錯(cuò)誤標(biāo)簽帶來(lái)的問(wèn)題,可以使用標(biāo)簽平滑技術(shù),它能夠有效減輕錯(cuò)誤標(biāo)簽對(duì)模型訓(xùn)練的影響,并且有助于防止過(guò)擬合、提高目標(biāo)檢測(cè)的精度。

2025/5/2234YOLO4模型

上式等價(jià)于:

2025/5/2235YOLO4模型學(xué)習(xí)率余弦退火衰減當(dāng)目標(biāo)函數(shù)達(dá)到局部最優(yōu)解時(shí),如果繼續(xù)使用梯度訓(xùn)練算法降低學(xué)習(xí)率就會(huì)陷入僵局,只能獲得局部最小值。此時(shí),可以提高學(xué)習(xí)率來(lái)跳出局部最優(yōu)的循環(huán)。

2025/5/2236YOLO4模型CIoU目標(biāo)檢測(cè)中,通常使用交并比(IntersectionoverUnion,IoU)來(lái)篩選預(yù)測(cè)框,并計(jì)算預(yù)測(cè)框與真實(shí)框之間的損失值。IoU由預(yù)測(cè)框與真實(shí)框的交集面積除以并集面積得到,它具有尺度不變的優(yōu)點(diǎn),但忽略了預(yù)測(cè)框間的距離,無(wú)法精準(zhǔn)反映框間的重合度大小。完備交并比(CompleteIntersectionoverUnion,CIoU)考慮了預(yù)測(cè)框錨點(diǎn)與目標(biāo)間的距離、重合率、尺度,并添加懲罰因子用于估計(jì)預(yù)測(cè)框長(zhǎng)寬比與真實(shí)框長(zhǎng)寬比,避免了模型訓(xùn)練過(guò)程中的發(fā)散問(wèn)題2025/5/2237YOLO4模型CIoU計(jì)算方式:

2025/5/2238YOLO4模型NMS在YOLO模型預(yù)測(cè)目標(biāo)檢測(cè)的結(jié)果時(shí),面臨著對(duì)同一個(gè)目標(biāo)可能會(huì)生成多個(gè)預(yù)測(cè)框的問(wèn)題,這時(shí)就需要使用非極大抑制(Non-MaximumSuppression,NMS)。

2025/5/2239實(shí)驗(yàn)結(jié)果及分析CAESAR-Radi數(shù)據(jù)集是中國(guó)科學(xué)院王超團(tuán)隊(duì)開(kāi)放的SAR圖像艦船數(shù)據(jù)集,包含了Sentinel-1及GF-3兩種遙感衛(wèi)星的圖像數(shù)據(jù),且為了降低硬件需求以便于模型訓(xùn)練,將高分辨率的圖像分割成了4300張256像素×256像素的低分辨率SAR圖像切片。6.3.1CAESAR-Radi數(shù)據(jù)集2025/5/2240實(shí)驗(yàn)結(jié)果及分析采用精確率(Precision)、召回率(Recall)及平均精確率(AveragePrecision,AP)這三個(gè)指標(biāo)來(lái)評(píng)價(jià)網(wǎng)絡(luò)模型的檢測(cè)精度。模型檢測(cè)的預(yù)測(cè)標(biāo)簽可以分為正負(fù)兩類(lèi):6.3.2評(píng)價(jià)指標(biāo)TP(TruePositive)表示真實(shí)標(biāo)簽與預(yù)測(cè)標(biāo)簽均為正;FP(FalsePositive)表示真實(shí)標(biāo)簽為負(fù)但預(yù)測(cè)標(biāo)簽為正;TN(TrueNegative)表示真實(shí)標(biāo)簽為正但預(yù)測(cè)標(biāo)簽為負(fù);FN(FalseNegative)表示真實(shí)標(biāo)簽與預(yù)測(cè)標(biāo)簽均為負(fù)。2025/5/2241實(shí)驗(yàn)結(jié)果及分析預(yù)測(cè)框匹配真實(shí)框示意圖如圖6.20所示,設(shè)置閾值為T(mén)(圖中T=0.5)。

當(dāng)IoU大于T時(shí),表示檢測(cè)目標(biāo)成功,TP加1;當(dāng)IoU小于T時(shí),表示檢測(cè)目標(biāo)失敗,F(xiàn)P加1;如果模型生成的預(yù)測(cè)框無(wú)法匹配真實(shí)框,F(xiàn)N加1。2025/5/2242實(shí)驗(yàn)結(jié)果及分析

精確率代表檢測(cè)正確的正樣本數(shù)占所有檢測(cè)正樣本數(shù)的比例,精確率越大表示模型的查準(zhǔn)率越大。精確率計(jì)算如下:

召回率代表檢測(cè)正確的正樣本數(shù)占所有真實(shí)正樣本數(shù)的比例,召回率越大表示模型對(duì)檢測(cè)目標(biāo)的查全率越高。召回率計(jì)算如下:2025/5/2243實(shí)驗(yàn)結(jié)果及分析以召回率為橫坐標(biāo)、精確率為縱坐標(biāo)繪制出一條曲線來(lái)反映兩者之間的變化關(guān)系。這條曲線與坐標(biāo)軸圍成的面積就是該目標(biāo)的平均精確度。平均精確度能有效衡量模型檢測(cè)性能的優(yōu)劣,值越大說(shuō)明模型的檢測(cè)精確率越高。2025/5/2244實(shí)驗(yàn)結(jié)果及分析訓(xùn)練過(guò)程中,按照9∶1的比例將CAESAR-Radi數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集與測(cè)試集;;學(xué)習(xí)方式使用余弦退火衰減算法,初始學(xué)習(xí)率設(shè)為0.001;每批處理8張SAR圖像,并采用標(biāo)簽平滑來(lái)提高模型的魯棒性。6.3.3實(shí)驗(yàn)分析進(jìn)行輕量化YOLO模型與YOLO4模型、YOLOX模型的對(duì)比分析,不同網(wǎng)絡(luò)訓(xùn)練過(guò)程圖如右圖所示。2025/5/2245實(shí)驗(yàn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論