SAR圖像處理與檢測 課件全套 第1-6章 緒論、SAR 圖像濾波的字典學習方法 -微分幾何理論基礎_第1頁
SAR圖像處理與檢測 課件全套 第1-6章 緒論、SAR 圖像濾波的字典學習方法 -微分幾何理論基礎_第2頁
SAR圖像處理與檢測 課件全套 第1-6章 緒論、SAR 圖像濾波的字典學習方法 -微分幾何理論基礎_第3頁
SAR圖像處理與檢測 課件全套 第1-6章 緒論、SAR 圖像濾波的字典學習方法 -微分幾何理論基礎_第4頁
SAR圖像處理與檢測 課件全套 第1-6章 緒論、SAR 圖像濾波的字典學習方法 -微分幾何理論基礎_第5頁
已閱讀5頁,還剩252頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2025/5/221SAR圖像處理與檢測2025/5/222第一章

緒論1.1背景與意義1.2基本定義與問題描述1.3小結2025/5/223背景與意義合成孔徑雷達(SyntheticApertureRadar,SAR)是一種主動式的對地觀測系統,由于該系統能夠實現穿透云霧、植被對地全天候遠距離的觀測,被廣泛應用于軍事、遙感、水文、地礦等領域。在過去的十幾年里,我國在研發獲取SAR數據的系統方面,投入了大量精力,從各種各樣的機載和星載SAR系統獲取了海量的高質量SAR圖像,但是在如何利用好這些海量的數據方面所做的工作卻相對較少。SAR圖像的圖像特性會隨著不同的配置條件(包括姿態、俯仰、遮擋、隱蔽、成像參數等)發生較大的變化,與光學圖像存在較大差異,盡管有經驗的圖像分析人員可以快速地識別出一些特征,但是,人工進行信息提取是一項非常耗時的工作,而且,不同分析人員間也沒有判讀結果的統一評價標準。因此,在對數據信息進行充分理解的基礎上,建立統一的決策標準,以獲得適合人眼觀察識別的圖像,同時能夠自動或半自動地生成某些決策將會給SAR圖像在各領域的推廣應用帶來極大的助力。由SAR系統獲得的圖像數據信息通常是高維的,結構豐富且多樣化。在大量復雜的數據中,感興趣的數據遠遠少于整體,如何能夠快速檢索到那些感興趣的信息是待解決的關鍵問題。基于有用信息在整體數據中稀疏性假設的稀疏表示理論提供給了研究工作者一個處理海量SAR圖像數據信息的新思路。相對于一維信號,二維SAR圖像數據具有更多的空間結構信息,能夠同時將圖像的結構信息和信息的稀疏性整合到一個框架中的群稀疏表示理論,能夠在SAR圖像的應用中獲得更好的效果。基本定義與問題描述SAR系統是測量地面和入射電磁波之間局部相互作用的一種測量系統,通過該系統可以產生描述該作用的高分辨率SAR圖像,從某種意義上來講,SAR圖像是地面局部散射特性的一種表現形式,即所有地面信息以電磁理論知識為載體。SAR圖像應用的獨特性及電磁理論的一般性之間存在廣闊的技術和理論發展空間,其目的是為SAR圖像分析與解譯提供一些一般性的方法。2025/5/224SAR圖像相干斑抑制SAR圖像是通過相干的電磁散射過程得到的,因此存在無法避免的各散射體之間的干擾現象,其在圖像中表現為相干斑噪聲,該干擾是理解與分析SAR圖像需要首要解決的問題。針對SAR圖像幅度圖像的相干斑抑制研究是最為廣泛的,通過結合不同的估計域(如空間域、頻率域、小波域、其他類型變換域等)、估計準則[如最小均方誤差(MinimunMeanSquareError,MMSE)、線性最小均方誤差(Linear

MinimumMeanSquareError,LMMSE)、最小平均絕對誤差等]、最大后驗概率(Maximum

APosteriorProbability,MAP)估計或者非貝葉斯模型,以及概率密度估計模型,可以獲得大量不同種類的相干斑抑制方法。有關相干斑抑制的研究工作最早始于圖像空間域的處理,該類方法基于對目標反射強度及相干斑相關統計特性(如自相關函數和概率分布函數等)的假設。根據其統計特性的不同,此類濾波器將真實SAR圖像中的區域分為三類:均勻區域、紋理區域及強散射區域。針對第一類圖像區域,該類區域在空間上具有恒定的強度值,對此類情形的最佳估計方法為在鄰域中取像素強度的平均值;屬于第三類圖像區域的像素值一般予以保留以進行目標檢測,并且用于校準及匹配等操作。此類濾波器的設計旨在降低第二類圖像區域的相干斑噪聲。2025/5/225SAR圖像相干斑抑制過去三十年還出現了許多不遵循貝葉斯準則的相干斑抑制算法,下面對較為流行的算法進行介紹和總結。以中值濾波器為代表的次序統計濾波器由于其邊緣保持的獨特特性而在相干斑抑制的應用領域得到了一定的普及,其中當條件中值濾波器識別像素為異常值(即窗口內極值)時,使用樣本中值替換局部滑動窗口的中心像素值。稀疏表示(Sparse

Representation,SR)信號模型受到圖像處理研究學者廣泛的歡迎和關注,該理論的基本假設:自然圖像都滿足稀疏先驗模型,即可以被視為字典中少數原子的線性組合。稀疏表示方法已被成功應用于圖像去噪、圖像分類和圖像恢復,同樣也被應用于SAR圖像的相干斑抑制。由于SAR圖像相干斑噪聲具有離散無結構分布形式,與具有明顯結構特征的圖像信息不同,如何利用群稀疏表示理論探索SAR圖像的目標結構特征表現出的群稀疏性,并進行相干斑噪聲抑制是本書相關算法設計的初衷。相干斑噪聲多被建模為指數分布的乘性噪聲,而融合稀疏表示理論中使用的信號模型為字典各原子的線性疊加形式,如何結合相干斑噪聲特點并利用群稀疏表示理論抑制乘性相干斑噪聲是本書的分析重點。2025/5/226SAR圖像目標檢測基于SAR圖像的目標檢測技術已經成為SAR軍事應用的核心技術,地面的坦克集群、運輸車輛、導彈發射架等是戰場上的重要目標,對感興趣目標實現實時的自動檢測,為戰場指揮提供有用信息,具有重要的意義。過去幾十年,SAR圖像目標檢測問題獲得了相關研究學者及機構廣泛的關注和研究,并涌現了多種目標檢測算法。按各檢測算法選用技術標準的不同,SAR圖像目標檢測的研究方法大致可分為兩種:基于對比度的目標檢測算法及基于圖像特征的目標檢測算法。在SAR圖像中除感興趣目標外,場景中還包含大量由雜波構成的像素點,一般情況下感興趣目標像素點只占有較小的空間區域,同時達到最小的虛警概率和最大的檢測概率是目標檢測算法設計的目的。基于對比度的目標檢測算法能較好地檢測出金屬質地的感興趣目標,如車輛、艦船、基站等,即具有較強的后向散射強度,能夠明顯區別于與周遭環境具有較大對比度的目標。恒虛警率(ConstantFalseAlarmRate,CFAR)檢測算法是SAR圖像目標檢測領域最常用且研究較為深入的一類算法,經典的CFAR檢測算法基于統計檢測理論,根據給定的虛警概率及背景雜波的統計特性計算檢測門限,將圖像內像素點與檢測門限進行對比,判斷該像素點是否屬于目標。在實際應用中,待處理的SAR圖像往往包含多種地物植被覆蓋類型,不匹配的雜波統計模型會直接影響CFAR檢測器的速度和精度,造成檢測性能的下降。CFAR類目標檢測算法是基于背景雜波統計模型的,感興趣目標被定義為背景雜波中的異常點進行檢測。但是在實際應用中,目標信息存在眾多差異,無法建立較為通用的各類目標統計模型,對該算法的推廣應用造成了較大困難。2025/5/227SAR圖像目標檢測上述目標檢測算法都是基于目標和背景之間后向散射強度的差異進行判斷的,這是目標區別于背景雜波的一個圖像特征,而從理論上講,目標在圖像上表現出的紋理、大小等多種圖像特征都可以作為目標檢測的依據,基于圖像特征的目標檢測算法就是通過提取圖像中與目標特征相匹配的信息實現目標檢測的。常用的目標特征有邊緣特征、紋理特征、區域形狀特征和方向特征等。另外,為解決大范圍高分辨率SAR圖像目標檢測問題,綜合利用圖像多特征及先驗信息是解決感興趣目標檢測問題的必要條件。相關研究學者提出了眾多基于圖像背景信息的目標檢測算法,該類算法采用了多種背景信息如圖像上下文信息、地域先驗知識及周遭環境信息等。使用圖像多特征信息進行聯合目標檢測的算法也得到了廣泛的研究,多種不同特征與不同類型的目標檢測算法結合形成了眾多目標檢測算法。理論和實驗結果分析表明,如果能夠選擇合適的特征及聯合規則,將會獲得比僅使用單個特征進行目標檢測更精確的性能。但基于圖像多特征及先驗信息的目標檢測算法,涉及變量較多,計算復雜,不能夠保證穩定的目標檢測性能。2025/5/228小結在一個分辨單元內,SAR接收到的實際目標回波是很多理想點目標回波的矢量和,導致實際目標的散射回波強度會在散射系數的基礎上隨機起伏,形成相干斑。相干斑噪聲是SAR系統的固有特性。因此,相干斑抑制算法一直是SAR圖像處理領域中的一個重要關注點。

SAR具有全天候、全天時、不受天氣影響等成像特點,目前已經成為人們對地觀測的重要手段之一。SAR圖像目標檢測旨在高效準確地對SAR圖像中的目標進行分類和定位。利用SAR數據進行目標檢測也是圖像解譯的重要研究方向之一。通過機載或星載SAR,能夠獲得大量的高分辨率SAR圖像,從SAR圖像中檢測目標有著廣泛的應用前景。在軍事領域,對特定目標進行位置檢測,有利于戰術部署,提升國防預警能力;在民用鄰域,對某些特定目標或區域進行檢測,有助于對其進行監測與管理。2025/5/2292025/5/2210第二章

SAR圖像濾波的字典學習方法2.1K-SVD算法2.2K-LLD算法2.3K-OLS算法2.4小結2025/5/2211字典學習方法超完備字典設計問題是信號稀疏表示建模中的研究熱點之一。相比于傳統的超完備字典設計方法,基于學習模式的超完備字典設計方法出現較晚,本身也隨著稀疏表示理論的發展而不斷發展。字典學習是對已有的初始字典進行訓練,使其更符合實際信號的特征,使得信號具有更稀疏、更準確的表示,因而引起了研究者的廣泛關注。基于字典學習的稀疏表示理論在語音的增強、去噪、超分辨,以及圖像的壓縮、分離、修復、目標檢測、識別等領域得到了廣泛應用,并取得了較好的應用效果。基于字典學習的SAR圖像相干斑抑制算法,其基本思想是利用原始SAR圖像作為樣本數據,通過學習的方式獲得具有良好逼近特性的原子集合(字典),并利用稀疏優化方法重建降噪后的SAR圖像數據。本章所介紹的自適應超完備字典學習算法,其核心思想是基于聚類算法的向量量化問題進行字典原子的訓練、更新。該類字典學習算法的實現過程是將字典的構建過程與優化算法結合起來,用待分解SAR圖像來訓練字典原子,擇優選取,獲得SAR圖像特征信息的超完備字典和稀疏表示系數。K-SVD算法

2025/5/2212K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法

2025/5/22K-SVD算法以圖2.1(a)所示圖像作為輸入數據,應用算法2.3,得到相應的超完備字典,如圖2.2所示。2025/5/22對于K-SVD算法可以發現,此類相干斑抑制算法所追求的目標是更為強大的噪聲抑制性能,從一定方面忽視了計算復雜度問題,然而,在處理大量的SAR數據時,通常對相干斑抑制性能的要求和對計算速度的要求同等重要,有時對計算速度的要求會更高。K-LLD(K均值局部學習字典)算法從一定程度上克服了K-SVD算法相干斑抑制的執行效率問題,但對于富含相干斑的SAR圖像,K-LLD算法也表現出了自身的不足之處。K-LLD算法2025/5/22

K-LLD算法

2025/5/22K-LLD算法

2025/5/22K-LLD算法

2025/5/22K-LLD算法

2025/5/22K-LLD算法

2025/5/22K-LLD算法SAR圖像相干斑抑制的K-LLD算法K-LLD算法本質上是一種梯度回歸算法,因此,基于K-LLD的圖像降噪算法對低水平、均勻噪聲有較好的處理效果。另外,基于K-LLD的圖像降噪算法采用Stein的無偏風險估計方法得到的最小均方誤差作為停止迭代的條件,其計算量很大。實驗結果及分析接下來進行實驗參數設定,聚類中心K=10。圖2.3所示為K-LLD算法SAR圖像相干斑抑制。K-LLD算法從一定程度上克服了K-SVD算法的執行效率問題,但對于富含相干斑的SAR圖像,其相干斑抑制效果要比K-SVD算法差,出現了顆粒狀的斑駁。若要降低顆粒狀的斑駁,相應的參數設置也是比較麻煩的事情。2025/5/22K-LLD算法2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法SAR圖像相干斑抑制的K-OLS算法本節介紹一種新的基于自適應超完備字典學習的SAR圖像相干斑抑制算法:針對SAR圖像所固有的稀疏結構信息,通過迭代優化的方式得到超完備字典,利用超完備字典對SAR圖像數據進行稀疏表示,運用乘性噪聲模型進行參數估計和閾值設定,通過正則化方法實現SAR圖像的相干斑抑制處理。考慮SAR圖像的強度測量值、反射系數和相干斑噪聲之間的關系模型,并以此為基礎獲得相干斑抑制算法的優化模型。圖2.4所示為K-OLS算法用于SAR圖像相干斑抑制的流程圖。2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22K-OLS算法SAR圖像相干斑抑制算法中的各項參數選取:字典原子個數k=144,滑動窗口大小h=6。以圖2.5(a)所示的SAR圖像作為輸入數據,應用SAR圖像相干斑抑制算法,得到相應的超完備字典,如圖2.6所示。2025/5/22K-OLS算法

2025/5/22K-OLS算法2025/5/22K-OLS算法

2025/5/22K-OLS算法相干斑抑制性能分析在空域相干斑抑制算法中,滑動相干斑抑制算法是一種重要的算法,即在SAR圖像上取一個滑動窗口,對窗口內的像素進行相干斑抑制處理得到窗口中心像素的相干斑抑制值,這種算法對處理像素的窗口區域是自適應的。這種局域自適應空域相干斑抑制算法大致可分為兩類:一類是使用斑點噪聲統計模型的相干斑抑制算法,如Lee濾波算法、K-SVD算法等;另一類是不使用斑點噪聲統計模型的算法,如非線性復擴散濾波器(NCDF)、K-OLS相干斑抑制算法等。K-OLS相干斑抑制算法利用新的超完備字典學習算法對SAR圖像各滑動窗口數據進行分解,獲得各窗口數據的稀疏表示,在一定程度上抑制了相干斑噪聲,而后利用正則化方法構造優化模型,通過對優化問題的求解重構SAR圖像場景分辨單元的平均強度,實現相干斑抑制處理,本節算法在多個方面優于Lee濾波算法、IACDF算法和K-SVD算法。2025/5/22K-OLS算法

2025/5/22K-OLS算法

2025/5/22小結考量運用于SAR圖像相干斑抑制的K-SVD算法可以發現,此類算法所追求的目標是更為強大的噪聲抑制性能,從一定方面忽視了算法的執行時間,即計算復雜度問題。然而,在處理大量的SAR圖像數據時,通常對相干斑抑制性能的要求和對計算速度的要求同等重要,有時對計算速度的要求會更高。運用于SAR圖像相干斑抑制的K-LLD算法,雖然考慮了K-SVD算法的計算復雜度問題,但具有較差的噪聲抑制性能。本章結合K-SVD算法和K-LLD算法在SAR圖像相干斑抑制中的優點,分析了運用于SAR圖像相干斑抑制的K-OLS算法。K-OLS算法運用OLS算法的思想,在保證相干斑抑制性能的條件下以成熟的OLS算法思想為指導來減少相干斑抑制算法的計算復雜度。該算法首先運用字典學習算法,得到SAR圖像中各滑動窗口數據的稀疏表示;其次采用正則化方法構造多目標優化模型;最后,通過求解相應的優化問題重建SAR圖像場景分辨單元的平均強度,從而實現了SAR圖像相干斑的抑制。2025/5/222025/5/2254SAR圖像濾波的多尺度分析方法基于SAR圖像的相干斑抑制技術與多尺度幾何分析2025/5/2255SAR圖像相干斑抑制的小波域算法

3.1.1小波域貝葉斯相干斑抑制方法2025/5/2256SAR圖像相干斑抑制的小波域算法算法原理在貝葉斯框架下:假設:2025/5/2257SAR圖像相干斑抑制的小波域算法

2025/5/2258SAR圖像相干斑抑制的小波域算法算法原理綜上可得:對上式求導,并令導函數為0,得到2025/5/2259SAR圖像相干斑抑制的小波域算法

2025/5/2260SAR圖像相干斑抑制的小波域算法實驗結果及分析

對于小波域貝葉斯相干斑抑制算法,此類相干斑抑制算法通過在小波域統計建模,重建小波變換系數。可以發現,此類算法的小波變換系數可以顯式給出,具有較低的計算復雜度。缺點小波變換系數的統計模型估計得未必準確,另外,由于小波的先天不足,其相干斑抑制后的SAR圖像仍可見大顆粒斑駁現象。2025/5/2261SAR圖像相干斑抑制的小波域算法

3.1.2小波域各向異性擴散相干斑抑制算法2025/5/2262SAR圖像相干斑抑制的小波域算法算法原理步驟1:構造結構張量

式中,特征向量表示圖像局部紋理的方向特征;特征值。(3.8)2025/5/2263SAR圖像相干斑抑制的小波域算法算法原理步驟2:構造擴散張量2025/5/2264SAR圖像相干斑抑制的小波域算法算法原理步驟3:進行小波逆變換,獲得濾波后的SAR圖像。2025/5/2265SAR圖像相干斑抑制的小波域算法實驗結果及分析實驗參數選取:小波分解層數選為5,局部鄰域的窗口大小選為5。2025/5/2266SAR圖像相干斑抑制的小波域算法實驗結果及分析對于小波域各向異性擴散相干斑抑制算法,此類相干斑抑制算法在小波域對變換系數運用變分法進行相干斑抑制。可以發現,此類算法中的小波變換系數是通過迭代方式獲得的,相比小波域貝葉斯相干斑抑制算法具有較高的計算復雜度,并且也凸顯了各向異性擴散算法的邊緣保持特性。缺點小波變換系數的相干斑抑制程度難以把握,另外,由于小波的先天不足,其相干斑抑制后的SAR圖像仍可見條紋式的斑駁現象。2025/5/2267SAR圖像相干斑抑制的剪切波域算法小波變換僅能夠很好地處理點奇異性特征,但不能有效地處理二維或更高維空間的奇異性特征。

剪切波是一種結合了輪廓波和曲線波優點的新型多尺度幾何分析工具,通過對基本函數的縮放、剪切、平移等仿射變換,生成具有不同特性的剪切波函數。剪切波對于二維空間中的奇異曲線、曲面具有最優逼近特性。3.2.1剪切波原理2025/5/2268SAR圖像相干斑抑制的剪切波域算法

3.2.1剪切波原理于是,可以定義合成小波:

2025/5/2269SAR圖像相干斑抑制的剪切波域算法對任意的3.2.1剪切波原理式中,、是一維小波基。在本節中,的支撐

的支撐2025/5/2270SAR圖像相干斑抑制的剪切波域算法3.2.1剪切波原理由此,可以得到函數的支撐2025/5/2271SAR圖像相干斑抑制的剪切波域算法3.2.1剪切波原理2025/5/2272SAR圖像相干斑抑制的剪切波域算法3.2.1剪切波原理剪切波的數理特性如下:2025/5/2273SAR圖像相干斑抑制的剪切波域算法3.2.2剪切波域硬閾值相干斑抑制算法算法原理剪切波是一種繼承了輪廓波和曲線波兩種變換優點的多尺度幾何分析工具,通過對基本函數的縮放、剪切和平移等仿射變換獲得具有不同特性的剪切波函數,對于SAR圖像的線奇異性和面奇異性具有最優的逼近特性。算法步驟

2025/5/2274SAR圖像相干斑抑制的剪切波域算法算法步驟

2025/5/2275SAR圖像相干斑抑制的剪切波域算法

2025/5/2276SAR圖像相干斑抑制的剪切波域算法實驗結果和分析剪切波域硬閾值相干斑抑制算法在剪切波域對變換系數運用硬閾值方法進行處理。可以發現,此類算法的閾值是由變換域高頻分量的方差獲得的,其在相干斑抑制和紋理保持方面均有一定的優勢,但是相干斑抑制的效果仍然不是很理想。2025/5/2277SAR圖像相干斑抑制的稀疏優化方法SAR圖像的強度測量值、反射系數和相干斑噪聲之間具有復雜的非線性關系,相干斑的模型可以看成不同的后向散射波之間的一種干涉現象,這些散射單元隨機地分散在分辨單元的表面上。這里考慮SAR圖像的強度測量值、反射系數和相干斑噪聲之間的關系模型,并以此為基礎獲得相干斑抑制算法的優化模型。3.3.1稀疏優化模型2025/5/2278SAR圖像相干斑抑制的稀疏優化方法當SAR圖像系統的分辨單元小于目標的空間細節時,認為SAR圖像中像素的退化是彼此獨立的,斑點噪聲可以被建模為乘性噪聲,即

2025/5/2279SAR圖像相干斑抑制的稀疏優化方法

稀疏優化(SparseOptimization,SP)是指在滿足一定的約束條件下,運用最優化算法求出具有稀疏性的解。運用冗余離散余弦變換字典,設和分別是帶限、非抽樣、緊支撐小波和帶限、緊支撐剪切波的正交變換基。稀疏超完備字典的SAR圖像相干斑抑制問題可以描述為如下稀疏優化模型:2025/5/2280SAR圖像相干斑抑制的稀疏優化方法求解稀疏優化模型,進而得到相干斑抑制后的SAR圖像:優化求解分為兩個步驟,首先構造冗余離散余弦變換字典,通過求解如下優化問題獲得反映場景分辨單元平均強度的低頻分量V:2025/5/2281SAR圖像相干斑抑制的稀疏優化方法通過求解上式可以獲得低頻分量V。然后求解如下優化問題:接下來,分別用低頻分量稀疏優化算法和高頻分量稀疏優化算法求解式(3.29)和式(3.30)。2025/5/2282SAR圖像相干斑抑制的稀疏優化方法低頻分量稀疏優化算法3.3.2模型求解辦法2025/5/2283SAR圖像相干斑抑制的稀疏優化方法算法步驟2025/5/2284SAR圖像相干斑抑制的稀疏優化方法實驗結果低頻分量稀疏優化算法中的各項參數選取:字典原子個數為144,滑動窗口大小h=6,,這里。2025/5/2285SAR圖像相干斑抑制的稀疏優化方法高頻分量稀疏優化算法這里通過迭代閾值收縮算法求解SAR圖像高頻分量I-V的式(3.30)所示的稀疏優化模型。算法步驟

2025/5/2286SAR圖像相干斑抑制的稀疏優化方法算法步驟

2025/5/2287SAR圖像相干斑抑制的稀疏優化方法

2025/5/2288SAR圖像相干斑抑制的稀疏優化方法實驗結果及分析

2025/5/2289SAR圖像相干斑抑制的稀疏優化方法

2025/5/2290SAR圖像相干斑抑制的稀疏優化方法評價指標稀疏優化算法利用新的稀疏優化模型和貪婪算法獲得了SAR圖像的低頻分量,以及包含點奇異性和線奇異性的高頻分量。低頻分量稀疏優化算法重構SAR圖像場景分辨單元的平均強度,在一定程度上抑制了相干斑噪聲,而后利用帶限、非抽樣、緊支撐小波和帶限、緊支撐剪切波實現了高頻分量中線特征和點特征的相干斑抑制處理。2025/5/2291小結SAR圖像本身具有低頻信息和高頻信息,高頻信息中又包括點奇異和線奇異等特征。現有的諸多算法傾向于綜合處理,忽略了不同特征之間的區別。針對上述問題,本章依據SAR圖像的主導結構信息建立了多元稀疏優化模型,通過求解多元稀疏優化模型,對SAR圖像的點、線、面等特征進行了稀疏表示。

基于多元稀疏優化模型的SAR圖像相干斑抑制算法,針對SAR圖像內在的結構信息,通過構建稀疏優化模型實現SAR圖像各細節特征在多個超完備字典下的表示;運用正則化方法重建SAR圖像的低頻分量;利用小波、剪切波所具有的點奇異性、線奇異性捕捉SAR圖像的細節特征;通過融合方式獲得SAR圖像場景分辨單元,從而實現了SAR圖像的相干斑抑制。實驗結果和性能分析表明,算法對SAR圖像相干斑噪聲有很好的抑制效果,并且具有增強SAR圖像細節信息的優點。2025/5/2292信息幾何理論2025/5/2293導言

信息幾何作為一門交叉學科,以黎曼流形為基礎,將概率論、信息論和微分幾何等多個領域的知識相互融合,運用微分幾何方法來研究信息領域中的問題,利用數學的方法揭示數據和信息的本質特征,從而推動計算機科學、人工智能和統計學等領域的發展。本章主要介紹部分與課題相關的信息幾何基礎知識,對一些理論做出概念性的描述。2025/5/2294微分幾何理論基礎

微分幾何理論基礎

2025/5/2295微分幾何理論基礎

2025/5/2296微分幾何理論基礎

2025/5/2297微分幾何理論基礎

2025/5/2298微分幾何理論基礎

2025/5/2299微分幾何理論基礎

2025/5/22100微分幾何理論基礎

2025/5/22101微分幾何理論基礎

2025/5/22102微分幾何理論基礎

2025/5/22103微分幾何理論基礎

2025/5/22104微分幾何理論基礎

2025/5/22105微分幾何理論基礎

2025/5/22106信息幾何理論基礎

2025/5/22107信息幾何理論基礎

2025/5/22108信息幾何理論基礎

2025/5/22109信息幾何理論基礎

2025/5/22110信息幾何理論基礎

2025/5/22111信息幾何理論基礎

2025/5/22112信息幾何理論基礎三、統計流形對于很多的應用問題來說,其數據在高維空間中的分布具有某一種幾何構造,即聚集在某一個形狀的低維流形附近。流形學習是一種無監督學習,旨在從高維數據中發現可能存在的低維結構。流形學習的主要思想是將高維數據嵌入到低維流形空間中,從而更好地理解和分析數據,發現其內在規律。其目標是通過降維方法來試圖還原數據在低維空間的結構,因此流形學習也可以稱作為非線性降維。流形學習可以概括為在保持流形上點的某些幾何特征的情況下,找出一組對應的內蘊坐標,將流形盡量好的可以在低維平面上進行展開,也就是找到從高維空間到低維空間的映射,同時在該低維的數據能夠表示出原先高維數據的本質特征,這種低維的表示也叫內蘊特征,外圍空間的維數稱為觀察維數,其表示稱為自然坐標。主要的流形學習的方法有等距映射(Lsomap)、局部線性嵌入(LocallyLinearEmbedding)以及拉普拉斯特征映射(LaplacianEigenmaps)等。2025/5/22113信息幾何理論基礎

2025/5/22114信息幾何理論基礎

2025/5/22115信息幾何理論基礎

2025/5/22116信息幾何理論基礎

2025/5/22117信息幾何理論基礎

2025/5/22118信息幾何理論基礎

2025/5/22119小結

本章簡要介紹了微分幾何和經典信息幾何方法的基本概念和原理。本章節以現代微分幾何的基本概念作為基礎,其中涉及微分流形、切空間與余切空間、聯絡以及黎曼流形和測地線等知識,接著對經典信息幾何中的指數分布族、Fisher信息理論、統計流形、散度及自然梯度算法等作了簡要論述。2025/5/221202025/5/22121第四章

SAR圖像目標檢測的黎曼幾何方法4.1統計流形及其幾何結構4.2SAR圖像目標檢測算法2.3實驗結果及分析2.4小結2025/5/22122介紹信息幾何是將現代幾何理論方法應用于信息學領域而發展起來的一套理論體系,其在非線性問題分析處理中具有獨特的優勢。依據信息幾何理論,針對所分析問題本身所具有的非線性特點,可通過構建微分流形的方式,定義具有線性結構的切叢,從而能像歐氏空間一樣在切叢上定義內積,將非線性問題轉化為局部線性問題求解。本章旨在分析指數分布族的參數流形及其度量,分析參數空間的幾何結構,探索微分幾何理論應用于SAR圖像目標檢測問題的切入點。本章算法從指數分布族出發,構建參數流形,引入參數化的費希爾信息度量,構造切向量,對待檢測目標區域進行顯著性表示,實現SAR圖像目標檢測。統計流形及其幾何結構

2025/5/22123統計流形及其幾何結構

2025/5/22統計流形及其幾何結構

2025/5/22統計流形及其幾何結構

2025/5/22統計流形及其幾何結構

2025/5/22統計流形及其幾何結構

2025/5/22SAR圖像目標檢測算法

2025/5/22SAR圖像目標檢測算法

2025/5/22SAR圖像目標檢測算法

2025/5/22SAR圖像目標檢測算法

2025/5/22實驗結果及分析實驗結果為了驗證本章目標檢測算法的有效性,實驗基于MATLAB仿真平臺進行了仿真,所采用的SAR圖像如圖4.1所示(圖像像素大小為153*151),其中,圖4.1(a)和圖4.1(b)各含有一個待檢測目標。本章采用威布爾分布對海雜波進行統計建模。2025/5/22實驗結果及分析

2025/5/22實驗結果及分析不失一般性,運用最大類間方差法分別對圖4.2和圖4.3所示的顯著性目標圖像進行二分類,得到最終的檢測結果,如圖4.4所示。在實驗中,本章算法運用威布爾分布對圖像各像素局部鄰域數據進行統計建模,借助艦船目標與其背景電磁散射的統計差異性,在參數流形上進行幾何結構分析,將SAR圖像各像素鄰域數據映射成切叢中的切向量長度,提高目標與背景之間的比度,實現了SAR圖像艦船目標檢測。實驗結果表明,本章算法提供了一個將信息幾何理論應用于SAR圖像檢測的好的切入點。2025/5/22實驗結果及分析在實驗中,本章算法運用威布爾分布對圖像各像素局部鄰域數據進行統計建模,借助艦船目標與其背景電磁散射的統計差異性,在參數流形上進行幾何結構分析,將SAR圖像各像素鄰域數據映射成切叢中的切向量長度,提高目標與背景之間的比度,實現了SAR圖像艦船目標檢測。實驗結果表明,本章算法提供了一個將信息幾何理論應用于SAR圖像檢測的好的切入點。SAR圖像系統的相干成像特點及復雜的海面狀況,導致SAR圖像中的海雜波分布具有較強的時變性、非平穩性、非高斯性等特征,嚴重影響了基于統計模型的傳統SAR圖像目標檢測算法的性能。2025/5/22實驗結果及分析圖4.1所示SAR圖像的三維網格圖如圖4.5和圖4.6所示,SAR圖像中存在大量與目標比較相似的雜波尖峰,使得海雜波呈現出非高斯特性,具有拖尾分布特征。圖4.7和圖4.8分別給出了圖4.1(a)和圖4.1(b)所示SAR圖像數據的概率密度分布圖,以及對其進行威布爾參數估計的概率分布曲線。由圖4.7和圖4.8可知,由威布爾參數估計所得到的概率分布曲線在一定程度上能夠擬合原SAR圖像數據的概率密度分布圖。2025/5/22實驗結果及分析2025/5/22實驗結果及分析

2025/5/22小結本章針對SAR圖像目標檢測中海雜波數據的非均勻性、非平穩性特點,分析了信息幾何理論應用于SAR圖像目標檢測領域的切入點,以及基于統計流形幾何結構特征融合的圖像感興趣目標顯著性表示方法。本章首先對高斯分布族的費希爾信息度量引入了尺度調置參數,以優化統計流形上各點之間的距離測度,并運用威布爾分布族對SAR圖像海雜波進行了建模。結合高斯統計流形上的費希爾信息度量形式,在威布爾統計流形上構建黎曼度量,以歸一化的尺度參數和形狀參數構造切向量,實現對SAR圖像目標的顯著性表示。理論分析和實驗結果表明,信息幾何檢測算法有潛力成為超越現有基于傳統統計學原理的檢測算法,獲得更加深刻、更加本質的結論。2025/5/222025/5/22141SAR圖像目標檢測的芬斯勒

幾何方法基于芬斯勒幾何理論的SAR圖像目標檢測2025/5/22142芬斯勒流形結構芬斯勒幾何是在其度量張量上沒有二次型限制的黎曼幾何,如果將芬斯勒幾何表述為某個集合,則黎曼幾何僅能表述這個幾何空間中由臨界面所連接的一些子集。5.1.1芬斯勒度量2025/5/22143芬斯勒流形結構2025/5/22144芬斯勒流形結構2025/5/22145芬斯勒流形結構依據SAR相干成像的物理散射機理,SAR相干斑噪聲可被視作乘性噪聲模型,或可被視作雷達橫截面(RadarCross-Section,RCS)與單位均值指數強度分布噪聲的乘積。基于以上假設,將對數引入到隨機變量函數構造中,實現乘性模型到加性模型的轉化,降低問題復雜度。5.1.2LogGamma流形2025/5/22146芬斯勒流形結構

2025/5/22147SAR圖像目標檢測算法

2025/5/22148SAR圖像目標檢測算法2025/5/22149SAR圖像目標檢測算法算法步驟2025/5/22150實驗結果及分析采用LogGamma分布族對海雜波數據進行局部統計建模,通過參數流形空間,將感興趣目標區域與背景海雜波區域分開。5.3.1實驗結果兩個圖像中各有一個艦船目標,圖像像素大小為150像素×150像素2025/5/22151實驗結果及分析為了降低計算復雜度,提高檢測效率,本章運用超像素法替換像素子塊滑動方式。不失一般性,本章采用簡單線性迭代聚類(SimpleLinearIterativeCluster,SLIC)算法。SLIC算法的尺度參數取為9,迭代次數取為10。2025/5/22152實驗結果及分析2025/5/22153實驗結果及分析運用最大類間方差法分別得到最終的檢測結果,SAR圖像目標檢測結果如下圖所示。2025/5/22154實驗結果及分析

5.3.2實驗分析2025/5/22155實驗結果及分析由于SAR圖像海雜波數據是非高斯的,不失一般性,假定海雜波數據符合威布爾分布,運用基于威布爾分布的CFAR檢測算法分別獲得下圖所示的檢測結果。2025/5/22156小結本章針對SAR圖像目標檢測問題,依據由芬斯勒幾何理論發展起來的信息幾何分析方法,探索統計流形中數據信息的描述方式。本章首先給出了芬斯勒空間的度量張量,在此范疇下,可將黎曼空間視為芬斯勒空間的一個特例,事實上,歐氏空間也可以被看作黎曼空間的一個特例,也就是說,本章旨在將SAR圖像目標檢測問題放入更為寬泛的空間中進行分析。其次,在此框架下,選取Gamma分布族作為問題分析的切入點,在考慮SAR圖像乘性噪聲假設的前提下,引入LogGamma分布族。事實上,在特定的芬斯勒幾何結構下,無論是Gamma分布族,還是LogGamma分布族,都未必是最優的SAR圖像數據統計表述方式。因此,需要依據特定的統計流形空間來構造特定的芬斯勒幾何結構,而這些工作的起點便是芬斯勒度量張量的構造。理論分析和實驗結果表明,芬斯勒幾何分析方法有潛力從更為深刻、更為本質的層面去解釋檢測和估計問題的本質。2025/5/22157信息幾何理論2025/5/22158微分幾何理論基礎微分幾何的主要研究范疇是流形上不同的微分幾何結構以及相應的變換規律。其中,黎曼幾何扮演著關鍵的角色,為流形提供了度量方法和基本的幾何概念,構成了微分幾何的核心內容。接下來主要針對流形、聯絡等幾何概念進行闡述。2025/5/22159微分幾何理論基礎

1.1.1微分流形同胚映射:2025/5/22160微分幾何理論基礎

2025/5/22161微分幾何理論基礎定義:切空間是定義在每一點的向量空間,其中包含了該點上所有可能的切向量。在黎曼流形上,切空間則描述了該點處的局部線性結構。同時,在黎曼流形上每一個切空間都配備有一個度量,即內積,它用來定義切向量的長度和夾角。定義:余切空間是切空間的對偶空間,余切空間中的元素可以看作是一組線性函數,它們作用于切向量時返回一個實數,余切空間中的元素由切空間中的所有切向量所對應的余切向量構成。1.1.2切空間與余切空間2025/5/22162微分幾何理論基礎

加運算:數乘運算:

2025/5/22163微分幾何理論基礎

加運算:數乘運算:

2025/5/22164微分幾何理論基礎

2025/5/22165微分幾何理論基礎

1.1.3聯絡對每個和。2025/5/22166微分幾何理論基礎

2025/5/22167微分幾何理論基礎在這里設置:2025/5/22168微分幾何理論基礎

2025/5/22169微分幾何理論基礎特別是:也可以重寫為:

2025/5/22170微分幾何理論基礎

1.1.4黎曼流形

2025/5/22171微分幾何理論基礎

黎曼等距是一個局部等距,它也是一個微分同態。2025/5/22172微分幾何理論基礎

因此,保留向量長度的微分同胚必然是黎曼等距。2025/5/22173微分幾何理論基礎

2025/5/22174微分幾何理論基礎我們在M流形上構造一個度量d:如果x和y都是流形M上的點,那么:這確實給出了M上的度量。由該度量導出的拓撲與M上的原始拓撲一致。2025/5/22175微分幾何理論基礎1.1.5測地線測地線:即為該流形上連接兩點局部最短的、連續參數化的平滑曲線。

2025/5/22176微分幾何理論基礎

如下式所示:

2025/5/22177微分幾何理論基礎

有且僅當:對所有k,才滿足式2025/5/22178微分幾何理論基礎這種普通的非線性二階微分方程(有時稱為“測地線方程”)提供了利用整個微分方程理論的強大工具來研究測地線的進一步性質,特別是它們的存在性和唯一性,通過進入切叢TM,可以方便地將二階方程變換為兩個一階方程組。此外,通過計算Christoffel符號并求解這些方程,至少可以在局部坐標中計算測地線,但這通常與長計算相關。2025/5/22179信息幾何理論基礎指數分布族(ExponentialFamily):也稱為指數族、指數族分布,是統計中最重要的參數分布族。指數型分布族(exponentialfamily)的概率密度函數如下:1.2.1指數分布族

2025/5/22180信息幾何理論基礎

2025/5/22181信息幾何理論基礎

1.2.2Fisher信息理論

2025/5/22182信息幾何理論基礎Fisher信息定義為分數的方差:

2025/5/22183信息幾何理論基礎

因此,Fisher信息可以被視為支持曲線的曲率(對數似然圖),并且,在最大似然估計附近,較低的Fisher信息表明最大值顯得“鈍”,即最大值很淺,并且存在許多具有類似對數似然的附近值。相反,高Fisher信息表明最大值很尖銳。2025/5/22184信息幾何理論基礎

Fisher信息矩陣是一個N×N正半定矩陣。如果它是正定的,那么它定義了N維參數空間上的黎曼度量。信息幾何使用它來將Fisher信息矩陣連接到微分幾何,在這種情況下,該度量稱為

Fisher信息度量。2025/5/22185信息幾何理論基礎在一定的規律性條件下,Fisher信息矩陣也可以寫為:如果Fisher信息矩陣是塊對角矩陣,并且這些分量位于單獨的塊中,我們稱兩個參數分量向量θ1和θ2是信息正交的。2025/5/22186信息幾何理論基礎在數學中,統計流形是黎曼流形,其每個點都是概率分布。統計流形為信息幾何領域提供了一個背景。Fisher信息度量提供了這些流形的度量。1.2.3統計流形

2025/5/22187信息幾何理論基礎

2025/5/22188信息幾何理論基礎自然梯度:是典型梯度的概括,它解釋了當前函數的曲率。1.2.4自然梯度算法

優化問題中,自然梯度算法能大大提高收斂速度。

2025/5/22189信息幾何理論基礎

自然梯度算法的優勢:自然梯度算法具備考慮參數空間中概率分布幾何結構的能力,以適當的縮放梯度方向方式更加準確地體現參數的更新方向,從而提高了優化的效果。對于概率模型訓練來說,該算法能通過適當的參數縮放,防止在參數空間中某些方向過度更新,特別是當存在高度相關的參數時,更能保證模型收斂的平穩性。2025/5/22190Finsler幾何度量:在通常意義下,度量是用來測量空間中兩點之間的“距離”,因此從一點到另一點的距離函數稱為度量。1.3.1Finsler度量這里所考慮的空間是一個有限維光滑流形,所考慮的度量是可以用來計算曲線長度的一個函數。更確切地說,它是流形上點和切向量的函數。2025/5/22191Finsler幾何

2025/5/22192Finsler幾何構成正定的矩陣,則稱F為M上的一個芬斯勒度量(Finslermetric)。

2025/5/22193Finsler幾何Randers度量

2025/5/22194Finsler幾何

1.3.2Finsler聯絡

2025/5/22195Finsler幾何根據以下屬性:

2025/5/22196Finsler幾何

2025/5/22197Finsler幾何仿射系數不是張量場的組成部分,可以證明,在坐標變化下,它們服從變換定律:

2025/5/22198Finsler幾何介紹其中一種芬斯勒聯絡陳聯絡:

2025/5/22199Finsler幾何

2025/5/22200Finsler幾何

1.3.3Finsler測地線

2025/5/22201Finsler幾何

2025/5/22202Finsler幾何

2025/5/22203Finsler幾何Finsler流形中的Ricci曲率是一個二階張量,描述了Finsler流形切叢上切矢量場的曲率。Ricci曲率的計算涉及到Finlser度量的二次導數和聯絡系數(Christoffel符號)。1.3.4Ricci曲率

2025/5/22204Finsler幾何里奇曲率張量,其中:里奇曲率張量也可以表示為,其中:2025/5/22205Finsler幾何

其中。里奇曲率張量可以通過其垂直的Hessian矩陣來恢復:2025/5/22206Finsler幾何

2025/5/22207Finsler幾何將里奇曲率張量的概念推廣到芬斯勒度量上可以表示為:

2025/5/22208Finsler幾何

2025/5/22209小結本章旨在介紹微分幾何、信息幾何及Finsler幾何三個理論,以為后續目標檢測算法的實踐操作提供深入思考。首先介紹提出優化算法所需要的微分幾何理論和信息幾何理論如流形,聯絡,指數分布族等概念,最后,第三節全面闡述Finsler幾何的相關理論,其中涉及Finsler度量、Finsler聯絡、Finsler測地線以及Ricci曲率等學術要點,覆蓋了該領域的基礎知識,并為后續研究提供了堅實的理論基礎。2025/5/22210SAR圖像目標檢測的YOLO方法基于YOLOv4的SAR圖像艦船檢測2025/5/22211卷積神經網絡基本理論神經元是構建神經網絡的基本單元,其主要由三部分組成:連接、求和節點及激活函數。6.1.1人工神經網絡(1)連接:神經元中數據的流動方向。(2)求和節點:對各通道的輸入信號和權重的乘積結果進行累加求和。(3)激活函數:一般都是非線性函數,對求和節點輸出的信號進行非線性映射。2025/5/22212卷積神經網絡基本理論2025/5/22213卷積神經網絡基本理論人工神經網絡(ArtificialNeuralNetwork,ANN)由多個神經元結構組合而成,一般分為輸入層、隱藏層及輸出層。每一層都包含多個神經元,而且每一個神經元都擁有輸入和輸出,第l層網絡神經元的輸出是下一層即第l+1層神經元的輸入。2025/5/22214卷積神經網絡基本理論

2025/5/22215卷積神經網絡基本理論對這簡單的三層神經網絡的參數進行向量化,輸入向量為X,權重向量為W,及偏置向量為b那么有:2025/5/22216卷積神經網絡基本理論由此可見,單層神經網絡的前向傳播算法可以使用如下矩陣形式:

2025/5/22217卷積神經網絡基本理論卷積神經網絡結構中的卷積層,其內部的卷積操作本質上就是對數字圖像信號進行濾波處理,故而卷積核(ConvolutionKernel,CK)也被稱為濾波器。6.1.2卷積神經網絡

2025/5/22218卷積神經網絡基本理論根據不同的卷積操作,輸出的特征圖尺寸也各不相同,主要分為三種情況。2025/5/22219卷積神經網絡基本理論從圖6.3所示的卷積計算可知,多層卷積計算過程本質上就是神經元的基本求和過程:2025/5/22220卷積神經網絡基本理論為了提高神經網絡的表達能力,激活函數一般都是單調遞增的非線性函數,將輸入數據重新映射為一個個非線性值,從而控制輸出數值的大小。

常用的激活函數有sigmoid函數、tanh函數、softmax函數、ReLU函數、LeakyReLU函數。6.1.3激活函數及其導數2025/5/22221卷積神經網絡基本理論sigmod函數sigmoid函數表達式如下:sigmoid函數易趨于飽和導致訓練結果不理想。此外,函數輸出的非線性值并不是零均值,數據存在偏差,導致分布不均勻。2025/5/22222卷積神經網絡基本理論tanh函數tanh函數又名為雙曲正切函數:

tanh函數可以更容易地處理負數。同時,tanh函數的輸出值以0為中心,故數據分布均勻,且零均值。2025/5/22223卷積神經網絡基本理論softmax函數softmax函數的公式如下:

softmax函數多用于多分類問題,首先使用指數函數將預測結果映射到零到正無窮區間,保證了概率的非負性;再將所有映射后的結果累加,并進行歸一化,即可得到每個類別的概率。2025/5/22224卷積神經網絡基本理論ReLU函數ReLU函數又名為修正線性單元(RectifiedLinearUnit):ReLU函數的梯度為0或常數,相較于sigmoid函數、tanh函數,ReLU函數不僅收斂速度快,還可以有效緩解梯度消失問題。2025/5/22225卷積神經網絡基本理論LeakyReLU函數LeakyReLU函數的公式如下:當輸入值小于零時,輸出值不再是零值,而有一個很小的遞增坡度。由于LeakyReLU函數的導數無零值,故有效解決了ReLU函數下權重無法更新的狀況。2025/5/22226卷積神經網絡基本理論池化層亦被稱為降采樣層,在多個組合卷積操作之后,往往通過池化操作來降低輸出特征向量的維度,在壓縮數據和參數數量的同時,也保持了模型對目標的平移、旋轉、伸縮等特性的不變性,從而增強了所提取特征的魯棒性。池化操作主要有最大池化(MaxPooling)和平均池化(AveragePooling)兩種。6.1.4池化操作2025/5/22227卷積神經網絡基本理論最大池化最大池化如下圖所示,假設池化層的輸入是4×4的特征圖,使用2×2池化核,并以步長為2對上述特征向量進行池化,相當于將特征圖劃分為4個2×2的區域,在每個區域內選取最大值,最后組合成尺寸更小的特征圖。2025/5/22228卷積神經網絡基本理論平均池化平均池化如下圖所示,同理將每個2×2區域內的數值累加并取均值。2025/5/22229卷積神經網絡基本理論

6.1.3前向傳播與反向傳播2025/5/22230卷積神經網絡基本理論假設激活函數為sigmoid函數,即則有2025/5/22231卷積神經網絡基本理論定義損失函數:綜上,可得

至此,完成了一次前向傳播過程。2025/5/22232卷積神經網絡基本理論

2025/5/22233卷積神經網絡基本理論根據鏈式推導法則,繼續向后傳播,更新其他節點上的權值。根據上面求得偏導,進而更新權重:2025/5/22234YOLO4模型YOLO4的主干網絡為CSPDarknet53網絡,即CSPNet與Darknet53網絡的結合。Darknet53網絡一共有5個特征層,均為殘差網絡,每個殘差網絡都包含不同數量的殘差塊,從低層到高層分別包含1、2、8、8、4個殘差塊。CSPDarknet53殘差塊的結構與Darknet53殘差塊的結構類似,只不過在堆疊過后還要進行一個1×1的卷積,而另一部分直接和主干部分的輸出拼接。6.2.1YOLO4模型的主干網絡2025/5/22235YOLO4模型為了解決多尺度的問題,特征金字塔(FPN)開創性地引入一種自上而下路徑的特征融合,即上采樣融合拼接,此方法可以在多個尺度上進行特征融合并分別進行目標檢測,可以顯著提升小目標檢測的精確度。

PANet在FPN的架構基礎上設計了一條自底向上的連接路徑。PANet通過自上而下的路徑將高層的語義特征向下傳遞,增強了語義信息的提取能力;同時通過自下而上的路徑將低層的定位信息傳遞上去,彌補了FPN的不足。YOLO4模型采用了在性能和實用性方面都具有較好表現的PANet作為檢測頸6.2.1YOLO4模型的檢測頸2025/5/22236YOLO4模型YOLO4模型的檢測頸除了使用了PANet結構,還添加了改進型的空間金字塔池化(SpatialPyramidPooling,SPP)模塊。

SPP模塊是三個不同尺寸的最大池化層的堆疊,并分別進行平鋪(Flatten)操作來降維,得到1×C、4×C和16×C(C代表通道數)這三個特征,然后將這三個特征拼接得到維度為(1+4+16)×C的特征。2025/5/22237YOLO4模型

為了能夠充分融合特征,YOLO4模型中的檢測頸還添加了多個五層卷積的卷積層,每個卷積層都包含一個BN層和一個LeakyReLU激活函數。2025/5/22238YOLO4模型

YOLO4模型的檢測頭由3×3的卷積層和1×1的卷積層組合而成。輸出通道數為3×(K+4+1),其中K是目標類別數目,本章只進行艦船檢測,目標為一類,因此K=1,則預測通道數為3×(1+4+1)=18。

在本章中,第1個通道是對艦船類的預測,中間4個通道是對邊界框位置的預測,最后一個通道是目標的置信度,用來區分前景背景。6.2.1YOLO4模型的檢測頭2025/5/22239YOLO4模型MosaicYOLO4模型中運用了Mosaic數據增強方法。Mosaic方法是通過融合四張圖像來實現。優點:一方面,它極大地豐富了檢測目標的背景,可以為模型提供更多的背景特征信息;另一方面,在進行批歸一化時會計算所傳入的四張圖像的數據,BatchSize(批次大小)不需要設置得很高,降低了對硬件的需求,使得YOLO4模型在單GPU上即可運行。6.2.1YOLO4模型的訓練2025/5/22240YOLO4模型Mosaic數據增強方法的步驟如下:(1)隨機選取四張SAR圖像作為輸入。(2)分別對這四張圖像進行幾何變換、色域變換(調整明亮度、飽和度、色調)等操作。(3)將處理過的四張圖像放置在左上、左下、右下、右上四個位置。(4)截取四張圖像部分區域并將它們拼接成一張圖像。2025/5/22241YOLO4模型在Mosaic幾何變換中,需要特別注意裁剪操作。對于四張待操作圖像,首先,隨機生成其中一張圖像的裁剪坐標,并根據坐標計算出待裁剪部分的長和寬。其次,基于裁剪坐標繪制出裁剪矩形并獲取它與原圖的交集。再次,將圖像的尺寸調整為YO

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論