




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1第五章 高光譜遙感數據的特征選擇與提取 本章主要介紹高光譜遙感數據的可分性標準,光譜特征選擇,光譜自相關性分析,特征提取以及投影變換等內容。2高光譜遙感數據有助于我們完成更加細致的遙感地物分類和目標識別,然而波段的增多也必然導致信息的冗余和數據處理復雜性的增加。 具體表現在:(1)數據量急劇增加:波段的增加,使得高光譜數據比傳統數據多1-2個數量級,表現在顯示,存儲,管理方面相當繁瑣(2)計算量增大:數據的膨脹導致計算機處理載荷大幅度增加,尋找有效地降維空間手段是必要的(3)統計參數的估計誤差增大:利用統計方法為了達到比較精確的估計,樣本個數一般是波段數的100倍以上,這在高光譜數據中往往無
2、法實現,因此,導致了分類精度的普遍下降。3當光譜維數增加的時候,特征組合形式成指數倍增加,例如原始波段為N,優選后的光譜波段是M,那么光譜特征組合數為:N!/(N-M)!/M!。顯然這個數目很巨大,直接導致了運算效率下降,因此,如何優化光譜特征空間,進行光譜選擇非常重要。問題提出?4該圖列出了波段數增加時,不同的樣本個數與類別可分性的變化5為了進行最優選擇,我們需要一個準則來衡量。如果特征可以進行分類,那么我們利用分類的錯誤概率來作為特征選擇的準則。前人的研究表明:可分性越高的特征,分類錯誤的概率越低,選擇的特征越優。最優特征分類錯誤概率可分性5.1 最優特征的選擇可分性6可分性準則選擇可分性
3、準則必須綜合考慮兩個策略:一、選擇各類平均可分性最大的特征二、選擇最難分的類別具有的可分性最大的特征第一個策略能均衡照顧到各類的可分性;第二個策略能照顧到最難分的類別。7設計光譜可分性的準則必須滿足三個方面的要求(黃鳳崗等,1998):(1)與錯誤概率具有單調關系。這樣準則取最大值的情況下,所得到的錯誤概率應該是最小的。(2)度量特性。設定兩類地物類別i,j的度量特性為 , 越大,兩類特征的分離程度越大。(3)單調性。新加入的特征,準則函數的值并不減小。光譜可分性準則8滿足這個策略的可分性準則有很多,歸納起來可以分為以下四種準則: (1)各樣本之間的平均距離; (2)類別間的相對距離; (3)
4、離散度; (4)J-M距離;可分性準則所描述的指標9(1)各類樣本間的平均距離各類樣本之間的距離越大,類別可分性越大,因此可以利用各類樣本之間的距離的平均值作為可分性的準則。例如:常用的距離函數有歐氏距離,馬氏距離,明氏距離等。但是,很多情況下,類別之間的平均距離并不一定代表了類別之間的可分性。如下圖所示10兩種分布的可分性比較類別間的距離平均值不能完全反映類別的可分性11(2)類別間的歸一化距離根據費歇爾準則,分類時總是希望類內的離散度盡量小,類間的離散度盡量大,那么根據這個定律,可以作為相對距離的一個度量,度量的公式為歸一化距離:1213當我們用這個距離公式衡量類別的可分性的時候,存在這樣
5、的情況,無法衡量兩類的差別:14(3)離散度離散度可以克服當兩個類別均值相等時,不能有效區分類別的局限,離散度表達式為:當類別多于兩個時,可以用平均離散度來衡量類別可分性。15盡管離散度克服了類均值相等給歸一化距離帶來的麻煩,但是并非最優的類別可分性度量,當樣本的分布存在的情況如下圖所示的時候,離散度并不能有效的反映可分性(b的可分性顯然要高于a)16(4)J-M 距離(Jeffries-Matusita )J-M距離基于條件概率理論,其表達式可以近似為:P代表第i個像元屬于w的條件概率。17總結1)可分性準則中J-M距離的可分性效果是最好的,J-M距離實際上就是兩類概率密度函數之差,基于先驗
6、概率和樣本分布。2)離散度的可分性效果總體不如J-M距離,但是當各類模式分布相對集中,模式距離沒有超出臨界值時,也比較有效。3)歸一化距離的衡量有效性又次之。加入樣本均值十分接近,或者過于分散,會喪失有效性。4)各樣本距離的平均值用來衡量可分性,效果最差。只有當樣本的各個分布一致,且既不太離散也不太集中的特殊情況下,才有效。185.2 光譜特征選擇19通過特征選擇,可以強化最具可分性的光譜波段,這里分為:光譜特征位置搜索和光譜距離統計。光譜特征位置搜索:根據專家對特定地物的物理化學性質和光譜特性分析,選擇最具有排他性的光譜特征波段。光譜距離統計:在光譜可分性距離的統計準則下,選擇光譜波段子集,
7、使得在某一個光譜可分性距離統計準則下,其統計差異最大或者最優。201.光譜特征位置搜索特征位置通常是要確定特征吸收波段的位置分為以下三個部分: 1)包絡線去除(包絡線歸一化)包絡線從外觀上面來看,相當于光譜曲線的“外殼”,我們用連續的這種折線段來近似表示光譜曲線的包絡線。21手工搜索:利用定義手工逐點直線連接突出的“峰”值點,并使得折線在“峰”值點的外角180度,然后用實際光譜波段值去除相應的波段值,這樣歸一化后,峰值點均為1,非“峰”值點均小于1。這樣就很容易測定吸收特征參數。22計算機搜索:23由包絡線去除法調整的明礬石光譜曲線24包絡線去除前后的光譜反射率曲線對比25舉例說明:經過包絡線
8、去除后,可以有效的區分高嶺石與白云石的有效區間,這里挑選5個特征波段: B1(2.16) B2(2.18) B3(2.21) B4(2.32) B5(2.38)2)選擇特征波段區分地物26以上的五個特征可以構成一個凸面幾何空間,高嶺石與白云石在這個投影變換后的特征空間集中在兩個彼此分離的區間,兩者能夠完全區分273)基于特征位置進行彩色合成高光譜影像具有上百個通道,但是彩色合成只有三個通道,因此選擇RGB的合成方案非常重要。利用特征位置,可以縮小候選區域,突出感興趣像元光譜的提取以及感興趣區域的劃分。28下圖是一種地物的光譜曲線,在1.4微米附近有一個特征吸收峰,如果在此特征吸收波段賦值為綠色
9、,在兩邊的非吸收通道賦值為紅色和藍色,那么在RGB合成圖像里面,紫紅色的像元就應該是具有該吸收特征的地物。這樣可以為我們進行ROI的選擇提供幫助。29高光譜遙感圖像波段眾多,如何在可分性的基礎上,從n個特征中選擇m個最優子集?介紹兩種算法:(1)單獨選擇法(按照平均可分性) 根據可分性準則函數計算n個特征中每個特征可分性,然后根據各個特征的可分性大小進行排序,選擇可分性最大的前m(nm)個特征。2.光譜距離統計30(2)擴充最優特征子集(平均可分性)一、計算每個特征對應的所有類別的可分性,選擇可分性最大的進入到最優子集當中;二、增加一個特征構成新的特征集,重新計算特征集合的可分性,選擇最大的特
10、征組合作為新的最優子集。三、重復執行第二步,直到最優的特征子集達到m個為止。31必須指出的是以上的算法均假設各個特征之間相互獨立,沒有考慮特征之間的相關性。實際上,各個特征之間是存在相關性的,首先應該剔除一些可分性小,與其他特征相關性大的特征,選擇最優,可分性最大的特征組。注意:32光譜距離統計33光譜相關性是指圖像同一空間位置的像素在各波段有相似性。原因:光譜圖像的每個波段圖像的像素值,是相同區域地物對各個波段光的反射強度值,相鄰波地物反射率是相近的,由此產生了一定的相關性。光譜相關性的大小很大程度上是由光譜分辨率決定的,光譜分辨率越高,統計相關性也越高。5.3 光譜自相關性分析34光譜相關
11、性波段選擇光譜波段選擇一般遵循以下3個原則:一、所選擇的波段信息總量要大二、所選的波段相關性弱三、目標地物類型要在所選的波段組合內與其他地物有很好的可分性。35選擇最優波段的方法(1)方差法。最簡單的挑選方式,每一個波段中單個像元的亮度值與平均亮度值差的平方和,再取平均數。單波段的方差越大,表明波段的離散程度越大,信息量越豐富。 36各波段的方差(標準差)反映了圖像各像元灰度值與平均值總的離散度,一定程度上反映了各波段信息量,其值越大,所包含的信息量越大,地物之間越容易區分。下面以一幅128個波段的omis影像為例,介紹圖像方差(標準差)所反應出來的圖像信息量大小。37(a)第10 波段的圖像
12、(b)第65波段的圖像(C)第126 波段的圖像38圖像在128個波段的標準差。可以看出,波段65-96這些波段的標準差較小(幾乎都小于50),所以這些波段子集包含的信息量就少。而波段27-30,35-39,113-114,116-118的標準差較大(基本都大于400),這些波段包含的信息量就較多。高光譜遙感圖像各波段的信息量分布并沒有規律,在一個很小的波長范圍內,各波段的信息量分布不均勻。就是相鄰兩個波段的信息量有時差別也很大。39(2)相關系數法通過相關系數r(-11之間)來比較兩個光譜圖像之間的相關性,它反映了不同變量之間的相關程度,R越大,說明波段問信息重疊越大。它的大小取決于兩個變量
13、之間的協方差和它們各自的標準差,其計算公式為:這里定義j=i+1,即:比較相鄰兩個波段之間的相關性,可以用下面的表來顯示40相鄰波段之間相關系數表41用圖像的直方圖形式來統計相關性424344相關系數也可以用來比較其他的參量45原理:由前面兩種評判的原則組成。即:圖像數據的標準差越大所包含的信息量也越大,波段間的相關系數越小,表明各波段圖像數據的獨立性越高,信息的冗余度越小。計算公式如下:S代表標準差,R代表相關系數此方法是目前最常用的波段選擇方法。計算方法簡單,易于操作,且更接近于波段選擇的原則。 (3)OIF( Optimum index最佳指數)46利用Gearys C指數衡量空間相關性
14、指標,衡量標準在于:通過該指數,選擇出來的波段,在地物集中區域的灰度反差越大越好(圖像清晰明了),波段之間越獨立越好(消除相關性)。Gearys C指數公式如下:z代表感興趣的屬性值;w代表權值;i,j分別是兩個不同像元(4)空間自相關性評價47利用Gearys c值可以反映兩個方面的情況: (1) 反映影像質量。影像的Gearys c值越小,方差越大,影像質量越高例:選擇某一幅高光譜圖像,下面是它的兩個不同波段影像。可以分別通過:目視;方差或Gearys值來判斷兩幅圖像質量的差異。Gearys c=0.428Gearys c=0.16948Gearys c值反映波段之間相關性 分別為0.61
15、7與0.223(2)選擇波段。比較兩個波段的比值圖像的空間自相關值, Gearys c的值越小,說明構成比值的圖像信息量越大,兩波段應入選。例:選擇兩個不同的比值圖像進行實驗,第一幅是選擇強烈相關的中心波長為:0.727與0.724;第二幅是選擇不相關的中心波長為:0.727與0.548。495.4 光譜特征的提取光譜特征的提取是光譜特征空間降維的過程。現有的降維方法可以分兩類:1、基于非變換的,如:利用光譜位置搜索進行波段選擇,人工選取感興趣波段,它的優點是保持了圖像的原有特征;2、基于變換的方法,如:主成分分析PCA(K-L變換),最小噪聲分離變換MNF,小波變換等,基于變換的降維方式的優
16、點是可以經過若干變換直接將高維數據降低到幾維,降維速度快。(主要進行描述的方法)50一、基于主成分變換 K-L變換是建立在統計特征基礎上的多維正交線性變換,多波段圖像通過這種變換后產生一組新的組分圖像(按照方差從大到小排列)。組分圖像數目可以等于或少于原來圖像的波段數目。一幅高光譜圖像通過KL變換能夠把原來多個波段中的有用信息盡量集中到數目盡可能少的新的組分圖像中,使圖像數據得到有效的壓縮,而且還能夠使新的組分圖像中的組分之間互不相關。幾何學上:把原來的坐標系旋轉形成新的坐標系,使新的坐標軸通過樣本方差最大的方向。51 為主分量變換后圖像的m維向量 為主分量變換前圖像的m維向量, 變換矩陣為由
17、原始圖像的協方差矩陣的特征向量組成,特征向量是按其對應的特征值由大到小的順序,重新進行排列而成 主成分分析方法可用變換矩陣表示如下:52根據KL變換的定義,有m個波段的高光譜圖像KL變換的過程概括如下:5354(a)第1波段圖像(C)第5波段圖像(d)第7波段圖像(b)第4波段圖像128個波段的omis影像進行主成份分析以后的結果圖像55從圖中可以看出變換后的新波段各主分量包含的信息量呈逐漸減少的趨勢,經KL變換后圖像的標準差曲線圖56K-L變換后部份波段的譜間相關系數57經過K-L變換后的RGB合成一般人眼對灰度的分辨率只有二三十種,而對彩色的分辨要比對灰度的分辨多得多,256種彩色對人眼來
18、說極為豐富。為此若一般的黑白圖像處理成彩色圖像,顯然可提高原圖像的分辨能力,獲得更好的判讀效果。原始遙感圖像共有128個波段,所以有128*127*126種合成方案。對原始高光譜圖像我們隨機選擇的50種方案。KL圖像我們選擇了30種方案,選出其中的兩幅圖像,對比如下:58 原始圖像的RGB圖(R:10 G:40 B 70)KL圖像的RGB圖(R:1 G:2 B:3)59原始圖像與KL變換圖像的對比60二、MNF變換(minimum noise fraction)最小噪聲分離法61MNF組成:可以認為是由兩個串聯的主成分變換來組成。第一個主成分變換基于噪聲的協方差矩陣進行的,去除相關性,重新調節
19、圖像中的噪聲分布。經過這個處理以后,噪聲在各個波段之間沒有相關性。第二個主成分變換是標準的主成分變換。在變換后的前幾個分量圖像按照方差大小順序進行排列,向后方差逐步減少,噪聲逐步增大,甚至全部為噪聲。物理意義62提取圖像端元光譜當MNF變換完成之后,同時輸出每個分量的特征值,繪制特征值曲線,當特征為1的時候,代表圖像中只有噪聲。端元光譜數量直接可以從特征值曲線上讀取,即特征值值降到1的波段位置。這種判斷方法并不一定正確,有時候需要增加維數。夏橋PHI高光譜:80波段波長范圍:0.41740.8544mm63mnf變換結果的第1分量,第4分量,第8分量,第13分量64三、穗帽變換穗帽變換(K-T
20、變換):是一種基于圖像物理特征上的固定轉換,與PCA變換相比,轉換后的圖像具有明確的物理意義,不隨數據而變,對于相同傳感器獲取的不同圖像,變換結果可以相互比較,因而得到了廣泛應用。65對于MSS數據和TM數據,提取植被或土壤信息的穗帽變換的變換系數矩陣分別為:MSSTM66實際應用中,對不同的數據,為防止出現負值,需要對變換后的像元矢量加一常數進行修正。穗帽變換對于處理Landsat/MSS和TM數據,尤其是提取的植被信息,由于是利用了所有波段的線性組合,提取的植被信息量比只利用兩個波段的植被指數NDVI要高。穗帽變換的缺點是依賴于傳感器,固定的轉換系數對其他傳感器不適用。6768四、典型分析
21、變換(CA) 與PCA主成分變換相比較 相同點: 都是統計學角度出發的正交變換。 不同點: PCA在對原始圖像缺少先驗知識的基礎上計算原始圖像的總協方差等統計參數 CA 針對具體的類別計算得到統計參量,變換矩陣能夠使得變換后的典型成分軸具有最大的類間方差和最小的類內方差。變換后的典型軸按類別可分性大小依此排列。 69典型成分分析方法的步驟為:(1)首先利用類別樣本求出類內協方差矩陣(2)再求樣本的類間協方差矩陣:(3)根據變換后,應當保證最大的類間方差和最小的類內方差,組建特征方程:(4)將由特征方程求出的特征值從大到小排列,并求出對應的特征向量矩陣,組建變換矩陣,對原始數據進行變換,即可完成
22、CA變換。 70典型成分分析方法以類間方差最大和類內方差最小作為優化條件,使變換后第一主成分包含了最大的類間可分性信息,同時降低了數據維數,有利于分類。但是,CA變換是基于類別統計分析的特征空間變換,對于高光譜數據,需要大量的訓練樣本,以便有足夠高的樣本數量和波段比,因此,得到類別協方差矩陣比較困難。典型分析變換(CA)的優缺點:715.5 高光譜投影變換歐式空間三維空間:向量x1,x2,x3在三維空間上必然可以分解為 x1,x2,x3=x11,0,0+x20,1,0+x30,0,1 這三個分量可以將任何三維向量線性表出。所以三維向量組成的幾何空間其實可以用這三個基表達出任何三維向量。向量和點對應,三維向量其實也是對應三維直角坐標系的一個點。n維空間:向量x1,x2,.,xn在n維空間上必然可以分解為 x1,x2,.,xn =x11,0,.,0+.+xn0,0,.,1 其實在n維空間上就是由n個基構成的一個線性組合。一個n維向量其實就是一個n維歐式空間的一個點。只不過是有n個向量的。 72歐式空間單形體在歐氏空間中中,只有(n1)個頂點的凸面幾何體是n 維空間中最簡單的形式,稱之為單形體(simplex)。如一維空間中由兩個點確定的線段、二維空間中由三個點
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB31/T 306-2022公交客車運行技術要求
- DB31/T 1231-2020奶牛場牛結核病、布魯氏菌病風險評估分級規程
- DB31/ 760-2013線性菲涅爾太陽能跟蹤聚焦集熱系統安全、能效技術要求及熱性能試驗方法
- 2025大學生綜合保險合同示范文本
- 運動防護用具的綠色體育產業與體育消費考核試卷
- 校長在高一學生家長會上講話新高考政策解讀與選科指導
- 離婚網店分割協議:網絡調解下的網店運營權分割與補償
- 酒店客房售后服務補充協議
- 節假日老人探望權輪換管理協議
- 房地產企業置業顧問培訓及職業發展合同
- 2024年危險品二手車收購協議書范文
- 高考英語高頻詞600
- 2022年江蘇省江陰市四校高一物理第二學期期末經典試題含解析
- 2023年江蘇省南京市中考化學真題(原卷版)
- DB15-T 3619-2024 旅游風景道驛站等級劃分與評定
- (高清版)DB15∕T 3585-2024 高標準農田施工質量評定規程
- 中考物理實驗19 (考點精講)測量滑輪組的機械效率
- 武進經濟發展集團筆試
- 全員消防安全責任制
- 2024年安徽省高考生物試卷(真題+答案)
- 加盟如家合同范本
評論
0/150
提交評論