高光譜數據降維與可分性準則PPT課件_第1頁
高光譜數據降維與可分性準則PPT課件_第2頁
高光譜數據降維與可分性準則PPT課件_第3頁
高光譜數據降維與可分性準則PPT課件_第4頁
高光譜數據降維與可分性準則PPT課件_第5頁
已閱讀5頁,還剩46頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

.,1,高光譜遙感第四章高光譜數據處理,第四章高光譜數據處理主要內容,高光譜數據的特征選擇與提取高光譜特征參量化高光譜遙感影像分類與光譜匹配混合光譜,.,2,第1節高光譜數據降維與可分性準則武漢大學遙感信息工程學院龔龑,高光譜遙感第四章高光譜數據處理,.,3,一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則,第四章第1節高光譜數據降維與可分性準則,.,4,高光譜分辨率的影響,在給定的波長區間內,高的光譜分辨率導致影像波段數眾多、連續。,一方面,高光譜遙感的核心優勢是反映光譜特征的細微差異;另一方面眾多的波段數目給數據處理帶來新的問題。,一、高光譜數據的降維問題,1.1高光譜數據的高維特征,.,5,波譜空間與光譜空間,波段數眾多導致光譜空間維數的增多,一、高光譜數據的降維問題,1.1高光譜數據的高維特征,波段數眾多導致波譜曲線信息的豐富,“維數”是指光譜空間的維數,.,6,高光譜影像屬于高維空間數據,已有的研究結果表明,這種數據有許多不同于低維數據的分布特性,這些特性決定了人們在對高光譜影像分析時應采用不同策略和方法。,一、高光譜數據的降維問題,1.1高光譜數據的高維特征,.,7,1.信息冗余大,波段數量多,但并非每個波段在任何時候都是有用信息。波段之間的相關性導致信息冗余很大,尤其是相鄰波段之間的相關性很強。,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,例如:對于有N個波段的高光譜數據來講,當前應用需求是區分w1類和w2類。,如果利用任意一個波段都能達到這個目的,那么,僅取一個波段就包含了足夠信息,其余N-1維特征就是多余的。,.,8,根據超維立方體的體積公式,隨著空間維數的增加,超立方體的體積急劇增加,并且向角部分布。,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,2.超維幾何體體積,.,9,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,2.超維幾何體體積,伽馬函數,超立方體中內切求的體積與超立方體之比,.,10,例如:密度分析GRID算法,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,2.超維幾何體體積,由于體積因素影響,高維空間中數據的分布呈現出稀疏、嚴重不規則等特點,使得常規的分析算法效果不佳。,.,11,思考:既然不同波段包含了不同光譜信息,那么,在利用遙感影像分類時,是否波段越多,分類越精確?,研究表明,事實并非如此,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,3.“維數災難”問題,.,12,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,3.“維數災難”問題,.,13,這說明高光譜數據區分地類之間的能力極大地受到訓練樣本的限制,在分析高光譜影像時,要獲得好的分類精度就需要更多的訓練樣本。,如果訓練樣本不足時,往往會出現在樣本點數目一定的前提下,分類精度隨著特征維數的增加“先增后降”的現象,這就是所謂的Hughes”維數災難”現象。,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,3.“維數災難”問題,.,14,隨著空間維數的增加,要得到同樣精度的估計值將需要更多的樣本數。,研究表明,對于監督分類而言,若要得到比較滿意的分類結果:,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,4.高維空間中的參數估計問題,線性分類器需要的樣本數與空間的維數呈線性關系。,對于基于二次估計量的分類器,所需的樣本數與空間的維數呈平方關系。,.,15,模式識別的類別統計信息,參數估計不準確,分類精度較低,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,4.高維空間中的參數估計問題,因此,“維數災難”現象可以從樣本數量與數據復雜度關系理論來解釋,.,16,在高維數據空間中,除了數據點分布的絕對位置以外,數據分布的形狀和方向對于分類具有更加重要的影響作用。,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,5.高階統計特性,.,17,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,5.高階統計特性,.,18,在低維空間,只使用均值向量進行分類的結果比只使用方差信息得到的結果的精度高,說明在此種情況下,在分類過程中數據分布的位置比分布的形狀和方向作用要大的多,這也是人們通常遇到的情況。,但是,當維數增加時,只考慮均值信息進行分類的精度并不再增加,而考慮方差信息的分類精度卻隨著特征維數的增加而繼續增加。,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,5.高階統計特性,.,19,綜上所述,高維特征引起了多種問題,因此,在高光譜數據應用的特定階段,可以對高維數據進行降維處理,得到具有代表意義的低維光譜特征,并在低維光譜空間中進行相應分析(聚類分析)。,信息冗余大超維幾何體體積“維數災難”問題高維空間中的參數估計問題高階統計特性,一、高光譜數據的降維問題,1.2高維特征帶來的新問題,.,20,一、高光譜數據的降維問題,1.3高光譜降維,方法:波段選擇特征變換,.,21,注意不要走向另一個極端:降維絕對不是對高維光譜信息的舍棄,而是立足于高維數據,針對不同的使用目的得到相應低維數據。,圖書館的書種類繁多,不同專業的同學各取所需,只選一小部分,但并不意味著其它的書是多余的。,一、高光譜數據的降維問題,1.3高光譜降維,.,22,高光譜數據降維的方法,波段選擇特征變換,降維后得到的低維特征空間是否有效進行類別區分?,一、高光譜數據的降維問題,1.3高光譜降維,.,23,一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則,第四章第1節高光譜數據降維與可分性準則,.,24,降維得到低維特征,定量化的指標,指導降維,二、類別可分性準則,2.1高光譜數據降維與類別可分性判據的關系,.,25,概念:從高維數據中得到了一組用來分類的特征,需要一個定量的標準來衡量特征對分類的有效性。,2.2可分性準則基本概念,可分性準則,二、類別可分性準則,可分性準則的主要類型:,基于幾何距離的可分性準則基于概率密度的可分性準則,特點:通過已知類別先驗知識,衡量當前特征空間對類別的區分效果。,.,26,一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則,第四章第1節高光譜數據降維與可分性準則,.,27,不同的類別不同的分布區域,類別可分性區域可分性,區域可分性通過幾何距離來度量,三、基于幾何距離的可分性準則,3.1基本思想,.,28,1.點與點的距離,在,維特征空間中,特征點,與特征點,之間的歐氏距離為:,3.2幾何距離可分性準則原理,三、基于幾何距離的可分性準則,.,29,2.點與點集的距離,3.2幾何距離可分性準則原理,三、基于幾何距離的可分性準則,.,30,總體的均值矢量,類內的均值矢量,3.類內及總體的均值矢量,3.2幾何距離可分性準則原理,三、基于幾何距離的可分性準則,.,31,類內均方歐氏距離定義為:,類內均方距離也可定義為:,3.2幾何距離可分性準則原理,4.類內距離,先求出各自到類心的距離的平方,再求和,兩兩運算,不涉及類心,三、基于幾何距離的可分性準則,.,32,類內離差矩陣,反映類內部樣本在均值周圍的散布情況。,3.2幾何距離可分性準則原理,5.類內離差矩陣,三、基于幾何距離的可分性準則,.,33,兩類樣本之間的距離,3.2幾何距離可分性準則原理,6.兩類之間的距離,三、基于幾何距離的可分性準則,.,34,取歐氏距離時,總的均方距離為,總的樣本距離,3.2幾何距離可分性準則原理,7.各類總的均方距離,三、基于幾何距離的可分性準則,.,35,A.總的類內離差矩陣,3.2幾何距離可分性準則原理,7.多類情況離差矩陣,三、基于幾何距離的可分性準則,.,36,B.類間離差矩陣,3.2幾何距離可分性準則原理,7.多類情況離差矩陣,三、基于幾何距離的可分性準則,.,37,實質是樣本總體的協方差矩陣不涉及類的概念,C.總體離差矩陣,3.2幾何距離可分性準則原理,7.多類情況離差矩陣,三、基于幾何距離的可分性準則,.,38,點與點的距離,如何通過幾何距離衡量可分性?,三、基于幾何距離的可分性準則,3.3判據構造,1.離差矩陣分析,.,39,類的內部越緊密越好類之間越分散越好,三、基于幾何距離的可分性準則,3.3判據構造,1.離差矩陣分析,.,40,原則:數值的大小直接體現降維后特征空間的類別可分性。,常見判據:,3.3判據構造,2.依據可分性準則構造判據,三、基于幾何距離的可分性準則,.,41,一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則,第四章第1節高光譜數據降維與可分性準則,.,42,先驗概率后驗概率條件概率,在樣本集中,預先已知的某一類出現的概率P(Wi),對于樣本集中的某一模式x,它屬于某類Wi的概率P(Wi|x),在某一類Wi中,模式x出現的概率P(x|Wi),4.1基本概念回顧,四、基于概率密度的可分性準則,.,43,100%,各類的條件概率密度函數P(x|Wi)重疊度越低,特征可分性越好。,四、基于概率密度的可分性準則,4.2概率密度分析,.,44,可分性判據的設定,基本性質:Jp=0;當兩類概率密度完全不重疊時,Jp取最大值;當兩類概率密度完全重疊時,Jp等于0;兩類概率密度具有“對稱性”。,四、基于概率密度的可分性準則,4.3基本性質,.,45,進行相關性運算,實際上是對兩個概率密度函數進行卷積運算。,兩個概率密度函數越重合,卷積結果越大;當二者完全重合時,相當于對p(x)進行全概率積分,等于1;當二者完全分離時,卷積結果等于零。,在開區間(0,1)內,y=-ln(x)取值范圍為0至正無窮大。(性質1,2,3),四、基于概率密度的可分性準則,4.4Bhattacharyya判據,.,46,更具一般性的判據:,S=0.5時,Chernoff判據即為Bhattacharyya判據,四、基于概率密度的可分性準則,4.5Chernoff判據,.,47,特征空間對w1類的可分性越好,特征空間對w2類的可分性越好,散度:基于貝葉斯判決的可分性判據,對于已知類別樣本x,四、基于概率密度的可分性準則,4.6散度判據,似然比,.,48,對w1類中的所有樣本求的期望:,對w2類中的所有樣本求的期望:,四、基于概率密度的可分性準則,4.6散度判據,.,49,四、基于概率密度的可分性準則,4.6散度判據,.,50,四、基于概率密度的可分性準則,思考:,對于多類情況下的概率密度可分性準則如何確定?,類別兩兩之間可分性之和,.,51,小

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論