高光譜數據降維與可分性準則_第1頁
高光譜數據降維與可分性準則_第2頁
高光譜數據降維與可分性準則_第3頁
高光譜數據降維與可分性準則_第4頁
高光譜數據降維與可分性準則_第5頁
已閱讀5頁,還剩43頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

高光譜數據降維與可分性準則1第一頁,共四十八頁,編輯于2023年,星期二第1節高光譜數據降維與可分性準則

武漢大學遙感信息工程學院

龔龑

《高光譜遙感》第四章高光譜數據處理第二頁,共四十八頁,編輯于2023年,星期二一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則第四章第1節高光譜數據降維與可分性準則第三頁,共四十八頁,編輯于2023年,星期二高光譜分辨率的影響

在給定的波長區間內,高的光譜分辨率導致影像波段數眾多、連續。

一方面,高光譜遙感的核心優勢是反映光譜特征的細微差異;另一方面眾多的波段數目給數據處理帶來新的問題。一、高光譜數據的降維問題1.1高光譜數據的高維特征第四頁,共四十八頁,編輯于2023年,星期二波譜空間與光譜空間波段數眾多導致光譜空間維數的增多高光譜多光譜灰度值灰度值一、高光譜數據的降維問題1.1高光譜數據的高維特征波段數眾多導致波譜曲線信息的豐富“維數”是指光譜空間的維數第五頁,共四十八頁,編輯于2023年,星期二

高光譜影像屬于高維空間數據,已有的研究結果表明,這種數據有許多不同于低維數據的分布特性,這些特性決定了人們在對高光譜影像分析時應采用不同策略和方法。一、高光譜數據的降維問題1.1高光譜數據的高維特征第六頁,共四十八頁,編輯于2023年,星期二1.信息冗余大

波段數量多,但并非每個波段在任何時候都是有用信息。波段之間的相關性導致信息冗余很大,尤其是相鄰波段之間的相關性很強。一、高光譜數據的降維問題1.2高維特征帶來的新問題

例如:對于有N個波段的高光譜數據來講,當前應用需求是區分w1類和w2類。

如果利用任意一個波段都能達到這個目的,那么,僅取一個波段就包含了足夠信息,其余N-1維特征就是多余的。第七頁,共四十八頁,編輯于2023年,星期二

根據超維立方體的體積公式,隨著空間維數的增加,超立方體的體積急劇增加,并且向角部分布。一、高光譜數據的降維問題1.2高維特征帶來的新問題2.超維幾何體體積第八頁,共四十八頁,編輯于2023年,星期二一、高光譜數據的降維問題1.2高維特征帶來的新問題2.超維幾何體體積伽馬函數超立方體中內切求的體積與超立方體之比第九頁,共四十八頁,編輯于2023年,星期二例如:密度分析GRID算法一、高光譜數據的降維問題1.2高維特征帶來的新問題2.超維幾何體體積

由于體積因素影響,高維空間中數據的分布呈現出稀疏、嚴重不規則等特點,使得常規的分析算法效果不佳。

第十頁,共四十八頁,編輯于2023年,星期二

思考:既然不同波段包含了不同光譜信息,那么,在利用遙感影像分類時,是否波段越多,分類越精確?研究表明,事實并非如此一、高光譜數據的降維問題1.2高維特征帶來的新問題3.“維數災難”問題第十一頁,共四十八頁,編輯于2023年,星期二一、高光譜數據的降維問題1.2高維特征帶來的新問題3.“維數災難”問題第十二頁,共四十八頁,編輯于2023年,星期二

這說明高光譜數據區分地類之間的能力極大地受到訓練樣本的限制,在分析高光譜影像時,要獲得好的分類精度就需要更多的訓練樣本。

如果訓練樣本不足時,往往會出現在樣本點數目一定的前提下,分類精度隨著特征維數的增加“先增后降”的現象,這就是所謂的Hughes”維數災難”現象。一、高光譜數據的降維問題1.2高維特征帶來的新問題3.“維數災難”問題第十三頁,共四十八頁,編輯于2023年,星期二

隨著空間維數的增加,要得到同樣精度的估計值將需要更多的樣本數。

研究表明,對于監督分類而言,若要得到比較滿意的分類結果:一、高光譜數據的降維問題1.2高維特征帶來的新問題4.高維空間中的參數估計問題

線性分類器需要的樣本數與空間的維數呈線性關系。

對于基于二次估計量的分類器,所需的樣本數與空間的維數呈平方關系。第十四頁,共四十八頁,編輯于2023年,星期二模式識別的類別統計信息向量均值和方差等根據訓練樣本估算出來訓練樣本的數目相對于特征空間的維數的比例參數估計不準確分類精度較低多光譜圖像高高光譜圖像低一、高光譜數據的降維問題1.2高維特征帶來的新問題4.高維空間中的參數估計問題因此,“維數災難”現象可以從樣本數量與數據復雜度關系理論來解釋分類精度較高參數估計較準確第十五頁,共四十八頁,編輯于2023年,星期二

在高維數據空間中,除了數據點分布的絕對位置以外,數據分布的形狀和方向對于分類具有更加重要的影響作用。一、高光譜數據的降維問題1.2高維特征帶來的新問題5.高階統計特性第十六頁,共四十八頁,編輯于2023年,星期二一、高光譜數據的降維問題1.2高維特征帶來的新問題5.高階統計特性第十七頁,共四十八頁,編輯于2023年,星期二

在低維空間,只使用均值向量進行分類的結果比只使用方差信息得到的結果的精度高,說明在此種情況下,在分類過程中數據分布的位置比分布的形狀和方向作用要大的多,這也是人們通常遇到的情況。

但是,當維數增加時,只考慮均值信息進行分類的精度并不再增加,而考慮方差信息的分類精度卻隨著特征維數的增加而繼續增加。一、高光譜數據的降維問題1.2高維特征帶來的新問題5.高階統計特性第十八頁,共四十八頁,編輯于2023年,星期二綜上所述,高維特征引起了多種問題

因此,在高光譜數據應用的特定階段,可以對高維數據進行降維處理,得到具有代表意義的低維光譜特征,并在低維光譜空間中進行相應分析(聚類分析)。

信息冗余大超維幾何體體積“維數災難”問題高維空間中的參數估計問題高階統計特性一、高光譜數據的降維問題1.2高維特征帶來的新問題第十九頁,共四十八頁,編輯于2023年,星期二

若為D維空間中的一個容量為N的數據集合,假設其來自于維數為D的某一數據集的采樣。降維的目標是探求數據集合適的低維坐標描述,將原數據集合投影到低維空間,獲得原數據集合的低維簡潔表示。一、高光譜數據的降維問題1.3高光譜降維

方法:波段選擇特征變換第二十頁,共四十八頁,編輯于2023年,星期二

注意不要走向另一個極端:降維絕對不是對高維光譜信息的舍棄,而是立足于高維數據,針對不同的使用目的得到相應低維數據。

圖書館的書種類繁多,不同專業的同學各取所需,只選一小部分,但并不意味著其它的書是多余的。一、高光譜數據的降維問題1.3高光譜降維第二十一頁,共四十八頁,編輯于2023年,星期二高光譜數據降維的方法

波段選擇特征變換具體內容在下一講中介紹

降維后得到的低維特征空間是否有效進行類別區分?一、高光譜數據的降維問題1.3高光譜降維第二十二頁,共四十八頁,編輯于2023年,星期二一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則第四章第1節高光譜數據降維與可分性準則第二十三頁,共四十八頁,編輯于2023年,星期二降維得到低維特征形成特征空間分布不同可分性存在差異衡量可分性?可分性判據定量化的指標指導降維二、類別可分性準則2.1高光譜數據降維與類別可分性判據的關系第二十四頁,共四十八頁,編輯于2023年,星期二概念:從高維數據中得到了一組用來分類的特征,需要一個定量的標準來衡量特征對分類的有效性。2.2可分性準則基本概念

可分性準則二、類別可分性準則可分性準則的主要類型:

基于幾何距離的可分性準則基于概率密度的可分性準則特點:通過已知類別先驗知識,衡量當前特征空間對類別的區分效果。第二十五頁,共四十八頁,編輯于2023年,星期二一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則第四章第1節高光譜數據降維與可分性準則第二十六頁,共四十八頁,編輯于2023年,星期二

不同的類別不同的分布區域

類別可分性區域可分性

區域可分性通過幾何距離來度量三、基于幾何距離的可分性準則3.1基本思想第二十七頁,共四十八頁,編輯于2023年,星期二1.點與點的距離在維特征空間中,特征點與特征點之間的歐氏距離為:3.2幾何距離可分性準則原理三、基于幾何距離的可分性準則第二十八頁,共四十八頁,編輯于2023年,星期二當前點與點集中每個點逐個計算距離2.點與點集的距離3.2幾何距離可分性準則原理三、基于幾何距離的可分性準則第二十九頁,共四十八頁,編輯于2023年,星期二總體的均值矢量類內的均值矢量3.類內及總體的均值矢量3.2幾何距離可分性準則原理三、基于幾何距離的可分性準則第三十頁,共四十八頁,編輯于2023年,星期二類內均方歐氏距離定義為:類內均方距離也可定義為:3.2幾何距離可分性準則原理4.類內距離先求出各自到類心的距離的平方,再求和兩兩運算,不涉及類心三、基于幾何距離的可分性準則第三十一頁,共四十八頁,編輯于2023年,星期二

類內離差矩陣,反映類內部樣本在均值周圍的散布情況。(矩陣的跡)與類內均方歐氏距離的關系:3.2幾何距離可分性準則原理5.類內離差矩陣三、基于幾何距離的可分性準則第三十二頁,共四十八頁,編輯于2023年,星期二兩類樣本之間的距離X1X2X3Y1Y2A類B類兩兩之間3.2幾何距離可分性準則原理6.兩類之間的距離三、基于幾何距離的可分性準則第三十三頁,共四十八頁,編輯于2023年,星期二取歐氏距離時,總的均方距離為總的樣本距離兩類樣本之間的距離類與類兩兩求和3.2幾何距離可分性準則原理7.各類總的均方距離三、基于幾何距離的可分性準則第三十四頁,共四十八頁,編輯于2023年,星期二第i類的離差矩陣第i類的比例A.總的類內離差矩陣3.2幾何距離可分性準則原理7.多類情況離差矩陣三、基于幾何距離的可分性準則第三十五頁,共四十八頁,編輯于2023年,星期二第i類樣本均值總體樣本均值每一類只有一個代表B.類間離差矩陣3.2幾何距離可分性準則原理7.多類情況離差矩陣三、基于幾何距離的可分性準則第三十六頁,共四十八頁,編輯于2023年,星期二任一樣本

實質是樣本總體的協方差矩陣不涉及類的概念總體樣本均值C.總體離差矩陣3.2幾何距離可分性準則原理7.多類情況離差矩陣三、基于幾何距離的可分性準則第三十七頁,共四十八頁,編輯于2023年,星期二點與點的距離點到點集類內的均值矢量類內距離類內均方距離類內離差矩陣總體的均值矢量兩類之間的距離總體離差矩陣各類模式之間總的均方距離如何通過幾何距離衡量可分性?三、基于幾何距離的可分性準則3.3判據構造1.離差矩陣分析第三十八頁,共四十八頁,編輯于2023年,星期二樣本的散布程度樣本越分散矩陣數值越大

類的內部越緊密越好類之間越分散越好降維方案1降維方案2樣本的類別信息已知越小越好越大越好情況復雜三、基于幾何距離的可分性準則3.3判據構造1.離差矩陣分析第三十九頁,共四十八頁,編輯于2023年,星期二原則:數值的大小直接體現降維后特征空間的類別可分性。常見判據:3.3判據構造2.依據可分性準則構造判據三、基于幾何距離的可分性準則第四十頁,共四十八頁,編輯于2023年,星期二一、高光譜數據的降維問題二、類別可分性準則三、基于幾何距離的可分性準則四、基于類的概率密度的可分性準則第四章第1節高光譜數據降維與可分性準則第四十一頁,共四十八頁,編輯于2023年,星期二

先驗概率后驗概率條件概率在樣本集中,預先已知的某一類出現的概率P(Wi)對于樣本集中的某一模式x,它屬于某類Wi的概率P(Wi|x)在某一類Wi中,模式x出現的概率P(x|Wi)4.1基本概念回顧四、基于概率密度的可分性準則第四十二頁,共四十八頁,編輯于2023年,星期二W1

W2

P(x|W1)P(x|W2)P100%0%W2W1100%W1

W2

P(x|W1)P(x|W2)P0%W1W2

各類的條件概率密度函數P(x|Wi)重疊度越低,特征可分性越好。四、基于概率密度的可分性準則4.2概率密度分析第四十三頁,共四十八頁,編輯于2023年,星期二可分性判據的設定衡量概率密度重疊度立足于基本性質:

Jp>=0;

當兩類概率密度完全不重疊時,Jp取最大值;

當兩類概率密度完全重疊時,Jp等于0;

兩類概率密度具有“對稱性”。四、基于概率密度的可分性準則4.3基本性質第四十四頁,共四十八頁,編輯于2023年,星期二

進行相關性運算,實際上是對兩個概率密

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論