空間內插方法比較_第1頁
空間內插方法比較_第2頁
空間內插方法比較_第3頁
空間內插方法比較_第4頁
空間內插方法比較_第5頁
已閱讀5頁,還剩3頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一、空間數據的插值用各種方法采集的空間數據往往是按用戶自己的要求獲取的采樣觀測值,亦既數據集合是由感興趣的區域內的隨機點或規則網點上的觀測值組成的。但有時用戶卻需要獲取未觀測點上的數據,而已觀測點上的數據的空間分布使我們有可能從已知點的數據推算出未知點的數據值。在已觀測點的區域內估算未觀測點的數據的過程稱為內插;在已觀測點的區域外估算未觀測點的數據的過程稱為外推。    空間數據的內插和外推在GIS中使用十分普遍。一般情況下,空間位置越靠近的點越有可能獲得與實際值相似的數據,而空間位置越遠的點則獲得與實際值相似的數據的可能性越小。下面介紹一些常用的內插方

2、法。1、邊界內插    使用邊界內插法時,首先要假定任何重要的變化都發生在區域的邊界上,邊界內的變化則是均勻的、同質的。     邊界內插的方法之一是泰森多邊形法。泰森多邊形法的基本原理是,未知點的最佳值由最鄰近的觀測值產生。如圖4-6-1所示。                       

3、;   泰森多邊形的生成算法見§5.7。2、趨勢面分析    趨勢面分析是一種多項式回歸分析技術。多項式回歸的基本思想是用多項式表示線或面,按最小二乘法原理對數據點進行擬合,擬合時假定數據點的空間坐標X、Y為獨立變量,而表示特征值的Z坐標為因變量。    當數據為一維時,可用回歸線近似表示為:    其中,a0、a1為多項式的系數。當n個采樣點方差和為最小時,則認為線性回歸方程與被擬合曲線達到了最佳配準,如圖4-6-2左圖所示,即: 當

4、數據以更為復雜的方式變化時,如圖4-6-2右圖所示。在這種情況下,需要用到二次或高次多項式:              (二次曲線)     在GIS中,數據往往是二維的,在這種情況下,需要用到二元二次或高次多項式:    (二次曲面)     多項式的次數并非越高越好,超過3次的多元多項式往往會導致奇異解,因此,通常使用二次多項式。   

5、;  趨勢面是一種平滑函數,難以正好通過原始數據點,除非數據點數和多項式的系數的個數正好相同。這就是說,多重回歸中的殘差屬正常分布的獨立誤差,而且趨勢面擬合產生的偏差幾乎都具有一定程度的空間非相關性。 3、局部內插    在GIS中,實際的連續空間表面很難用一種數學多項式來描述,因此,往往使用局部內插技術,即利用局部范圍內的已知采樣點的數據內插出未知點的數據。常用的有線性內插、雙線性多項式內插、雙三次多項式(樣條函數)內插。(1)、線性內插    線性內插的多項式函數為:  

6、  只要將內插點周圍的3個數據點的數據值帶入多項式,即可解算出系數a0、a1、a2 。(2)、雙線性多項式內插    雙線性多項式內插的多項式函數為:    只要將內插點周圍的4個數據點的數據值帶入多項式,即可解算出系數a0、a1、a2、a3 。    如果數據是按正方形格網點布置的(如圖4-6-3),則可用簡單的公式即可計算出內存點的數據值。    設正方形的四個角點為A、B、C、D,其相應的特征值為ZA、ZB、ZC、ZD,

7、P點相對于A點的坐標為dX、dY,則插值點的特征值Z為:(3)、雙三次多項式(樣條函數)內插    雙三次多項式是一種樣條函數。樣條函數是一種分段函數,對于n次多項式,在邊界處其n-1階導數連續。因此,樣條函數每次只用少量的數據點,故內插速度很快;樣條函數通過所有的數據點,故可用于精確的內插,可以保留微地貌特征;樣條函數的n-1階導數連續,故可用于平滑處理。    雙三次多項式內插的多項式函數為:      將內插點周圍的16個點的數據帶入多項式,可計算出

8、所有的系數。4、移動平均法    在未知點X處內插變量Z的值時,最常用的方法之一是在局部范圍(或稱窗口)內計算個數據點的平均值。既:    對于二維平面的移動平均法也可用相同的公式,但位置Xi應被坐標矢量Xi代替。    窗口的大小對內插的結果有決定性的影響。小窗口將增強近距離數據的影響;大窗口將增強遠距離數據的影響,減小近距離數據的影響。    當觀測點的相互位置越近,其數據的相似性越強;當觀測點的相互位置越遠,其數據的相似性越低。因

9、此,在應用移動平均法時,根據采樣點到內插點的距離加權計算是很自然的。這就是加權移動平均法,即:       其中,i是采樣點i對應的權值,常取的形式有:     加權平均內插的結果隨使用的函數及其參數、采樣點的分布、窗口的大小等的不同而變化。通常使用的采樣點數為68點。對于不規則分布的采樣點需要不斷地改變窗口的大小、形狀和方向,以獲取一定數量的采樣點??臻g內插方法比較(空間統計學)摘 要:空間內插可以分為幾何方法、統計方法、空間統計方法、函數方法、隨機 模擬方法、物理模型模擬方法和綜合方法。介紹

10、了每一種方法的適用范圍、算法和優缺點。指出沒有絕對最優的空間內插方法,必須對數據進行空間探索分析,根據數據的特點,選擇最優方法;同時,應對內插結果做嚴格的檢驗。開發通用空間內插軟件、 智能化內插以及加強相關基礎研究將是空間內插研究的重點。 1 空間內插 根 據已知地理空間的特性探索未知地理空間的特性是許多地理研究的第一步,也是地理學的 基本問題。常規方法無法對空間中所有點進行觀測,但是我們可以獲得一定數量的空間樣本,這些樣本反映了空間分布的全部或部分特征,并可以據此預測未知地理空間的特征。在這 一意義上,空間內插可以被定義為根據已知的空間數據估計(預測)未知空間的數據值。其目標可以歸納為:缺值

11、估計:估計某一點缺失的觀測數據,以提高數據密度;內插等值線:以等值線的形式直觀地顯示數據的空間分布;數據格網化:把無規則分布的空間數 據內插為規則分布的空間數據集,如規則矩形格網、三角網等。 空 間內插對于觀測臺站十分稀少,而臺站分布又非常不合理的地區具有十分重要的實際意義 。這些地區的常規觀測常常不能滿足要求,在這種情況下,利用有限的常規觀測估計合理的空間分布,或盡可能地提高數據密度就成為迫切要求。在這些方面,缺值估計和數據格網化 將發揮重要的作用。 (1) 缺值估計。各種科學考察中形式多樣的短期觀測是提高數據觀測密度的重要方式, 無形中起到了加密臺站的作用;而且由于這些考察常常到達人跡罕至

12、的高海拔和極地等區域 ,有助于了解區域內觀測變量的完整空間分布。但是,這些觀測序列往往很短,短則數十天,長不過幾年。如何利用周圍臺站的長序列觀測資料和短期觀測本身的信息,將觀測變量插 補到長序列是一個重要問題。 (2) 數據格網化。規則格網能夠更好地反映連續分布的空間現象,并對他們的變化作出模擬?,F代地球科學模型和氣候模型,如GCM(一般環流模型),都要求與GIS數據模型和遙 感數據高度兼容的空間數據集。格網化的數據,尤其是規則矩形格網,已成為目前地學模型 的主要數據形式。因此,對已知觀測臺站的觀測數據進行空間內插,得到格網化數據是模型的第一步。 空間內插一般包括這樣幾個過程:內插方法(模型)

13、的選擇;空間數據的探索分析,包括對數據的均值、方差、協方差、獨立性和變異函數的估計等;內 插方法評價;重新選擇內插方法,直到合理;內插。 因此,通過比較而選擇一個合用的、適合于數據空間分布特點的內插方法是空間內插的關鍵 。本文將空間內插分類為幾何方法、統計方法、空間統計方法、函數方法、隨機模擬方法、物理模型模擬方法和綜合方法,通過比較研究,指出每一種方法的適用范圍、算法和優缺點 。 2 空間內插方法比較 空間內插可依據:確定或隨機;點與面;全局或局部等標準分類。本文依據內插方法的基本假設和數學本質,把空間內插分類為以下幾種方法。 2.1幾何方法 是 最簡單的空間內插方法。幾何方法基于“地理學第

14、一定律”的基本假設,即鄰近的區域比距離遠的區域更相似。幾何方法的優點是計算開銷少,具有普適性,不需要根據數據的特點對方法加以調整。當樣本數據的密度足夠大時,幾何方法一般能達到滿 意的精度。幾何方法的最大問題是,無法對誤差進行理論估計。最常用的幾何方法有泰森多邊形(最近距離法)和反距離加權方法。 2.1.1泰森多邊形(最近距離法) 泰森多邊形用于生成“領地”或控制區域。實際上,盡管泰森多邊形產生于氣候學領域,它卻特別適合于專題數據的內插,因為它生成專題與專題之間明顯的邊界,不會有不同級別之間的中間現象。泰森多邊形的算法非常簡單,未采樣點的值等于與它距離最近的 采樣點的值。 2.1.2反距離加權方

15、法 反距離加權法是最常用的空間內插方法之一。它認為與未采樣點距離最近的若干個 點對未采樣點值的貢獻最大,其貢獻與距離成反比??捎孟率奖硎荆?(1) 式中,Z是估計值,Zi是第i(i=1,n)個樣本,i是距離,p是距離的冪,它顯著影響內插的結果,它的選擇標準是最小平均絕對誤差。Husar等的研究結果表明,冪越高,內插結果越具有平滑的效果。 2.2統計方法 其 基本假設是,一系列空間數據相互相關,預測值的趨勢和周期是與它相關的其它變量的函數。統計方法的優點是計算開銷不大,有一定的理論基礎,能夠對誤差作出整體上的估計。 但是,其前提是一定要有好的采樣設計,如果采樣過程不能反映出表面變化的重要因素,如

16、周期性和趨勢,則內插一定不能取得好的效果。常用的統計方法有趨勢面方法和多元回歸方法。 2.2.1趨勢面 趨勢面根據有限的觀測數據擬合曲面,進行內插。它適用于:能以空間的視點詮釋趨勢和殘差;觀測有限,內插也基于有限的數據。當趨勢和殘差分別能與區域和局部尺度的空間 過程相聯系時,趨勢面分析最有用。 趨勢面方法可以被定義為: y=A+e (2) 式中,y是n×1維矩陣,對應于n個樣本;A是n個樣本的坐標矩陣;是趨勢面參數矩陣。A和依賴于趨勢面的次數。趨勢面的次數是它最重要的特征。 e是殘差,通常是一個獨立隨機變量。當殘差是隨機獨立時,統計檢驗有效;但實際上,趨勢面中的殘差常是自相關(特別是

17、趨勢面的次數較低時),因此,檢驗是顯著有偏差的。殘差的空間自相關可以用隨機過程模型模擬。 由于趨勢面的以上特性,它的目標有時并非最佳擬合,而是把數據分成區域趨勢組分和局部的殘差。 2.2.2多元回歸 在各種統計方法中,使用較多的是回歸分析,其特點是不需要分布的先驗知識。 多 元回歸在數學形式上與趨勢面很相似,但是,它們又有著顯著的不同。首先,在趨勢面分析中,A是坐標矩陣,而在回歸分析中,它可以是任意變量。其次,在趨勢面方法中,模 型的擬合嚴格地遵從自常數、一次、二次、立方等的順序,主要的問題是確定模型的次數, 因此,趨勢面分析有內在的多重共線性問題;而在多元回歸中,盡管也存在多重共線性,但它并

18、非內在的,可以通過逐步回歸解決,因此,相對于趨勢面的選擇次數,多元回歸的核心 問題是選擇變量(主成分分析等方法有助于選擇變量)和區分模型。 2.3空間統計(Geostatistics)方法 空間統計又稱地質統計學,于20世紀50年代初開始形成,60年代在 法國統計學家Matheron的大量理論研究工作基礎上逐漸趨于成熟。其基本假設是建立在空間相關的先驗模型之上的。假定空間隨機變量具有二階平穩性,或者是服從空間統計的本征假設(in trinsic hypothesis。則它具有這樣的性質:距離較近的采樣點比距離遠的采樣點更相似,相似的程度、或空間協方差的大小,是通過點對的平均方差度量的。點對差異

19、的方差大小只與采樣點間的距離有關,而與它們的絕對位置無 關??臻g統計內插的最大優點是以空間統計學作為其堅實的理論基礎,可以克服內插中誤差難以分析的問題, 能夠對誤差做出逐點的理論估計;它也不會產生回歸分析的邊界效應。缺點是復雜,計算量大,尤其是變異函數(variogram)是幾個標準變異函數模型的組合時,計算量很大;另一 個缺點是變異函數需要根據經驗人為選定??臻g統計方法以Kriging及其各種變種(Cokri ging等)為代表。 2.3.1Kriging內插 (1) Kriging內插的公式 Kriging內插由南非地質學家Krige發明,并因此而命名。Matheron給出了Kriging

20、的一般公式。Kriging內插的公式為: (3) 式中,z(xi)為觀測值,它們分別位于區域內xi位置;x0是一個未采樣點;i為權,并且其和等于1。即 (4) 選取i,使z(x0)的估計無偏,并且使方差DD(-*2DD) 2e小于任意觀測值線形組合的方差。 最小方差由下式給定: (5) 它由下式得到: (6) 式中,(xi,xj)是z在采樣點xi和xj之間的半方差(semi-variance),(xj,x0)是z在采樣點xi和未知點x0之間的半方差,這些量都從適宜的變異函數得到。是極小化處理時的拉格朗日乘數。 估計半方差是一個較為復雜的過程,這一過程稱為空間數據探索分析(ESDA)。 (2)

21、空間數據探索分析(ESDA) 對于Kriging內插而言,空間數據探索分析的目標是建立半方差(h)和點對之間的空間距離h之間的關系,即變異函數。 由于空間統計的本征假設可以表示為以下兩個公式: · 任意兩個距離為h的兩點間的差值的數學期望為0: EZ(x)-Z(x+h)=0 (7) · 任意兩個距離為h的兩點間的差值的方差最?。?VarZ(x)-Z(x+h)=E'(x)-'(x+h)2=2(h) (8) 因此,由下式估計半方差(h): (9) 這 一關系即變異函數。它提供了內插、優化采樣的有用信息。Kriging內插的第一步是 根據樣本找到適合的變異函數理論

22、模型。最常用的變異函數模型有:nugget、球面、指數、 高斯、阻尼正弦、冪和線形模型。其中,前幾種模型在一定的范圍內達到極大方差,而線形 模型的方差增長沒有極限。以下是幾種基本變異函數的形式,這些變異函數的特性分別是: ·Nugget模型缺乏空間相關。 ·球面模型空間相關隨距離的增長逐漸衰減,當距離>后,空間相關消失。 ·指數模型空間相關隨距離的增長以指數形式衰減,相關性消失于無窮遠。表示距離,在此距離上95%的變量的可變性趨于穩定。 ·高斯模型空間相關隨距離的增長而衰減,相關性消失于無窮遠。曲線起始一段的形狀是拋物線,表示變量的空間變化非常平滑

23、。 ·阻尼正弦模型阻尼正弦模型適宜于周期性變化的空間變量,但其變化強度隨距離的增長而衰減。表示周期。 ·線性模型空間可變性隨距離的增長而呈線性地增長,不會在某一距離穩定下來。 變異函數的形式是內插質量的關鍵。需要注意的是,由于不同的區域有不同的空間模式,因 而也就有不同的變異函數。而空間內插都有一個隱含的假定,即空間是連續的,因此,在選擇變異函數模型之前,檢查數據以確定空間連續性是十分必要的。 2.3.2Cokriging內插 Cokriging (共協kriging)內插的基本原理與Kriging相同,但它通過考慮一個以上變量而優化估計;內插由于考慮了變量之間的關系而得到

24、改善。例如,在估計溫度、降水等氣候變 量時,海拔高度是附加的重要變量。Cokriging內插包括以下過程:確定多個觀測值之間 空間相關的特征;借助于變異函數和交叉變異函數(crossvariogram),對相關建模; 利用這些函數估計內插值。 除公式(7)、(8)外,Cokriging引入一個新的假定,即兩個變量之間差值的方差最小。 VarZ(x)-Zk(x)=2k(h) (10) 式中,Zk(x)是與估計值Z(x)相關的第k個變量。 Cokriging 中引入交叉變異函數,它是兩個不同變量之間的相關隨距離變化的函數。它與簡單 變異函數不同,前者的形式是方差,因此總為正或零;而后者的形式為協方

25、差,因此可以為 正、負或零。如果兩個變量向相反的方向變化,交叉變異函數為負;如果兩個變量的變化相獨立,交叉變異函數為零。 交叉變異函數的形式為: (11) Cokriging內插的關鍵是估計交叉變異函數,以分析變量自身以及變量之間的空間相關。Cokriging的其它過程都是與Kriging一致的。 2.4函數方法 是 使用函數逼近曲面的一種方法。函數方法在空間內插領域大多用于一些特殊場合,如利用 高密度的高程數據產生等高線、為提高格網數據的空間分辨率而內插數據等。對于利用有限的觀測數據進行缺值預測和內插格網,函數方法多不適合,因為它難以滿足內插的精度,也 難以估計誤差。函數方法的特點是不需要對

26、空間結構的預先估計、不需要做統計假設。缺點是難以對誤差進行估計,點稀時效果不好。常用的函數方法有:傅里葉級數、樣條函數、雙線性內插、立方卷積法等。 2.4.1傅里葉級數 對于周期性的數據序列,如海浪,可以利用傅里葉級數將它們分解為正弦波和余弦波。 2.4.2樣條函數方法 樣 條函數是使用函數逼近曲面的一種方法。樣條函數易操作,計算量不大,它與空間統計方 法相比具有以下特點,不需要對空間方差的結構做預先估計;不需要做統計假設,而這些假設往往是難以估計和驗證的;同時,當表面很平滑時,也不犧牲精度。樣條函數適合于非常平滑的表面,一般要求有連續的一階和二階導數;它適合于根據很密的 點內插等值線,特別是

27、從不規則三角網(TIN)內插等值線。 樣條函數的缺點是難以對誤差進行估計,點稀時效果不好。樣條函數的種類很多,最常用的有B樣條、張力樣條和薄盤樣條等。 2.4.3雙線性內插 雙線性內插和立方卷積法都主要用于網格數據的內插(重采樣),一般很少用于根據離散 數據內插空間分布。它使用與待估計網格距離最近的4個網格值,線性內插獲得新的網格值 。雙線性內插方法的優點是數據重采樣后的結果較為平滑,沒有階躍效應, 同時具有較高的精度。缺點是網格被平均化,具有低頻濾波的效果;邊緣被平滑,有些極值丟失了。 2.4.4立方卷積法 是 最常使用的網格數據內插方法之一。它使用與待估計網格距離最近的16個網格值,根據立

28、方卷積公式計算輸出。立方卷積公式有幾個不同版本,有的產生低通濾波的效 果,有的產生高通濾波的效果,較好的方法應該在高頻信息和低頻信息的取舍間取得平衡。 立方卷積法的優點是采樣結果的統計信息(均值和方差)與原數據的相似程度比其他采樣方法高。缺點是數據值被改變,因此不能用于類型數據(專題圖)的內插。立方卷積法特別適 宜于顯著改變了網格尺寸,但要保持原數據統計特性的數據內插,如數字高程數據的重采樣。 2.5隨機模擬方法 其基本假設 與空間統計方法不同,隨機模擬認為地理空間具有非平穩性,是空間異質的。它通過空間分布現象的可選的、等概率的、數值表達(地圖)來對空間不確定性建模。對應不確定性,可以接受可選

29、的多個答案。與空間統計方法不同,隨機 模擬方法不是產生唯一的估計結果,它產生一系列可選的結果,它們都與實際數據一致,而 且相關模型將它們聯系起來。隨機模擬方法的最大優點是定義了各種隨機變量之間的空間相關,這類相關可以根據相鄰數據把高度不確定性的先驗分布更新為低不確定性的后驗分布。 缺點是建模困難,計算量大。常用的隨機模擬方法有高斯過程、馬爾科夫過程、蒙特卡羅方法、人工神經網絡方法等。 2.6確定性模擬 其 基本假設是變量的空間分布受物理定律控制,因此,可以使用物理模型或半經驗、半物理 的模型模擬空間分布。對于這一類內插,常常是使用有限的觀測值獲得一些必須的經驗參數,再把這些參數代入到物理模型之

30、中。典型的例子是,GCM是一個純物理模型,但它的參數 化使用了經驗方法。在山區氣候變量的內插過程中,也大量使用這種方法。確定性模擬的最大優點即它的確定性,它不依賴或很少依賴觀測樣本。但空間現象是否可以被確定性地預測以及我們是否可以持這一樂觀的信念十分值得懷疑。 2.7綜合方法 是以上幾種方法的綜合。對于空間變量,一般能夠用不同的方法分別對結構化變量、隨機變 量和觀測誤差(殘差)建模。王勁峰把空間變量分解為: 空間變量=趨勢+周期+隨機+噪聲 (12) 并分別用統計方法、譜函數、人工神經網絡和隨機過程建模描述相應的成分。 綜合方法還適宜于能夠得到輔助性數據,如遙感數據的場合。通過從輔助性數據中提

31、取空間 模式,在合理的數據結構,如四叉樹的支持下,劃分空間同質的區域,從而逼近最佳的預測值。 3結論與建議 3.1結論 (1) 空間內插可依據其基本假設和數學本質分類為:幾何方法、統計方法、空間統計方法 、函數方法、隨機模擬方法、物理模型模擬方法和綜合方法。 (2) 空間內插是極為重要的GIS空間分析方法。對于觀測臺站稀少,而測點分布又極不合理的地區,空間內插是研究這些區域空間變量空間分布的基本方法,是建立空間模型的前提之一。 (3) 空間數據探索分析是分析地理數據的重要工具,它的一個重要目標是估計空間變量的 變異函數。變異函數反映空間相關隨距離變化的特征,可以用幾個基本變異函數模型描述。根據變異函數,可以判斷數據是否具有平穩性,是否符合空間統計的本征假設。 (4) 本文比較了主要的空間內插方法,分析了各種方法的假設、適用范圍、算法和優缺點 ,并且重點介紹了空間統計方法。必須指出,對于眾多的空間內插方法而言,沒有絕對最優的空間內插方法,只有特定條件下的最優方法。因此,必須依據數據的內在特征,依據對數 據的空間探索分析,經過反復實驗,選擇最優的空間內插方法。同時,應對內插結果做嚴格的檢驗。 3.2對空間內插研究的建議 (1) 開發通用空間內插軟件??臻g內插是地理學的基本問題,也是GI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論