




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 可修改 歡送下載 精品 Word 可修改 歡送下載 精品 Word 可修改 歡送下載 精品 Word數 據 質 量 檢 查 與 質 量 控 制 要想清楚(qng chu)并深層次的了解數據(shj)質量檢查與質量(zhling)控制的原理(yunl),首先應該知道數據質量的根本(gnbn)概念以及數據誤差的來源。因為在某些情況下,數據質量問題在很大程度上可以看作是數據誤差問題。下面我就詳細的為大家介紹數據質量的根本概念和誤差來源及其分析,并就其誤差,我們再結合相應的檢查方法進行精度分析的探討。一、數據質量的根本概念1、準確性Accuracy即一個記錄值測量或觀察值與它的真實值之間的接近程度。
2、這個概念是相當抽象的,似乎人們已經知道存在這樣的事實。在實際中,測量的知識可能依賴于測量的類型和比例尺。一般而言,單個的觀察或測量的準確性的估價僅僅是通過與可獲得的最準確的測量或公認的分類進行比擬。空間數據的準確性經常是根據所指的位置、拓撲或非空間屬性來分類的。它可用誤差Error來衡量。2、精度Precision即對現象描述的詳細程度。如對同樣的兩點,精度低的數據并不一定準確度也低。精度要求測量能以最好的準確性來記錄,但是這可能誤導提供了較大的精度,因為超出一個測量儀器的準確度的數字在效率上是冗于的。因此,如果手工操作的數字化板所返回的坐標不可能依賴于比0.1mm還要準確的一個“真正的數值,
3、那么就不存在任何的點,在十分之一的地方是以mm表示的。3、空間分辨率(Spatial Resolution)分辨率是兩個可測量數值之間最小的可辯識的差異。那么空間分辨率可以看作記錄變化的最小距離。在一張用肉眼可讀的地圖上,假設一條線用來記錄一個邊界,分辨率通常由最小線的寬度來確定。地圖上的線很少以小于0.1mm的寬度來畫。在一個圖形掃描儀中最細的物理分辨率從理論上講是由設施的像元之間的別離來確定的。在一個激光打印機上這是一英寸的300分之一,而且在高質量的激光掃描儀上,這會細化十倍。如果沒有放大,最細的激光掃描儀的線是看不到的,盡管這依賴于背景顏色的對照。因此,在人的視覺分辨率和設備物理分辨率
4、之間存在著一個差異。一個相似的區別可以存在于兩個最小距離之間,即當人操作者操作數字化儀時所區別的最小距離和數字化儀硬件可以不斷地報告的最小距離。4、比例尺Scale比例尺是地圖上一個記錄的距離和它所表現的“真實世界的距離之間的一個比例。地圖的比例尺將決定地圖上一條線的寬度所表現的地面的距離。例如,在一個1:10000比例尺的地圖上,一條0.5mm寬度的線對應著5m的地面距離。如果這是線的最小的寬度,那么就不可能表示小于5m的現象。5、誤差(wch)Error定義出一個所記錄的測量和它的事實之間的準確性以后(yhu),很明顯對于大多數目的(md)而言,它的數值是不準確的。誤差研究包括:位置誤差,
5、即點的位置的誤差、線的位置的誤差和多邊形的位置的誤差;屬性誤差;位置和屬性誤差之間的關系。6、不確定性Uncertainty地理信息系統的不確定性包括空間(kngjin)位置的不確定性、屬性不確定性、時域不確定性、邏輯上的不一致性及數據的不完整性。空間位置的不確定性指GIS中某一被描述物體與其地面上真實(zhnsh)物體位置上的差異;屬性不確定性是指某一物體在GIS中被描述的屬性與其真實的屬性之差異;時域不確定性是指在描述地理現象時,時間描述上的過失;邏輯上的不一致性指數據結構內部的不一致性,尤其是指拓撲邏輯上的不一致性;數據的不完整性指對于給定的目標,GIS沒有盡可能完全地表達該物體。二、空
6、間數據質量問題的來源從空間數據的形式表到達空間數據的生成,從空間數據的處理變換到空間數據的應用,在這兩個過程中都會有數據質量問題的發生。下面按照空間數據自身存在的規律性,從幾個方面來闡述空間數據質量問題的來源。1、空間現象自身存在的不穩定性空間數據質量問題首先來源于空間現象自身存在的不穩定性。空間現象自身存在的不穩定性包括空間特征和過程在空間、專題和時間內容上的不確定性。空間現象在空間上的不確定性指其在空間位置分布上的不確定性變化;空間現象在時間上的不確定性表現為其在發生時間段上的游移性;空間現象在屬性上的不確定性表現為屬性類型劃分的多樣性,非數值型屬性值表達的不精確性。因此,空間數據存在質量
7、問題是不可防止的。2、空間現象的表達數據采集中的測量方法以及量測精度的選擇等受到人類自身的認識和表達的影響,這對于數據的生成會出現誤差。如在地圖投影中,由橢球體到平面的投影轉換必然產生誤差;用于獲取各種原始數據的各種測量儀器都有一定的設計精度,如GPS提供的地理位置數據都有用戶要求的一定設計精度,因而數據誤差的產生不可防止。3、空間數據處理中的誤差在空間數據處理過程中,容易產生的誤差有以下幾種:投影變換:地圖投影是開口的三維地球橢球面到二維場平面的拓撲變換。在不同投影形式下,地理特征的位置、面積和方向的表現會有差異。地圖數字化和掃描后的矢量化處理:數字化過程采點的位置精度、空間分辨率、屬性賦值
8、等都可能出現誤差。數據格式轉換(zhunhun):在矢量格式和柵格格式之間的數據格式轉換中,數據所表達的空間特征(tzhng)的位置具有差異性。數據抽象:在數據發生比例尺變換時,對數據進行的聚類、歸并、合并等操作時產生的誤差(wch),如知識性誤差和數據所表達的空間特征位置的變化誤差。建立拓撲(tu p)關系:拓撲過程中伴隨有數據所表達(biod)的空間特征的位置坐標的變化。與主控數據層的匹配:一個數據庫中,常存儲同一地區的多層數據面,為保證各數據層之間空間位置的協調性,一般建立一個主控數據層以控制其它數據層的邊界和控制點。在與主控數據層匹配的過程中也會存在空間位移,導致誤差。數據疊加操作和更
9、新:數據在進行疊加運算以及數據更新時,會產生空間位置和屬性值的差異。數據集成處理:指在來源不同、類型不同的各種數據集的相互操作過程中所產生的誤差。數據集成是包括數據預處理、數據集之間的相互運算、數據表達等過程在內的復雜過程,其中位置誤差、屬性誤差都會出現。數據的可視化表達:數據在可視化表達過程中為適應視覺效果,需對數據的空間特征位置、注記等進行調整,由此產生數據表達上的誤差。數據處理過程中誤差的傳遞和擴散:在數據處理的各個過程中,誤差是累計和擴散的,前一過程的累計誤差可能成為下一個階段的誤差起源,從而導致新的誤差的產生。4、空間數據使用中的誤差在空間數據使用的過程中也會導致誤差的出現,主要包括
10、兩個方面:一是對數據的解釋過程,二是缺少文檔。對于同一種空間數據來說,不同用戶對它的內容的解釋和理解可能不同,處理這類問題的方法是隨空間數據提供各種相關的文檔說明,如元數據。另外,缺少對某一地區不同來源的空間數據的說明,如缺少投影類型、數據定義等描述信息,這樣往往導致數據用戶對數據的隨意性使用而使誤差擴散。表:數據的主要誤差來源數據處理過程誤差來源數據搜集野外測量誤差:儀器誤差、記錄誤差遙感數據誤差:輻射和幾何糾正誤差、信息提取誤差地圖數據誤差:原始數據誤差、坐標轉換、制圖綜合及印刷數據輸入數字化誤差:儀器誤差、操作誤差不同系統格式轉換誤差:柵格-矢量轉換、三角網-等值線轉換數據存儲數值精度不
11、夠空間精度不夠:每個格網點太大、地圖最小制圖單元太大數據處理分類間隔不合理多層數據疊合引起的誤差傳播:插值誤差、多源數據綜合分析誤差比例尺太小引起的誤差數據輸出輸出設備不精確引起的誤差輸出的媒介不穩定造成的誤差數據使用對數據所包含的信息的誤解對數據信息使用不當三、常見空間數據的誤差(wch)分析GIS中的誤差(wch)是指GIS中數據表示與其現實世界(shji)本身的差異(chy)。數據誤差的類型可以是隨機的,也可以是系統的。歸納起來,數據的誤差主要有四大類,即幾何誤差、屬性(shxng)誤差、時間誤差和邏輯誤差。在這幾種誤差中,屬性誤差和時間誤差與普通信息系統中的誤差概念是一致的,幾何誤差是
12、地理信息系統所特有的,而幾何誤差、屬性誤差和時間誤差都會造成邏輯誤差,因此下面主要討論邏輯誤差和幾何誤差。1、誤差的類型1邏輯誤差數據的不完整性是通過上述四類誤差反映出來的。事實上檢查邏輯誤差,有助于發現不完整的數據和其他三類誤差。對數據進行質量控制或質量保證或質量評價,一般先從數據的邏輯性檢查入手。如圖1所示,其中橋或停車場等與道路是相接的,如果數據庫中只有橋或停車場,而沒有與道路相連,那么說明道路數據被遺漏,使數據不完整。圖1:各種邏輯(lu j)誤差2幾何(j h)誤差由于地圖是以二維平面坐標表達位置,在二維平面上的幾何誤差主要(zhyo)反映在點和線上。21點誤差(wch)關于某點的點
13、誤差即為測量(cling)位置x,y與其真實位置x0,y0的差異。真實位置的測量方法比測量位置的要更加精確,如在野外使用高精度的GPS方法得到。點誤差可通過計算坐標誤差和距離的方法得到。坐標誤差定義為:x=x-x0 ; y=y-y0為了衡量整個數據采集區域或制圖區域內的點誤差,一般抽樣測算x,y。抽樣點應隨機分布于數據采集區內,并具有代表性。這樣抽樣點越多,所測的誤差分布就越接近于點誤差的真實分布。22線誤差線在地理信息系統數據庫中既可表示線性現象,又可以通過連成的多邊形表示面狀現象。第一類是線上的點在真實世界中是可以找到的,如道路、河流、行政界線等,這類的線性特征的誤差主要產生于測量和對數據
14、的后處理;第二類是現實世界中找不到的,如按數學投影定義的經緯線、按高程繪制的等高線,或者是氣候區劃線和土壤類型界限等,這類線性特征的線誤差及在確定線的界限時的誤差,被稱為解譯誤差。解譯誤差與屬性誤差直接相關,假設沒有屬性誤差,那么可以認為那些類型界線是準確的,因而解譯誤差為零。另外,線分為直線(zhxin)、折線、曲線與直線混合的線圖2。GIS數據庫中用兩種方法表達(biod)曲線、折線,圖3對這兩類誤差(wch)作了對照。圖2:各種( zhn)線直線(zhxin)、折線、曲線圖3:折線和曲線的誤差線誤差分布可以用Epsilon帶模型來描述,它由沿著一條線以及兩側定寬的帶構成,真實的線以某一概
15、率落于Epsilon帶內。Epsilon帶是等寬的類似于后面講述的緩沖區,不過其意義不同,在此根底上,誤差帶模型被提出,與Epsilon帶模型相比,它在中間最窄而在兩端較寬。基于誤差帶模型,可以把直線與折線誤差分布的特點分別看作是“骨頭型或者“車鏈型的誤差分布帶模式圖4。圖4:折線誤差的分布對于曲線的誤差分布或許應當考慮“串腸型模式圖5。圖5:曲線的誤差分布2、地圖數據的質量問題地圖數據是現有地圖經過數字化或掃描處理后生成的數據。在地圖數據質量問題中,不僅含有地圖固有的誤差(wch),還包括圖紙變形、圖形數字化等誤差。1地圖固有誤差:是指用于數字化的地圖本身所帶有的誤差,包括控制點誤差、投影誤
16、差等。由于這些誤差間的關系很難確定,所以很難對其綜合誤差作出準確評價。如果假定綜合誤差與各類誤差間存在(cnzi)線性關系,即可用誤差傳播定律來計算綜合誤差。2材料變形產生(chnshng)的誤差:這類誤差是由于圖紙的大小受濕度和溫度變化的影響而產生的。溫度不變的情況下,假設(jish)濕度(shd)由0%增至25%,那么紙的尺寸可能改變1.6%;紙的膨脹率和收縮率并不相同,即使濕度又恢復到原來的大小,圖紙也不能恢復原有的尺寸,一張6英寸的圖紙因濕度變化而產生的誤差可能高達0.576英寸。在印刷過程中,紙張先隨溫度的升高而變長變寬,又由于冷卻而產生收縮。3圖象數字化誤差:數字化方式主要有跟蹤數
17、字化和掃描數字化兩種。跟蹤數字化一般有點方式和流方式兩種工作方式,前者在實際工作中使用較多,后者進行數字化所產生的誤差要比前者大得多。此外,還有不同數據的錄入方式對數據質量的影響問題,主要包括跟蹤數字化和掃描數字化。跟蹤數字化:影響其數據質量的因素主要有:數字化要素對象、數字化操作人員、數字化儀和數字化操作。其中,數字化要素對象:地理要素圖形本身的高度、密度和復雜程度對數字化結果的質量有著顯著影響,如粗線比細線更易引起誤差,復雜曲線比平直線更易引起誤差,密集的要素比稀疏的要素更易引起誤差等;數字化操作人員:數字化操作人員的技術與經驗不同,所引入的數字化誤差也會有較大的誤差,這主要表現在最正確采
18、點點位的選擇、十字絲與目標重疊程度的判斷能力等方面,另外,數字化操作人員的疲勞程度和數字化的速度也會影響數字化的質量;數字化儀的分辨率和精度對數字化的質量有著決定性的影響;數字化操作方式也會影響到數字化數據的質量,如曲線采點方式流方式或點方式和采點密度等。掃描數字化:掃描數字化采用高精度掃描儀將圖形、圖象等掃描并形成柵格數據文件,再利用掃描矢量化軟件對柵格數據文件進行處理,將它轉換為矢量圖形數據。矢量化過程有兩種方式:即交互式和全自動。影響掃描數字化數據質量的因素包括原圖質量如清晰度、掃描精度、掃描分辨率、配準精度、校正精度等。3、遙感數據的質量問題遙感數據的質量問題,一局部來自遙感儀器的觀測
19、過程,一局部來自遙感圖象處理和解譯過程。遙感觀測過程本身存在著精確度和準確度的限制,這一過程產生的誤差主要表現為空間分辨率、幾何畸變和輻射誤差,這些誤差將影響遙感數據的位置和屬性精度。遙感圖像處理和解譯過程,主要產生空間位置和屬性方面的誤差。這是由圖像處理中的影像或圖像校正和匹配以及遙感解譯判讀和分類引入的,其中包括混合像元的解譯判讀所帶來的屬性誤差。4、測量數據的質量(zhling)問題測量(cling)數據主要指使用大地測量、GPS、城市測量、攝影測量和其他一些測量方法直接(zhji)量測所得到的測量對象的空間位置信息。這局部(jb)數據(shj)質量問題,主要是空間數據的位置誤差。空間數
20、據的位置通常以坐標表示,空間數據位置的坐標與其經緯度表示之間存在著某誤差因素,由于這種誤差因素無法排除,一般也不作為誤差考慮。測量方面的誤差通常考慮的是系統誤差、操作誤差和偶然誤差。系統誤差的發生與一個確定的系統有關,它受環境因素如溫度、濕度和氣壓等、儀器結構與性能以及操作人員技能等方面的因素綜合影響而產生。系統誤差不能通過重復觀測加以檢查或消除,只能用數字模型模擬和估計。操作誤差是操作人員在使用設備、讀書或記錄觀測值時,因粗心或操作不當而產生的。應采用各種方法檢查和消除操作誤差。一般地,操作誤差可通過簡單的幾何關系或代數檢查驗證其一致性,或通過重復觀測檢查并消除操作誤差。偶然誤差是一種隨機性
21、的誤差,由一些不可測和不可控的因素引入。這種誤差具有一定的特征,如正負誤差出現頻率相同、大誤差少、小誤差多等。偶然誤差可采用隨機模型進行估計和處理。四、空間數據質量控制數據質量控制是個復雜的過程,要控制數據質量應從數據質量產生和擴散的所有過程和環節入手,分別用一定的方法減少誤差。空間數據質量控制常見的方法有:1、傳統的手工方法質量控制的人工方法主要是將數字化數據與數據源進行比擬,圖形局部的檢查包括目視方法、繪制到透明圖上與原圖疊加比擬,屬性局部的檢查采用與原屬性逐個比照或其他比擬方法。2、元數據方法數據集的元數據中包含了大量有關數據質量的信息,通過它可以檢查數據質量,同時元數據也記錄了數據處理
22、過程中質量的變化,通過跟蹤元數據可以了解數據質量狀況和變化。3、地理相關法用空間數據的地理特征要素自身的相關性來分析數據的質量。如從地表自然特征的空間分布著手分析,山區河流應位于微地形的最低點,因此,疊加河流和等高線兩層數據時,如河流的位置不在等高線的外凸連線上,那么說明兩層數據中必有一層數據有質量問題,如不能確定哪層數據有問題時,可以通過將它們分別與其它質量可靠的數據層疊加來進一步分析。因此,可以建立一個有關地理特征要素相關關系的知識庫,以備各空間數據層之間地理特征要素的相關分析之用。五、數據(shj)質量檢查GIS的質量主要(zhyo)是指數據的質量,而GIS的空間數據主要來自直接(zhji)測量、遙感與攝影測量(cling)以及數字化方法等。GIS空間數據的精度(jn d)分析與質量控制的研究可以追索到測繪科學中的經典誤差分析和測量平差理論。所以GIS的數據檢查主要表現在:1、定位精度的檢驗,具體如下:1數學根底:經緯網、控制點、圖廓點的坐標值是否標準;2平面精度:測量數據抽樣50個點,20條邊與鄰近控制點或鄰近點的誤差、數字化數據分層輸出再與原圖疊加;3高程精度:測量數據實地檢查、數字化數據;4接邊精度:允許幾何裂縫不允許邏輯裂縫。2、屬性精度的檢驗。3、邏輯一致性與完整性的檢驗。4、拓撲關系的檢查:多邊形是否閉合、遺漏的多邊形。總的來說,數據質量的檢查,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 監工合同協議書模板
- 電商培訓合同協議模板
- 田徑協議書模板
- 甲方無責任合同協議
- 電商外包咨詢合同協議
- 電臺配件出售合同協議
- 電梯廣告租合同協議
- 2025年新網購平臺產品運營合作合同7篇
- 遙感城市規劃與設計-全面剖析
- 貨幣經紀公司風險評估模型構建-全面剖析
- 四川省項目建設工作咨詢以下收費標準
- 眼屈光檢查 屈光參差的屈光狀態分析
- 公路路面基層施工技術規范
- 高中生生涯規劃講座稿
- GB/T 4423-2007銅及銅合金拉制棒
- GB/T 34943-2017C/C++語言源代碼漏洞測試規范
- GB/T 18959-2003木材保管規程
- 交互設計1課件
- 光學信息處理第六章光學圖像識別課件
- 甜菜堿含量檢測試劑盒說明書-可見分光光度法UPLC-MS-4566
- 經濟適用房申請表好的范本
評論
0/150
提交評論