基于關系數據庫的模式匹配技術研究_第1頁
基于關系數據庫的模式匹配技術研究_第2頁
基于關系數據庫的模式匹配技術研究_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于關系數據庫的模式匹配技術研究<      摘  要隨著 網絡 技術的 發展 ,信息處理需要對大量的、異構的數據源的數據進行統一存取,多源異構數據的集成問題就顯得十分重要。而模式匹配是數據集成領域的一個基本技術。文章提出一種解決關系數據庫語義沖突問題的模式匹配技術,以實現異構數據的共享與互操作。    關鍵詞 數據集成;模式匹配;語義沖突 1  引言    隨著 計算 機及網絡技術的快速發展,網絡上的各種信息以指數級爆炸性增長,成為了一個巨大的信息

2、庫,同時各 企業 單位開發了大量的軟硬件平臺各異的應用系統,在各種應用系統下又積累了豐富的數據資源。這樣就形成了成千上萬個異構的數據源,多為傳統的關系數據庫數據。這些數據資源由于軟硬件平臺各異、數據模型各異而形成了異構數據,使各數據源間的互操作變得復雜。為了更好地利用這些異構信息,以及不造成 企業 應用系統的重復建設和數據資源的浪費,模式匹配技術吸引了眾多關注。本文針對模式匹配過程中存在的語義沖突進行分類,并提出了相應的解決策略,以達到異構數據源的共享和互操作。2  模式匹配中的沖突問題    在數據集成領域中,由于數據源系統多是獨立開發,數據源是相對自

3、治的,因此描述數據的數據模型或存儲結構經常會出現模式的不一致,數據源的自治性和數據源模式的異構性使數據源在共享和互操作上存在了語義沖突。這些正是模式匹配的焦點問題,它們形式上的性質使得人們很容易想到要用模式匹配去解決邏輯、語義和知識的描述問題。    對于描述模式匹配中的語義沖突有兩種較有代表性的分類4。第一種分類將沖突分為異類沖突、命名沖突、語義沖突和結構沖突。第二種分類主要是對第一類異類沖突概念的一個細致的改進,但和其它分類仍有細微的不同,它把異類沖突看作是語義不一致的一類(如語義沖突),把沖突分為命名沖突、域沖突、元數據沖突、結構沖突、屬性丟失和硬件/軟件不

4、同。    模式匹配是一項復雜而繁重的任務,所能集成的數據源越來越多,上述沖突情況也會越來越普遍,想解決所有的模式沖突是不現實的。本文主要解決關系數據模式之間的語義沖突。3  模式匹配中的語義沖突    本文所提出的模式匹配方法是根據關系數據庫的特點設計的。關系數據庫中關系的基本單位是屬性,屬性本身就包含著語義信息,因此異構數據源語義相似性就圍繞著數據源模式中的屬性來進行,并在匹配的過程中解決異構數據源模式之間的一系列語義沖突。3.1  語義匹配體系結構    本文提出的語義匹配體系結

5、構采用數據集成中的虛擬法數據集成系統的典型體系結構,采用將局部模式匹配到全局模式的語義匹配體系結構,自下而上地建立全局模式。首先進行模式轉化,消除因各種局部數據模式之間的差異所帶來的影響,解決各種局部模式之間的語義沖突等,然后在轉化后的模式的基礎上進行模式匹配,其主要手段是提供各數據源的虛擬的集成視圖。    數據仍保存在各數據源上,集成系統僅提供一個虛擬的集成視圖和對該集成視圖的查詢的處理機制。系統能自動地將用戶對集成模式的查詢請求轉換成對各異構數據源的查詢。在這種體系結構中,中間層根本不實際存儲數據,當客戶端發出查詢請求時,僅是簡單地將查詢發送到適當的數據源上

6、。由于該方法不需要重復存儲大量數據,并能保證查詢到最新的數據,因此比較適合于高度自治、集成數量多且更新變化快的異構數據源集成。    本文中的語義匹配的體系結構如圖1所示。3.2  關系數據庫模式中語義沖突問題分類及其解決策略    大多數數據庫系統提供了一套概念結構來對現實世界的數據進行建模。每一個概念結構被認為是一個類型,它可以是一種復雜類型或一種基本類型。類型和它所表示的數據間的聯系就稱為語義3。    在關系數據庫中,一個關系模式是一個有序對(R,c),其中R為模式所指向的關系(表)的名

7、稱,而c則為具有不同名稱的屬性的有限集。同時,屬性也是一個有序對(N,D),其中N為屬性的名稱,而D則為一個域。可以看出關系模式的基本單位是屬性。屬性本身就包含著語義信息,因此模式語義相似性就圍繞模式中的屬性來進行,并在模式匹配的過程中解決異構數據庫模式之間的一系列語義沖突。圖 1  語義匹配體系結構    根據語義的定義,在關系數據庫系統中,語義系統是由模式、模式的屬性、模式中屬性之間的聯系和模式間的屬性之間的聯系構成。這里將語義分為3級:模式級、屬性級和實例級。下面將異構模式中存在的語義沖突問題進行了分類,并闡述了各種語義沖突的解決策略: 1  2    下一頁                 【內容導航】         第1頁:基于關系數據庫的模式匹配

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論