不完備模糊信息系統中的模糊分類_第1頁
不完備模糊信息系統中的模糊分類_第2頁
不完備模糊信息系統中的模糊分類_第3頁
不完備模糊信息系統中的模糊分類_第4頁
不完備模糊信息系統中的模糊分類_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

不完備模糊信息系統中的模糊分類

摘要考慮既有模糊屬性,又有不確定屬性值的不完備模糊信息系統,采用兩種不同的數據補齊方式來討論對象之間的相似程度,建立了一種新的模糊容差關系以對不完備模糊信息系統中的對象進行模糊分類。在此基礎上,新定義了不完備模糊信息系統中模糊知識的粗糙熵,并進行了相關性質的探討。關鍵字不完備模糊信息系統;模糊容差關系;熵

1引言粗糙集理論[1,2](RoughSetTheory,RST)是由波蘭學者Pawlak于上世紀八十年代初提出的一種處理含糊和不精確性問題的新型數學工具。傳統粗集模型的處理對象是具有離散屬性值的完備信息系統(CompleteInformationSystem,CIS),并且Pawlak所做的工作都是基于這樣一個假設,即CIS中的知識是確定的。然而,模糊集的創始人Zadeh告訴我們現實世界中的大部分知識不是精確而是模糊的,因此對于客觀存在的模糊信息系統[3,4](FuzzyInformationSystem,FIS)的研究不僅是必要的,而且相對于CIS的研究來說,具有更為廣泛的意義。不完備模糊信息系統(IncompleteFuzzyInformationSystem,IFIS)是一種更為復雜的信息系統形式,其中既有模糊知識,又可能存在未知的模糊屬性值。由于RST建立在分類機制的基礎上,所以對于IFIS,文獻首先采用數據補齊方式來處理未知的模糊屬性值,然后建立了IFIS中的模糊容差關系以進行對象的模糊分類,并進行了模糊知識的約簡研究。文獻在IFIS中進行數據補齊時簡單地將未知模糊屬性值用模糊屬性的全體值域來填充,然而經過筆者的研究,發現這種簡單的數據補齊方式并不能很完整地刻畫對象之間的模糊相似程度。因此,本文中采用了兩種不同的數據補齊方式來處理不確定模糊屬性值,分別得到對象間相似程度的樂觀和悲觀估計,從而構成相似度的估計區間,由此建立的新的模糊容差關系實際上是文獻中的模糊容差關系的一種推廣形式。本文的主要內容安排第一節簡要介紹模糊信息系統中的相關知識;第二節采用兩種不同的數據補齊方式處理未知模糊屬性值,建立了一種新的模糊容差關系;第三節重新定義了不完備模糊信息系統中模糊知識的粗糙熵,并進行了相關性質的討論;第四節總結全文。

2不完備模糊信息系統定義1一個模糊信息系統(FIS)為二元組S=〈U,AT〉,其中U是一個非空有限對象集合,稱為論域,U上的模糊子集族記為F(U),AT為模糊屬性集合。令S為一FIS,對于,有a:U→Va,Va表示模糊屬性a的值域;對于,a(x)表示x在模糊屬性a上的取值,即為Va的一模糊子集;對于表示x在模糊屬性a上取值為v的可能性程度且。FIS是集值信息系統、完備信息系統[1,2]的拓展形式,若對于,有,則FIS就退化為集值信息系統;更進一步地,若有,則FIS就退化成為完備信息系統,由此可見,FIS是CIS的一種廣義化的表現形式。但是,由于FIS中存在的是模糊知識,因此經典粗集理論中的不可分辨關系已不再適用,取而代之的是模糊等價關系或其他更弱的模糊二元關系。定義2設S為一FIS,對于,定義二元模糊關系如下所示:,其中x,y∈U.關系Ra(x,y)表示對象x與y在模糊屬性a上取值的相似程度,對于,有Ra(x,y)∈[0,1],容易驗證Ra滿足自反性和對稱性,但并不一定滿足傳遞性,因此稱Ra為一個模糊容差關系。命題1設S為一FIS,對于,則由模糊屬性集合A決定的模糊容差關系記為RA且,其中x,y∈U.定義3設S為一FIS,其中,對于,則x基于RA的模糊容差類記為F(a)(x)且在Pawlak所討論的CIS的基礎上,已有很多學者將信息系統的概念進一步拓展,討論了其中存在未知屬性值的情況,這種未知屬性值類似于關系數據庫系統中的“Null”值,稱這種信息系統為不完備信息系統[7~9](IncompleteInformationSystem,簡稱IIS).對于IIS,一般來說有2種處理方式:①間接處理,即數據補齊或數據刪除,將IIS轉化為CIS來處理;②直接處理,對不可分辨關系進行擴展,建立了容差關系、相似關系、限制容差關系等較弱的二元關系。對于模糊信息系統來說,由于數據測量的誤差、對數據理解或獲取的限制等原因,也可能存在數據遺漏等不完備、不確定的情況。設S為一FIS,當且僅當至少存在一個不確定值使得a(x)=*,則稱其為不完備模糊信息系統(IncompleteFuzzyInformationSystem,IFIS).

3數據補齊方式在FIS中,我們不能說一個對象是否完全屬于一個模糊容差類,而只能稱這個對象以何種程度屬于某個模糊容差類,因此對于IFIS中的未知模糊屬性值,只能采用間接方式進行處理。定義4設S為一IFIS,其中a∈AT,對于,則x與y的樂觀相似度表示為RaOPT:RaOPT(x,y)=Ra(x,y),其中a(x)=*=a(x)=Va.定義4是文中的模糊分類方法,a(x)=*=a(x)=Va表示x在模糊屬性a上確實有可能取值,只是由于某些原因目前無法取何值,因此假定所取的值為a的值域。關系RaOPT(x,y)表示對象x與y在模糊屬性a上的相似程度的最大值。命題2設S為一IFIS,其中a∈AT,x,y∈U,若a(x)=*且a(y)1*,則。證明:根據定義4,因為a(x)=*,所以假設a(x)=Va,那么對于,就有a(x)(v)∧a(y)(v)=a(y)(v),再由定義2就可以得到。特別地,若a(x)=*且a(y)=*,則RaOPT(x,y)=1。表1是文用來分析的一個不完備模糊信息系統,其中a(O7)=b(O3)=c(O3)=*,由定義4,可以得到RaOPT(O2,O7)=1,RaOPT(O2,O3)=1,RaOPT(O2,O3)=1.然而,若假設a(O7)=/H+1/N,可以求得O2與O7之間的相似程度為,這個結果與RaOPT差距很大,所以說僅僅用RaOPT并不能客觀地表示具有不完備模糊屬性值的對象之間的相似程度,于是引入對象間的悲觀相似度如定義5所示。表1不完備模糊信息系統

UabcHNLRSTmnpOOO3100******O4011001010OOO7***O定義5設S為一IFIS,其中a∈AT,對于"x,y∈U,則x與y的悲觀相似度表示為RaPES:RaPES(x,y)=Ra(x,y),其中a(x)=*=a(x)=φ.在定義5中,我們使用空集來替代“*”,這樣做的目的是由于目前的模糊屬性值未知,所以就假定這樣的模糊屬性值是不存在的。命題3設S為一IFIS,其中a∈AT,x,y∈U,若a(x)=*,則對于,有RaPES(x,y)=0。證明:因為a(x)=*,所以根據定義5,就可以假設a(x)=φ,即。那么根據定義2就可以得到,其中v∈Va,所以RaPES(x,y)=0。命題3說明了由于未知模糊屬性值被認為是不存在的,所以具有未知模糊屬性值的對象與其他對象的相似度就為0,即兩者之間被認為是不可比的。

例如對于表1所示的IFIS,根據定義5,可以得到RaPES(O2,O7)=0,RaPES(O2,O3)=0,RaPES(O2,O3)=0。通過對表1的分析可以發現,根據兩種不同的數據補齊方式,可以分別求得兩種不同的模糊相似程度。對于具有不完備模糊屬性值的對象來說,樂觀相似度表示了兩對象間的最大可能的相似程度,而悲觀相似度表示了兩對象間的最小可能的相似程度,即為0。綜上,具有不完備模糊屬性值的對象之間的相似程度實際上是落在一個區間值范圍內,這個區間的上下界分別是樂觀、悲觀相似度。命題4設S為一IFIS,對于,若a(x)=*且a(y)≠*,則x與y的模糊相似程度,其中x,y∈U.特別地,若a(x)=*且a(y)=*,則R’a(x,y)∈[0,1]。命題4表示了具有未知模糊屬性值的對象與其他對象之間的模糊相似程度實際上是不確定的,落在一個區間范圍內。在進行模糊知識約簡時,可以設置一個閾值,根據不同的需求選取不同的模糊相似程度。設S為一IFIS,其中A,對于,y∈U,記B(x,y)={a∈A:a(x)1*∧a(y)≠*}.定義6設S為一IFIS,其中,對于,y∈U,則由A決定的模糊容差關系記為R’A且由定義6可以看出,由于在模糊信息系統中出現了模糊屬性值不完備的情況,因此將x與y的模糊相似程度分成兩部分來計算。表示根據具有完備屬性值的屬性,計算出x與y確切的相似度;表示對于具有不完備性屬性值的屬性,利用悲觀和樂觀估計,分別計算出兩對象之間的相似度的區間值,然后利用閾值a在相似區間上確定一個模糊相似度,其中a∈[0,1],由決策者選擇。可以看出,若取a=1,則R’A(x,y)表示的是對象間的樂觀相似度;若取a=0,則R’A(x,y)表示的是對象間的悲觀相似度。例如對于表1所示的不完備模糊信息系統,有B(O2,O7)={b,c},則,,若設a=,則R’A(O2,O7)=,若設a=1,則R’A(O2,O7)=定義7設S為一IFIS,,對于"x∈U,則x基于R’A的模糊容差類記為F’(A)(x)且例如對于表1所示的IFIS,A={a,b,c},若設a=,則可得到對象的模糊容差類如下所示:F’(A)(O1)=1/O1+1/O2+/O3+0/O4+0/O5+/O6+0/O7+0/O8F’(A)(O2)=1/O1+1/O2+/O3+/O4+/O5+/O6+/O7+/O8F’(A)(O3)=/O1+/O2+1/O3+0/O4+0/O5+/O6+/O7+0/O8F’(A)(O4)=0/O1+/O2+0/O3+1/O4+0/O5+0/O6+/O7+1/O8F’(A)(O5)=0/O1+/O2+0/O3+0/O4+1/O5+/O6+0/O7+/O8F’(A)(O6)=/O1+/O2+/O3+0/O4+/O5+1/O6+0/O7+/O8F’(A)(O7)=0/O1+/O2+/O3+/O4+0/O5+0/O6+1/O7+/O8F’(A)(O8)=0/O1+/O2+0/O3+1/O4+/O5+/O6+/O7+1/O8由以上分析可以看出,使用對象間相似度的樂觀和悲觀估計可以更為客觀、完整地刻畫具有不完備模糊屬性值的對象之間的模糊相似程度。在一個IFIS中,若令U/R’A表示所有模糊容差類的集合,即U/R’A={F’(A)(x):x∈U},則U/R’A構成了論域上的一個模糊覆蓋[10]。

4模糊知識的粗糙熵在Pawlak研究的完備信息系統中,梁吉業[11]等人將信息熵的概念引入其中,建立了知識的粗糙熵及粗糙集的粗糙熵的概念,用于度量知識和粗糙集的不確定性。定義8設在一完備信息系統中,R是論域U上的一等價關系,由等價關系R形成的論域劃分U/R={P1,P2,?,Pm},則知識R的粗糙熵記為E(R)且.定義9設S為一IFIS,對于,模糊知識A的粗糙熵記為E(A)且,其中|F’(a)(x)|表示模糊集合F’(a)(x)的基數且.若設由模糊知識A所形成的模糊容差類構成了論域上的一個劃分,即U/R’A={X1,X2,?,Xn},且對于,有Xi∩Xj=φ,于是可做如下形式的推導由以上推導過程可以看出,定義9中的模糊知識的粗糙熵實際上是定義8中粗糙熵的一種推廣形式。命題5設S為一IFIS,若,則有.命題6設S為一IFIS,對于,,有E(A∪B)≤min(E(A),E(B)),E(A∩B)≥max(E(A),E(B)).

5結束語IFIS是一種既具有模糊知識又具有不確定性信息的特殊信息系統,相比于傳統RST所研究的信息系統來說,具有更廣義的形式。筆者使用兩種不同的數據補齊方式來處理IFIS中的未知屬性值,從而定義了一種新的模糊容差關系,使得對象間相似程度的刻畫更為客觀。在此基礎上,對IFIS中的模糊知識的粗糙熵給出了新的定義,取得了一些重要結論。在今后的工作中,筆者將根據本文所建立的模糊容差關系設計IFIS中的知識約簡算法,進行模糊決策分析的研究。

參考文獻[1]PawlakZ.Roughsettheoryanditsapplicationstodataanalysis[J].JournalofCyberneticsandSystems,1998,29:661~688PawlakZ.Roughsetsandintelligentdataanalysis[J].JournalofInformationSciences,2002,147:1~12WuWeizhi,ZhangWenxiu,LiHuaizu.Knowledgeacquisitioninincompletefuzzyinformationsystemsviatheroughsetapproach[J].ExpertSystems,2003,20(5):280~286BoscP,KraftD,PetryF.Fuzzysetsindatabaseandinformationsystems:statusandopportunities[J].FuzzySetsandSystems,2005,156(3):418~426張鈴,張鈸.模糊商空間理論(模糊粒度計算方法)[J].軟件學報,2003,14(4):770~776張文修,吳偉志.信息系統與知識發現[M].西安交通大學出版社,2003Kr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論