粗糙集理論-研究現狀與發展前景課件_第1頁
粗糙集理論-研究現狀與發展前景課件_第2頁
粗糙集理論-研究現狀與發展前景課件_第3頁
粗糙集理論-研究現狀與發展前景課件_第4頁
粗糙集理論-研究現狀與發展前景課件_第5頁
已閱讀5頁,還剩84頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

粗糙集理論

--研究現狀與發展前景粗糙集理論

--研究現狀與發展前景主要內容研究背景粗糙集基本理論粗糙集與知識表達與其它處理不確定性問題方法的關系粗糙集理論的應用與發展前景參考文獻主要內容研究背景研究背景粗糙集(RoughSets)是波蘭數學家Z.Pawlak于1982年提出的[1](為開發自動規則生成系統及研究軟計算問題而引入)。由于最初關于粗糙集理論的研究大部分是用波蘭語發表的,因此當時沒有引起國際計算機學界和數學界的重視。研究地域也局限在東歐一些國家,直到80年代末才引起各國學者的注意。九十年代初,人們才逐漸認識到它的意義。1992年在波蘭Kiekrz召開了第一屆國際RS研討會。這次會議著重討論了集合近似定義的基本思想及應用,其中RS環境下的機器學習基礎研究是這次會議的四個專題之一。研究背景粗糙集(RoughSets)是波研究背景(續)1993年在加拿大Banff召開第二屆國際RS理論與知識發現研討會。這次會議積極推動了國際上對RS理論與應用的研究。由于當時正值KDD(數據庫知識發現)成為研究的熱門話題,一些著名KDD學習者參加這次會議,并且介紹了許多應用擴展RS理論的知識發現方法與系統。1996年在日本東京召開了第5屆國際RS研討會,推動了亞洲地區對RS理論與應用的研究。1995年,ACMCommunication將其列為新浮現的計算機科學的研究課題。研究背景(續)1993年在加拿大Banff召開第二屆研究背景(續)1998年,國際信息科學雜志(InformationSciences)為粗糙集理論的研究出了一期專輯[2,3]。第一屆中國RS理論與軟計算學術研討會,于2001年5月在重慶舉行。第二屆中國RS理論與軟計算學術研討會,于2002年10月在蘇州大學舉行。第三屆中國RS理論與軟計算學術研討會,于2003年8月在重慶舉行。第四屆中國RS理論與軟計算學術研討會,將于2004年在舟山舉行。研究背景(續)1998年,國際信息科學雜志(Info

粗糙集的理論及應用的文章主要發表在以下雜志國內:1.模式識別與人工智能2.軟件學報3.科學通報4.計算機科學5.計算機學報6.模糊系統與數學7.計算機應用與軟件8.計算機研究與發展9.計算技術與自動化粗糙集的理論及應用的文章國內:1.模式識別與人工

粗糙集的理論及應用的文章主要發表在以下雜志(續)國際:1.InformationSciences2.Fuzzysetsandsystems3.InternationalJournalofComputerandInformationSciences4.CommunicationoftheACM5.ComputationalIntelligence6.Journalofcomputerandsystemsciences

粗糙集的理論及應用的文章國際:1.Informa7.AIMagazine8.AICommunications9.EuropeanJournalofOperationalResearch10.InternationalJournalofApproximateReasoning11.Theoreticalcomputersciences12.DecisionsupportSystems13.InternationalJournalofMan-Machinestudies14.FundamentaInformaticae15.IntelligentAutomationSciences7.AIMagazine粗糙集理論粗糙集理論是一種處理不精確、不確定與不完全數據的新的數學方法。由于它在機器學習與知識發現、數據挖掘、決策支持與分析、專家系統、歸納推理、模式識別等方面的廣泛應用,現已成為一個熱門的研究領域[2]。RS理論主要興趣在于它恰好反映了人們用Rough集方法處理不分明問題的常規性,即以不完全信息或知識去處理一些不分明現象的能力。或依據觀察,度量到的某些不確定的結果而進行分類數據的能力[4]。粗糙集理論粗糙集理論是一種處理不精確、不確定粗糙集理論的基本概念RS理論認為知識即是將對象進行分類的能力,假定我們起初對全域里的元素(對象)具有必要的信息、或知識,通過這些知識能夠將其劃分到不同的類別。若我們對兩個元素具有相同的信息,則它們就是不可區分的(即根據已有的信息不能夠將其劃分開)。顯然這是一種等價關系。不可區分關系是RS理論最基本概念。在此基礎上引入了成員關系,上近似和下近似等概念來刻劃不精確性與模糊性[1,2,4,5]。粗糙集理論的基本概念RS理論認為知識即是將對象進行樣本粗糙集方法處理具有優化指標的樣本評審樣本學習樣本數據預處理(粗糙集方法、模糊集方法)模糊、粗糙推理神經網絡遺傳算法智能信息系統樣本粗糙集方法處理具有優化指標的樣本評審樣本學習樣

設U是非空有限論域(全域、集合),R是U上的二元等價關系(具有相反、對稱、傳遞性的關系),R稱為不可分辨關系。序對A=(U,R)稱為近似空間。,若,則稱對象x與y在近似空間A中是不可分辨的。U/R是U上由R生成的等價類全體,它構成U的一個劃分,U上的劃分可以與U上的二元等價關系之間建立一一對應。

基本概念基本概念

U/R中的元素(集合)稱為U的基本集或原子集,任意有限個基本集的并稱為可定義集,空集也稱為可定義集(可定義集也稱為精確集)。否則稱為不可定義集。若將U中的集合稱為概念或表示知識,則A=(U,R)稱為知識庫,原子集(基本集)表示基本概念或知識模塊。那么精確集可以在知識庫中被精確地定義或描述,可表示已知的知識。

基本概念(續)基本概念(續)

上近似,下近似

對于一個近似空間A=(U,R),X是U的任意一個子集。X不一定能用知識庫中的知識來精確地描述;即X可能為不可定義集,這時就用X關于A的一對下近似、上近似來“近似”地描述。下面表示x所在的R-等價類。

稱為集合X關于R的下近似。=稱為集合X關于R的上近似。上近似,下近似對于一個近似空間A=(U,R),粗糙集理論--研究現狀與發展前景課件

例1

給定一玩具積木的集合,并假設這些積木有不同的顏色(紅、黃、藍),形狀(方、圓、三角)和體積(大、小)。積木的集合U可按顏色、形狀、體積分類。:顏色關系,:形狀關系,:體積。則例1給定一玩具積木的集合

例1(續)

取,那么

例1(續)取下近似也稱為X關于近似空間A的正域,記為pos(X)。解釋為:由那些根據現有知識判斷出肯定屬于X的對象所組成的最大集合。上近似可以解釋為:由那些根據現有知識判斷出可能屬于X的對象所組成的最小集合。稱作X關于A的負域,記為neg(X)。解釋為:由那些根據現有知識判斷肯定不屬于X的對象所組成的集合。

下近似也稱為X關于近似空間A的正域,

稱作X的邊界(域)記為BND(X)。解釋為:由那些根據現有知識判斷出可能屬于X但不能完全肯定是否一定屬于X的對象所組成的集合[5]。(上下近似之差,即:)

X是可定義;X是不可定義的,此時稱X在近似空間A中是粗糙集。同時,稱為粗糙代數系統[6],其中∽表示集合補。

粗糙集的幾種表示①稱二元對為Rough集(粗糙集)可認為Rough集的另一種表示形式,這種定義方式可直接算出U上關于其子集X的含糊元素數目。這種邊界區意味著由于掌握的知識不完全而存在不能辨別的區域,即bnd(X)上的元素不可分辨,所以U上子集X關于U上不分明關系R是Rough的,主要是,否則它是可分辨的。一個集合X的邊界區域越大,則這個集合X的含糊元素也越多,這種思想可以用數值化的系數表示。粗糙集的幾種表示①稱二元對粗糙集的幾種表示(續)③,cardX表X的基數。稱為X的近似精度,(粗糙程度。于是也可用來定義Rough集。當,稱U上子集X關于U上不分明關系R是Rough的;當,稱X關于R是精確的;可被用作Rough邏輯中的算子。粗糙集的幾種表示(續)③粗糙集的幾種表示(續)④在Rough集上也有元素隸屬于集合的問題(與Fuzzy集一樣)。設,

,則。稱為Rough隸屬函數,解釋為一種條件概率,能從全域上的個體加以計算。Fuzzy集上的隸屬函數則不然。用來定義Rough集,則得到Rough集的第四種表示形式。粗糙集的幾種表示(續)④在Rough集上也有元素隸屬于集合的粗糙集的幾種表示(續)若存在,有,稱X關于R是Rough的,若對每個,有,則X關于R是精確的。相反地,Rough隸屬函數可用來定義一個集合的上、下近似集及邊界集

粗糙集的幾種表示(續)若存在,有粗糙集的幾種表示(續)無論哪一種Rough集的表示形式都離不開全域U上的不分明關系R以及由R定義的下和上近似集。因此對Rough集理論中的不分明關系以及下和上近似集的研究尤其重要。定義觀點的不同往往帶來研究的側重面的不同。

粗糙集的幾種表示(續)X關于A的度量

X關于A的近似質量:近似質量反映了知識X中肯定在知識庫中的部分在現有知識中的百分比。X關于A的粗糙性測度:則,且X是可定義的X是粗糙的。粗糙性測度反映了知識的不完全程度。X關于A的度量X關于A的近似質量:X關于A的度量(續)

X關于A的近似精度:它反映了根據現有知識對X的了解程度[2,5]。

X關于A的度量(續)X關于A的近似精度:集合類關于近似空間的下近似、上近似設是由U的子集所構成的集類。則F關于近似空間A的下近似F和上近似F:F關于A的近似精度集合類關于近似空間的下近似、上近似設集合類關于近似空間的下近似、上近似近似質量為當F也是U的劃分時,F關于A的近似在判別一個決策表是否是協調的和規則提取中有重要作用。集合類關于近似空間的下近似、上近似近似質量為粗糙集理論中的知識表示

信息系統屬性的約簡及核規則的協調與提取粗糙集理論中的知識表示信息系統屬性的約簡

信息系統粗糙集理論中的知識表達方式一般采用信息表或稱為信息系統的形式。信息表表示輸入數據,這些數據是從任意領域中收集的。信息系統可用四元有序組表示,其中U是對象的全體,即論域;A是屬性全體;,是屬性a的值域;是一個信息函數,反映了對象x在K中的完全信息[5,10]。如下信息表:信息系統粗糙集理論中的知識表達方式一般采用信息表或稱為對象屬性頭痛肌肉痛體溫決策流感是是正常

否是是高

是是是很高

是否是正常否否否高否否是很高

是表1信息表對象屬性決策是是

信息系統(續)標記被稱為實例(個體,實體,對象),記。識別兩種變量:屬性(有時稱之為條件屬性),決策(有時稱之為決策屬性)。例如:如果信息表描述一家醫院,每個實例可能就是病人,屬性是癥狀和檢測,而決策是病癥。如果信息表表示一個工業生產過程,則這些實例可代表在某些特定時刻及時采集的過程中的樣品,屬性是過程中的參數,而決策是由操作員(專家)采取的決定。信息系統(續)標記

信息系統(續)RS理論的一個重要概念是不分明關系,它通常與一屬性集合聯系在一起。如上表1中頭痛、肌肉痛、體溫均為屬性。ⅰ)頭痛且肌肉痛決定不分明關系,則ⅱ)集合根據屬性頭痛和肌肉痛是可定義的。ⅲ)頭痛和體溫決定不分明關系,則信息系統(續)RS理論的一個重要概念是不分明關

信息系統(續)

iv)頭痛、體溫、肌肉痛決定不分明關系,則

于是說明肌肉痛是多余的屬性。對于信息系統,每個屬性子集都定義了論域上的一個等價關系。即,對信息系統(續)

屬性的約簡及核粗糙集理論給出了對知識(或數據)的約簡和求核的方法,從而提供了從信息系統中分析多余屬性的能力[2,5,9,10]。信息系統類似于關系數據庫模型的表達方式。有時屬性集A還可分為條件屬性C和決策(結論)屬性D,這時的信息系統也稱為決策表,常記為。無決策的數據分析和有決策的數據分析是粗糙集理論在數據分析中的兩個主要應用。屬性的約簡及核粗糙集理論給出了對知識(

定義:設是一個信息系統,由屬性集所導出的等價關系為。ⅰ)設,則稱屬性a是多余的(如表1中的肌肉痛)。ⅱ)若在系統中沒有多余屬性,則稱A是獨立的iii)子集稱為是A的約簡。若,且B中沒有多余屬性。常記為A的全體約簡,ⅳ)A的所有約簡的交集稱為A的核,記為core(A)。一般來說:屬性集的約簡不唯一而核是唯一的。定義:設

例2(無決策情形的屬性的約簡、核

設,其中,,信息函數見下表2

例2(無決策情形的屬性的約簡、核)設

例2(續)

表2信息系統U11111221111112212211221133323332例2(續)

例2(續)

因此將對象及其信息壓縮后得下面表3例2(續)因此將對象及其信息壓縮后得下面表3

例2(續)

表3信息系統U/A{,}1111{,}1221{,}2211{,}3332且可驗證屬性是多余,且令。則有中沒有多余屬性。

例2(續)

例2(續)

于是信息表2有三個屬性的約簡,即,從而可得信息系統的三個約簡表如下。112221231112223311122133而且。表1的核:CoreA={頭痛,體溫}。例2(續)于是信息表2有三個屬性的約簡,即

規則的協調與提取

粗糙集理論除給出了對知識(或數據)的約簡和求核的方法外,還提供了從決策表中抽取規則的能力,機器學習和從數據庫中的機器發現就是基于這個能力。在一個決策表中,若,X關于由導出的近似空間的下近似和上近似相等,即,稱條件屬性子集關于決策屬性是協調的。也稱決策表是協調的,否則為不協調[10]。

規則的協調與提取粗糙集理論除給出了對

規則的協調與提取(續)

如果用包含度理論來解釋,則決策表是協調的,當且僅當[2],其中

規則的協調與提取(續)如果用包含度理論來解釋,

規則的協調與提取(續)

從協調的決策表中可以抽出確定性規則,而從不協調的決策表中只能抽出不確定性的規則或可能性規則,有時也稱為廣義決策規則,這是因為在不協調的系統中存在著矛盾的事例。決策表中的決策規則一般可以表示為形式[5]:其中稱為規則的條件表示,稱為規則的決策部分。決策規則即使是最優的也不一定唯一。規則的協調與提取(續)從協調的決策表中可以

規則的協調與提取(續)

在決策表中抽取規則的一般方法為[3]:(1)在決策表中將信息相同(即具有相同描述)的對象及其信息刪除只留其中一個得到壓縮后的信息表,這一步稱為刪除多余事例;(2)刪除多余的屬性;(3)對每一個對象及其信息中將多余的屬性值刪除;(4)求出最小約簡;(5)根據最小約簡,求出邏輯規則。規則的協調與提取(續)在決策表中抽取規則的一般方法為

例3(決策情形)

設,其中,具體的決策表見下面表4

例3(決策情形)設

例3(續)

表4決策表U111112211111122122112211333233321122132435354545例3(續)

例3(續)

因此

例3(續)因此

例3(續)

從而對于它的決策子表(U,,V,),(U,,V,),我們可得到它們的一個約簡表如下(一般不唯一)例3(續)從而對于它的決策子表(U,,

例3(續)

111122213234111122113124225335表5表6例3(續)1111222

例3(續)

且,,故(U,,V,)是協調的。但,,,

故(U,,V,)不協調的。例3(續)且,

例3(續)

由表5可得決策表(U,,V,)的四條最優決策規則。且這四條規則都是確定的。例3(續)由表5可得決策表(U,,V

例3(續)

由表6(它是不協調的)也可得到決策表(U,,V,)的四條最優決策規則:其中是不確定的,而只有是確定的。例3(續)由表6(它是不協調的)也可得到決策表其中

與其他不確定性數學方法的關系

RS理論與其他處理不確定和不精確問題理論的最顯著的區別是無需提供問題所需處理的數據集合之外的任何先驗信息即它不需要任何預備的或額外的有關數據信息。如統計學中的概率分布,Fuzzy理論中的隸屬度函數等。所以RS理論對問題的不確定性的描述或處理可以說是比較客觀的。與其他不確定性數學方法的關系RS理

與其他不確定性數學方法的關系

由于這個理論未能包含處理不精確或不確定原始數據的機制,因此,單純地使用這個理論不一定能有效地描述數據不精確或不確定的實際問題,而證據理論與模糊集理論等具有處理不精確或不確定數據的方法,所以這個理論與概率統計,模糊數學,證據理論等其他處理不精確或不確定問題的理論有很強的互補性。。與其他不確定性數學方法的關系由于這

與其他不確定性數學方法的關系

在粗糙集理論與其它處理模糊性或不確定性方法的理論研究中,主要集中在它與概率統計,模糊數學,D-S證據理論和信息論的相應滲透與補充。下面從三方面進行比較。(1)與概率統計結合(2)與模糊數學(3)與D-S證據理論(Dempster-Shafer證據理論)。與其他不確定性數學方法的關系在粗糙集

與概率統計結合在信息系統中,知識庫的知識的類型一般有兩類:一類庫中所有對象的描述是完全已知的,Pawlak粗糙集模型和一般二元關系下的粗糙集模型的是屬于這一種。另一類庫中的對象的描述只有部分是已知的,即知識庫中的知識是不確定的,它只能通過訓練樣本所提供的信息來刻畫概念。與概率統計結合在信息系統中,知識庫的知識

與概率統計結合(續)

為了使從訓練樣本獲得的規則符合整個論域的對象,在抽取樣本時應符合統計規律性,粗糙集理論不管這一類工作,因些概率統計作為研究自然界,人類社會及技術過程中大量隨機現象的規律性的一門學科,它與粗糙集理論的結合就顯得非常自然[2]。

與概率統計結合(續)為了使從訓練樣本獲得的規則符合整

與模糊數學粗糙集理論用粗糙隸屬函數來刻畫知識的模糊性[2,13,14]。(ⅰ)這是對一般二元關系R下的近似空間A(U,R)而言的。當R為等價關系時,。(ⅱ)

與模糊數學粗糙集理論用粗糙隸屬函數來

與模糊數學(續)

在概率近似空間下,用它表示粗糙隸屬函數。粗糙隸屬一般不是Zadeh意義下的隸屬函數。粗糙集理論和模糊集理論在處理不確定性和不精確性問題方面都推廣了經典集合論,雖有一定的相容性和相似性,然后它們的側重面不同。

a)從知識的“粒度“的描述上來看,模糊集通過對象關于集合的隸屬程度來近似描述;而粗糙集是通過一個集合關于某個可利用的知識庫的一對上、下近似來描述的。

與模糊數學(續)在概率近似空間下,用它表示粗

與模糊數學(續)

b)從集合對象間的關系來看,模糊集強調的是集合邊界的不分明性,而粗糙強調是是對象間的不可分辨性。

c)從研究的對象來看,模糊集研究的是屬于同一類的不同對象間的隸屬關系,重在隸屬程度,而粗糙集研究的是不同類中的對象組成的集合關系,重在分類。

與模糊數學(續)b)從集合對象間的關系來看

與模糊數學(續)

雖然模糊集的隸屬函數和粗糙集的粗糙隸屬函數都反映了概念的模糊性,直觀上有一定的相似性,但模糊集的隸屬函數大多是專家憑經驗給出的,因此往往帶有很強烈的主觀意志,而粗糙的粗糙隸屬函數的計算是從被分析的數據中直接獲得的,非常客觀。也正因為如此,將粗糙集理論和模糊集理論進行某些“整合”后去描述知識的不確定性和不精確性比它們各自描述知識的不確定性和不精確性可望顯示更強的功能。(目前所見的模糊粗糙集模型是其中的一些成功范例)。與模糊數學(續)雖然模糊集的隸屬函

與D-S證據理論粗糙集理論是為開發規則的機器自動生成而提出的,而D-S理論主要用于證據推理;RS理論用概念的一對上,下近對其進行描述,而D-S證據理論是用一對信任函數和似然函數在給定證據下對假設進行估計和評價。RS理論中的下近似和上近似的概率恰好分別是信任函數和似然函數。然而生成信任函數和似然函數的基本概率分配函數(mass函數)方法是不同的。前者來自于系統中數據本身,比較客觀,而后者往往來自于專家的經驗,帶有很強的主觀性。RS理論與D-S證據理論有很強的互補性[15]。與D-S證據理論粗糙集理論是

與D-S證據理論(續)

粗糙集理論中知識的不確定性主要由兩個原因產生[2]:(1)直接來自論域上的二元關系及其產生的知識模塊,即近似空間本身。如果二元等價關系產生的每一個等價中只有一個元素,那么等價關系產生的劃分不含有任何信息,劃分越粗,每個知識模塊越大,知識庫中的知識越粗糙,相對于近似空間的概念和知識就越不確定。這時處理知識的不確定性的方法往往用香農信息熵來刻畫,知識的粗糙性與信息熵的關系比較密切,知識的粗糙性實質上是其所含信息多少的更深層次刻畫。單從這個角度來看,RS理論與信息論的關系就比較密切。與D-S證據理論(續)粗糙集理論中知識的不確定性主要

與D-S證據理論(續)

粗糙集理論中知識的不確定性主要由兩個原因產生[2]:(2)來自于給定論域里粗糙近似的邊界。當邊界為空集時知識就是完全確定的,邊界越大知識就越粗糙或越模糊。至今,RS理論刻畫概念X的不確定性用正則條件熵和粗糙性測度來實現的。但這兩個度量并沒有完全提供哪些完全屬于X的下近似的區域里面與不可分辨關系的知識粒度有關的不確定性,于是有人引進了粗糙熵Er(X)的概念來刻畫概念X的不確定性,所以,尋求一個合適的度量來刻畫知識的不確定性也是RS理論研究的一個重要方向[2,16]。與D-S證據理論(續)粗糙集理論中知識的不確定性主

粗集理論的應用及發展前景RS理論已經被證實在實踐中是非常有用的。從大量的現實生活中應用的記錄來看已經非常明顯,這一理論對AI(人工智能)和認知科學尤為重要,在專家系統,決系表等方面都有有非常成功的應用實例。利用Rough集理論處理的主要問題包括:數據簡化(即刪除多余的數據),數據相關性的發現,數據意義的評估,由數據產生決策(控制)算法,數據的近似分類等。下面介紹兩的應用和研究前景:粗集理論的應用及發展前景RS理論已經被證實在實

(1)美國Kansas大學開發了基于RS方法學習的例子,并開發了基于Rough集方法的學習系統——LERS(LearningfromExamplesbasedonRS)。這個系統的知識獲取項對于用不完全信息工作的專家系統,幫助其建立知識庫是一個十分恰當的規則歸納法的應用實例,它在NASA’SJohnson空間中心應用了多年,充分顯示了它在開發專家系統進行全球氣候變化的研究中起的作用,它是作為一種開發專家系統的工具被引用的。

基于RS的典型系統

(1)美國Kansas大學開發了基于RS方法學習的例子,

LERS可以從信息表形式中給定的實例導出一套規則集,并且可以利用這一套規則分類新的實例,LERS還被用于兩項醫學方面,其一用來比較手術后的病人取暖設備的效果,其二用來評估孕婦超強度勞動的危險。還有一種很重要的LERS用途是全球氣候變化的研究,描述對全球氣溫有影響的規則由一些屬性所表征的數據引出。如太陽的能量釋放,火山活動、美國南部的指針搖擺器、二氧化碳流向和二氧化碳的余量。這方面的專家依據獲得的新數據把握地球氣候變化的奧妙。

基于RS的典型系統(續)

LERS可以從信息表形式中給定的實例導出一套規

Rough集理論之所以提供了AI的有效方法,是因為實現它的程序可以很容易在平行機上運行。且基于Rough集理論的Rough邏輯將使單調邏輯非單調化,從而在AI的近似或不精確推理中將發揮不可估量作用。

基于RS的典型系統(續)

Rough集理論之所以提供了AI的有效方法,是

(2)Rough集方法用于決策分析已體現在波蘭Poznan科技大學開發的計算機系統中,稱之為RoughDAS和RoughClass,它們對任務分別執行解釋和描述。這兩個系統已經在許多實際領域都有應用。(RoughDAS執行信息系統數據分析任務,RoughClass支持新對象的分類,這兩個軟件都是基于DOS操作系統的)[4]。

基于RS的典型系統(續)

(2)Rough集方法用于決策分析已體現在波蘭P

RS理論在AI中的應用可分為兩大類:有決策的分析,無決策的分析。有決策的分析主要包括:監督學習與決策分析。RS理論在監督學習中的應用可分為兩個方面:其一:對學習的訓練集作預處理,這是考試到從實際測量中所獲得的訓練集,常包含有多余的屬性,應用RS的屬性約簡可有效地去除冗余的屬性。例如:對豌豆疾病的數據進行RS處理,使得原有屬性數從35個約簡到9個;對美國1984年眾議案的投票數據的分析,則使屬性從原有16個減少為9個。另外,每個屬性的值域也會有冗余,同樣應用RS方法中的約簡技術可以刪除某些屬性的多余值。

RS理論在AI中的應用可分為兩大類:有決策的分析,無決

RS理論在AI中的應用(續)

其二應用RS方法獲取規則:利用RS中提供的值約簡方法由實例集直接獲取規則,但是,由于從決策表中直接獲取所有的值約簡已被證明是一個NP完全問題,因此,利用領域獨立的啟發式算法求取最小約簡是一個自然的方法。例如,通過值約簡可將美國1984年眾議案的投票數據由435個例子約簡為44條規則。

RS理論在AI中的應用(續)其二應用RS方法獲取規

RS理論在AI中的應用(續)

RS理論應用于有決策分析還包括:(1)應用于決策不完全時的學習(利用RS理論中的上,下近似的概念表示不完全的決策,以及對學習效果所產生的影響)。(2)進行增量式學習(從RS理論中的差別矩陣出發,利用與或邏輯求取規則描述,對新的例子只需在差別矩陣上添加相應的行列,即可獲取增量后的規則)。在決策分析的應用中,則是利用RS理論的屬性約簡,值約簡及核等概念,對被決策的數據進行約簡和尋找對于決策最有用的信息。

RS理論在AI中的應用(續)RS理論應用于有決

RS理論在AI中的應用(續)

無決策的數據分析主要是:數據壓縮、化簡、聚類、模式發現與機器發現等。這類問題主要是利用屬性的約簡去除不必要的屬性,利用值約簡壓縮數據及進行數據的聚類分析,由于無決策的數據的約簡問題也是NP完全問題,因而仍要利用啟發式知識求取最小約簡。屬于這類應用的典型AI分支是機器發現,特別是從大型數據庫進行知識發現,RS被認為是一個非常有效的方法。

RS理論在AI中的應用(續)無決策的數據分析主要

RS理論在AI中的應用(續)

近幾年來,RS理論已在很多實際領域得到了成功應用。如美國的NASAJohnson空間中心利用LERS學習系統來發展空間自由行走的醫學專家系統,希臘的工業發展銀行ETEUA應用RS求取貸款信用,美國的環境保護署利用LERS來增進資源之間的協調等。目前,RS理論已在西方的研究機構和大學與大的公司得到較廣泛的應用,前者側重于將這個理論作為機制來研究、而后者則使用作為大規模數據的處理的工具[3]。

RS理論在AI中的應用(續)近幾年來,RS理論已研究領域與前景

Rough集理論除了朝著邏輯及其近似推理方向發展以外,近些年來出現了大量的Rough數及Rough函數的研究,發表了一系列關于Rough函數方面的論文,Rough函數的各種近似運算,Rough函數的基本性質,關于它的Rough連續,Rough數限,Rough可導Rough積分和Rough穩定性,Rough函數控制及建立由Rough實函數控制的離散動態系統都是典型的問題,這些問題都要求在Rough函數理論的模型下,給予公式化。這些問題的研究將有貢獻于定性推理方法的研究。這種研究實質上是使連續數學離散化。如此,連續數學也能被現代計算機所接受。

研究領域與前景Rough集理論除了朝著邏輯及其近似研究領域與前景(續)

目前,對RS理論研究集中在其數學性質,RS拓廣,與其它不確定方法的關系和互補,及有效算法等方面。1)RS理論數學性質方面的研究,主要討論RS的代數結構。拓撲結構,以及RS的收斂性問題。2)RS拓廣方面的研究主要涉及廣義RS模型(或稱變精確性RS模型)與對連續屬性的離散化等。3)RS理論與其他不確定性方法之間的關系的研究中,目前主要討論它與模糊集理論和D-S證據理論的關系和互補。

研究領域與前景(續)目前,對RS理論研究集中在其數學性質研究領域與前景(續)

4)在RS有效算法方面的研究,主要集中于(a)導出規則的增量式算法:原有的算法是在固定的數據集上進行的,當有新的數據增加到數據集時,若用原有算法導出規則是相當麻煩的,增量式算法是對原有規則進行修正,從而得出關于新數據集的規則的方法。

研究領域與前景(續)4)在RS有效算法方面的研究,主要集研究領域與前景(續)

(b)約簡的啟發式算法對于一個信息系統來說,找出其所有約簡是NP完全問題,很自然的想法是采用啟發式方法找出最優或次優約簡,這些算法的共同特點是利用屬性的重要性作為啟發式,去求約簡,只是它們對屬性重要性的度量不同。(c)RS基本運算的并行算法RS的基本性質決定,它的很多基本運算可以并行計算,由于RS研究的初衷就是試圖為處理大量數據提供一個數學工具。由此,這些性質就顯得十分重要了。

研究領域與前景(續)(b)約簡的啟發式算法研究領域與前景(續)

5)基于RS的邏輯是關于RS的不確定推理的基礎,發展這類邏輯的理論基礎也是目前RS理論研究的重要課題。今后,圍繞著其邏輯特點和知識處理機理,主要有下列研究方向值得注意。其一、是數學理論的系統化和形式化。盡管Rough集理論產生于真正的數學基礎,但許多理論問題仍有待于真正澄清。Pawlak粗糙集模型的推廣一直是RS理論研究的主流方向,目前主要有兩種方法a)構造性方法b)代數性(公理化)方法。

研究領域與前景(續)5)基于RS的邏輯是關于RS的不確定研究領域與前景(續)

其二、是算法的研究。RS理論中有效算法研究是粗糙集在人工智能方向上研究的一個主要方向。目前,RS理論中有效算法研究主要集中在導出規則的增量式算法,約簡的啟發式算法,粗糙集基本并行算法,以及與粗糙集有關的神經網絡與遺傳算法等。這些研究的成功應用有的已經獲得了商業價值。

其三、是面向粗糙集對象的專家系統和智能系統和粗糙集在工程技術方面的應用。

研究領域與前景(續)其二、是算法的研究。RS理論中研究領域與前景(續)

其四、是與其他數學理論的聯系。從算子的觀點看RS理論,與之關系較緊的有拓撲空間,數理邏輯,格與布爾代數,模態邏輯,算子代數等。從構造性和集合的觀點來看,它與概率統計、模糊數學、證據理論、圖論、信息論等聯系較為密切。RS理論研究不但需要以這些理論作為基礎,同時也相應地帶動這些理論的發展。隨著RS結構與代數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論