第九章_模糊聚類分析_181-202__第1頁
第九章_模糊聚類分析_181-202__第2頁
第九章_模糊聚類分析_181-202__第3頁
第九章_模糊聚類分析_181-202__第4頁
第九章_模糊聚類分析_181-202__第5頁
已閱讀5頁,還剩17頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第三篇 評價、決策方法與模型近年來,圍繞著評價與決策方法,各種相關知識不斷滲入,使得評價與決策的方法不斷豐富,相關研究也不斷深入。綜合評價與決策逐漸成為一個多學科邊緣交叉、相互滲透、多點支撐的新興研究領域。從某種意義上來講,沒有評價就沒有決策。評價是一種認知過程,是科學決策的前提,而決策是評價的最終目的。目前流行的幾種現代綜合評價、決策方法包括模糊綜合評價、層次分析法、數據包絡分析法、決策分析法、人工神經網絡評價法、灰色綜合評價法、組合評價法等等。各種評價、決策方法有簡有繁,相互區別但又相互聯系。各種評價、決策方法各具特色,對某類具體問題選擇評價、決策方法提供了借鑒。基于篇幅的限制,本篇僅對模

2、糊聚類分析、模糊綜合評價、層次分析法、決策分析法介紹其基本原理、模型建立和求解方法,并討論各方法在經濟管理中的應用。第九章 模糊聚類分析1965年,模糊理論的創始人,美國加利福尼亞大學伯克利分校的計算機和自動控制理論專家L.A.Zadeh教授發表了題為“Fuzzy Set”的論文,這標志著模糊信息處理的誕生,并于20世紀60年代在各科學會議上,從模糊信息處理觀點出發,闡述了他的理論。這一理論是描述和處理事務的模糊性和系統的不確定性,模擬人所特有的模糊邏輯思維功能,從定性到定量,創造了研究模糊性或不確定性問題的理論方法。Zadeh教授在隨后的研究工作中,準確地闡述了模糊性的含義,制定了刻畫模糊性

3、的數學方法。即模糊集合、隸屬度、隸屬函數等,迄今已成為了一個較為完整的數學分支。目前對模糊數學的研究十分活躍,模糊集合理論進一步豐富了經典數學的理論系統,為人們處理模糊信息提供了很多好的方法。現在,模糊數學的公理化基礎已經建立,正接受實踐的檢驗,并進一步得到完善。自從1976年模糊數學傳入我國以來,通過廣大模糊數學研究工作者的努力,模糊數學在我國得到了極大的發展,目前水平己居于世界前列。模糊數學在實際應用中幾乎涉及到了國民經濟的各個領域及相關部門,模糊數學在醫學、氣象、環境、農業、能源、軍事、經濟管理和地質勘探等方面都得到了廣泛的應用。從模糊理論誕生到今天四十年來,模糊理論和技術得到了迅速的發

4、展,在這個領域國內外許多學者做了大量卓有成效的研究工作。模糊理論與技術的一個突出優點就是能較好地描述和模仿人的思維方式,并能總結和反映人的體會和經驗,對復雜事務和系統可進行模糊度量、模糊識別、模糊推理、模糊控制與模糊決策。尤其是將模糊理論與人工智能在神經網絡和專家系統等方面相互結合的研究已深入到計算機技術、多媒體技術、自動控制技術以及信息采集與處理技術等一系列高新技術的開發、研究與利用,為推動決策科學、應用科學、管理科學與社會科學的進步作出了極大的貢獻。這種學術理論體系不斷完善的新成果正在迅速地轉變為生產力,促進了全人類社會物質文明的不斷發展。第一節 關系及分類客觀世界的各種事物之間存在著不同

5、的相互關系。在數學上使用“關系”作為一種數學模型來描述事物之間的聯系,例如,大小關系、次序關系、等價關系、兄弟關系、函數關系等。普通集合也存在關系。1.關系的定義定義9.1.1 從到的關系是指論域為笛卡兒乘積(直積)的一個子集,即,稱為從到的二元關系。特別地,當時,稱之為上的二元關系。二元關系統稱為關系。例1 設,定義關系,稱為“小于”關系。于是這表明“小于”關系是笛卡兒乘積的子集。例2 設周一,周二,周三,周四,周五,周六,周日和晴,陰,雨。某一周的天氣情況是:周一陰,周二雨,周三晴,周四晴,周五雨,周六雨,周日雨,則形成關系(周一,陰),(周二,雨),(周三,晴),(周四,晴),(周五,雨

6、),(周六,雨),(周日,雨),關系是笛卡兒乘積的一個子集。2.關系的表示法關系可以分別用表格、圖形和矩陣表示,下面以例2為例進行說明。(1)表格。見表9-1表9-1 關系的表格表示周一周二周三周四周五周六周日晴0011000陰1000000雨0100111(2)圖形。見圖9-1,如果,則連一條直線,否則不連。論域 論域周一 晴周二周三 陰周四周五周六 雨周日圖9-1用連線圖表示關系(3)矩陣。見圖9-2。對一般情況,設論域為有限。關系,。周一 周二 周三 周四 周五 周六 周日圖9-2 關系的矩陣表示3.特征函數定義9.1.2 設是論域上的集合,記為集合的特征函數。特征函數表征了元素對集合的

7、隸屬程度。表示,反之表示。第二節 模糊關系及矩陣在數學上,概念的外延可以通過“集合”來表達。然而,日常生活中涉及的眾多的概念常有內涵的“模糊(Fuzzy)性”,這必然導致外延的“不清晰性”。例如,對于高矮之分等。正是考慮到現實世界中很多事物的分類邊界是不分明的,而這種不分明的劃分在人們的識別、判斷和認知過程中起著重要的作用,為了用數學的方法來處理這種問題,扎德于1965年提出了模糊集合的概念。他用隸屬度函數來刻畫出中間過渡的事物對差異雙方所具有的傾向性。可以認為隸屬函數是普通集合中特征函數的推廣。將特征函數的值域由二值擴展到區間時,就描述了一個模糊集合。1.模糊集合隸屬函數定義9.2.1 論域

8、上的模糊集合由隸屬函數來表征,其中在閉區間上取值,的值反映了中的元素對于的隸屬程度。例1 設論域周一,周二,周三,周四,周五,周六,周日,從周一到周四是好天氣,周五到周日都是壞天氣。按普通集合觀點,特征函數為,其隸屬度為(周一)=1,(周二)=1,(周三)=1,(周四)=1;(周五)=0,(周六)=0,(周日)=0。 利用模糊集合概念能較好區分好壞天氣,選取之間的數對天氣情況進行細分。這時對于天氣的隸屬度可以寫成(周一)=0.9,(周二)=0.8,(周三)=0.7,(周四)=0.6;(周五)=0.3,(周六)=0.2,(周日)=0.1。2.模糊關系定義9.2.2 設論域和,稱的一個模糊子集為從

9、到的模糊二元關系,記為。其隸屬度函數為映射:這時隸屬度表示與具有關系的程度。特別地,當時,稱為上的模糊關系。例2 論域100,150,200,250,300,350,400,450,500,550,600,650,700,750,800(公斤畝),高產水稻。由于全國各地的自然條件差異和生產水平不同,人們對水稻畝產多少才算高產的理解不一樣,畝產量與“高產水稻”之間的關系是模糊關系。通過對不同地區種植水稻的123個農民的問卷調查,獲得表9-2的結果。表9-2 畝產量與“高產水稻”的模糊關系公斤/畝100150200250300350400450500550600650700750800頻數1251

10、01518252015332211累計頻數1381835517696111114117119121122123累計頻率0.010.020.070.150.270.410.620.780.900.930.950.970.980.991表9-2中的累計頻數就是的一個模糊子集。將累計頻數變換到區間成為累計頻率,這時累計頻率就是隸屬函數。(500,高產水稻)=0.90表明畝產500公斤與“高產水稻”的相關程度為90%。定義9.2.3 設分別為和上的兩個模糊關系。則與的合成,記為其中,則為矩陣與的合成(也稱為模糊矩陣乘積或模糊乘積)。其中“”與“”為邏輯符號,分別表示取大、取小。定義9.2.4 模糊關系

11、的傳遞閉包定義為:。由于可見,這個性質稱為傳遞性。集合論中的“關系”抽象地刻畫了事物的“精確性”的聯系,而“模糊關系”則從更深刻的意義上表現了事物間更廣泛的聯系。從某種意義上講,模糊關系的抽象形式更接近于人的思維。在經濟生活與經濟科學中存在大量的模糊關系,而分類也是經濟分析與經營管理中常常使用的方法,模糊關系理論是許多應用原理和方法的基礎。3.模糊矩陣定義9.2.5 設,是到的模糊關系,記,記,則稱為模糊矩陣。例3 設是個工作人員的集合,是項工作的集合。若用表示能勝任的程度,就可獲得到的模糊矩陣。設(即有4個工作人員),(即有5項工作),則模糊矩陣:例如第2個人能勝任第4項工作的程度為0.5。

12、定義9.2.6 設論域為有限集合,上的一個模糊關系為,與其對應的模糊矩陣為,若滿足:(1) 自反性:(2) 對稱性:(3) 傳遞性:則稱為一個模糊等價矩陣,其關系是模糊等價關系。若只滿足自反性和對稱性則為相似關系。定理9.2.1 設是模糊相似矩陣,則存在一個最小自然數,使得傳遞閉包,對于一切大于的自然數,恒有。此時,為模糊等價矩陣。下面介紹一個實用求傳遞閉包的簡捷方法二次方法。例4 設,求傳遞閉包。解:容易驗證,是模糊相似矩陣,用二次方法求其傳遞閉包。,故傳遞閉包。4.模糊矩陣的-截矩陣定義9.2.7 設為模糊矩陣,對于任意的,稱為模糊矩陣的-截矩陣,其中顯然,截矩陣為布爾矩陣。例5 設,則當

13、時的-截矩陣為。第三節 模糊聚類分析的一般步驟在科學技術、經濟管理中常常需要按一定的標準(相似程度或親疏程度)進行分類。例如,根據生物的某些性狀可對生物分類,根據土壤的性質可對土壤分類等。對所研究的事物按一定標準進行分類的數學方法稱為聚類分析,它是多元統計“物以類聚”的一種分類方法。由于科學技術、經濟管理中的分類界限往往不分明,因此采用模糊聚類方法通常比較符合實際。傳統的聚類把每個樣本嚴格地劃分到某一類。隨著模糊集理論的提出,傳統聚類被推廣為模糊聚類。在模糊聚類中,每個樣本不再僅屬于某一類,而是以一定的隸屬度屬于每一類。換句話說,通過模糊聚類分析,可得到樣本屬于各個類別的不確定性程度,即建立起

14、了樣本對于類別的不確定性的描述,這樣就更能準確地反映現實世界。模糊聚類分析步驟可以分為:數據標準化、建立模糊相似矩陣、聚類。一、數據標準化1.數據矩陣設論域為被分類的對象,每個對象又由個指標表示其性狀,即,于是,得到原始數據矩陣為。2.數據標準化在實際問題中,不同的數據可能有不同的量綱。為了使不同量綱的數據也能進行比較,需要對數據進行適當的變換。根據模糊矩陣的要求將數據壓縮到區間。通常需要做如下幾種變換:(1)平移-標準差變換,其中。經過變換后,每個變量的均值為0,標準差為1,且消除了量綱的影響。但是這樣得到的還不一定在區間上。(2)平移-極差變換,顯然有,而且也消除了量綱的影響。(3)對數變

15、換,取對數以縮小變量間的數量級。二、建立模糊相似矩陣建立模糊相似矩陣又稱為標定,即標出衡量被分類對象間相似程度的統計量。設論域,依照傳統聚類方法確定相似系數,建立模糊相似矩陣,與的相似程度。確定的方法主要借用傳統聚類分析的相似系數法、距離法以及其他方法。具體用何種方法,可根據問題的性質,選取下列公式之一計算。1.相似系數法(1)數量積法,其中。顯然,若中出現負值,也可采用以下方法將壓縮到上:令,則。當然也可用上述的平移-極差變換。(2)夾角余弦法(3)相關系數法,其中。(4)指數相似系數法,其中,。(5)最大最小法。(6)算術平均最小法。(7)幾何平均最小法。2.距離法(1)直接距離法,其中為

16、適當選取的參數,它使得,表示與的距離。經常采用的距離有以下幾種:海明距離:;歐氏距離:;切比雪夫距離:。(2)倒數距離法其中為適當選取的參數,使得。(3)指數距離法上述三種距離法中若采用海明距離,則又分別稱為絕對值減數法、絕對值倒數法、絕對值指數法。3.主觀評分法請專家或有實際經驗者直接對與的相似程度評分,作為的值。(1)百分制采用百分制,將評出的總分數除以100,即得閉區間的一個。為降低主觀性,可以請多個專家參與評分,再取平均定出。(2)相似度和自信度假定請個專家組成專家組,這時有,其中,為第個專家所給出與的相似度,是專家對自己給出相似度時的自信度。和都是在區間的數值。三、聚類1.模糊等價矩

17、陣聚類(1)傳遞閉包法根據標定所建立的模糊矩陣,不一定具有傳遞性,只是模糊相似矩陣。首先將改造成模糊等價矩陣。根據定理9.2.1,用二次方法求傳遞閉包。再讓由大變到小,就可形成動態聚類圖。例1 設論域表示農業小區域,已知每個小區域的氣候取決于4個指標:熱量、水分、霜凍、霜雹,即,其數值如表9-3所示。表9-3 農業小區域及指標關系指標農業小區域熱量()1223356654水分()3.52.53.5330.51.51.533霜凍()1213154421霜雹()0211120122 由于所給數據,且沒有單位,所以直接選取數量積法建立模糊相似矩陣,無需做變換。 用公式,選取使得對一切,有。在本例中由

18、數量積法可得。于是,得到的模糊相似矩陣為用二次方法求的傳遞閉包:,得到模糊等價矩陣為將由大到小進行聚類取,分為10類:,。取,分為9類:,。取,分為8類:,。取,分為7類:,。取,分為5類:,。取,分為2類:,。取,分為1類:,。(2)布爾矩陣法設是論域上的模糊相似矩陣,若要得到的元素在水平上的分類,使用布爾矩陣的具體做法如下: 求模糊相似矩陣的-截矩陣,顯然為布爾矩陣。 判斷是否是等價的。如果在任一排列下都沒有下列形式的特殊子矩陣:,則具有傳遞性,為等價矩陣,可以證明為等價矩陣。 如果判斷是等價的,則由可得在水平上的分類。 如果判斷不是等價的,只要將中上述特殊形式子矩陣的0一律改成1,直到不

19、再出現特殊形式子矩陣為止,修改后的為等價矩陣,可以獲得水平上的分類。例2 每個環境單元可以包括空氣、水分、土壤、作物4個要素,環境單元的污染狀況由污染物在4個要素中含量的超限度來描述,設論域為5個單元,它們的污染數據如表9-4所示。表9-4 環境單元污染狀況環境單元指標空氣()水分()土壤()作物()55322345552315312451按絕對值減數法進行標定,取,由得模糊相似矩陣。用布爾矩陣法分類: 取,得,分為5類:,。取,得,分為4類:,。取,得,分為3類:,。取,得,先互換的第1、2行,再互換第1、2列,得,再按布爾矩陣法進行改造,得,分為2類:,。取,得,先互換的第1、2行,得,再

20、按布爾矩陣法進行改造,得,分為1類:,。2.直接聚類(1)直接聚類法在建立模糊相似矩陣后,既不求傳遞閉包,也不用布爾矩陣法,而是直接從模糊相似矩陣進行聚類。其步驟如下:取(最大值),對每個作相似類,且,即將滿足的與放在一類,構成相似類。相似類與等價類的不同之處是,不同的相似類可能有公共元素,即可出現,。此時只要將有公共元素的相似類合并,即可得水平上的等價分類。取為次大值,從中直接找出相似程度為的元素對(即),將對應于的等價分類中所在的類與所在的類合并,將所有這些情況合并后,即得對應于的等價分類。取為第三大值,從中直接找出相似程度為的元素對(即),類似的將對應于的等價分類中所在的類與所在的類合并

21、,將所有這些情況合并后,即得對應于的等價分類。依次類推,直到合并到成為一類為止。(2)最大樹法以被分類元素為頂點,以相似矩陣的元素為權重的一棵最大的樹,取定,砍斷權重低于的枝,得到一個不連通的圖,各個連通的分支便構成了在水平上的分類。下面介紹求最大樹的克魯克(Kruskal)法。設,先畫出所有頂點,從模糊相似矩陣中按從大到小的順序依次畫枝,并標上權重,要求不產生圈,直到所有頂點連通為止,這就得到一棵最大樹。例3 用最大樹法求例2環境單元的分類。解:論域,模糊相似矩陣,畫出最大樹,如圖9-3(a)所示。(a)(e)(d)(c)(b)x1x1x1x1x1x3x3x3x3x3x4x4x4x4x4x5

22、x5x5x5x5x2x2x2x2x20.80.80.80.80.60.60.60.50.4圖9-3環境單元分類砍去最大樹枝權重低于的枝,即得在水平上的分類。取,分為5類:,如圖9-3(b)所示。取,分為4類:,如圖9-3(c)所示。取,分為3類:,如圖9-3(d)所示。取,分為2類:,如圖9-3(e)所示。取,分為1類:,如圖9-3(a)所示。最大樹法所得的結果與布爾矩陣法分類結果是一致的。第四節 應用案例:模糊聚類分析法在經濟管理中的應用例1 亞洲玉米螟測報的數學模型。亞洲玉米螟是影響我國玉米生產的主要害蟲之一。過去,人們對玉米螟種群動態的研究,一般僅考慮時間因子,即研究種群隨時間變化的規律

23、,也有從玉米螟空間格局加以研究的。而本例是把種群的數量動態與空間格局聯系起來加以研究。同時還應指出,玉米螟的種群動態是一個具有模糊性的問題,玉米螟對玉米的危害程度也具有模糊性。因此,本例利用模糊數學方法,建立亞洲玉米螟測報的數學模型。解 第一步:采集樣本,確定主要因子,建立數據矩陣。設論域是武漢地區1951-1985年間的歷史資料(26個樣本),每個樣本由8個主要指標來描述,即 。8個主要指標的含義如下:上年7月、8月的平均氣溫;:上年12月,當年1、2月的平均氣溫;:當年4月溫濕系數;:當年4月雨日數(降水量不小于的天數);:當年4月日照數;:當年4月風速();:當年5月上旬的溫濕系數;:當

24、年5月上旬田間調查的玉米螟卵塊數。由歷史資料提供的原始數據如表9-5所示。表9-5玉米螟原始數據樣本號指 標128.53.55.901885.52.620.35.6228.75.24.5210192.33.420.67.9327.94.44.8111161.12.922.86.3430.04.95.351897.12.819.41.7528.75.24.489185.92.820.13.4628.42.74.9119122.12.716.38.1728.35.44.7117146.53.018.54.1828.65.34.449177.73.019.08.6931.05.45.3312140.

25、82.717.41.61028.54.64.4612159.52.920.84.11129.84.95.5916146.22.717.42.11228.64.55.6315110.32.717.51.51327.85.25.5816126.32.721.66.51429.63.45.6219121.22.919.76.11527.72.85.2915148.23.623.56.81627.84.65.5916190.12.420.77.01728.44.75.1912126.43.118.94.11829.33.05.4715149.53.122.73.91928.15.24.6316158.

26、03.720.27.82028.53.93.9310187.12.918.97.12128.64.55.3316134.33.118.97.22228.13.34.8617127.12.416.77.42328.15.44.7311199.91.921.32.72430.16.05.0915177.82.717.21.32528.85.44.7513139.02.720.43.12627.94.35.1216151.02.018.79.3第二步:標定-建立模糊相似矩陣。采用指數相似系數,第個樣本與第個樣本的相似系數為,其中是第個因子的方差,即,。可得模糊相似矩陣為第三步:聚類。(1)用二次方法

27、求傳遞閉包,得模糊等價矩陣為(2)聚類。當由0.916降到0.679時,得到一系列等價的布爾矩陣(省略)。(3)根據武漢地區的實際情況,將玉米螟對玉米的危害程度劃分為(輕)、(較重)、(重)、(嚴重)4個等級。取,將原始樣本分為4類。類(危害輕年份):,;類(危害較重年份):;類(危害重年份):,;類(危害嚴重年份):。(4)回報與預測。將1986年和1987年的有關因子的8個數據輸入上述模型,經過運算,同樣取,可以判定:1986年和1987年歸并類,即這兩年為危害輕年份。類似地,將要預測年份的有關8個因子的數據輸入上述模型,經過運算,同樣可判定該年份歸并哪一類,即可判定該年份危害的輕重程度。

28、此模型對防治玉米螟有一定的實用價值。例2 模糊聚類分析在市場劃分中的應用。在市場經濟條件下,市場劃分是一項重要的戰略措施,它有許多顯著的特點:使企業的產品經銷有針對性,可以更好地滿足顧客的需求;在市場經營上便于專業化,銷售人員可以集中力量對一些特定顧客進行宣傳和推銷,從而提高市場經營的效果。因此,將市場動態地劃分為各個層次的若干種類群是很有意義的。由于在給定的一個市場中,顧客的購買行為是有差異的,因而,根據對顧客購買行為的差異的觀測數據,可將市場進行劃分。例如,設一個市場具有個顧客和種商品,那么,可以用矩陣來表示顧客的購買行為,其中表示第個顧客對第種商品的購買行為的程度。解 第一步:設論域(2

29、0個國家和地區)。以一個國家或地區作為一個需求單位,每個國家或地區用10個特征指數來衡量(如,地理指數地理位置、人口密度等;人口狀況指數生活方式、商品使用率等;經濟指數國民生產總值、進出口貿易總值等;社會結構指數君主立憲制、議會制等),即,原始數據如表9-6所示。表9-6國際市場劃分原始數據123456789101美國2112.0007.5906172.36.963218.927-37.125552.95389323.52 加拿大197.4701.9064801.80.83856.8251.358716.07098932.43 墨西哥92.6161.961883.80.40512.086-3.

30、104586.2409893354.94 澳大利亞116.2491.4854955.50.40518.2320.443717.144981221.95 中國香港13.6801.4852257.10.04717.137-2.305664.956844530.06印度117.6566.064121.313.7948.150-1.710363.565384198.07日本1053.32018.8395305.01.170110.670-7.625206.14284312.48 新加坡8.1215.8222138.30.01117.635-3.402515.0218483.09泰國21.7852.11

31、3313.30.2637.156-1.848554.27938483.010埃及18.7610.991296.80.3758.837-1.997570.578383340.811伊朗19.2746.745627.30.0117.26111.739794.79968427.712 黎巴嫩3.0861.9261262.50.0622.414-1.709595.918384299.013 摩洛哥13.3290.231478.90.0183.807-1.935573.074683343.914 索馬里0.2490.069252.90.0210.440-0.258564.10268335.615 贊比亞

32、-2.9000.064252.90.0210.7560.572664.77668337.616蘇丹5.3070.048244.80.0031.110-0.575637.40868337.117韓國47.5832.488794.70.54220.399-5.284516.577984383.818 巴基斯坦19.7270.511215.00.1464.061-1.025315.37438499.219秘魯8.8941.795400.80.3862.1461.386510.493389313.620 馬來西亞16.2498.379881.80.0947.8493.228580.209684100.0第二步:標定。用歐式距離公式來定義兩個需求單位之間的需求相似程度,這樣一來,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論