


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、IRIS數(shù)據(jù)集的Bayes分類實驗一、實驗原理1)概述模式識別中的分類問題是根據(jù)對象特征的觀察值將對象分到 某個類別中去。統(tǒng)計決策理論是處理模式分類問題的基本理論之 一,它對模式分析和分類器的設(shè)計有著實際的指導(dǎo)意義。 貝葉斯(Bayes)決策理論方法是統(tǒng)計模式識別的一個基本方法, 用這個方法進行分類時需要具備以下條件:各類別總體的分布情況是己知的。要決策分類的類別數(shù)是一定的。其基本思想是:以Bayes公式為基礎(chǔ),利用測量到的對象特征 配合必要的先驗信息,求岀各種可能決策情況(分類情況)的后 驗概率,選取后驗概率最大的,或者決策風(fēng)險最小的決策方式(分 類方式)作為決策(分類)的結(jié)果。也就是說選取
2、最有可能使得對 象具有現(xiàn)在所測得特性的那種假設(shè),作為判別的結(jié)果。常用的Bayes判別決策準(zhǔn)則有最大后驗概率準(zhǔn)則(MAP),極大 似然比準(zhǔn)則(ML),最小風(fēng)險Bayes準(zhǔn)則,Neyman-Pearson準(zhǔn)則 (N-P)等。2)分類器的設(shè)計對于一個一般的c類分類問題,其分類空間:O = vv1,vv2,-,vv.表特性的向量為:其判別函數(shù)有以下幾種等價形式:a)P(w店)P(旳任)tw G Wp j = 2、心印 H j叱,b)p(x|w.)F(vvf) )F(wJ J = 1,2,c,且/知 T w ec)心)=牛嗎牛,) = 1,2,C,印知TWM;d)In /?(x|vv.) + In P(
3、vv ) In J J = 1,2,心 hj 工 i t w e w;3)IRIS數(shù)據(jù)分類實驗的設(shè)計> IRIS數(shù)據(jù)集:一共具有三組數(shù)據(jù),每一組都是一個單獨的類別,每組 有50個數(shù)據(jù),每個數(shù)據(jù)都是一個四維向量。其分類空間為: 表特性的向量為:x = (xx2,xx4)>實驗?zāi)康模豪肂ayes判別準(zhǔn)則對三組數(shù)據(jù)進行分類,希望能夠盡 量準(zhǔn)確的判斷岀從IRIS數(shù)據(jù)集中選取的樣本所屬的類別。 >實驗設(shè)計思路:將每個數(shù)據(jù)看作是一個具有4維特征的觀察樣木Xi =(兀,Xi2,忑3,兀4丿=1,2,350其中,) = 1234 = 123.假設(shè)每類數(shù)據(jù)的每維都的分別服從正態(tài)分布即 廠“;
4、町 20-/2并且兩兩獨立。由數(shù)理統(tǒng)計理論可知,樣木均值和修正方差分別為和 ,的無偏估計量,故可近似為求得“和/為:“;卩=%yj = l,2,3,4.p = l,2,3.2 =_!_y (xy - Xf y J = 1,2,3,4." = 1,2,3.貝葉斯決策規(guī)則選取:心)= '¥1”丿 = 123, M/HiTwew血旳丿P(叱)由于不同維度數(shù)據(jù)兩兩獨立,故其中:1()="伸叫)_ /(駟)_仟九(入帆)A ”龜)人Lb)1喬exp3-/<7)2=n-g ib;另讓門限值:P(wJ N.-/< = - j、i = 123 j 式 iPM
5、M 其中:Nj和M為所選待分類樣本j類數(shù)據(jù)和i類的個數(shù), 屬于先驗知識。比較心)與門限值的大小判斷樣本所屬類別 最后計算分類的正確率>二、實驗過程1) 求取每類數(shù)據(jù)的每個分量的均值和修正方差數(shù)代碼如 下:sum=zeros(3,4); sd=zeros(3,4); for j=l:l:4 for i=l:1:50$ for i=l:l:20 $sum(1,j)=sum(1,j)+samplel(iz j);sum(2z j)=sum(2,j)+sample2(iz j);sum(3,j)=sum(3,j)+sample3(iz j);endend sum=sum/50;$sum=sum/
6、20;$for j=l:l:4for i=l:1:50sd(lz j)=sd(lz j) + (samplel(i,j)-sum(lz j)A2; sd(2,j)=sd(2z j) + (sample2(i,j)-sum(2,j)A2; sd(3zj)=sd(3zj) + (sample3(i z j)-sum(3 z j)A2; end endsd=sd/49;$ sd=sd/19; $其中每類數(shù)據(jù)都有4組均值和修正方差,3類數(shù)據(jù)總共12組,分 別存放在sum和sd這兩個3X4的矩陣中。2) 用一個函數(shù)來實現(xiàn)分類器的功能,代碼如下 function elfresult accuracyrat
7、e = bayesclassifier(samples,dimen,sum,sdz modelz mode2) elfresult=zeros(dimenz 2);if ( (model (1,1) -=0) && (mod" (1,2) -=0) && (mod" (l,3)=0) compare=1,2;endif (model(1,1)-=0)&&(mod“(l,2)=0)&&(mod“(lz3)-=0) compare=1,3;endif ( (model (1, l)=0) && (m
8、od“ (1,2) -=0) && (mod" (1,3) =0) compare=2,3;endcomparel=compare(1z1);compare2=compare(lz 2); class=zeros(1,3);la=zeros(1,4);lb=zeros(1,4);for i=l:1:dimenif samples(iz 5)=1class (1,1)=class(1z1)+1;endif samples(i,5)=2 class (1f 2)=class(1,2)+1;endif samples(iz 5)=3 class (1,3)=class(1z
9、 3)+1;endendn=class(1,compare2)/class(1,comparel)for i=l:1:dimenla (1 z 1)=1/sqrt (sd (comparel z 1) ) *e:-:p (- (samples (iz 1) -sum (comparel z1)A2/ (2*sd(comparel,1);la(lz2)=l/sqrt(sd(comparelz 2)*exp(-(samples(i z 2)-sum(comparel ,2)A2/ (2*sd(comparel,2);la(lz3)=l/sqrt(sd (comparel z 3) ) *e:-:p
10、 (- (samples (iz 3) -sum (comparel z3)A2/(2*sd(comparelz3);la(14)=l/sqrt(sd(comparelr 4)*exp(-(samples(i,4)-sum(comparel z4)A2/(2*sd(comparel,4);lb (1 z 1)=1/sqrt (sd (compare2,1) ) *e:-:p (- (samples (iz 1) -sum (compare2 z1)A2/ (2*sd(compare2,1);lb(lz2)=l/sqrt(sd(compare2,2)*exp(-(samples(i z 2)-s
11、um(compare2 ,2)A2/ (2*sd(compare2,2);lb(lz3)=l/sqrt(sd(compare2 r 3)*exp(-(samples(iz 3)-sum(compare2 z3) ) A2/(2*sd(compare2,3);lb(14)=l/sqrt(sd(compare2,4)*exp(-(samples(i,4)-sum(compare2 z4) )A2/(2*sd(compare2z4);for j=l:l:4if(mode2(1,j)=0)la(l,j)=l;lb(l,j)=l;endendlx=la(lzl)*la(lz2)*la(lz3)*la(l
12、z4)/(lb(lz1)*lb(lz2)*lb(lz3)*lb(1,4)elfresult(iz1)=i;if lx>=nelfresult(i,2)=comparel;else elfresult(i,2)=compare2;endendaccuracyrate=O;for i=l:1:dimenif elfresult(iz 2)=samples(iz 5) accuracyrate=accuracyrate+l;endendaccuracyrate=accuracyrate/dimen;end該函數(shù)有共有兩個輸出量,六個輸入?yún)?shù)。其中各個參數(shù)的規(guī)定如下:Samples: 一個Dim
13、enX 5的矩陣,Dimen是選取樣本的 數(shù)量,矩陣前4列存放樣本的4維數(shù)據(jù),最后一列存 放相應(yīng)行樣本真實的類別數(shù)(1, 2, 3)。Dimen:選取樣本的數(shù)量。Sum:數(shù)據(jù)集的均值參數(shù)陣。Sd:數(shù)據(jù)集的修正方差參數(shù)陣。Model:模式選擇參數(shù)1,它是一個3維的行向量:mod e =,a29a3)其中曲= 1,2,3分別對應(yīng)數(shù)據(jù)集的三個類別,當(dāng)曲= 1,2,3 不為零時,就在決策域中添加第i類。總共有三種模 式:n«d H = (1,1,0)在第一類和第二類中進行判別n«dH =(L0,l)在第一類和第三類中進行判別 檢心(0,1,1)在第二類和第二類中進行判別Mode2:
14、模式選擇參數(shù)2,它是一個4維德行向量:mod e2 =(01,02,民,04)其中0J = 1,2,3,4分別對應(yīng)數(shù)據(jù)集的4個維度分量,當(dāng) «,-,/ = 1,2,3不為零時,第i個維度的分量就作為判別分 類的依據(jù)進行考慮,匕,山1,2,3為零時,則第i個維度的 分量忽略。Mode2共有多種模式15種模式。例如: nx)de2 = (1,0,14)表示第二維的數(shù)據(jù)特征不參與分類。 對于兩個輸出參數(shù):Clfresult:是一個3XDimen的矩陣,輸出對每個數(shù)據(jù) 的分類結(jié)果,并顯示其真實所屬類別和在Samples中 的序號。Accuracyrate:輸出Bayes分類的正確率。3) 選
15、定不同的樣本組合與特征的組合,調(diào)用 bayesclassifier函數(shù)進行分類。三. 實驗結(jié)果與分析1)實驗結(jié)果:利用每類50個數(shù)據(jù)求出相應(yīng)的均值和修正方差作為正態(tài)分布參數(shù)。并將每類中所有的50個數(shù)據(jù)全部 拿來分類,dimen=100結(jié)果為(分類的正確率):一類(50)一類(50)二類(50)Mode2二類(50)三類(50)三類(50)(1,0, 0, 0)0. 890.950. 70(0, 1,0, 0)0. 830. 750. 58(0, 0, 1,0)110.93(0, 0, 0, 1)110. 94(1, 1,0, 0)0. 990.990. 68(1,0, 1,0)110. 87(
16、1,0,0, 1)110. 94(0, 1, 1, 0)110. 88(0, 1,0, 1)110. 92(0, 0, 1, 1)110. 94(1, 1, 1,0)110. 82(1, 1,0, 1)110. 92(1,0, 1, 1)110. 95(0, 1, 1, 1)110. 94(1,1,1,1)110. 94利用每類的20個數(shù)據(jù)求岀相應(yīng)的均值和修正方差 作為正態(tài)分布參數(shù)。并將每類中另外的30個數(shù)據(jù)拿 來分類,dimen=60結(jié)果為(分類的止確率):Model一類(30)一類(30)二類(30)Mode2二類(30)三類(30)三類(30)(1,0, 0, 0)0.91670. 98
17、330.7167(0, 1, 0, 0)0. 86670. 750.60(0, 0, 1, 0)110.9167(0, 0, 0, 1)110.9167(1, 1,0, 0)0. 983310. 70(1,0, 1,0)110. 8667(1,0, 0, 1)110. 9333(0, 1, 1, 0)110. 8667(0, 1,0, 1)110. 9000(0, 0, 1, 1)110. 9333(1, 1, 1,0)110.8167(1, 1,0, 1)110. 9333(1,0, 1, 1)110. 9500(0, 1, 1, 1)110. 9333(1,1,1,1)110. 9500利
18、用每類的20個數(shù)據(jù)求出相應(yīng)的均值和修正方差 作為正態(tài)分布參數(shù)。分別在第二類中取20個,10 個和5個數(shù)據(jù),在第三類中固定取30個數(shù)據(jù),放在 一起進行分類,結(jié)果為(第二類數(shù)據(jù)分類的正確率):ModelMode2二類(20)三類(30)二類(10)三類(30)二類(5) 三類(30)(1,0, 0, 0)0. 650000(0, 1, 0, 0)0. 300000(0, 0, 1, 0)0. 85000. 50000. 4000(0, 0, 0, 1)0. 90000. 80000. 6000(1, 1, 1, 1)0. 90000. 80000. 80002)分析:實驗結(jié)果反映出鶯尾花數(shù)據(jù)集:第一類數(shù)據(jù)和第二類數(shù)據(jù)的第一和第二維比較相 似,第三和第四維數(shù)據(jù)差別很大。第一類數(shù)據(jù)和第三類數(shù)據(jù)的第一和第二維比較
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年生態(tài)旅游可持續(xù)發(fā)展規(guī)劃與管理旅游目的地生態(tài)旅游發(fā)展規(guī)劃報告
- 智能電網(wǎng)在2025年能源行業(yè)中的應(yīng)用與產(chǎn)業(yè)生態(tài)構(gòu)建報告
- 智能設(shè)備配對管理制度
- 大公司工廠績效管理制度
- 印刷廠安全生產(chǎn)管理制度
- 婦產(chǎn)科儀器設(shè)備管理制度
- 護理制度流程化管理制度
- 客服辦公室設(shè)備管理制度
- 春季魚塘開口管理制度
- 產(chǎn)品銷售群規(guī)定管理制度
- 2025-2030中國經(jīng)顱磁刺激儀(TMS)行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030中國碳酸鎂行業(yè)市場發(fā)展分析及發(fā)展趨勢與投資前景研究報告
- 《飛向太空的航程》課件【中職專用】高一語文(高教版2023基礎(chǔ)模塊下冊)
- 2025蘭州資源環(huán)境職業(yè)技術(shù)大學(xué)輔導(dǎo)員考試試題及答案
- 2025年下半年山西焦煤西山煤電集團公司招聘270人易考易錯模擬試題(共500題)試卷后附參考答案
- 小紅書《家的一平米》招商方案
- 上海中考:地理高頻考點
- 道路工程平移合同協(xié)議
- 尺骨骨折護理課件
- 處世奇書《解厄鑒》全文譯解
- 導(dǎo)彈的介紹教學(xué)課件
評論
0/150
提交評論