第二十九章判別分析_第1頁
第二十九章判別分析_第2頁
第二十九章判別分析_第3頁
第二十九章判別分析_第4頁
第二十九章判別分析_第5頁
已閱讀5頁,還剩19頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二十九章第二十九章判別分析判別分析定義:定義:根據一批分類明確的樣品(訓練樣品)制定出根據一批分類明確的樣品(訓練樣品)制定出一個分類標準以指導新樣品歸類一個分類標準以指導新樣品歸類用途用途:1 疾病診斷(專家診斷系統)疾病診斷(專家診斷系統) 2 疾病預報疾病預報 3 預后估計預后估計 4 病因探討病因探討 5 環保評估環保評估v第一節 分類變量資料判別分析分類變量資料判別分析v目的:作出以定性或等級指標判別個體屬性目的:作出以定性或等級指標判別個體屬性分類或等級的概率公式。分類或等級的概率公式。v常用方法:常用方法:v1 最大似然判別法最大似然判別法v2 Bayes公式判別法公式判別法

2、一 最大似然判別法(優度法) 適用于指標為定性指標的兩類判別或多類判別。資料:個體分兩類或多類,判別指標全部為定性或等級 資料。原理:用獨立事件的概率乘法定理得到判別對象歸屬某 類的概率。1122()|) ( ()|)()|), 1,2, (18-7)klklkmlmkPP X SYP XSYP XSYkgv兩類判別v例29-1 用13個指標對脾虛證病人及非脾虛證病人作計量診斷,兩組病人均是消化系統、呼吸系統、心血管系統、內分泌系統及婦科病人(兩組病人病種構成差異無統計學意義,具有可比性)。步驟v指數計分法指數計分法v1 確定條件概率確定條件概率P(Xjk/Yi)v2 將概率換算成指數將概率換

3、算成指數 v Lijk=lgP(Xjk/Yi)+110v3 將條件概率換算成計量診斷表將條件概率換算成計量診斷表v4 新樣本以指數和大小為計量診斷的判斷標新樣本以指數和大小為計量診斷的判斷標 準準v5 回代回代v 病人男性,病人男性,45歲,面色蒼白無華,浮腫(歲,面色蒼白無華,浮腫(+),口淡(),口淡(+),脘),脘腹脹滿,舌胖色淡,舌苔白膩,脈緩細弱,血漿白蛋白腹脹滿,舌胖色淡,舌苔白膩,脈緩細弱,血漿白蛋白3.2g%,紅細胞紅細胞340/mm3,該病人是否屬于脾虛證?,該病人是否屬于脾虛證?v條件概率相乘法vPi=P(X1k/Yi) P(X2k/Yi) P(X3k/Yi)vP1=0.6

4、0*0.4*0.85*0.633*= 4.5410-4vP2=0.52*0.6*0.16*0.14* = 1.3110-9 多類判別多類判別 試用7個指標對4種類型的闌尾炎作鑒別診斷,收集的5668例完整、確診的病史資料歸納。表中列出了各型闌尾炎出現的體征、癥狀的頻率,以樣本頻率作為總體概率的估計值。表表18-3 5668例不同型闌尾炎病例的癥狀發生頻率(例不同型闌尾炎病例的癥狀發生頻率(%) 00017. 008. 061. 008. 095. 072. 011. 057. 01P 0018. 028. 032. 039. 093. 045. 037. 034. 02P 30.35 0.55

5、 0.35 0.81 0.79 0.18 0.610.0047P 00015. 057. 010. 096. 009. 022. 065. 021. 04P 如某病例昨晚開始出現右下腹痛、嘔吐等癥狀,大便正常。經檢查,右下腹部壓痛,肌性防御(+)、壓跳痛(+),體溫36.6,白細胞23.7109/L。 P3最大,故診斷該病例為壞疽型闌尾炎。手術所見與判別分析結果一致。 二二 Bayes公式判別法公式判別法v概念:根據事前概率(先驗概率)分布求出事后概率(后驗概念:根據事前概率(先驗概率)分布求出事后概率(后驗概率)分布,并依據事后概率分布做出統計推斷。概率)分布,并依據事后概率分布做出統計推斷

6、。v事前概率事前概率 P(yi) :用概率來描述事先對所研究對象認識的:用概率來描述事先對所研究對象認識的程度程度v (1) 由文獻查到由文獻查到 v(2)總體中隨機求得的各樣本例數的構成比)總體中隨機求得的各樣本例數的構成比v事后概率:根據具體資料、事前概率、特定的判別規則計算事后概率:根據具體資料、事前概率、特定的判別規則計算出來的概率,是對事前概率修正的結果。出來的概率,是對事前概率修正的結果。事后概率P(Y1/Xjk)=0.24.5410-4/(0.24.5410-4+0.81.3110-9) =9.9998810-1P(Y2/Xjk)=0.81.3110-9/(0.24.5410-4

7、+0.81.3110-9) =1.15417210-5)/()./()()/()./()()/(11imkikiimkikijkiYXPYXPYPYXPYXPYPXYP 第二節第二節 數值變量資料判別分析數值變量資料判別分析 目的:是作出以定量指標判別個體屬性分目的:是作出以定量指標判別個體屬性分類或等級的判別函數。類或等級的判別函數。 常用方法常用方法|: 1 Fisher判別法判別法 2 二值回歸二值回歸判別法判別法Fisher判別法步驟判別法步驟v1收集原始樣本,確定判別指標收集原始樣本,確定判別指標v2計算基礎數據計算基礎數據v3計算各組及兩組合計的離均差平方和及離均差積計算各組及兩組

8、合計的離均差平方和及離均差積和和v4計算判別系數及判別函數計算判別系數及判別函數v5判別函數有效性檢驗判別函數有效性檢驗v6回代回代v7新樣本檢驗新樣本檢驗v 例:為判別脾虛證及非脾虛證病人,分別抽取18例病人,選用三個指標:血漿白蛋白含量,血紅蛋白含量,總E玫瑰花環形成百分率,做判別分析。v一一 計算基礎數據計算基礎數據v1計算兩組基礎數據計算兩組基礎數據v2計算各組及兩組合計的離均差平方和及離均計算各組及兩組合計的離均差平方和及離均差積和差積和vLij=XiXj-(Xi)(Xj)/nv3計算兩組均數差數計算兩組均數差數vd1= 1A - 1Bvd2= 2A - 2Bvd3= 3A - 3B

9、XXXXXXl11b1+l12b2+.+l1mbm=d1l21b1+l22b2+.+l2mbm=d2 lm1b1+lm2b2+.+lmmbm=dm判別函數 Z=b1X1+b2X2+bnXnZ=1.9862X1-0.3642X2-0.1429X3 4 計算判別系數、判別函數計算判別系數、判別函數v二 確定臨界值vZA= b1 1A+b2 2A+b3 3AvZB= b1 1B+b2 2B+b3 3B20BAZZZXXXXXXXXZ0=(-3.03994 - 4.77080)/2 = -3.9054v三 判別函數有效性檢驗)()(2() 12DnnnnmnnmnnFBABABABA()()(2() 12DnnnnmnnmnnFBABABABA() 2)(.(22112BAmmnndbdbdbDv四 各因素的貢獻率v

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論