表格資料匯總常用統計方法_第1頁
表格資料匯總常用統計方法_第2頁
表格資料匯總常用統計方法_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、分類數據常用統計方法在科研數據的統計分析中,經常會遇到分類數據。分類數據包括計數資料和等級資料,兩者都是將觀 察指標分類(組),然后統計每一類(組)數目所得到的數據,區別是如果觀察指標的分類是無序的則為 計數資料,也叫定性資料或無序分類變量;如果觀察指標的分類是有序的,則為等級資料,也叫有序分類 數據。如調查某人群的血型分布,按照A、B、AB與0四型分組,計數所得該人群的各血型組的人數就是計數資料(因為 A、B、AB與0血型之間是平等的,并沒有度或量的差異);觀察用某藥治療某病患者的療效,以患者為觀察單位,結果可分為治愈、顯效、好轉、無效四級,然后對該病的患者,分別計數治 愈、顯效、無效、好轉

2、的人數則為等級數據(因為無效的療效最差、次之為好轉、治愈的療效最好,它們 之間有度或者量的區別)。分類數據進行統計分析時要列成表格,根據表格中分組變量和指標變量的性質、 樣本含量(n)和理論頻數(T )的大小以及分析的目的,所用的統計方法是不一樣的。下面通過一些有 代表性的例子來介紹分類數據常用的統計分析方法。一、2X 2 表2X2表也叫四格表。在實驗研究中,將研究對象分為2組進行實驗,實驗只有 2種可能的結果,如陽性與陰性,故叫2X2表;因為基本數據只有 4個,所以也叫四格表。根據不同的實驗安排,四格表又分 為完全隨機設計四格表和配對設計四格表。表1某抗生素的人群耐藥性情況用藥史不敏感敏感合

3、計耐藥率(%)曾服該藥180(174.10)215(220.90)39545.57未服該藥73(78.90)106(100.10)17940.78合計25332157444.08表1為完全隨機設計四格表。 其目的是要比較曾服該抗生素的人群和未曾服過該抗生素的人群,對該抗生素的耐約率有尢差異。表格中的四個基本數據(也叫實際頻數)分別為180、215、73、106; 括號中的四個數據(174.10、220.90、78.90、100.10)為四個理論頻數(T ),因n= 574 40且四個理論頻數(T )均大于5,故應用Pearson檢驗。經(SPSS 11.0,以下同)計算=1.145,P=0.2

4、85>0.05,故可認為曾服過該抗生素的人群和未曾服過該抗生素的人群對該抗生素的耐藥率尢差異。表2兩個年級大學生的近視眼患病率比較年級近視非近視合計近視率(%)四年級2(4.67)26(23.33)287.14五年級5(2.33)9(11.69)1435.71合計7354216.67表2也為完全隨機設計四格表。雖n -42 40但有兩個格子的理論頻數比1大比5小,此時需對 2進行連續性校正(因為理論頻數太小,會導致2增大,易出現錯誤的有差異的結論)。經計算,連續性校正的 2c=3.621 , P=0.057>0.05,可認為大學四年級與大學5年級學生近視眼的患病率無差異。如果不用連

5、續性校正的2檢驗,則 2 =5.486 , P=0.019<0.05,則會得出五年級大學生近視眼的患病率高于四年級大學生的錯誤結論。表3兩種療法對腰椎間盤脫岀癥的療效療法治愈未治愈合計治愈率(%)新療法72977.78保守療法26825.00合計981752.94表3也為完全隨機設計四格表。因n =17<40 (或有理論頻數小于 1),即使采用校正公式計算7.2也會有偏差,此時應采用四格表的Fisher確切檢驗法。經計算P=0.057>0.05,故認為新療法與保守療法對腰椎間盤脫出癥的治愈率無差異。表4198份痰液標本分別用 A、B兩種培養基的培養結果A培養基B培養基合計+

6、+48247220106126合計68130198表4為配對設計四格表。 A、B兩種培養基對同一份標本的培養結果視為對子數據,故為配對設計。欲分析 A、B兩種培養基的培養結果有無差異,應用配對四格表2 (也叫McNemar)檢驗。經計算P=0.652>0.05,故認為A、B兩種培養基的培養結果無差異。表5三個不同地區血型樣本的頻數分布地區ABABO合計亞洲321369952951080歐洲2584322194517北美洲40810637444995合計9875181549332592表5為完全隨機設計的 RX C表。與四格表不同的是:表 5的行或列均超過2,此類表格統稱為仃X列表,也叫R

7、X C表。四格表也可以視為行(或R) =2,列(或C)=2的行X列表。此表因為結果變量(血型)為多分類,故屬于多個構成比的比較。欲分析不同地區人群的血型分布構成有無差異,應用Pears on 2檢驗。經計算尸=297.375,P=0.000<0.05,可認為三地區人群的血型分布構成有差異。經進一步分析,發現亞洲地區A( 29.7%)、B( 34.2%)和0( 27.3%)血型的人比較多,歐洲和北美洲 A (分別為49.9%和41%)和O (分別為37.5%和 44.6%)血型的人比較多。表6三組藥物治療失眠的有效率組別有效無效合計有效率(%)新藥6424812.50傳統藥11263729

8、.73安慰劑2983778.38合計467612237.70表6也為完全隨機設計 RX C表,因結果變量為藥物的療效,分為有效和無效,屬于2分類變量,故屬于多個率的比較。欲分析不同藥物治療失眠的有效率有無差異,也用Pearson 2檢驗。經計算 2 =40.044,P=0.000<0.05,可認為三種藥物治療失眠的有效率有差異。經進一步分析,發現安慰劑治療失眠的效果最佳。表7某地5801人的血型ABO血型MN血型合計MNMNO4314909021823A3884108001598B4955879502032A計1451166626845801表7為雙向無序的表格

9、(即 ABO血型無等級差別,MN血型也無等級差別)。此表的試驗設計類似于配對設計(同一觀察對象同時觀察兩個屬性。即同一人既觀察 ABO血型,又觀察MN血型)。欲分析ABO2 / 4血型系統與 MN血型系統之間有無關聯,應先做Pearson 2檢驗,2 =213.626, P=0.000<0.05,可認為ABO血型系統與可認為雖然MN血型系統之間有關聯。進一步計算列聯系數C=0.188,因列聯系數(和1相比)不大,故ABO血型系統與 MN血型系統之間雖有關聯,但聯系不是很密切。表8三種藥物療效的觀察結果療效無效好轉顯效治愈A藥5314915100B藥22509485C藥244515185合

10、計511267320270表8為單項有序列聯表(即分組變量為藥物,為無序分類變量,結果變量為藥物的療效,為有等級順學的等級變量)。欲分析不同藥物的療效有無差異,應用秩和檢驗而不能像表 5那樣用 2檢驗。其理由為:如果用 2檢驗,則認為療效的四個等級(無效,好轉、顯效和無效)之間是平等的,無等級差別,顯然是不正確的。經秩和檢驗得 H=61.146, P=0.000<0.05,可認為A、B、C藥物的療效有差異。經進一步分 析得A藥的療效最好(95%)。表9眼晶狀體渾濁度與年齡的關系年齡晶狀體渾濁程度合計+202156744326301311016329540148128132408合計494

11、2962391029表9為雙向有序屬性不同的表格(年齡有等級順序,眼晶狀體渾濁程度有等級順序)。欲分析不同年齡組眼晶狀體渾濁程度有無差異,可把年齡看做無序變量,做秩和檢驗,經計算得H=68.078 , P=0.000<0.05, 可認為不同年齡組眼晶狀體渾濁程度有差異,經進一步分析得年齡在20的眼晶狀體+所占比例最多(66%);如果欲分析年齡與晶狀體渾濁程度之間有無關聯,則用Spearman等級相關分析。經計算得rs =0.253, P=0.000<0.05,可認為年齡與眼晶狀體渾濁程度相關,也即年齡越大,眼晶狀體渾濁程度越高。表10兩法檢查147例冠心病人室壁收縮運動的符合情況正

12、常582363減弱142750異常891734合計675327147對比法正常核素法減弱異常合計表10為雙向有序并且屬性相同的表格。此類表格的特點是雙向均為按等級分類,且分類屬性相同。 欲分析兩種方法檢查結果是否一致,應做一致性(Kappa)檢驗。經計算,Kappa檢驗的統計量=11.411,P=0.000<0.05,可認為兩種方法檢查結果一致,一致率為79.6%。對上面的內容進行整理,可得出不同分析目的和不同特征表格常用的統計方法見表11。表11分類資料常用統計方法總結分類試驗設計條件檢驗方法n > 40 且 T> 52Pearson檢驗(如表 1)完全隨機"、丄n >40 且 K TV 5設計校正2檢驗(如表2)四格表n V 40 或 Ov TV 1確切概率法(fisher檢驗)(如表3)配對設計配對72檢驗(McNemar檢驗)(如表4)欲分析構成比則 2檢驗;欲分析行指標與列指標有無關聯,則2雙

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論