計數資料的統計描述課件_第1頁
計數資料的統計描述課件_第2頁
計數資料的統計描述課件_第3頁
計數資料的統計描述課件_第4頁
計數資料的統計描述課件_第5頁
已閱讀5頁,還剩42頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

計數資料的統計描述計數資料的統計描述主要內容一、常用相對數二、應用相對數的注意事項三、動態數列四、常用疾病統計指標五、計數資料的統計推斷計數資料的統計描述年齡工人管理人員農民商業服務無知識分子總計182000305209261018045222871024701115024503428521534436126504325451337036628343510347857248301114112239171143214231424360344253122283621145114383110218400020002合計2071411022085372061401按某種屬性分類,然后清點每類的數據。如按年齡(2歲一組)與職業整理。計數資料的數據整理計數資料的統計描述為什么引入相對數?

絕對數的局限性。計數資料的統計描述相對數的概念:兩個有聯系的(數值)指標之比。相對數的種類:比:1.構成比

2.相對比

3.率重要區別:分子、分母計數資料的統計描述率(rate):說明某現象或某事物發生的頻率或強度。率=(實際發生數/可能發生總數)×比例基數

比例基數:100%、1000‰、10000/萬、

100000(1/10萬)等。如:發病率、死亡率、發生率、陽性率、患病率等。

注意:不受其它指標的影響;各率相互獨立,其之和不為1(如是則屬巧合);一、常用相對數(relativenumber)指標計數資料的統計描述某地某年四種常見心血管病死亡率計數資料的統計描述構成比(proportion):說明某一事物內部,各組成部分所占的比重。也叫百分比。構成比=(某部分觀察單位數/各組成部分觀察單位總數)×100%

如:教研室16人中高級職稱有4人,占20%。

注意:各組成部分的構成比之和為100%某一部分比重增大,則其它部分相應減少。常用相對數(relativenumber)指標計數資料的統計描述相對比(relativeratio):是A、B兩個有關指標之比,說明A是B的若干倍或百分之幾,通常用倍數或分數表示。如:男:女、醫生:護士、教師:學生注意:1.A、B可以相同,也可以不同

2.A、B可以是絕對數,也可以是相對數常用相對數(relativenumber)指標計數資料的統計描述率與構成比率構成比概念發生的頻率或強度各組成部分所占的比重強調點隨機發生事件各部分的構成資料獲得較難容易特點不一定合計為100%計數資料的統計描述

年齡組⑴

受檢人數⑵白內障例數⑶

患者年齡構成比(%)⑷

患病率(%)⑸=(3)/(2)40~50~60~70~≥80合計5604412961492268129135971915.1828.7930.1321.654.2412.1429.2545.6165.1086.36

1468448100.0030.52率與構成比的例子計數資料的統計描述1.不能以構成比代替率。2.計算相對數的分子不宜過小。小則直接敘述。3.進行率的對比分析時,應予注意資料可比性。兩個率要在相同的條件下進行。研究方法相同、研究對象同質、觀察時間相等、地區、民族、年齡、性別等。4.正確求平均率。例:若P1=x1/n1;P2=x2/n2;P3=x3/n3

P=(x1+x2+x3)/n1+n2+n3)(正確)

P=(P1+P2+P3)/3(錯誤)5.假設檢驗:遵循隨機抽樣原則,進行差別顯著性檢驗。二、應用相對數的注意事項計數資料的統計描述例子

例1.在進行某遺傳病的研究中,一研究人員發現,在該病患者中,有90%是第一個孩子,由此可見該病的遺傳與出生順序有關---更容易遺傳給第一個孩子。這個結論是否正確,為什么?例2.該縣為提高醫療衛生的服務水平,對衛生人員進行培訓,但是,經過1年培訓,與培訓前相比,該縣孕產婦的死亡率卻升高,統計學檢驗差異有顯著性。如何解釋?培訓前:2000孕產婦100/10萬(死亡2人)

培訓后:2010孕產婦149/10萬(死亡3人)計數資料的統計描述概念:按照一定的時間順序,將某事物的統計指標依次排列起來,以便于觀察和比較該事物在時間上的發展變化趨勢。常用指標:1.絕對增長量:說明事物在一定時期內所增長的絕對數量(累計增長量、逐年增長量)。2.定基比發展速度:統一某個時間的指標作基數,其它各時間的指標與之相比3.環比發展速度:以前一個時間的指標作基數,相鄰的后一個指標與之相比。三、動態數列計數資料的統計描述四、常用疾病統計指標1.發病率2.患病率3.某病病死率4.治愈率5.有效率計數資料的統計描述1.發病率(incidencerate)概念:表示在觀察期內,可能發生某種疾病的一定人群中新發生該病的頻率。計算公式:某病發病率=×K在通常情況下,發病率的分母泛指一般平均人口數。意義:發病率是反映某病在人群中發生頻率大小的指標,常用于衡量疾病的發生,研究疾病發生的因果關系和評價預防措施的效果。計數資料的統計描述2.患病率(prevalencerate)概念:表示在某時點檢查時可能發生某病的一定人群中患有某病的頻率。計算公式:

其中某病病例數包括新病例和舊病例,凡患該病的一律統計在內。同一人不應同時成為同一疾病的兩個病例。這一指標最適用于病程較長的疾病的統計研究,用于衡量疾病的存在,反映某病在一定人群中的流行規模或水平,估計醫療設施的需求量。計數資料的統計描述3.某病病死率(casefatality)概念:在規定的觀察時間內,某病患者中因該病而死亡的頻率。計算公式:某病病死率=上式分母中患病情況不同,指標的概念也不同。如住院病人的病死率,分母為出院人數。某一地區某病病死率的分母則包括該地區所有患該病的病人。故醫院的病死率不能代表地區的病死率。計數資料的統計描述治愈率概念:接受治療的病人中治愈的頻率。治愈率=(治愈病人數/受治病人數)×100%有效率概念:接受治療的病人中治療有效的頻率有效率=(治愈有效病人數/受治病人數)×100%注意比較時:明確的標準;可比性。4.治愈率、有效率計數資料的統計描述率的抽樣誤差與可信區間率的統計學推斷1.樣本率與總體率比較的u檢驗2.兩個樣本率比較的u檢驗卡方檢驗1.卡方檢驗的基本思想2.四格表專用公式3.連續性校正公式4.配對四格表資料的χ2檢驗5.行×列(R×C)表資料的χ2檢驗五、計數資料的統計學推斷計數資料的統計描述(一)率的抽樣誤差與可信區間

1.率的抽樣誤差與標準誤

2.總體率的可信區間計數資料的統計描述1.率的抽樣誤差與標準誤

樣本率(p)和總體率(π)的差異稱為率的抽樣誤差(samplingerrorofrate),用率的標準誤(standarderrorofrate)度量。如果總體率π未知,用樣本率p估計計數資料的統計描述標準誤的計算計數資料的統計描述2.總體率的可信區間

總體率的可信區間(confidenceintervalofrate):根據樣本率推算總體率可能所在的范圍計數資料的統計描述(二)率的統計學推斷1.樣本率與總體率比較u檢驗2.兩個樣本率的比較u檢驗計數資料的統計描述1、樣本率與總體率比較的u檢驗u檢驗的條件:np

和n(1-p)均大于5時計數資料的統計描述2.兩個獨立樣本率比較的u檢驗表5-1兩種療法的心血管病病死率比較療法死亡生存

合計病死率(%)鹽酸苯乙雙胍26(X1)178204(n1)12.75(p1)安慰劑2(X2)6264(n2)3.13(p2)合計2824026810.45(pc)u檢驗的條件:n1p1和n1(1-p1)與n2p2和n2(1-p2)均>5計數資料的統計描述小結

1.樣本率也有抽樣誤差,率的抽樣誤差的大小用σp或Sp來衡量。

2.率的分布服從二項分布。當n足夠大,π和1-π均不太小,有nπ≥5和n(1-π)≥5時,近似正態分布。

3.總體率的可信區間是用樣本率估計總體率的可能范圍。當p分布近似正態分布時,可用正態近似法估計率的可信區間。

4.根據正態近似原理,可進行樣本率與總體率以及兩樣本率比較的u檢驗。計數資料的統計描述率的u檢驗能解決以下問題嗎?

率的反應為生與死、陽性與陰性、發生與不發生等二分類變量,如果二分類變量為非正反關系(如治療A、治療B);反應為多分類,如何進行假設檢驗?率的u檢驗要求:n足夠大,且nπ≥5和n(1-π)≥5。如果條件不滿足,如何進行假設檢驗?

計數資料的統計描述(三)卡方檢驗

χ2檢驗(Chi-squaretest)是現代統計學的創始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統計方法,可用于兩個或多個率間的比較,計數資料的關聯度分析,擬合優度檢驗等等。本章僅限于介紹兩個和多個率或構成比比較的χ2檢驗。計數資料的統計描述1.卡方檢驗的基本思想(1)療法死亡生存

合計病死率(%)鹽酸苯乙雙胍26(a)178(b)204(a+b)12.75(p1)安慰劑2(c)62(d)64(c+d)3.13(p2)合計28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表5-2兩種療法的心血管病病死率的比較實際頻數A(actualfrequency)(a、b、c、d)的理論頻數T(theoreticalfrequency)(H0:π1=π2=π):a的理論頻數=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理論頻數=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理論頻數=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理論頻數=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.計數資料的統計描述1.卡方檢驗的基本思想(2)

各種情形下,理論與實際偏離的總和即為卡方值(chi-squarevalue),它服從自由度為ν的卡方分布。計數資料的統計描述χ2檢驗的基本公式

上述基本公式由Pearson提出,因此軟件上常稱這種檢驗為Peareson卡方檢驗,下面將要介紹的其他卡方檢驗公式都是在此基礎上發展起來的。它不僅適用于四格表資料,也適用于其它的“行×列表”。計數資料的統計描述2.四格表專用公式(1)

為了不計算理論頻數T,可由基本公式推導出,直接由各格子的實際頻數(a、b、c、d)計算卡方值的公式:計數資料的統計描述2.四格表專用公式(2)

2(1)~u2

=2.19492=4.82(n>40,所有T

5時)計數資料的統計描述3.連續性校正公式(1)

χ2分布是一連續型分布,而行×列表資料屬離散型分布,對其進行校正稱為連續性校正(correctionforcontinuity),又稱Yates校正(Yates'correction)。⑴當n≥40,而1≤T<5時,用連續性校正公式⑵當n<40或T<1時,用Fisher精確檢驗(Fisherexacttest)校正公式:計數資料的統計描述3.連續性校正公式(2)因為1<T<5,且n>40時,所以應用連續性校正χ2檢驗計數資料的統計描述4.配對四格表資料的χ2檢驗計數資料的統計描述配對四格表資料的χ2檢驗也

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論