分類資料描述_第1頁
分類資料描述_第2頁
分類資料描述_第3頁
分類資料描述_第4頁
分類資料描述_第5頁
已閱讀5頁,還剩82頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、定性資料的統計描述為比較A、B兩藥治療缺鐵性貧血的效果,18名患者隨機等分為兩組,分別使用兩種藥物治療,觀察結果見下表。1.若比較兩藥療效的差異,下列說法錯誤的是:A 若兩組差值均服從正態分布且方差齊,應選擇t 檢驗B 若兩組差值均服從正態分布但方差不齊,應選擇t 檢驗C 若兩組差值均服從正態分布且方差齊,應選擇方差分析D 若兩組差值均服從正態分布但方差不齊,應選擇方差分析E 若兩組Hb差值不服從正態分布,應選擇秩和檢驗患者編號患者編號A藥藥B藥藥tP治療治療前前(Hb0)47.011.550.714.4-0.60 0.558 治療治療后后(Hb1)62.613.169.613.0-1.14

2、0.273 差值差值(d=Hb1-Hb0)15.6 9.818.913.5-0.60 0.556 貧血貧血患者經患者經A、B兩藥治療前后血兩藥治療前后血紅蛋白紅蛋白的變化結果的變化結果( ,g/L)xs2.若比較兩藥療效的差異,設兩組差值均服從正態分布且方差若比較兩藥療效的差異,設兩組差值均服從正態分布且方差齊,進行方差分析,下列說法錯誤的是:齊,進行方差分析,下列說法錯誤的是:A SS總總=SS組間組間+SS組內組內B MS總總=MS組間組間+MS組內組內C 若結果若結果P ,必有,必有F1D 若若同時進行同時進行t檢驗檢驗,兩種方法檢驗結果必一致,兩種方法檢驗結果必一致E 若同時進行若同時

3、進行t檢驗,必有檢驗,必有F=t2=0.363. 若為若為A、B、C三種藥物療效的比較,以確定何種藥物療效最三種藥物療效的比較,以確定何種藥物療效最佳,若三組均服從正態分布且方差齊,下列說法正確的是:佳,若三組均服從正態分布且方差齊,下列說法正確的是:A 應進行兩兩應進行兩兩t 檢驗,并將檢驗水準檢驗,并將檢驗水準 提高到提高到0.1或或0.2B 進行兩兩進行兩兩t檢驗增大了犯檢驗增大了犯II型錯誤概率型錯誤概率C 若方差分析若方差分析P ,可認為三種藥物療效完全,可認為三種藥物療效完全不等不等D 應進行方差分析,進一步采用應進行方差分析,進一步采用SNK法進行兩兩比較法進行兩兩比較E 應應進

4、行方差分析,進一步進行方差分析,進一步采用采用Dunnett-t 法進行法進行兩兩兩兩比較比較 統計分析統計分析 統計描述統計描述(statistical description) 統計推斷統計推斷(statistical inference) 參數估計參數估計 假設檢驗假設檢驗 復習統計研究的基本內容返回 國家醫師資格考試大綱臨床執業醫師頻數表與絕對數常用相對數及其應用注意事項與標準化法動態數列及其應用醫學統計中常用指標思考與討論課后作業本章要求單元單元細目細目要點要點二、醫學統計學二、醫學統計學方法方法4.4.定性資料的定性資料的統計描述統計描述(1 1)相對數常用指標及)相對數常用指標及

5、其意義;其意義;(2 2)相對數應用注意事)相對數應用注意事項。項。定性變量實際收集到的變量值的集合群體用統計指標、統計圖、統計表描述變量在群體中的的分布特征利用所收集資料,用統計指標、統計圖、統計表描述定性變量在群體中的的分布特征。定性變量&統計描述 定性變量:變量值為定性描述 按該變量的特征表現為若干窮盡,且互斥的類別分類變量 從群體角度出發,考察該變量各類別的觀察對象數計數變量 統計描述:用統計圖、表、指標等描述變量在群體中的分布特征ID縣別縣別不住院原因不住院原因ID縣別縣別不住院原因不住院原因1甲縣甲縣經濟困難經濟困難1乙縣乙縣沒有必要沒有必要2甲縣甲縣經濟困難經濟困難2乙縣

6、乙縣經濟困難經濟困難3甲縣甲縣經濟困難經濟困難3乙縣乙縣經濟困難經濟困難4甲縣甲縣沒有必要沒有必要4乙縣乙縣經濟困難經濟困難5甲縣甲縣經濟困難經濟困難5乙縣乙縣沒有時間沒有時間6甲縣甲縣經濟困難經濟困難6乙縣乙縣經濟困難經濟困難7甲縣甲縣經濟困難經濟困難7乙縣乙縣經濟困難經濟困難8甲縣甲縣沒有時間沒有時間8乙縣乙縣經濟困難經濟困難9甲縣甲縣沒有時間沒有時間9乙縣乙縣沒有時間沒有時間10甲縣甲縣其其 它它10乙縣乙縣經濟困難經濟困難333甲縣甲縣經濟困難經濟困難306乙縣乙縣其其 它它甲、乙兩縣應住院者未住院原因情況調查甲、乙兩縣應住院者未住院原因情況調查定性資料頻數表 以變量的類別作為分組標志

7、(組段),統計相應的頻數原因經濟困難沒有時間沒有必要其它合計頻數293171013333表表5.1甲縣應住院者未住院原因情況甲縣應住院者未住院原因情況原因原因經濟困難經濟困難沒有時間沒有時間沒有必要沒有必要其它其它合計合計頻數頻數282996306表表5.2乙縣應住院者未住院原因情況乙縣應住院者未住院原因情況列聯表(contingency table, cross tabs / tabulations) 將觀察對象按兩個定性變量的類別交叉分組,統計相應的頻數形成的頻數表,也叫RC表 行變量,有R個類別,一般存放處理因素 列變量,有C個類別,一般存放觀測指標表5.3甲、乙兩縣應住院者未住院原因情

8、況甲、乙兩縣應住院者未住院原因情況293171013333282996306575261919639縣別經濟困難沒有時間沒有必要其它合計甲乙合計縣別縣別經濟困難經濟困難沒有必要沒有必要沒有時間沒有時間其它其它合計合計甲甲293101713333乙乙282996306合計合計575192619639 該變量某個類別在群體中的發生次數 與基數有關:觀察總次數(或觀察對象數) 不便于相互比較分析 抽樣研究中難以說明總體的特征絕對數表5.3甲、乙兩縣應住院者未住院原因情況 例如某病用A法治療100人,有效80人;B法治療 150人,有效100人。若僅用絕對數80人和 100人比較會得到B法比A法好的錯

9、誤結論。 在比較兩法的療效,使計數資料具有可比性,將原始的兩個資料之比所得指標統稱為相對數(relative number)。 概念:兩個有關的數據或指標之比 意義 消除絕對數所來自基數不同的影響,便于資料比較、分析 在抽樣研究中,更能體現總體的特征 根據含義或用途不同可以分為: 構成比(Proportion) 率 頻率(Frequency) 速率(Rate) 比(Ratio)率 (rate) 概念:是指某種現象在一定條件下,實際發生的觀察單位數與可能發生該現象的總觀察單位數之比,用以說明某種現象發生的頻率大小或強度。 常以百分率(% %)、千分率()、萬分率(/ /萬)、十萬分率(1010萬

10、)等表示。 計算公式:注意: 比例基數“K”K”通常依據習慣而定,治愈率、感染率用百分率,出生率、死亡率用千分率,某些疾病的死亡率用十萬分率。 各率相互獨立,其之和不為1 1(如是則屬巧合)。K 單位總數單位總數可能發生某現象的觀察可能發生某現象的觀察總數總數發生某現象的觀察單位發生某現象的觀察單位率率研究終止時間(2015.12.31)研究開始時間(2015.1.1)研究期限研究起點(zero time)死亡事件(death event)代表規定的終點事件隨訪截止,7月生存時間(survival time) 研究起點到隨訪截止之間的時間意外死亡,10月失訪,8月仍然存活,12月11月10月2

11、月4=100%7=57.1% 年年累累計計死死亡亡頻頻率率 4=7111021081212=0.8/年年死死亡亡速速率率年年7例肺癌患者術后死亡情況例肺癌患者術后死亡情況1 12 23 34 45 56 67 7常用的頻率指標 病死率病死率(fatality rate):表示一定時期內(通常為1年),患某病的全部病人中因該病死亡者的比例。 病死率表示確診疾病的死亡概率,可表明疾病的嚴重程度,也可反映醫療水平和診斷能力,通常多用于急性傳染病,較少用于慢性病。 用病死率作為評價不同醫院的醫療水平時,要注意可比性。%100 同期患某病的病人數同期患某病的病人數數數某時期內因某病死亡人某時期內因某病死

12、亡人病死率病死率構成比 (Proportion) 概念:也叫構成指標,是指一事物內部某一組成部概念:也叫構成指標,是指一事物內部某一組成部分的觀察單位數與該事物各組成部分的觀察單位總分的觀察單位數與該事物各組成部分的觀察單位總數之比,數之比,用以說明某一事物內部各組成部分所占的用以說明某一事物內部各組成部分所占的比重或分布比重或分布。通常以通常以100100為比例基數,以百分比為比例基數,以百分比表示。表示。 計算公式: 某一組成部分的觀察單位數某一組成部分的觀察單位數/ /同一事物各組成部分同一事物各組成部分的觀察單位總數的觀察單位總數 100%100% 取值在0,1 各部分構成比總和為1或

13、100%,此消彼長 各部分構成比結合在一起說明該事物的內部構成情圖圖5.1 甲縣應住院者未住院原因構成比甲縣應住院者未住院原因構成比(%)88%3%5%4%經濟困難沒有必要沒有時間其它92%3%3% 2%經濟困難沒有必要沒有時間其它圖圖5.2 乙縣應住院者未住院原因構成比乙縣應住院者未住院原因構成比(%)圖圖5.3 甲、乙兩縣應住院者未住院原因甲、乙兩縣應住院者未住院原因構成情況構成情況0%10%20%30%40%50%60%70%80%90%100%甲甲乙乙經濟困難經濟困難沒有必要沒有必要沒有時間沒有時間其它其它餅圖(Pie graph)百分比條圖(Percent bar graph)縣別縣

14、別經濟困難經濟困難沒有必要沒有必要沒有時間沒有時間其它其它合計合計甲甲293(87.99)10(5.11)17(3.00)13(3.90)333(100.00)乙乙282(92.16)9(2.94)9(2.94)6(1.96)306(100.00)合計合計575(89.98) 19(2.97)26(4.07)19(2.97)639(100.00)構成比表表11.5甲、乙兩縣應住院者未住院原因構成比甲、乙兩縣應住院者未住院原因構成比(%)絕對數之比 ()100男男性性人人數數性性別別比比 性性比比例例 = =女女性性人人數數年齡年齡性別比性別比出生時出生時10720歲歲10050歲歲9860歲歲

15、9570歲歲8580歲歲662010年第六次人口普查(2010年11月1日零時標準時點):出生性別比105.20總 人 口 性 別 比118.06平均預期壽命(歲)74.83 男性72.38 女性77.37平均數之比 例5.4 為了解新生兒的鋅的營養狀況,分別測量某醫院足月兒、早產兒的臍血血清鋅含量,如下表:例數例數血清鋅含量血清鋅含量tP足月兒足月兒1001.850.545.3560 20599 9.23 60 2.91 5998 4.01 24 4.00 合計合計 223100 1.00 302 1.35 149605 1.00 192 1.28 某省疾病預防控制中心調查了甲乙兩地不同年齡

16、肝癌死亡率標準化直接法的計算步驟 1.1.選取標準構成。標準構成選取方法有三種: (1 1)另外選取一個包含比較各組(如各地區)的有代表性的、較穩定的、數量較大的構成為標準。如世界的、全國的、全省的數據為標準構成。 (2 2)取比較各組的各層例數的合計為標準構成。 (3 3)從比較的各組(如各地區)中任選其一的構成作 為標準構成。標準化直接法的計算步驟 2. 2.在標準構成下,以原分層率計算各組的預期發生數。 3.3.計算標準化率。4111000372705524.乙地標準化死亡率乙地標準化死亡率2911000372705480.甲地標準化死亡率甲地標準化死亡率注意事項注意事項標準化的目的在于

17、消除混雜因素對結果的影響,使計算的標準化總率具有可比性;標準化率并不表示某地實際水平,只能表明對比資料間的相對水平,且同一資料用不同“標準”標化,所得標化率不同,但是對比時的分析結論通常不變;注意事項注意事項對于存在混雜因素的兩個總率進行比較時,若不進行標準化,也可通過比較兩組的各年齡別發病(死亡)率,得出正確結論;資料分析時,若各組分率大小交叉出現,則不宜采用標準化法處理,應采用分層分析等平衡混雜因素的影響;比較樣本標準化率時,因同樣存在抽樣誤差,尚需進行假設檢驗。 動態數列及其應用 一系列按照時間順序排列的統計指標(包括絕對數、相對數或平均數) 反映事物或現象在時間上的變化和發展趨勢 常用

18、的動態數列分析指標 絕對增長量 發展速度與增長速度 平均發展速度與平均增長速度。年份年份患者數患者數絕對增長量絕對增長量發展速度發展速度增長速度增長速度累計累計逐年逐年定基比定基比環比環比定基比定基比環比環比19992669420005017523481234811.881.880.880.88200150600239064251.901.010.900.012002547132801941132.051.081.050.08平均平均1.270.27表5.6 某地區19992002年住院患者數發展動態 經調查得知甲、乙兩地的惡性腫瘤的粗死亡率均為89.94/10萬,但經過標準化后甲地惡性腫瘤的

19、死亡率為82.74/10萬,而乙地為93.52/10萬,發生此現象最有可能的原因是 A. 甲地的診斷技術水平更高 B. 乙地的惡性腫瘤防治工作做得比甲地更好 C. 甲地的老年人口在總人口中所占比例比乙地多 D. 乙地的老年人口在總人口中所占比例比甲地多 E. 甲地的男性人口在總人口中所占比例比乙地多From:卡方檢驗基本思想 2檢驗 考察實際頻數分布與假設成立條件下的理論分布之間吻合程度的假設檢驗方法 率或構成比的比較:比較兩個或多個總體率或構成比有無差別 頻數分布的擬合優度檢驗 關聯性分析/獨立性檢驗 線性趨勢檢驗1.建立檢驗假設,確立檢驗水準1:H血塞通銀杏達莫21890.83%240合并

20、0.050:=H血塞通銀杏達莫表表11.1 血塞通和銀杏達莫治療急性腦梗死的療效血塞通和銀杏達莫治療急性腦梗死的療效組別組別有效有效無效無效合計合計有效率有效率(%)血塞通血塞通114612095.00銀杏達莫銀杏達莫1041612086.67合計合計2182224090.832.選定檢驗方法,計算檢驗統計量 組別組別有效有效無效無效合計合計有效率有效率(%)血塞通血塞通12090.00銀杏達莫銀杏達莫12086.67合計合計2182224090.83120112009221824018240120112009221824018240120120222211240240表表11.1 血塞通和銀

21、杏達莫治療急性腦梗死的療效血塞通和銀杏達莫治療急性腦梗死的療效120120222211240240rcrcn mTn理論頻數的計算表表11.1 血塞通和銀杏達莫治療急性腦梗死的療效血塞通和銀杏達莫治療急性腦梗死的療效組別組別有效有效無效無效合計合計有效率有效率(%)血塞通血塞通114(109.0)6(11.0)12090.00銀杏達莫銀杏達莫104(109.0)16(11.0)12086.67合計合計2182224090.83注:括號內為理論頻數注:括號內為理論頻數計算Pearson 2 實際頻數(A)與理論頻數(T)之間的吻合程度每個格子的差異每個格子的差異形成綜合性指標形成綜合性指標考慮每

22、個格子對總差異考慮每個格子對總差異的相對貢獻大小的相對貢獻大小去除正負號的影響去除正負號的影響Pearson 2 1900年Karl Pearson首先提出,故又稱Pearson 2 度量實際頻數(A)與H0成立條件下理論頻數(T)之間吻合程度的指標 本例22()A TT2222()114 146 104905.004120 120 218 22adbcnA TTabcdacbd 四格表3.確定是否發生小概率事件 Pearson 2與 2分布 若H0成立,即 血脈通= 銀杏達莫=90.83% 理論上 2=0 2不正好等于0,是由于抽樣誤差引起 在一次抽樣中出現較大 2的可能性較小22A TT2

23、11RC111=1=kspRCCRRCkRCsCpR(格子數)(用樣本統計量估計總體參數個數)(總體個數)3.確定是否發生小概率事件 Pearson 2與 2分布 若H0成立,即 血脈通= 銀杏達莫=90.83% 理論上 2=0 2不正好等于0,是由于抽樣誤差引起 在一次抽樣中出現較大 2的可能性較小22A TT211RC111=1=kspRCCRRCkRCsCpR(格子數)(用樣本統計量估計總體參數個數)(總體個數) 2分布 =1 =3 =5 =10不同自由度下的 2分布曲線21.取值區間為取值區間為0,+);2.曲線的形狀為正偏態,且僅決定于參數曲線的形狀為正偏態,且僅決定于參數 : 越越

24、小曲線越偏斜;小曲線越偏斜; + 時逼近于正態分布;時逼近于正態分布;3.曲線下面積表示相應區間的概率,總面積等于曲線下面積表示相應區間的概率,總面積等于1;4.隨著隨著 2值增大其右側尾部面積不斷減小。值增大其右側尾部面積不斷減小。概率密度 P0.99 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.02 0.01 0.005 10.00 0.00 0.02 0.06 0.15 0.45 1.07 1.64 2.71 3.84 5.41 6.63 7.88 20.02 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61

25、 5.99 7.82 9.21 10.60 30.11 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 9.84 11.34 12.84 40.30 0.71 1.06 1.65 2.19 3.36 4.88 5.99 7.78 9.49 11.67 13.28 14.86 50.55 1.15 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 13.39 15.09 16.75 60.87 1.64 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 15.03 16.81 18.55

26、71.24 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 16.62 18.48 20.28 81.65 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 18.17 20.09 21.95 2界值表界值表(P333)3.84 P0.99 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.02 0.01 0.005 10.00 0.00 0.02 0.06 0.15 0.45 1.07 1.64 2.71 3.84 5.41 6.63 7.88 20.02

27、0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 7.82 9.21 10.60 30.11 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 9.84 11.34 12.84 40.30 0.71 1.06 1.65 2.19 3.36 4.88 5.99 7.78 9.49 11.67 13.28 14.86 50.55 1.15 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 13.39 15.09 16.75 60.87 1.64 2.20 3.07 3.83 5.35 7

28、.23 8.56 10.64 12.59 15.03 16.81 18.55 71.24 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 16.62 18.48 20.28 81.65 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 18.17 20.09 21.95 2界值表界值表(P451) 2檢驗步驟1.建立檢驗假設,確立檢驗水準H0:兩種藥有效率相同,即 血脈通= 銀杏達莫H1:兩種藥有效率不同,即 血脈通 銀杏達莫 =0.052.選定檢驗方法,計算檢驗統計量利用樣本信息完成兩總體率的比較,考慮選擇 2檢驗 2=5.004 2(1)3.確定P值,作出統計推斷P40,Tmin=115,符合 2檢驗的條件,且無需校正。 2=5.004 2(1)3.確定P值,作出統計推斷查 2界值表,得0.02P0.05。按 =0.05水準,拒絕H0,接受H1,差別有統計學意義,可以認為兩藥治療急性腦梗死的有效率不同,血塞通較高。Pearson 2與 2分布 Pearson 2只是近似服從 2分布,尤其對于四格表 2分布本身為0, + )連續型分布 Pearson 2 根據頻數計算而來,取值是離散的 只有當總例數或理論頻數足夠大時,這種近似才較好79練習定性變量實際收集到的變量值的集合群

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論