




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 1卡方分布的基本知識卡方分布的基本知識普通四格表資料卡方檢驗普通四格表資料卡方檢驗配對四格表資料卡方檢驗配對四格表資料卡方檢驗行行*列表資料卡方檢驗列表資料卡方檢驗多個樣本率間的多重比較多個樣本率間的多重比較有序分組資料的線性趨勢檢驗有序分組資料的線性趨勢檢驗2設隨機變量設隨機變量u1,u2,uk,相互獨立,且都服從標準正態(tài),相互獨立,且都服從標準正態(tài)分布分布N (0,1)。那么,我們將。那么,我們將k個獨立標準正態(tài)變量的平方個獨立標準正態(tài)變量的平方和稱為和稱為卡方變量,它卡方變量,它滿足自由度為滿足自由度為的卡方分布,記為:的卡方分布,記為:2221222221212. .( )xxxXu
2、uuuX 如果隨機變量如果隨機變量X滿足以下概率密度函數,滿足以下概率密度函數,則稱其滿足自由度為則稱其滿足自由度為的卡方分布的卡方分布22221()22 Xf XXe221u自自由由度度,222122uu自自由由度度,222155uu自自由由度度,+ +1022110iu自自由由度度,3522135iu自自由由度度,其其頻頻數數分分布布仍仍然然為為偏偏態(tài)態(tài)22 取取近近似似正正態(tài)態(tài)分分布布222 21 , 1N當當 確定后,卡方分布曲線下右側尾部的面確定后,卡方分布曲線下右側尾部的面積為積為a a時,橫軸上相應的卡方值,記為時,橫軸上相應的卡方值,記為 2 2a,a,,如下圖如下圖;實際應用
3、時,可根據實際應用時,可根據 由附表由附表8查得查得如果如果 2 2 2 2a,a,,曲線下面積小于,曲線下面積小于a a;反之則;反之則大于大于a a 2(a a, )a1875年,年,F. Helmet得出:來自正態(tài)總體的樣本方得出:來自正態(tài)總體的樣本方差的分布服從卡方分布:差的分布服從卡方分布:因此卡方分布可用于總體方差的區(qū)間估計:因此卡方分布可用于總體方差的區(qū)間估計:卡方分布也可用于樣本方差與總體方差比較的假卡方分布也可用于樣本方差與總體方差比較的假設檢驗設檢驗222(1)(1)nSn 222220.9750.025(1)(1)95% ,總總體體方方差差的的可可信信區(qū)區(qū)間間,nSnS從
4、一正態(tài)總體中抽樣,樣本方差從一正態(tài)總體中抽樣,樣本方差s2并不總等于總并不總等于總體方差體方差2,二者間存在抽樣誤差;這種抽樣誤差,二者間存在抽樣誤差;這種抽樣誤差存在統(tǒng)計規(guī)律存在統(tǒng)計規(guī)律根據樣本方差的分布規(guī)律有:根據樣本方差的分布規(guī)律有:22220.975,10.025,1220020(1)(1) nnnsns 若若或或則則認認為為總總體體方方差差不不是是1900年年K. Pearson又從檢驗分布的擬合優(yōu)度又從檢驗分布的擬合優(yōu)度(goodness of fit)中也發(fā)現了卡方分布可用于檢驗中也發(fā)現了卡方分布可用于檢驗資料的實際頻數和理論頻數是否相符等問題:資料的實際頻數和理論頻數是否相符等
5、問題: 221 kiiiiATTCarl Pearson or Karl Pearson (1857-1936)Journal BiometrikaPearson product-moment correlation coefficient、Linear regression、Pearsons chi-square test12 在兩對遺傳因子的試驗中,在兩對遺傳因子的試驗中,F2的四種表型見下表,問該結的四種表型見下表,問該結果能否滿足果能否滿足Mendel關于關于F2的的9:3:3:1規(guī)律?規(guī)律?假設滿足上述規(guī)律,則不難求出假設滿足上述規(guī)律,則不難求出2500株植物中各種表型的株植物中各種
6、表型的理論頻數理論頻數T將實際頻數將實際頻數A與對應的理論頻數與對應的理論頻數T代入公式得:代入公式得: 2421222212601406.25625468.75610468.755156.25 =1406.25468.75468.75156.25 =256.2667 iiiiATT本例中有四個實際頻數,其中受到總頻數為本例中有四個實際頻數,其中受到總頻數為2500的限制,因此能夠自由取值的僅有的限制,因此能夠自由取值的僅有4-1=3個,所個,所以自由度以自由度=3查表得查表得20.05,3=7.81,故在,故在=0.05的水準上拒絕的水準上拒絕H0,接受接受H1;認為該批植物的兩種遺傳因子不
7、滿足;認為該批植物的兩種遺傳因子不滿足9:3:3:1的遺傳定律;可能出現連鎖遺傳的遺傳定律;可能出現連鎖遺傳在課文在課文P96、P126中,詳細闡述了如何使用卡方中,詳細闡述了如何使用卡方檢驗推斷某現象的頻數分布是否滿足特定的概率檢驗推斷某現象的頻數分布是否滿足特定的概率分布分布例如資料是否滿足正態(tài)分布、二項分布、例如資料是否滿足正態(tài)分布、二項分布、Poisson等醫(yī)學研究中常見的概率分布等醫(yī)學研究中常見的概率分布 24212222=4-1-1()26-10.877410-31.35252830.1229189.6472 =10.877431.352530.12299.6472 =42.95i
8、iiiATT 自自由由度度組組數數計計算算卡卡方方值值需需要要事事先先估估計計總總體體概概率率普通四格表的普通四格表的2檢驗可用于:檢驗可用于:兩個樣本率間的比較兩個樣本率間的比較兩兩個二分類變量間關聯度分析個二分類變量間關聯度分析*21某中藥在改變劑型前治療某中藥在改變劑型前治療152例,治愈例,治愈129例;改變劑例;改變劑型后又觀察型后又觀察130例,治愈例,治愈101例,改變劑型前后的療效例,改變劑型前后的療效是否不同?是否不同?組別組別療效療效合計合計(有效率有效率)治愈治愈未愈未愈舊劑型舊劑型12923152(84.9%)新劑型新劑型10129130(77.7%)合計合計23052
9、28222在表格中有兩組,每組的結果為二分類結果在表格中有兩組,每組的結果為二分類結果(22),這樣的表格稱為四格表,其通用格式),這樣的表格稱為四格表,其通用格式表達如下:表達如下:23 a+b c+d abcdac bdN 陽陽性性 陰陰性性 合合計計分分組組甲甲分分組組乙乙合合計計 從表中可見兩劑型的治愈率不相同,那么這從表中可見兩劑型的治愈率不相同,那么這種差別究竟是由于抽樣誤差還是由于不同劑種差別究竟是由于抽樣誤差還是由于不同劑型療效的確有差別?型療效的確有差別?不妨假設兩劑型的療效是相同的,那么此時不妨假設兩劑型的療效是相同的,那么此時兩種劑型的療效之差僅僅來源于抽樣誤差兩種劑型的
10、療效之差僅僅來源于抽樣誤差24既然假設兩劑型的總體療效相同,可以考慮將既然假設兩劑型的總體療效相同,可以考慮將兩組樣本資料合并,計算一個兩組樣本資料合并,計算一個“合計率合計率”,作,作為總體率的估計為總體率的估計兩劑型的合計治愈率兩劑型的合計治愈率Pc=230/282=81.56%在此合計治愈率的情況下,治療在此合計治愈率的情況下,治療152例患者應該例患者應該有有Pc152=124.0例治愈,例治愈,(1-Pc)152 =28.0例例未愈;同理如果治療未愈;同理如果治療130例患者,應該有例患者,應該有106.1例有效,例有效,23.9例無效例無效將上述數據稱為療效的理論數將上述數據稱為療
11、效的理論數,據此可推算其,據此可推算其余數據的理論頻數余數據的理論頻數2526()()()()abcdacaaTabNbdbbTabNacccTcdNbdddTcdN所所對對應應的的列列合合計計值值所所對對應應的的行行合合計計值值總總例例數數所所對對應應的的列列合合計計值值所所對對應應的的行行合合計計值值總總例例數數所所對對應應的的列列合合計計值值所所對對應應的的行行合合計計值值總總例例數數所所對對應應的的列列合合計計值值所所對對應應的的行行合合計計值值總總例例數數組別組別療效療效合計合計治愈治愈(理論治愈理論治愈)未愈未愈(理論未愈理論未愈)舊劑型舊劑型129(124.0)23(28.0)1
12、52新劑型新劑型101(106.1)29(23.9)130合計合計2305228227從表中可見,療效的理論數(根據假設兩總體從表中可見,療效的理論數(根據假設兩總體療效相同得到)與實際人數存在差別療效相同得到)與實際人數存在差別如果我們的假設成立的話,這種差別屬于抽樣如果我們的假設成立的話,這種差別屬于抽樣誤差,應該不會很大;反之,如果這種差別很誤差,應該不會很大;反之,如果這種差別很懸殊,則因該懷疑原假設不成立懸殊,則因該懷疑原假設不成立如何評價如何評價“懸殊懸殊”與與“不懸殊不懸殊”?28卡方檢驗基本公式卡方檢驗基本公式:理論數與實際數間的差距可為正亦可為負,因此需要理論數與實際數間的差
13、距可為正亦可為負,因此需要對二者之差取平方,而后再累加對二者之差取平方,而后再累加如前所述,比較兩組數據變異程度,直接比較標準差如前所述,比較兩組數據變異程度,直接比較標準差是不合理的,因為兩組數據的均數可能差距甚大或單是不合理的,因為兩組數據的均數可能差距甚大或單位不同位不同例如:例如:A=303,T=300,A-T=3; A=33,T=30,A-T=3;因此僅有;因此僅有(A-T)2尚不足以說明二者間不吻合的尚不足以說明二者間不吻合的程度,需要對程度,需要對A與與T間的差距作間的差距作“標準化標準化”或或“相對相對化化”29222()()ATT 實實際際頻頻數數理理論論頻頻數數理理論論頻頻
14、數數如何對如何對A與與T間的差距作間的差距作“相對化相對化”或或“標準標準化化”?最直觀的方法就是將離差的平方除于一個頻最直觀的方法就是將離差的平方除于一個頻數數實際頻數實際頻數A或理論頻數或理論頻數T最終將其除于最終將其除于T可有以下幾點解釋:可有以下幾點解釋: 為了避為了避免免A=0時除式沒有意義的情況,時除式沒有意義的情況, 實際頻數實際頻數A即使在樣本含量相同的情況下,仍將隨不同抽即使在樣本含量相同的情況下,仍將隨不同抽樣改變;而樣改變;而T無此問題,比無此問題,比A穩(wěn)定,用其作為分穩(wěn)定,用其作為分母更穩(wěn)健也更具代表性母更穩(wěn)健也更具代表性30此外,卡方計算公式中每項均非負,因此卡方此外
15、,卡方計算公式中每項均非負,因此卡方值的大小不僅取決于值的大小不僅取決于A與與T間的相對差距,還取間的相對差距,還取決于累加項數的多少決于累加項數的多少因此需對累加項數作調整,引入因此需對累加項數作調整,引入“自由度自由度”的的概念概念在列聯表資料中(四格表也是一種列聯表),在列聯表資料中(四格表也是一種列聯表),自由度可以簡單地表達為自由度可以簡單地表達為(行數行數-1)(列數列數-1),即,即(R-1)(C-1);其含義為;其含義為列聯表中除行、列合計值列聯表中除行、列合計值外可以自由取值的格子個數(或總自由度外可以自由取值的格子個數(或總自由度-行合行合計自由度計自由度-列合計自由度)列
16、合計自由度)31如果假設成立,實際數與理論數的差距應該較如果假設成立,實際數與理論數的差距應該較小,按照上式計算的卡方值因該接近小,按照上式計算的卡方值因該接近0,如果卡,如果卡方值遠離方值遠離0則應該拒絕原假設則應該拒絕原假設卡方值滿足卡方分布,求得相應卡方值的曲線卡方值滿足卡方分布,求得相應卡方值的曲線下面積就可以得到下面積就可以得到P值,進而作結論值,進而作結論可見卡方檢驗的基本原理就是分析實際頻數與可見卡方檢驗的基本原理就是分析實際頻數與根據假設構建的理論頻數間的吻合程度(擬合根據假設構建的理論頻數間的吻合程度(擬合度)度)32H0:兩總體率相同:兩總體率相同 H1:兩總體率不同:兩總
17、體率不同a a=0.05 2=(A-T)2/T計算卡方值為計算卡方值為2.428自由度自由度v=(R-1)(C-1)=1,即四個格子中可自由取即四個格子中可自由取值的個數;本例中,由于行列的合計值固定,值的個數;本例中,由于行列的合計值固定,所以四個格子中只有一個可自由取值,故所以四個格子中只有一個可自由取值,故v=1查表得:查表得: 2 20.05,10.05,1=3.84,所以,所以P0.05,在,在a a=0.05的水準上不拒絕的水準上不拒絕H0,尚不認為兩種劑型的治,尚不認為兩種劑型的治愈率不同愈率不同33如前所述,卡方分布是連續(xù)的;然而如前所述,卡方分布是連續(xù)的;然而理論數的取值卻是
18、不連續(xù)的;因此本理論數的取值卻是不連續(xù)的;因此本章節(jié)的公式章節(jié)的公式7-1是對卡方的近似公式,是對卡方的近似公式,其使用效能受到理論數大小的制約其使用效能受到理論數大小的制約34由離散型資料按卡方檢驗公式式算得的卡方值均有由離散型資料按卡方檢驗公式式算得的卡方值均有偏大的趨勢(使得我們偏向于拒絕原假設),尤其偏大的趨勢(使得我們偏向于拒絕原假設),尤其是當自由度是當自由度=1 而且理論數較小時,偏差較大而且理論數較小時,偏差較大Frank Yates(1934)提出對四格表卡方值進行連)提出對四格表卡方值進行連續(xù)性矯正續(xù)性矯正矯正后的卡方值記為矯正后的卡方值記為 2c352210.5kiici
19、iATT當理論頻數當理論頻數T有有T5,而且而且n40時,卡方公時,卡方公式不需要校正,直接使用式不需要校正,直接使用當理論頻數當理論頻數T有有1T5,而且而且n40時,需時,需要校正,或者用精確概率法計算概率值要校正,或者用精確概率法計算概率值當理論頻數當理論頻數T有有T1,或者或者n40時,只可時,只可用精確概率法計算概率值用精確概率法計算概率值36原始卡方公式需要計算理論數,略顯麻煩原始卡方公式需要計算理論數,略顯麻煩在四格表資料中,可以使用專用公式,省略計算理在四格表資料中,可以使用專用公式,省略計算理論數的過程論數的過程專用公式如下:專用公式如下: 22 a+b c+dabcdac
20、bdNadbcnabcdacbd 37若有若有1T5,而且,而且n40時,該專用公式同樣需時,該專用公式同樣需要校正要校正38 22/ 2adbcnnabcdacbd 將病情相似的淋巴系統(tǒng)腫瘤患者隨機分成兩組,分別作將病情相似的淋巴系統(tǒng)腫瘤患者隨機分成兩組,分別作單純化療與復合化療,緩解情況見下表,問兩療法的緩單純化療與復合化療,緩解情況見下表,問兩療法的緩解情況是否不同?解情況是否不同?化療化療方法方法緩解情況緩解情況合計合計緩解緩解(理論緩解理論緩解)未緩解未緩解(理論未緩解理論未緩解)單純化療單純化療2(4.8)10(7.2)12復合化療復合化療14(11.2)14(16.8)28合計合
21、計16244039四格表卡方檢驗的校正四格表卡方檢驗的校正在上表中最小的理論數應該是在上表中最小的理論數應該是“單純化療單純化療” “緩解緩解”所對應,因為它所對應的行、列合計值最小;所對應,因為它所對應的行、列合計值最小;2所對所對應的理論數為應的理論數為4.8,小于,小于5,而且例數不小于,而且例數不小于40,所,所以本題應該作校正以本題應該作校正校正后卡方值為校正后卡方值為2.624(未校正時為(未校正時為3.889),故尚不),故尚不認為兩方案緩解情況不同認為兩方案緩解情況不同40什么是配對設計?什么是配對設計?常見配對設計的情況是那些?常見配對設計的情況是那些?41同一批樣品用兩種不
22、同的方法處理,處理同一批樣品用兩種不同的方法處理,處理的結果為二分類資料的結果為二分類資料 觀察對象根據配對條件配成對子,同一對觀察對象根據配對條件配成對子,同一對子中的不同個體分別接受不同的處理,處子中的不同個體分別接受不同的處理,處理的結果為二分類資料理的結果為二分類資料42例例7-3:某實驗室分別用乳膠凝集法和免疫熒光法:某實驗室分別用乳膠凝集法和免疫熒光法對對58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進行測定,結果見下表,問兩種方法的檢測結果有行測定,結果見下表,問兩種方法的檢測結果有無差別無差別:43 乳膠法乳膠法 免疫法免疫法 份數份數 11 2
23、 12 33在本例題中每份標本被一分為二(兩份標本實質上在本例題中每份標本被一分為二(兩份標本實質上是一樣的),同時接受兩種方法檢測;這樣抗核抗是一樣的),同時接受兩種方法檢測;這樣抗核抗體檢出情況差別完全取決于不同的方法,而與受檢體檢出情況差別完全取決于不同的方法,而與受檢者的基本情況無關者的基本情況無關所以本例為配對設計,目的是通過樣本資料判斷兩所以本例為配對設計,目的是通過樣本資料判斷兩方法的總體陽性概率是否有差別方法的總體陽性概率是否有差別44我們將上述表格稍作改變,得到如下四格表:我們將上述表格稍作改變,得到如下四格表:該四格表與前面所介紹的普通四個表有所不同;普通該四格表與前面所介
24、紹的普通四個表有所不同;普通四格表的四格表的“行行”為分組因素,為分組因素,“列列”為分組的結局,為分組的結局,而在配對四個表中,而在配對四個表中,“行行”中既包含分組因素,同時中既包含分組因素,同時也有該因素的結局,也有該因素的結局,“列列”也同樣也同樣,所以這種四格表,所以這種四格表稱為配對四格表稱為配對四格表 免疫法免疫法 乳膠法乳膠法 合合 計計 11 12 23 2 33 35 合合 計計 13 45 5845對含量為對含量為n的一份隨機樣本同時按照兩個二的一份隨機樣本同時按照兩個二項分類屬性,進行交叉分類形成的四格表項分類屬性,進行交叉分類形成的四格表屬性屬性A分類分類 屬性屬性B
25、分類分類 合合 計計 陽陽 性性 陰陰 性性 陽陽 性性 a c a+c 陰陰 性性 b d b+d 合合 計計 a+b c+d n4647在配對設計的四格表中,如果要了解不同的在配對設計的四格表中,如果要了解不同的處理方案的結局是否有別(例如兩種檢測方處理方案的結局是否有別(例如兩種檢測方法的陽性率是否有別)并不需要用到所有四法的陽性率是否有別)并不需要用到所有四格中的數據格中的數據免疫法免疫法中的陽性率為中的陽性率為(11+12)/58;乳膠法;乳膠法中的中的陽性率為陽性率為(11+2)/58;可見兩者都陰性可見兩者都陰性的的33份份標本對二者陽性率的差別沒有影響,而且二標本對二者陽性率的
26、差別沒有影響,而且二者都陽性者都陽性的的11份份標本也對結果沒有影響(兩標本也對結果沒有影響(兩種方法結果一致的對二者的率差沒有影響),種方法結果一致的對二者的率差沒有影響),導致兩者陽性率的差別主要來源于培養(yǎng)結果導致兩者陽性率的差別主要來源于培養(yǎng)結果不一致不一致的的14份份樣本樣本(122)48假設假設122的主要原因是抽樣誤差導致,那么兩的主要原因是抽樣誤差導致,那么兩方法的總體陽性率就是一致的方法的總體陽性率就是一致的所以其假設主要針對所以其假設主要針對12與與2,即,即H0為為B=C,兩種,兩種方法的抗核抗體陽性檢出率相等方法的抗核抗體陽性檢出率相等如果如果H0成立,則二者檢測結果不一
27、致的兩個格成立,則二者檢測結果不一致的兩個格子理論數都應該是子理論數都應該是(b+c)/2所以卡方檢驗的公式變?yōu)椋核钥ǚ綑z驗的公式變?yōu)椋?9將數據代入上述公式中,因為將數據代入上述公式中,因為12+2小于小于40,故需要校正,校正卡方值,故需要校正,校正卡方值為為5.79因為因為5.793.84,故,故P0.05,在,在a a0.05的水準上拒絕的水準上拒絕H0,認為兩法的,認為兩法的陽性檢出率不同陽性檢出率不同50 2222222/ 2/ 2=/ 2/ 2 =111401=cbbccbcATTbcbcbcbcbcbcMcNemarbc 行行數數列列數數;當當時時需需要要校校正正,校校正正公
28、公式式如如下下:,上上述述檢檢驗驗也也稱稱為為檢檢驗驗本法一般用于本法一般用于樣本含量不太大樣本含量不太大的資料。因為的資料。因為它僅考慮了兩法結果不一致的兩種情況它僅考慮了兩法結果不一致的兩種情況(b, c),而未考慮樣本含量而未考慮樣本含量n和兩法結果一致的兩種和兩法結果一致的兩種情況情況(a, d)。所以,當。所以,當n很大且很大且a與與d的數值很的數值很大(即兩法的一致率較高),大(即兩法的一致率較高),b與與c的數值相的數值相對較小時,即便是檢驗結果有統(tǒng)計學意義,對較小時,即便是檢驗結果有統(tǒng)計學意義,其實際意義往往也不大其實際意義往往也不大51如果有超過如果有超過2組,每組的結局超過
29、組,每組的結局超過2種分類,種分類,就構成了就構成了RC列聯表;四格表是最簡單的列聯表;四格表是最簡單的列聯表列聯表完全隨機設計的列聯表資料的卡方檢驗原理完全隨機設計的列聯表資料的卡方檢驗原理與四格表的相同,只不過組數或結局增多了與四格表的相同,只不過組數或結局增多了而已而已52例例7-6:某醫(yī)師研究物理療法、藥物治療和外用膏藥三:某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經麻痹的療效,資料見下表。種療法治療周圍性面神經麻痹的療效,資料見下表。問三種療法的有效率有無差別?問三種療法的有效率有無差別?53其檢驗思想同四格表卡方檢驗:先假設三其檢驗思想同四格表卡方檢驗:先假設三種
30、種療法的總體療效相同療法的總體療效相同,將三組的治療情況合,將三組的治療情況合并作為并作為總有效率的總有效率的估計值,而后可以據此計估計值,而后可以據此計算算各處理方案的各處理方案的理論有效與無效人數,如果理論有效與無效人數,如果假設成立的話它們間的差別應該很小,卡方假設成立的話它們間的差別應該很小,卡方值應該不大,否則就有理由認為它們不是來值應該不大,否則就有理由認為它們不是來源于同一總體源于同一總體H0:三療法有效率相同三療法有效率相同;H1:三療法有效率三療法有效率不不全全相同相同54請注意,對立假設包括多種情況:例如請注意,對立假設包括多種情況:例如三組間互不相同、三組間互不相同、某兩
31、組間相同且都與第三組不同某兩組間相同且都與第三組不同;所以如果拒絕原假設,;所以如果拒絕原假設,還需要對三組進行還需要對三組進行多重比較多重比較(卡方分割卡方分割)才可以最終下結才可以最終下結論論卡方檢驗的公式既可以使用基本公式卡方檢驗的公式既可以使用基本公式 2=(A-T)2/T;也可以通過下列公式減少計算量:也可以通過下列公式減少計算量:55221 ;(-1)(1)ijijijijAnAnnn nn 式式中中為為實實際際頻頻數數, 與與 為為該該實實際際數數對對應應的的行行、列列的的合合計計值值, 為為總總例例數數;自自由由度度行行數數列列數數需要說明一點:該公式也可以用于普通四格需要說明
32、一點:該公式也可以用于普通四格表,它的結果與四格表專用公式表,它的結果與四格表專用公式(未校正未校正)計計算結果完全相同算結果完全相同將表中數據代入:將表中數據代入:查表得:查表得: 2 20.05,20.05,2=5.99,所以,所以P0.05,在,在a a=0.05的水準上拒絕的水準上拒絕H0,認為三種療法的總,認為三種療法的總體有效率不全相同體有效率不全相同5622221997265321 =21.04481 20651 20651 144(-1)(1)2 行行數數列列數數例例7-7:某醫(yī)師在研究血管緊張素:某醫(yī)師在研究血管緊張素I轉化酶轉化酶(ACE)基因基因I/D多態(tài)(分多態(tài)(分3型
33、)與型)與2型糖尿病腎病型糖尿病腎病(DN)的關系時,的關系時,將將249例例2型糖尿病患者按有無糖尿病腎病分為兩組,型糖尿病患者按有無糖尿病腎病分為兩組,資料見下表。問兩組資料見下表。問兩組2型糖尿病患者的型糖尿病患者的ACE基因型總基因型總體分布有無差別?體分布有無差別?57 組別組別DDIDII合計合計 DN組組42(37.8)48(43.3)21(18.9)111 無無DN組組30(21.7)72(52.2)36(26.1)138 合計合計72(28.9)120(48.2) 57(22.9)249請注意,本例題中只有兩組觀察對象,因此備擇假設請注意,本例題中只有兩組觀察對象,因此備擇假
34、設為為“兩組患者的基因構成不同兩組患者的基因構成不同”H0:兩組患者的基因構成相同兩組患者的基因構成相同 H1:兩組患者的基因構成不同兩組患者的基因構成不同a a=0.05代入公式得:代入公式得:在在a=0.05的水準上,拒絕的水準上,拒絕H0,接受,接受H1,認為兩組患,認為兩組患者的總體基因構成不同者的總體基因構成不同58 2222424836=249+-1 =7.91111 72111 120138 57= 2-13-1 =2 同四格表資料一樣,同四格表資料一樣,RC表的表的 2分布是建立在大樣本的假定上的,分布是建立在大樣本的假定上的,要求總例數不可過少,不能有要求總例數不可過少,不能
35、有1/5以上的格子理論頻數小于以上的格子理論頻數小于5,且不,且不能有一個格子的理論頻數小于能有一個格子的理論頻數小于1如果出現上述情況,可以考慮:增大樣本量;如果出現上述情況,可以考慮:增大樣本量;根據專業(yè)知識根據專業(yè)知識合理地合理地合并相鄰的組別;刪除理論數太小的行列合并相鄰的組別;刪除理論數太小的行列 ;改用其它方法分析,;改用其它方法分析,例如確切概率法例如確切概率法當多個樣本率(或構成比)作當多個樣本率(或構成比)作 2檢驗,結論為拒絕零假設時,只能檢驗,結論為拒絕零假設時,只能認為各總體率(或總體構成比)之間總的有差別,不能說明兩兩之認為各總體率(或總體構成比)之間總的有差別,不能
36、說明兩兩之間有差別;兩組間的比較可采用間有差別;兩組間的比較可采用 2分割的方法分割的方法 59多個樣本率比較的資料若經卡方檢驗的結論為拒絕多個樣本率比較的資料若經卡方檢驗的結論為拒絕H0 ,接受,接受H1 時,意味著總體率間不全相同,須用時,意味著總體率間不全相同,須用卡方分割法把卡方分割法把 RC表分成多個獨立的四格表進行兩表分成多個獨立的四格表進行兩兩比較,但必須重新規(guī)定檢驗水準,其目的是為保兩比較,但必須重新規(guī)定檢驗水準,其目的是為保證檢驗假設中證檢驗假設中I型錯誤型錯誤 的概率不變。的概率不變。三組作兩兩比較需要比較三次,如果每次的顯著性三組作兩兩比較需要比較三次,如果每次的顯著性水
37、準均為水準均為0.05,則三次比較后的顯著性水準為,則三次比較后的顯著性水準為1-0.953=0.14,遠大于原先的預期,所以要重新確認,遠大于原先的預期,所以要重新確認a a,使得經過三次比較后一類錯誤仍為使得經過三次比較后一類錯誤仍為0.05因分析目的不同,因分析目的不同,k個樣本率兩兩比較的個樣本率兩兩比較的次數不同,故重新規(guī)定的檢驗水準的估次數不同,故重新規(guī)定的檢驗水準的估計方法亦不同;通常有兩種情況計方法亦不同;通常有兩種情況任意兩個實驗組間的比較,以及多個實任意兩個實驗組間的比較,以及多個實驗組同一個相同的對照間的比較驗組同一個相同的對照間的比較6212=k+a aa a實驗組與同
38、一個對照組的比較實驗組與同一個對照組的比較 分析目的分析目的為各實驗組與同一個對照組的比較,而為各實驗組與同一個對照組的比較,而各實驗組間不須比較;其檢驗水準各實驗組間不須比較;其檢驗水準 用下用下式估計式估計632(1)=ka aa a 6465對比組對比組結果結果理療理療 vs. 藥物藥物有差別有差別理療理療 vs. 膏藥膏藥有差別有差別藥物藥物 vs. 膏藥膏藥尚不認為有別尚不認為有別*40Fisher如如果果兩兩兩兩比比較較的的四四格格表表的的理理論論數數較較小小,則則應應該該校校正正;如如果果過過小小,或或總總例例數數小小于于,宜宜采采用用精精確確概概率率法法前以述及,前以述及, 2
39、檢驗是基于大樣本假定,四格表檢驗是基于大樣本假定,四格表時,如果總例數小于時,如果總例數小于40或任意一格子理論數或任意一格子理論數小于小于1,大樣本假定不成立,則不能用,大樣本假定不成立,則不能用 2檢驗檢驗 另外,有些情況下雖然滿足卡方檢驗的使用另外,有些情況下雖然滿足卡方檢驗的使用條件,但是計算的卡方值與卡方界值十分接條件,但是計算的卡方值與卡方界值十分接近近(P十分接近十分接近a a)此時也可以考慮使用確切概率此時也可以考慮使用確切概率法法該方法是由該方法是由Ronald Fisher提出,直接計算概提出,直接計算概率值;因此嚴格說來,它并不屬于卡方檢驗,率值;因此嚴格說來,它并不屬于卡方檢驗,而是獨立于卡方檢驗而是獨立于卡方檢驗例例74:將:將33名名HBsAg陽性孕婦隨機分為乙肝免疫球蛋陽性孕婦隨機分為乙肝免疫球蛋白預防組與非預防組,觀察兩組新生兒的乙肝感染率,白預防組與非預防組,觀察兩組新生兒的乙肝感染率,問兩組感染率
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自動化施工方案
- 幼兒園大班《滑梯的回憶》教案
- 建筑施工特種作業(yè)-高處作業(yè)吊籃安裝拆卸工真題庫-2
- 容錯性定義題目及答案
- 1 1 集合-2026版53高考數學總復習A版精煉
- 2023-2024學年云南省保山市高二下學期期末質量檢測數學試題(解析版)
- 2023-2024學年山東省青島市萊西市高二下學期期末考試數學試題(解析版)
- 新疆盛鼎龍新材料科技有限責任公司2500噸-年高效偶聯劑5000噸-年甲基苯基硅油及3萬噸-年硅酮膠項目環(huán)評報告
- 2025年秋三年級上冊語文同步教案 8 總也倒不了的老屋
- 物流公司和客戶合作協(xié)議
- 年產12000噸水合肼(100%)項目環(huán)評報告書
- 《有機波譜分析》期末考試試卷及參考答案
- 公路工程基本建設項目概算、預算編制辦法
- 最詳細的整車開發(fā)流程
- 部編版七年級歷史(下)材料論述題專項訓練
- 年產1000噸乳酸的生產工藝設計
- 博克服裝CAD制版說明操作手冊(共95頁)
- 光電效應測普朗克常數-實驗報告
- (完整word版)數據模型與決策課程案例分析
- 自制桁架移動式操作平臺施工方案
- 物業(yè)服務參與校園文化建設及舉辦大型活動配合措施
評論
0/150
提交評論