




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、常用離散型變量概率分布常用離散型變量概率分布及應用及應用二項分布和泊松分布二項分布和泊松分布張合喜張合喜 公共衛生學院公共衛生學院 第一節第一節 二項分布和總體率的估計二項分布和總體率的估計一、二項分布一、二項分布(一)二項分布的概念(一)二項分布的概念 在生命科學研究中,經常會遇到一些事物,在生命科學研究中,經常會遇到一些事物,其結果可分為兩個彼此對立的類型,如一個病其結果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養人的死亡與存活、動物的雌與雄、微生物培養的陽性與陰性等,這些都可以根據某種性狀的的陽性與陰性等,這些都可以根據某種性狀的出現與否而分為非此即彼的對立
2、事件。這種非出現與否而分為非此即彼的對立事件。這種非此即彼事件構成的總體,就稱為二項總體此即彼事件構成的總體,就稱為二項總體(binomial populationbinomial population)。)。 第一節第一節 二項分布和總體率的估計二項分布和總體率的估計 二項分布二項分布(binomial distribution)(binomial distribution)就就是對這種只具有兩種互斥結果的離散型是對這種只具有兩種互斥結果的離散型隨機變量的規律性進行描述的一種概率分隨機變量的規律性進行描述的一種概率分布。由于這一種分布規律是由瑞士學者貝布。由于這一種分布規律是由瑞士學者貝努里
3、努里( (Bernoulli) )首先發現的,又稱貝努里首先發現的,又稱貝努里分布。分布。 二項分布有兩個基本假設:二項分布有兩個基本假設: 1.1.各事件是相互獨立的,即任一事件各事件是相互獨立的,即任一事件的發生與否,不影響其它事件的發生的發生與否,不影響其它事件的發生概率;概率; 2.各個隨機事件只能產生相互排斥的各個隨機事件只能產生相互排斥的兩種結果。兩種結果。 定理:幾個相互獨立事件同時發生定理:幾個相互獨立事件同時發生的概率等于各獨立事件的概率之積。的概率等于各獨立事件的概率之積。 定理:在幾個互不相容的事件中,定理:在幾個互不相容的事件中,任一事件發生的概率等于這幾個事任一事件發
4、生的概率等于這幾個事件的概率之和。件的概率之和。 抓中兩黑一白的概率:抓中兩黑一白的概率:P(2)=30.125=0.375抓中三個黑球的概率:抓中三個黑球的概率:P(3)=0.50.50.5=0.125 各種可能發生的結果對應的概率相當各種可能發生的結果對應的概率相當于展開后的各項數值,即:于展開后的各項數值,即: 前例:前例:=0.8,1-=0.2,n=3nnxxnnnnnxnxnn)1 ()1 ()1 ()!( !/!)1 ()1 (113211233)2 . 0()2 . 0()8 . 0(3)2 . 0()8 . 0(3)8 . 0(2 . 08 . 0二項分布的概率公式二項分布的概
5、率公式 如果一個事件如果一個事件A,在,在n次獨立試驗中,次獨立試驗中,每次試驗都具有概率每次試驗都具有概率 ,那么,這一事件,那么,這一事件A將在將在n次試驗中出現次試驗中出現x次的概率為:次的概率為: 式中:式中: 稱二項系數。稱二項系數。)!( !xnxnCxn).3 , 2 , 1( ,)1 ()(nxCxPxnxxn(二)二項分布的應用條件(二)二項分布的應用條件 1. 各觀察單位只能具有互相對立的一種結各觀察單位只能具有互相對立的一種結果,屬于二項分類資料;果,屬于二項分類資料; 2. 已知發生某一結果的概率為已知發生某一結果的概率為,其對立結,其對立結果的概率則為果的概率則為1-
6、 。實際工作中要求。實際工作中要求是從是從大量觀察中獲得的比較穩定的數值;大量觀察中獲得的比較穩定的數值;3. n個觀察單位的觀察結果互相獨立,即每個觀察單位的觀察結果互相獨立,即每個觀察單位的觀察結果不會影響到其它觀個觀察單位的觀察結果不會影響到其它觀察單位的結果。察單位的結果。 (三)二項分布的性質(三)二項分布的性質 1.二項分布的均數和二項分布的均數和 標準差標準差 二項分布的平均數:二項分布的平均數:=n 上式的意義:做上式的意義:做n次獨立試驗,某事件平均次獨立試驗,某事件平均出現的次數為出現的次數為n次,這一結果較為符合人們的次,這一結果較為符合人們的直觀想法。如果,生男孩這一事
7、件的概率是直觀想法。如果,生男孩這一事件的概率是1/2,則則100個新生兒中可期望有個新生兒中可期望有n =1001/2=50個個是男孩。是男孩。 當用率表示時,當用率表示時, (三)二項分布的性質(三)二項分布的性質 二項分布的標準差:二項分布的標準差: 標準差表示標準差表示x取值的離散度或變異的大小。取值的離散度或變異的大小。如如n=5,=5/6,1-=1-5/6,則:,則:)1 (n8333. 061655)1 (n(三)二項分布的性質(三)二項分布的性質 二項分布的標準誤二項分布的標準誤 若以比值或百分數表示,則標準誤為若以比值或百分數表示,則標準誤為 : p被稱為率的標準誤(被稱為率
8、的標準誤(standard error of rate),),用來反映隨機抽樣獲得的樣本率用來反映隨機抽樣獲得的樣本率p與總體與總體之間之間的抽樣誤差大小。的抽樣誤差大小。 np)1 ((三)二項分布的性質(三)二項分布的性質 二項分布的標準誤二項分布的標準誤 若以比值或百分數表示,則標準誤為若以比值或百分數表示,則標準誤為 :實際工作中常用實際工作中常用p作為作為 的估計值,得:的估計值,得:np)1 (nppsp)1 ( (三)二項分布的性質(三)二項分布的性質 2.二項分布的累計概率二項分布的累計概率常用的有左側累計和右側累計常用的有左側累計和右側累計2種方法。種方法。從陽性率為從陽性率
9、為 的總體中隨機抽取的總體中隨機抽取n個個體,則個個體,則(1)最多有最多有k例陽性的概率例陽性的概率P(xk)=P(0) + P(1) + P(k)(2)最少有最少有k例陽性的概率例陽性的概率P(xk)=P(k) + P(k+1) + P(n) =1- P(xk-1)(三)二項分布的性質(三)二項分布的性質 3.二項分布的圖形二項分布的圖形 二項分布的圖形,取決于兩個方面,其一為二項分布的圖形,取決于兩個方面,其一為事件發生的概率事件發生的概率 ,其二為樣本含量,其二為樣本含量n。當當 =1- =1/2時,二項分布的圖形是對稱的;時,二項分布的圖形是對稱的;當當 1/2時,二項分布的圖形呈右
10、偏態;時,二項分布的圖形呈右偏態;當當與與1- 不變時,即使不變時,即使 1- ,但隨著,但隨著n的增大,的增大,二項分布的的偏態程度會逐漸降低而趨于對稱。二項分布的的偏態程度會逐漸降低而趨于對稱。 二項分布總體不同樣本例數時的抽樣分布二項分布總體不同樣本例數時的抽樣分布 二、二、二項分布的應用二項分布的應用 (一一 )、總體率的估計、總體率的估計 有點值估計和區間估計。有點值估計和區間估計。1 1 查表法查表法:當當n較小,如較小,如n50時,特別是時,特別是p很接近于很接近于0或或1時,可由附表時,可由附表6百分率的置百分率的置信區間表直接查出。信區間表直接查出。P709 or p817例
11、:某地對例:某地對13名輸卵管結扎的育齡婦女經名輸卵管結扎的育齡婦女經壺腹部吻合術后,觀察其受孕情況,發現壺腹部吻合術后,觀察其受孕情況,發現有有6人受孕,據此估計該吻合術婦女的受人受孕,據此估計該吻合術婦女的受孕的孕的95%可信區間可信區間 此例:此例:n=13,x=6 查表得查表得95%CI為:為:19%75%。 二、二、二項分布的應用二項分布的應用 (一一 )、總體率的估計、總體率的估計 1 1 查表法查表法:附表附表6百分率的置信區間表直接百分率的置信區間表直接列出了列出了Xn n/2/2的部分的部分。其余部分可以查。其余部分可以查n-x的陰性部分的的陰性部分的QLQU再相減得再相減得
12、PLand pU PL=1-QL 1-QU例:例:某地調查某地調查50名兒童蛔蟲感染情況,發現有名兒童蛔蟲感染情況,發現有10人大便人大便中有蛔蟲卵,問兒童蛔蟲感染率的中有蛔蟲卵,問兒童蛔蟲感染率的95%置信區間是多少?置信區間是多少? 此例:此例:n=50,x=10 查表得查表得95%CI為:為:10%34%。 二項分布的應用二項分布的應用 2 2 正態近似法正態近似法:應用條件:應用條件:np及及n(1p)均均5pusp 例:在某地隨機抽取例:在某地隨機抽取329人,做人,做HBsAg檢驗,得陽性檢驗,得陽性率為率為8.81%,求陽性率,求陽性率95%置信區間。置信區間。 已知:已知:p=
13、8.81%,n=329,故:,故: 95%CI:8.811.961.56;即;即5.75%11.87%。 %56. 10156. 0329/ )0881. 01 (0881. 0/ )1 (nppsp二項分布二項分布 下表是用下表是用P PU Ua as sp p時要求的時要求的P P值值與與N N的大小參考數字。的大小參考數字。 P P n n n nP P 0.5 30 15 0.5 30 15 0.4 50 20 0.4 50 20 0.3 80 24 0.3 80 24 0.2 200 40 0.2 200 40 0.1 600 60 0.1 600 60 0.05 1400 70 0
14、.05 1400 70二項分布的應用二項分布的應用(二二 )差異的顯著性檢驗差異的顯著性檢驗1 直接法直接法例例 某醫院用甲藥治療某病,其治愈率為某醫院用甲藥治療某病,其治愈率為70%,今用乙藥治療該病今用乙藥治療該病10人,治愈人,治愈9人,問甲乙兩藥人,問甲乙兩藥療效有無差別?療效有無差別?已知:已知: =0.7,1- =0.3,假設兩藥療效無差別,假設兩藥療效無差別,則治愈與非治愈的概率應符合二項分布,即:則治愈與非治愈的概率應符合二項分布,即: 10 3 . 07 . 0)1 (n如果甲乙兩藥療效無差別,按甲藥的治愈率如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用用乙藥治療乙藥治療
15、10人應治愈人應治愈7人,實際治愈人,實際治愈9人,相差人,相差2人。人。雙側檢驗,計算相差雙側檢驗,計算相差2人及人及2人以上的總概率,即人以上的總概率,即x9和和x5的概率之和:的概率之和:P=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:或:P=1-(0.200121+0.266828+0.233474)=0.299577028248. 0121061. 0233474. 0266828. 0200121. 0102919. 0036757. 0009002. 00014
16、47. 0000138. 0000006. 0)3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0(3 . 07 . 0010101019910288103771046610555106441073310822109111010001010CCCCCCCCCCC P=0.2995770.05,差異無統計學意義,尚,差異無統計學意義,尚不能認為乙
17、藥療效優于甲藥。不能認為乙藥療效優于甲藥。 本例如采用單側檢驗,即要求判斷本例如采用單側檢驗,即要求判斷乙藥療效乙藥療效優于甲藥?此時只需計算相差優于甲藥?此時只需計算相差2人及以上的人及以上的總概率:總概率:P=P(9)+P(10)=0.121061+0.028248=0.149309P0.05,差異無統計學意義,尚不能認為乙藥差異無統計學意義,尚不能認為乙藥療效優于甲藥。療效優于甲藥。3.研究疾病的家族聚集性研究疾病的家族聚集性 例例 某單位發生乙肝暴發流行,經調查某單位發生乙肝暴發流行,經調查4口之家共口之家共288戶,其中無病例的戶,其中無病例的167戶,發生戶,發生1例的例的51戶,
18、戶,2例的例的50戶,戶,3例的例的17戶,全家發病的戶,全家發病的3戶,問乙肝的發戶,問乙肝的發病是否具有家族集聚性?病是否具有家族集聚性? =214/1152=0.1858,1-=0.8142 計算發病數計算發病數x=0,1,2,3,4時的理論概率時的理論概率和理論戶數。列表,比較實際戶數與理論戶數差和理論戶數。列表,比較實際戶數與理論戶數差別有無顯著性意義。別有無顯著性意義。 二項分布展開計算表二項分布展開計算表發病人數發病人數展開式展開式概率概率理論戶數理論戶數實際戶數實際戶數xCxn x(1-)n-xPT=P288A0C04 (0.1858)0(0.8142)40.4395126.5
19、71671C14 (0.1858)1(0.8142)30.4011115.52 512C24 (0.1858)2(0.8142)20.1373 39.54 503C34 (0.1858)3(0.8142)10.0209 6.02 174C44 (0.1858)4(0.8142)00.0012 0.35 3二項分布擬合優度的二項分布擬合優度的2檢驗檢驗發病人數發病人數實際戶數實際戶數理論戶數理論戶數(A-T)2(A-T)2xATT0167126.571634.5812.911 51115.524162.8336.042 50 39.54 109.41 2.773 17 6.02 120.5620
20、.034 3 0.35 7.0220.062=91. 81,按,按=組數組數-2=5-2=3查查2界值表得:界值表得: 20.01(3)=11.345,故故P50時時(有人認為當有人認為當20),泊松分布,泊松分布就近似于正態分布。就近似于正態分布。 =0.5010020030040050060070001234頻率=101002003004000123456頻率=50501001502000246810121416頻率=200306090120579 11 13 15 17 19 21 23 25 27 29 31 33 35 37頻率Poisson分布總體均數不同時的抽樣分布分布總體均數不
21、同時的抽樣分布 (三)(三)Poisson分布的性質分布的性質 當當n很大,很大,p很小,很小,np=為一常為一常數時,二項分布近似于泊松分布。數時,二項分布近似于泊松分布。p愈小,近似程度愈好。愈小,近似程度愈好。 例:據以往經驗,新生兒染色體異常例:據以往經驗,新生兒染色體異常率為率為1%,試分別用二項分布和泊松,試分別用二項分布和泊松分布原理,求分布原理,求100名新生兒中發生名新生兒中發生x例例(x=1,2,3.)染色體異常的概率。)染色體異常的概率。 二項分布與泊松分布的比較二項分布與泊松分布的比較 由上表可見,二者計算結果非常接近,當由上表可見,二者計算結果非常接近,當n愈大其接愈
22、大其接近程度愈好,但泊松分布的近程度愈好,但泊松分布的P(X)計算較為簡便。計算較為簡便。 XP(X) 二項分布二項分布 泊松分布泊松分布 0123456780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計合計1.0000 1.0000 5. Poisson分布的可加性分布的可加性 如果相互獨立的如果相互獨立的k個隨機變量都服從個隨機變量都服從泊松分布,則它們之和仍服從泊松分布,泊松分布,則它們之和仍服從泊松分布,且其均數為
23、且其均數為k個隨機變量的均數之和。此個隨機變量的均數之和。此稱為泊松分布的可加性。稱為泊松分布的可加性。 例:已知某放射性物質每例:已知某放射性物質每10分鐘放射脈分鐘放射脈沖數呈泊松分布,沖數呈泊松分布,5次測量的結果分別為次測量的結果分別為35、34、36、38、34次,那么,次,那么,50分鐘總分鐘總計的脈沖數計的脈沖數177次,亦呈泊松分布。因此,次,亦呈泊松分布。因此,泊松分布資料可利用可加性原理使泊松分布資料可利用可加性原理使20,這樣就可以用正態近似法處理。這樣就可以用正態近似法處理。 Poisson分布的應用分布的應用 置信區間的估計置信區間的估計 對于小樣本資料的泊松分布置信
24、區間估計,對于小樣本資料的泊松分布置信區間估計,可以查附表可以查附表7。p448 例例 由一份混合好的自來水中取由一份混合好的自來水中取1ml水樣,培養得水樣,培養得細菌細菌5個,請估計原水中每個,請估計原水中每ml細菌數細菌數95%的置信的置信區間。區間。查附表查附表7:樣本計數:樣本計數X=5,95%CI:1.611.7。Poisson分布的應用分布的應用 置信區間的估計置信區間的估計 對于大樣本資料(對于大樣本資料(X50)的置信區間估計,)的置信區間估計,可以近似地運用正態分布法進行,即:可以近似地運用正態分布法進行,即:95%置信區間為:置信區間為:99%置信區間為:置信區間為:例例
25、 同一份樣品分別用同一份樣品分別用10個平皿進行培養,共數個平皿進行培養,共數得菌落數得菌落數1460個,試估計該樣品菌落數個,試估計該樣品菌落數95%置置信區間。信區間。本例:本例:X=1460/10=146(個)(個) 95%CI: ,即,即122.32169.68。 XX96. 1XX58. 214696. 1146 Poisson分布的應用分布的應用 泊松分布的配合泊松分布的配合 例:將培養皿中的細菌稀釋液置于血球計上,數例:將培養皿中的細菌稀釋液置于血球計上,數出小方格中的細菌數,共計出小方格中的細菌數,共計128個方格,計數結果個方格,計數結果見下表。問此分布是否符合泊松分布?見下
26、表。問此分布是否符合泊松分布? 表表 細菌在計數小方格中的分布細菌在計數小方格中的分布 每小格細菌數(每小格細菌數(X) 觀察的方格數(觀察的方格數(f) 01234264038177Poisson分布的應用分布的應用計算過程:計算過程:求出樣本均數求出樣本均數 以以 代替代替,按照泊松分布的概率公式求出,按照泊松分布的概率公式求出 X=0,1,2,3,4 時的概率時的概率P(X)。本例本例=1.5234,代入公式得:,代入公式得: P(0)=e- x/x!= e- 1.5234(1.5234)0/0!=0.2180 P(1)=e- 1.5234(1.5234)1/1!=0.3321 P(2)
27、=e- 1.5234(1.5234)2/2!=0.2529 P(3)=e- 1.5234(1.5234)3/3!=0.1284 P(3)=e- 1.5234(1.5234)4/4!=0.0489 x5234. 1128195ffxx也可按下面的遞推公式計算:也可按下面的遞推公式計算: 0489.0)3(45234.1)4(1284.0)2(35234.1)3(2529.0)1(25234.1)2(3321.0)0(15234.1)1(2180.0!)0()1()(PPPPPPPPexePxPxxPx 驗算:驗算:P(0)+P(1)+P(2)+ +P(n)=1 本例:本例:0.2180+0.33
28、21+0.2529+0.1284+0.0489=0.9803 以各組的概率以各組的概率P(X)乘以乘以n即為即為X=0,1,2,3,4按泊松按泊松分布的理論頻數。分布的理論頻數。 將理論頻數與實際頻數比較將理論頻數與實際頻數比較(2-test),判斷此分,判斷此分布是否符合泊松分布。布是否符合泊松分布。 Poisson分布擬合優度檢驗計算表分布擬合優度檢驗計算表 2=(A-T)2/T=1.3606 因擬合泊松分布時用了因擬合泊松分布時用了n和和,故,故=組數組數-2=5-2=3。查查2界值表得界值表得20.05(3)=7.81,故,故P0.05 結論:實際分布與理論分布差別無統計學意義,結論:
29、實際分布與理論分布差別無統計學意義,可認為符合泊松分布。可認為符合泊松分布。 xATA-T(A-T)2(A-T)2T0123426403817727.9042.5032.3716.446.26-1.90-2.505.630.560.743.61046.265131.64580.31380.54600.12940.14740.97750.01910.1872Poisson分布資料的差異顯著性檢驗分布資料的差異顯著性檢驗 例:某種生物制劑的異常反應發生率一般在例:某種生物制劑的異常反應發生率一般在1/萬左右,今試用該生物制劑新制品,在受試者萬左右,今試用該生物制劑新制品,在受試者100人中發現人中
30、發現1人有異常反應,問該生物制劑的人有異常反應,問該生物制劑的異常反應率是否高于一般?異常反應率是否高于一般? 假設新制品反應率與一般反應率相同,則假設新制品反應率與一般反應率相同,則100人中反應的平均數為:人中反應的平均數為: H0: = 0 =1001/10000=0.01 本例本例 =0.0001,很小,很小,n=100,很大,可用泊,很大,可用泊松分布作近似計算,松分布作近似計算,100人中人中1例異常反應也不例異常反應也不出現的概率為:出現的概率為: Poisson分布資料的差異顯著性檢驗分布資料的差異顯著性檢驗100人中人中1例異常反應也不出現的概率為:例異常反應也不出現的概率為
31、: 出現出現1例及例及1例以上的概率:例以上的概率:P(x1)=1-P(0) =1-0.990050=0.009950 P50,可用正態近似法進行泊松分布,可用正態近似法進行泊松分布的檢驗。的檢驗。 H0:兩種培養基的菌落數相同,:兩種培養基的菌落數相同, H1:兩種培養基的菌落數不同。:兩種培養基的菌落數不同。 =0.05。 Poisson分布資料的差異顯著性檢驗分布資料的差異顯著性檢驗 在對泊松分布資料進行顯著性檢驗時,如兩樣本在對泊松分布資料進行顯著性檢驗時,如兩樣本觀察單位數相同,則采用下式:觀察單位數相同,則采用下式: x1、x2分別為兩樣本各觀察單位的計數之和。分別為兩樣本各觀察單位的計數之和。 如兩樣本觀察單位數不等,則檢驗時用下式:如兩樣本觀察單位數不等,則檢驗時用下式: 221121/nxnxxxu2121XX
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 剛做完的數學試卷
- 費縣期末考試六上數學試卷
- 肝性昏迷的護理
- 肥城初一數學試卷
- 福建漳州數學試卷
- 高考的文科的數學試卷
- 廣安中考數學試卷
- 東北中學六年級數學試卷
- 個性化購物輔助工具開發考核試卷
- 燈湖中學月考數學試卷
- 幼兒園中班語言教案《頑皮的小雨滴》含反思
- 2023年北京理工附中小升初英語分班考試復習題
- NY/T 455-2001胡椒
- GB/T 5585.1-2005電工用銅、鋁及其合金母線第1部分:銅和銅合金母線
- GB/T 20470-2006臨床實驗室室間質量評價要求
- 《沙盤游戲與大學生心理治療》課程教學大綱
- FZ/T 12001-2006氣流紡棉本色紗
- 丁類(D類)功率放大器
- 論湖湘傳統文化與大學生思政教育之間的融合優秀獲獎科研論文-1
- DB23T 3104-2022 油田含油污泥處置與利用污染控制要求
- (0059)船舶貨運保險理賠答疑手冊
評論
0/150
提交評論