第六章二項分布和Poisson分布_第1頁
第六章二項分布和Poisson分布_第2頁
第六章二項分布和Poisson分布_第3頁
第六章二項分布和Poisson分布_第4頁
第六章二項分布和Poisson分布_第5頁
已閱讀5頁,還剩37頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章 二項分布和poisson分布chapter 6 binomial distribution and poisson distribution 醫學數據處理與sas軟件應用medical data processing and the application of sas生物醫學工程研究所 張玉華第六章 二項分布和poisson分布n6.1 二項分布n6.1.1 二項分布函數n6.1.2 樣本率與總體率的比較n6.1.3 兩個樣本率比較的u檢驗n6.2 poisson分布n6.2.1 poisson分布的概率函數n6.2.2 樣本均數與總體均數比較n6.2.3 兩個樣本均數比較6.1 二

2、項分布n定義:若一個隨機變量x,它的可能取值是0,1, ,n,且相應的取值概率為 則稱此隨機變量x服從以n、為參數的二項分布,記為xb(n,)。n二項分布成立的條件:每次試驗(bernoulli trial)只能是互斥的兩個結果之一;每次試驗的條件不變;各次試驗獨立。 6.1 二項分布n度量指標 xb(n,) nx的均數 nx的方差 nx的標準差n分布特性 n可加性:如果 x1,x2, xk相互獨立,且它們分別服從以 ni(i=1,2, ,k) ,p為參數的二項分布,則 x=x1x2xk服從以n (n=n1+n2+nk) ,p為參數的二項分布。n近似分布n正態近似:當 n 較大,不接近 0也不

3、接近 1時,二項分布b(n,)近似正態分布。 npoisson分布近似:當 n很大,很小, 為一常數時,二項分布近似于poisson分布。 6.1 二項分布n總體率的區間估計 n查表法當n50 時可以通過查表求總體率的95和99可信區間。 n正態近似法當二項分布滿足近似正態分布的條件時(n 較大,樣本率p 不接近0 也不接近1),可用正態近似法求總體率的1-可信區間:樣本率的標準差,即率的標準誤6.1.1 二項分布函數n又稱為二項式概率分布函數n在sas中的表達為 probbnml(p, n, r)np為事件的發生率nn為樣本含量nr為陽性事件個數n其意義是發生陽性事件數r的概率cdf or

4、pdf ?6.1.1 二項分布函數實例例6.1n給大鼠注射某微生物作致死試驗,以同窩同性別大鼠每4只為一組。如致死概率為1/2,則生存概率也為1/2。試計算此4只大鼠死亡2只及兩只以下的概率。 data jin; p=probbnml(0.5,4,2); q=1-p;proc print;run;求概率為0.5,樣本含量為4,r2的概率 死亡2只以上的概率 6.1.1 二項分布函數實例例6.2設p=0.5,n=4,求r=0,1,2,3,4的概率。 如要求出r=0,1,n各數值的概率,可用probbnml(p,n,r)遞次減出的方法。 p(k=2)=p(k2)- p(k1)p(k=0)=p(k0

5、)6.1.1 二項分布函數實例例6.2data binom4; do r=0 to 4; p=probbnml(0.5,4,r); q=1-p; if r=0 then d=p; else d=probbnml(0.5,4,r)-probbnml (0.5,4,r-1); output; end;proc print;run;把每一求出的p,q,d值輸出到數據集,以免前一數值為后一數值所代替 避免r-1為負值 6.1.1 二項分布函數實例例6.26.1.1 二項分布函數實例例6.2n結果說明:np為各r的p值,如p(r=0)=0.0625,p(r1)=0.3125,. nq=(1-p)nd為各

6、r的p值,即p(0)=0.0625,p(1)=0.25,p(2)=0.375.6.1.2 樣本率與總體率的比較 應用二項分布的概率計算公式計算事件(一般指x取某給定值一側的所有值)發生的概率,再比較其與檢驗水準大小,推斷樣本所在的總體率與給定總體率的關系。 6.1.2樣本率與總體率的比較實例例6.3n題目:據報道,對輸卵管結扎了的育齡婦女實施壺腹部壺腹部吻合術后,受孕率為0.55。今對10名輸卵管結扎了的育齡婦女實施峽部峽部吻合術,結果有9人受孕。問行峽部吻合術的受孕率是否高于壺腹部壺腹部吻合術?n程序說明:h0: =0.55, h1: 0.55.本例需計算在受孕率為0.55時,10個人中有大

7、于8人受孕的概率是多少,然后比較是否大于5%。 6.1.2樣本率與總體率的比較實例例6.3data a; d=probbnml(0.55,10,8); p=1-d;proc print; var p;run;6.1.2樣本率與總體率的比較實例例6.3結果說明:由于p=0.023260.05,說明兩個樣本率的差別無統計學意義,所以尚不能認為該職業人群頸椎病的發病有性別差異。6.2 poisson分布npoisson分布:若離散型隨機變量x 的取值為0,1,n,且相應的取值概率為 則稱隨機變量x服從以為參數的 poisson分布,記為xp()。npoisson分布成立的條件:平穩性:x的取值與觀察

8、單位的位置無關,只與觀察單位的大小有關;獨立增量性:在某個觀察單位上x的取值與前面各觀察單位上x的取值無關;普通性:在充分小的觀察單位上 x 的取值最多為1。n此分布主要用以描述在單位時間(空間)中稀有事件的發生數 6.2 poisson分布n分布參數 xp() nx的均數nx的方差 nx的標準差n分布特性 n可加性: 如果 x1,x2,xk相互獨立,且它們分別服從以i(i=1,2, ,k)為參數的 poisson分布,則 x=x1x2xk服從以(=1+2+k)為參數的poisson分布。 n近似分布 :當20,其分布接近正態分布。 當50,可認為是正態分布6.2 poisson分布n總體均數

9、的區間估計 n查表法n當樣本計數x50 時,可用查表法求得總體均數的95或99可信區間。n正態近似法n當樣本計數x50 時,可利用poisson分布的正態近似性,計算其總體均數(1-)可信區間如下:6.2.1 poisson分布的概率函數npoisson(,n)函數是poisson分布的概率函數n其中是總體均數,n為已知的發生情況,該函數根據和n,可計算得到來自poisson分布的隨機變量n的概率。n利用該函數可對服從poisson分布的數據進行分析。6.2.1 poisson分布概率函數實例例6.5n題目:有人觀察紅細胞在計數池中400個小格,數出每小格中紅細胞數,其均數為3.6175,試計

10、算每格中有細胞數5個的概率。n分析:要求出每格中有細胞數5個的概率,則需分別求出n5及n4的概率,然后計算兩者的差即可。 6.2.1 poisson分布概率函數實例例6.5data poisson1; p=poisson(3.6175,5)-poisson(3.6175,4);proc print;run;6.2.2 樣本均數與總體均數比較 樣本均數與總體均數比較的目的是推斷此樣本所代表的未知總體均數是否等于已知總體均數0。n6.2.2.1 直接法(直接計算概率法)。 n6.2.2.2 正態近似法6.2.2.1直接法n當總體均數較小時,可采用直接計算概率法進行比較。n注意:樣本均數與總體均數比

11、較時,應以x取大于等于(樣本均數大于總體均數時)或小于等于(樣本均數小于總體均數時)樣本均數的所有值的概率總和同檢驗界值進行比較,切不可僅以x取樣本均數的概率同檢驗界值進行比較。6.2.2.1直接法實例例6.6n題目:已知在某培養液中,有細菌數為每毫升3個,今采集放在5冰箱的1ml培養液得細菌數5個,能否說培養液中細菌數有增加?n分析:n本例提問為“是否有增加”,故為單側檢驗。n細菌在液體中隨機分布時為poisson分布。nh0: =3, h1: 3n應計算=3,n5的概率與=0.05比較。n要求p(n5)可用1-p(n4)。 6.2.2.1直接法實例例6.6data poisson3; p=

12、1-poisson(3,4);proc print;run;6.2.2.1直接法實例例6.7 某山區采制的蜂蜜發現有毒,經分析為含有雷公藤花粉粒,經反復取20g毒蜜溶解,離心后的沉淀物在顯微鏡下觀察,每玻片內含雷公藤花粉粒平均為2顆。另外,從該地某個養蜂戶采集的蜂蜜中取20g作檢驗,同樣操作后觀察一個玻片并未找到雷公藤花粉顆粒。據此能不能說此養蜂戶蜂蜜所含雷公藤花粉顆粒低于該山區平均水平? 6.2.2.1直接法實例例6.7data poisson3; p=poisson(2,0);proc print;run;由于p=0.13534 0.05,故不能認為該養蜂戶的蜂蜜中所含雷公藤花粉低于該山區

13、的平均水平。h0: =2, h1: 26.2.2.2正態近似法n當總體均數較大時(20時),可用正態近似法進行統計推斷。此時 poisson 分布近似正態分布,故可計算標準正態統計量u, n通過u 值得出相應的概率,推斷樣本均數與總體均數的關系。 00xu6.2.2.2正態近似法實例例6.8 ( 20時)有研究表明,一般人群精神發育不全的發生率約為3。今調查了有親緣血統婚配關系的后代25000人,發現123人精神發育不全。問有親緣血統婚配關系的后代其精神發育不全的發生率是否要高于般人群? 6.2.2.2正態近似法實例例6.8 ( 20時)data prg6_8; input n x pai ;

14、 s=n*pai; u=(x-s)/sqrt(s); p=(1-probnorm(abs(u)*2;cards;25000 123 0.003proc print; var u p;run;6.2.2.2正態近似法實例例6.8結果說明:u檢驗的檢驗統計量的值為5.54256,所對應的p值為2.9808e-8,遠遠小于0.05,說明樣本和總體之間的差異有統計學意義,可以認為有親緣血統婚配關系的后代其精神發育不全的發生率高于一般人群 。6.2.3兩個樣本均數比較6.2.3.1 兩個樣本觀察單位相同6.2.3.2 兩個樣本觀察單位不相同6.2.3.1兩個樣本觀察單位相同實例例6.9某衛生檢疫機構對兩

15、種純凈水各抽驗了1ml水樣,分別培養出大腸桿菌4個和7個,試比較這兩種純凈水中平均每毫升所含大腸桿菌數有無差異? 6.2.3.1兩個樣本觀察單位相同實例例6.9data prg6_9; x1=4; x2=7; u=(abs(x1-x2)-1)/sqrt(x1+x2); p=(1-probnorm(u)*2;proc print; var u p;run; xl和x2為兩個樣本均數,u為檢驗統計量,由于所得的樣本均數均0.05,說明兩個樣本的差異無統計學意義不能認為這兩種純凈水中平均每毫升所含大腸桿菌數有差異。6.2.3.2兩個樣本觀察單位不同實例例6.10n題目:某研究者為分析一種罕見非傳染性疾病發病的地域差異,對甲地區連續觀察了4年,發現有32人發??;對乙地區連續觀察了3年,發現有12人發病。指定甲、乙兩地區在觀察期內人口構成相同,人口基數相近且基本不變,試作統計推斷。n分析:本例中疾病的發病人數服從poisson分布,但兩個樣本觀察單位不相同,對甲地區連續觀察了4年,而對乙地區只連續觀察了3年。6.2.3.2兩個樣本觀察單位不同實例例6.10data prg6_10; input x1 x2 n1 n2 ; u=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論