總體均數的估計和假設檢驗_第1頁
總體均數的估計和假設檢驗_第2頁
總體均數的估計和假設檢驗_第3頁
總體均數的估計和假設檢驗_第4頁
總體均數的估計和假設檢驗_第5頁
已閱讀5頁,還剩65頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于總體均數的估計和假設檢驗第1頁,共70頁,2022年,5月20日,16點43分,星期三一.均數的抽樣誤差和標準誤2.表示方法:標準誤 Standard error 1.抽樣誤差(Sampling error) 由于抽樣造成的樣本均數與總體均數的差異、或樣本均數之間的差異。抽樣誤差是不可避免的,但可以控制。 是說明樣本均數抽樣誤差的大小的指標,反映了樣本均數間的離散程度。也反映了樣本均數與總體均數的差異;第2頁,共70頁,2022年,5月20日,16點43分,星期三 3.標準誤的計算公式 = : 總體標準誤 n S S = S :樣本標準誤, n 為的估計值4.標準誤的意義1)表示抽樣誤差的

2、大小2)與均數結合表示樣本均數對總體均數的 代表性( xSx )第3頁,共70頁,2022年,5月20日,16點43分,星期三設:x1, x2 , x3 , 服從正態分布 N(, )則:服從標準正態分布 N(0,1)x1 x2 ,x3 若:x1, x2 , x3 , 服從正態分布 N(, x )x1 x x2 x x3 x ,服從標準正態分布 N(0,1) 則:若:x 未知,用 Sx 代替 x1 Sxx2 Sxx3 Sx,則:服從 t 分布 第4頁,共70頁,2022年,5月20日,16點43分,星期三二 . t-分布 t-distribution1. t- 分布的概念 從正態總體 N(,)

3、中進行無數次樣本含量為 n 的隨機抽樣, 每次均可得到一個 x 和s, x -通過 t = 公式轉換,可得無數個 t 值, s /nt 值分布即為含量為 n 的 t 值的總體或稱 t 分布。第5頁,共70頁,2022年,5月20日,16點43分,星期三 t-分布(t-distribution )主要用于總體均數可信區間的估計和t-檢驗等。它最早由英國統計學家 W. S. Gosset于1908年以“student”筆名發表,故又稱 student t 分布( students t-distribution), t-檢驗又稱為t-test 或者students test 。第6頁,共70頁,20

4、22年,5月20日,16點43分,星期三 1)以0為中心,左右對稱 2)t-分布曲線的形狀與自由度有關 3)t-分布曲線下面積為1 t-分布曲線下面積分布可由t值表中查出 -4 -3 -2 -1 0 +1 +2 +3 +4f(t) = (-) / = (u-d) = 5 = 1-自由度分別為1、5、的t-分布2. t- 分布特征第7頁,共70頁,2022年,5月20日,16點43分,星期三 t -分布曲線下面積分布從 t 值表(P696)查出: 雙側 P( t -t/2 , ) +P( t t/2 , ) = 單側 P( t -t ) = 或 P( t t ) = - t 0 + t/2/2第

5、8頁,共70頁,2022年,5月20日,16點43分,星期三2. 區間估計 interval estimation三 、總體均數的估計1. 點估計 point estimation用樣本均數作為總體均數的估計值(1) 可信區間的概念 confidence interval , CI 按一定的概率(可信度,1 -) 估計包含總體均數所在范圍,亦稱總體均數的可信區間第9頁,共70頁,2022年,5月20日,16點43分,星期三1) 當未知時(2) 總體均數可信區間的計算:P ( -t/2 t t /2 ) =1 - - P( -t/2 t /2 ) =1 - S故總體均數:的(1-)雙側可信區間為

6、: - t/2 S + t/2 S t/2 S 或 t/2 S /n第10頁,共70頁,2022年,5月20日,16點43分,星期三2) 當未知但 n 足夠大時3) 當已知 x - u/2 x + u/2 即 x u/2 或 x u/2 /n x - u/2 s x - t0.05 S x - t0.01 S x + t0.01 S 99%CI :下側:上側:隨機抽取10個午餐肉罐頭測定其亞硝酸鹽含量均數為17.6mg/kg , 標準差為1.64mg/kg,估計該批午餐肉罐頭平均含量的95%CI。例3:0.05 (來自同一總體) ? 假設檢驗回答 環境條件影響 P 0 (單側檢驗) 或 0 =

7、 0 0 是否 0 = 0 2 1 = 2 1 2 是否 1 2 1 = 2 1 2 第21頁,共70頁,2022年,5月20日,16點43分,星期三 根據資料類型及統計推斷的目的選用合適的檢驗方法計算出統計量( t值、u值、2值等 )。 根據自由度,查不同統計量的界值表( t值表、2值表等) ,確定現有統計量的概率P值 當: t 0.05 t 0.01() t t 0.05() 0.01 按所取檢驗水準不拒絕H0 P 按所取檢驗水準拒絕H0第23頁,共70頁,2022年,5月20日,16點43分,星期三(一) t 檢驗 t - test or Students test 五. t 檢驗和 u

8、 檢驗目的:推斷樣本所代表的未知總體均數與已 知的總體均數0有無差別單樣本 t 檢驗(樣本均數與總體均數比較) one sample / group t - test0 : 理論值、標準值或經過大量觀察所得的 穩定值等第24頁,共70頁,2022年,5月20日,16點43分,星期三條件:理論上要求樣本來自正態分布總體 x -0 公式: t = S x -0 = , = n 1 S/n第25頁,共70頁,2022年,5月20日,16點43分,星期三例:某醫生在一山區隨機抽查了25名成年健康男子的脈搏,得脈搏均數為74.2次/分,標準差為6.0次/分。根據大量調查,已知健康成年男子脈搏均數為72次

9、/分,能否據此認為該山區成年男子的脈搏均數與一般成年男子的脈搏均數不同?已知:一般健康成年男子脈搏 0 = 72次/分山區健康成年男子脈搏 x = 74.2次/分 S = 6.0次/分 ?推斷: 是否等于0 第26頁,共70頁,2022年,5月20日,16點43分,星期三1. 建立檢驗假設,確定檢驗水準H0: = 0 = 72次/分H1: 0 = 72次/分 = 0.052. 選定檢驗方法,計算檢驗統計量 x -0 t = S x -0 = S/n 74.2 72= 6/25= 1.833 = n 1= 25 1 = 243. 確定 P 值,推斷結論t 0.05,24 = 2.064P 0.0

10、5P 不拒絕H0山區健康成年男子脈搏均數與一般健康男子相同第27頁,共70頁,2022年,5月20日,16點43分,星期三目的:推斷兩種處理的效果有無差別或推斷某種 處理有無作用(二) 配對 t 檢驗 paired / matched t - test配對方法:兩個同質受試對象接受兩種不同的處理2. 同一受試對象分兩部分接受兩種不同的處理3. 同一受試對象處理前與處理后的結果條件:樣本來自正態總體第28頁,共70頁,2022年,5月20日,16點43分,星期三 d 0 d t = = = n -1 Sd Sd /n d2 (d )2 / n S d = n - 1公式:d : 每對數據的差值d

11、 : 差值的樣本均數Sd :差值的標準差Sd :差值均數的標準誤n : 對子數第29頁,共70頁,2022年,5月20日,16點43分,星期三例1: 為研究女性服用某避孕新藥后是否影響其血清總膽固醇含量,將20名女性按年齡配成10對。每對中隨機抽取1人服用新藥,另一人服用安慰劑。經過一定時間后測定血清總膽固醇含量 ( mmol/L) 得下表結果。問該新藥是否影響女性血清總膽固醇含量?第30頁,共70頁,2022年,5月20日,16點43分,星期三新藥組與安慰劑組血清總膽固醇含量(mmol/L)配對號 新藥組 安慰劑組 差值d d2 (1) (2) (3) (4)=(2)-(3) (5)=(4)

12、2 1 4.4 6.2 -1.8 3.24 2 5.0 5.2 -0.2 0.04 3 5.8 5.5 0.3 0.09 4 4.6 5.0 -0.4 0.16 5 4.9 4.4 0.5 0.25 6 4.8 5.4 -0.6 0.36 7 6.0 5.0 1.0 1.00 8 5.9 6.4 -0.5 0.25 9 4.3 5.8 -1.5 2.25 10 5.1 6.2 -1.1 1.21 -4.3 8.85第31頁,共70頁,2022年,5月20日,16點43分,星期三1. 建立檢驗假設,確定檢驗水準H0: d0 新藥對女性血清總膽固醇含量無影響H1: d0 新藥對女性血清總膽固醇含量

13、有影響 = 0.052. 計算檢驗統計量d = -0.43 , d = -4.3 , d2=8.85 , n = 10 d2 (d )2 / n S d = n - 1 8.85 (-4.3)2 / 10 = 10 - 1= 0.882第32頁,共70頁,2022年,5月20日,16點43分,星期三 d 0 d t = = Sd Sd /n -0.43 = = -1.542 0.882 /10= n 1 = 10 1 = 93.確定P值,推斷結論0.20 P 0.10P 不拒絕H0新藥對女性血清總膽固醇含量無影響(H0 : d0 )第33頁,共70頁,2022年,5月20日,16點43分,星期

14、三例2:同時用A、B兩種測聲計對10個場地的噪聲進行進行測定,結果如下表。兩種測聲計的測定結果是否相同? A、B兩種測聲計的測定結果場地 測聲計A 測聲計B 差值d d2 1 87 86 1 1 2 65 66 -1 1 3 74 77 -3 9 4 95 95 0 0 5 65 60 5 25 6 55 53 2 4 7 63 62 1 1 8 88 83 3 9 9 61 59 2 4 10 54 55 -1 1 9 55第34頁,共70頁,2022年,5月20日,16點43分,星期三假設:H0: d0 兩種測聲計的測定結果相同H1: d0 兩種測聲計的測定結果不同 = 0.05d =9

15、, d2=55 , d=9/10=0.9 n=10 d2 (d )2 / n S d = n - 1 55 (9 )2 /10 = 10 - 1=2.2828 d 0 d t = = = Sd Sd /n0.92.2828 /10=1.247= n 1 =10-1=90.40P0.20兩種測聲計的測定結果相同第35頁,共70頁,2022年,5月20日,16點43分,星期三例3: 用克矽平霧化吸入治療矽肺患者7人,治療 前后患者血清粘蛋白有無變化? 克矽平治療前后的血清粘蛋白(/L)患者號 治療前 治療后 差值d d2 (1) (2) (3) (4)=(2)-(3) (5)=(4)2 1 65

16、34 31 961 2 73 36 37 1369 3 73 37 36 1296 4 30 26 4 16 5 73 43 30 900 6 56 37 19 361 7 73 50 23 529 180 5432第36頁,共70頁,2022年,5月20日,16點43分,星期三假設:H0: d0 治療前后血清粘蛋白相同H1: d0 治療前后血清粘蛋白不同 = 0.05d =180 , d2=5432 , d=180/7=25.7 n=7 d2 (d )2 / n S d = n - 1 5432 (180 )2 / 7 7 - 1=11.6 d 0 d t = = = Sd Sd /n25.

17、711.6 /7= 5.86= n 1 = 7-1 = 60.002P0.001治療前后血清粘蛋白不同,治療后會降低第37頁,共70頁,2022年,5月20日,16點43分,星期三條件:兩樣本來自正態總體; 兩總體方差相等 S12 ( 較大)F = S22 (較?。?. 兩樣本 t 檢驗 two - sample/ group t- test目的:推斷兩樣本均數分別代表的總體均數 1與2有無差別。方差齊性檢驗的方法:F檢驗1= n1 -12= n2 -1第38頁,共70頁,2022年,5月20日,16點43分,星期三 x1 x2 S x1 x2t = = ( n1 - 1) + ( n2 -

18、1) = n1+ n2 - 2 S x1 - x2 = 1 1 n1 n2Sc2( + ) (n1 -1) s12+ (n2 -1) s22 n1+ n2 - 2Sc2 =S x1 x2 :合并標準誤Sc:合并標準差x12 (x1)2 /n1 + x22 (x2)2 /n2 ( n1 - 1) + ( n2 - 1) Sc2 =第39頁,共70頁,2022年,5月20日,16點43分,星期三例: 為研究肥胖與脂質代謝的關系,測定了肥胖兒童與正常兒童血中過氧化脂質(LPO), 結果如下表。能否認為肥胖與脂質代謝有關?兩組兒童血中LPO含量( mol/L) 分組 n x S肥胖組 30 9.36

19、0.83正常組 30 7.58 0.64第40頁,共70頁,2022年,5月20日,16點43分,星期三方差齊性檢驗 H0: 12= 2 2 , 肥胖組與正常組LPO的總體方差相等 H1: 12 2 2 , 肥胖組與正常組LPO的總體方差不等 =0.10 假設: S12 ( 較大)F = S22 (較?。?0.832 = 0.642 =1.6821= n1 -12= n2 -11= 30 1=292= 30 1=29F0.1(30,29)=1.85P0.1 肥胖組與正常組LPO的總體方差相等F 值表(P698)查出:第41頁,共70頁,2022年,5月20日,16點43分,星期三兩組LPO均數

20、比較的 t 檢驗假設:H0: 1 2 兩組兒童的LPO總體均數相等H1: 1 2 兩組兒童的LPO總體均數不等 = 0.05 (n1 -1) s12+ (n2 -1) s22 n1+ n2 - 2Sc2 = 0.549 Sx -x2 = 1 1 n1 n2Sc2( + ) (30 -1)0.832+ (30 -1)0.642 30+30 - 2= 1 1 30 300.549 ( + ) = 0.191第42頁,共70頁,2022年,5月20日,16點43分,星期三 x1 x2 S x1 x2t = 9.36 7.58 0.191= 9.302 = ( n1 - 1) + ( n2 - 1)

21、= n1+ n2 - 2= 30 + 30 2 = 58P0.001兩組兒童的LPO總體均數不等第43頁,共70頁,2022年,5月20日,16點43分,星期三 條件:兩樣本來自正態總體,總體方差不等時: x1 - x2 公式: t = s12 s22 + n1 n2sx12 t,1+ sx22 t,2 t = 1= n1 - 1 sx12 + sx22 2= n2 - 1 (二)近似 t 檢驗 t 檢驗 separate variance estimation t-test第44頁,共70頁,2022年,5月20日,16點43分,星期三例:由X線胸片上測得兩組病人肺門橫徑右側距 R1值(cm

22、)結果如下表。比較兩組的 R1值是否不同? 兩組病人的 R1值(cm) 例數 x S1. 肺癌 10 6.21 1.79 2. 矽肺0期 50 4.34 0.56方差齊性檢驗 S12 ( 較大)F = S22 (較?。┘僭O:H0: 1 2 = 2 2 , H1: 1 2 2 2 ,= 0.10 1.7920.562= = 10.2171= n1 1=9 2= n2 1=49F0.10(9,50)= 2.07P0.10兩組病人R1值的總體方差不同第45頁,共70頁,2022年,5月20日,16點43分,星期三t 檢驗1. 假設:H0: 1 2 兩組病人R1值總體均數相同H1: 1 2 兩組病人R

23、1值總體均數不同 = 0.05 S12 S22 + n1 n2t =X1 - X2 1.792 0.562 + 10 50 =6.21 4.34= 3.2722. 計算統計量 t 值第46頁,共70頁,2022年,5月20日,16點43分,星期三sx12 t,1+ sx22 t,2sx12 + sx22 t0.05 =1= n1 1= 9 , 2 = n2 1= 49 t0.05,9 = 2.262 , t0.05,50 = 2.009t0.01,9 = 3.250 , t0.01,50 = 2.6783. 計算 t 界值的校正值 t 界值1.792/102.262 + 0.562/50 2.

24、009 1.792/10 + 0.562/50 =t0.05 = 2.2571.792/103.250 + 0.562/50 2.678 1.792/10 + 0.562/50 =t0.01 = 3.239t = 3.272 ,P 0.10 H0: 1 2 = 2 2 兩組滴度倒數總體方差對數相等 H1: 1 2 2 2 兩組滴度倒數總體方差對數不等 = 0.10 假設:兩組總體方差對數相等第49頁,共70頁,2022年,5月20日,16點43分,星期三t 檢驗H0: G1G2 兩組滴度倒數總體均數對數相等 H1: G1 G2 兩組滴度倒數總體均數對數不等 = 0.05假設: (n1 -1)

25、s12+ (n2 -1) s22 n1+ n2 - 2 1 1 ( + ) n1 n2X1 - X2t = 11( 0.18142+ 0.23232 ) 12+12 - 2 1 1 ( + ) 12 121.5757 1.3153 = 3.0610.01P0.005兩組滴度倒數總體均數對數不等第50頁,共70頁,2022年,5月20日,16點43分,星期三 條件:當 n 較大( n 50 ) 時; 或 n 雖小,但總體標準差 已知時1. 單樣本 u 檢驗 one sample u -test x - 0 u = ( n 較大時 ) s / n x - 0 u = ( 0已知時) 0 / n(四

26、) u 檢驗 u - test公式:第51頁,共70頁,2022年,5月20日,16點43分,星期三 x1 - x2 x1 -x2 u = = S1 -2 S12 S22 + n1 n22. 兩樣本的 u 檢驗 two sample u -test條件:兩樣本含量較大時(n1 50、n2 50) P值的確定:當 n 較大時,可用 =查 t 值表公式:第52頁,共70頁,2022年,5月20日,16點43分,星期三 u1.96 P0.05 2.58 u 1.96 0.01 P0.05 u 2.58 P0.01 u 1.65 P0.05 2.33 u 1.65 0.01 P0.05 u 2.33

27、P0.01常用單雙側 u 值( =) 單側 雙側 0.101.2821.645 0.051.6451.960 0.022.0542.326 0.012.3262.578雙側:單側:P值的確定第53頁,共70頁,2022年,5月20日,16點43分,星期三例1: 隨機抽取某大學學生208名進行心理健康調查(SCL-90量表),計算得因子總分均數為144.9,標準差為35.8。已知全國的均數為130.0,該大學學生的調查結果是否與全國水平相同?H0: = 0 = 130 該校的總分均數與全國相同H1: 0 = 130 該校的總分均數與全國不同 = 0.05假設: x -0 = S x -0 u =

28、 S/n 144.9-130.0 = 35.8/208= 5.999P 0.50不同身高正常男子上頜間隙相同第56頁,共70頁,2022年,5月20日,16點43分,星期三(一)等效檢驗基本步驟 六.兩均數的等效檢驗在等效檢驗中,規定1 2 ,為正。當1 - 2 時,兩總體均數等效。 當1 - 2 時,兩總體均數不等效。若 X1 - X2 ,則樣本信息不支持等效假設,不必要進行兩總體均數的等效檢驗。第57頁,共70頁,2022年,5月20日,16點43分,星期三1. 給定等效界值,建立檢驗假設,確定檢驗水準H0: 1 - 2 時,兩總體均數不等效H1: 1 - 2 時,兩總體均數等效 = 0.

29、052. 選定檢驗方法,計算檢驗統計量3. 確定 P 值,推斷結論P , 拒絕H0,接受H1,有統計學意義。兩總體均數等效第58頁,共70頁,2022年,5月20日,16點43分,星期三第59頁,共70頁,2022年,5月20日,16點43分,星期三1.值的選定在等效檢驗中非常重要,須在等 效試驗前予以確定。 血壓值為0.67kPa(5mmHg),膽固醇為0.52mmol/L(20mg/dl) 白細胞為0.5109/L(500個/mm3)。 當難以確定時,可用0.2-0.5倍標準差作為參考。2.等效檢驗和差別檢驗的基本思想一致,但對 于等效資料,前者更合適,效率更高。3.在等效檢驗中,拒絕H0

30、,接受H1,有統計學 意義。兩總體均數等效(二)應用等效檢驗的注意事項第60頁,共70頁,2022年,5月20日,16點43分,星期三 七、型錯誤和型錯誤 type error & type error 假設檢驗可能發生的兩類錯誤客觀成立 假設檢驗的結果 拒絕H0 不拒絕H0H0成立 型錯誤() 推斷正確(1- )H0不成立 推斷正確(1- ) 型錯誤( ): 一般取0.05或0.01: 很難確定,但已知樣本例數確定時 愈 小, 愈大第61頁,共70頁,2022年,5月20日,16點43分,星期三當n固定時, 愈小, 愈大;反之亦然。同時減少和的唯一方法是增加樣本含量。 判斷正確 判斷錯誤(I型錯誤)判斷錯誤 (II型錯誤) 判斷正確011-1- (type I error) (type

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論