第五章 數值變量資料的假設檢驗課件_第1頁
第五章 數值變量資料的假設檢驗課件_第2頁
第五章 數值變量資料的假設檢驗課件_第3頁
第五章 數值變量資料的假設檢驗課件_第4頁
第五章 數值變量資料的假設檢驗課件_第5頁
已閱讀5頁,還剩101頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章(二)假設檢驗

Hypothesistesting山東大學公共衛生學院劉靜7第五章數值變量資料的假設檢驗22Example1

ThedeanofamedicalschoolstatesthatthestudentsoftheschoolareahighlyintelligentgroupwithanaverageIQof135.

Doyoubelievehim?Thestudentsofourschoolareveryclever.TheaverageIQofourstudentsisupto135.7第五章數值變量資料的假設檢驗23Suppose

isreally135RandomSamplesample?PopulationNotnecessarily.Samplingerrorwillalwayscausethesamplemeantodeviatefromthepopulationmean.

7第五章數值變量資料的假設檢驗24H0:=0,then~N(

0,

2/n)Fig.1

DistributionofsamplemeanswhenH0istrueTosuspectH0

07第五章數值變量資料的假設檢驗25H0:=0

0Fig.2:Regionsofrejectionandnonrejection

inhypothesistestingofonesamplemeanRejectregionNonrejectionregionareaofnonrejectionregion,1-

areaofrejectionregion,

Criticalvalueofsamplemean7第五章數值變量資料的假設檢驗26Fig.3:Criticalvalueoftinhypothesistesting

foronesamplemeanareaofnonrejectionregion,1-

areaofrejectionregion,

Criticalvalueoft:-t,

tDegreesoffreedom,=n-17第五章數值變量資料的假設檢驗27-tt07第五章數值變量資料的假設檢驗28Arandomsampleof10studentsisdrawn;theirIQsareasfollows:1151401331251201261361241321297第五章數值變量資料的假設檢驗29Calculatethevalueoftthatcorrespondstothemeanofthesample.7第五章數值變量資料的假設檢驗210-2.935-t,=-1.833Inthisexample,thetscore(-2.935)doesfallintheregionofrejection.Therefore,thenullhypothesisshouldberejected,andnaturallythealternativehypothesisisaccepted.

Conclusion!!

=n-1=9t7第五章數值變量資料的假設檢驗211StepstotestahypothesisaboutameanStatethenullandalternativehypotheses,H0andH1.Selectthedecisioncriterion

(or

“significancelevel”).Establishthecriticalvalue(s)ofthetestingstatistic.Drawarandomsamplefromthepopulation,thencalculatethemeanandthestandarddeviationofthatsampleandestimatesamplingerror().Calculatethevalueoftheteststatistictcorrespondingtothemeanofthesample.Comparethecalculatedvalueoftwiththecriticalvaluesoft,andthendrawaninferentialconclusiontorejectornottorejectthenullhypothesis.7第五章數值變量資料的假設檢驗212HypothesistestingofthecurrentexampleConclusion:

Thenullhypothesiswasrejectedandlogicallythealternativehypothesiswasacceptedunderthesignificancelevelof0.05.Therefore,themeanIQofthestudentsofthatmedicalschoolwaslessthan135.,

=n-1=97第五章數值變量資料的假設檢驗213

一、假設檢驗的基本思想反證法:當一件事情的發生只有兩種可能A和B,為了肯定其中的一種情況B,但又不能直接證實B,這時否定另一種可能A,則間接的肯定了B。假設檢驗之所以可行,其理論背景為“小概率事件原理”,即小概率事件在一次抽樣中不可能發生。7第五章數值變量資料的假設檢驗214二、假設檢驗的一般步驟(一)建立假設和確定檢驗水準

1.確定單、雙側檢驗根據研究目的或專業知識確定單側檢驗(one-sidedtest)或雙側檢驗(two-sidedtest)。7第五章數值變量資料的假設檢驗215二、假設檢驗的一般步驟(續)(二)選定檢驗方法和計算統計量根據研究目的、設計類型、資料類型及其分布特征等選用適當的統計檢驗方法,并計算出相應的檢驗統計量。(三)確定值,做出推斷結論求出檢驗統計量后,查相應的統計用表,得出概率值。P值是指從H0所規定的總體中隨機抽樣時,獲得等于及大于(負值時為等于及小于)現有樣本統計量的概率。

7第五章數值變量資料的假設檢驗216P值的含義——雙側檢驗areaofnonrejection,1-

areaofrejection,/2

areaofrejection,/2

t不拒絕H0拒絕H0拒絕H0P/2P/27第五章數值變量資料的假設檢驗217Areaofnonrejection,1-

Areaofrejection,

tNonrejectionregionRejectionregionP值的含義——單側檢驗P7第五章數值變量資料的假設檢驗218二、假設檢驗的一般步驟(續)7第五章數值變量資料的假設檢驗2第五章t檢驗7第五章數值變量資料的假設檢驗220數值變量資料兩組均數的比較

——t檢驗和u

檢驗一、單樣本的假設檢驗——樣本均數與已知總體均數比較二、配對資料的t檢驗三、成組設計資料的兩樣本均數比較

(兩獨立樣本的t檢驗)7第五章數值變量資料的假設檢驗221一、單樣本的檢驗——

樣本均數與已知總體均數(

0)的比較1、t檢驗——當總體標準差未知時:檢驗統計量2、u檢驗——當總體標準差已知時:檢驗統計量7第五章數值變量資料的假設檢驗222例1.某醫學院校的校長稱該校學生的平均智商為135。現有人從該校學生中隨機抽取10人進行智商測定,得均數為128,標準差為7.54。試推斷該校長所言是否正確。7第五章數值變量資料的假設檢驗223(1)建立假設,確定檢驗水準。

H0:該校學生平均智商為135,即

=0=135

H1:該校學生平均智商低于135,即

<135

=0.05(2)選擇檢驗方法,計算檢驗統計量。

本例應用t檢驗,檢驗統計量為(3)確定P值,做出推斷結論。

|t|>t0.01,9=2.821,故P<0.01,按=0.05的檢驗水準拒絕H0,接受H1,認為該校學生的平均智商低于135。7第五章數值變量資料的假設檢驗224例2.隨機測量了26名男性汽車司機的脈搏平均數為73.7次/min,標準差為8.8次/min。可否據此認為男性汽車司機脈搏平均數高于一般男性脈搏數(72次/min)?7第五章數值變量資料的假設檢驗225(1)建立假設,確定檢驗水準。

H0:男性汽車司機平均脈搏次數與一般男性相同、即

=0=72

H1:男性汽車司機平均脈搏次數與一般男性不同、即

0=72

=0.05(2)選擇檢驗方法,計算檢驗統計量。

本例應用t檢驗,檢驗統計量為(3)確定P值,做出推斷結論。

7第五章數值變量資料的假設檢驗226例3.一般男性血色素含量的醫學參考值為14.0g/dl。某研究者從某高原地區人群中隨機抽取120名健康男性,測得其血色素均數g/dl,標準差g/dl。問該高原地區健康男性血色素含量是否高于一般男性?7第五章數值變量資料的假設檢驗227(1)建立假設,確定檢驗水準。

H0:高原地區健康男性血色素含量與一般男性相同、即

=0=14.0

H1:高原地區健康男性血色素含量高于一般男性、即

>0

=0.05(2)選擇檢驗方法,計算檢驗統計量。

本例應用t檢驗,檢驗統計量為(3)確定P值,做出推斷結論。因很大,可以u界值代替t界值,t>>1.645,故P<<0.05,按

=0.05水準拒絕H0,接受H1,該地健康男性與一般男性血色素含量的差別有統計學意義,可認為該高原地區健康男性血色素含量高于一般男性。

7第五章數值變量資料的假設檢驗228例4.大量調查表明,某市某年正常順產新生兒的出生體重均數為3.20kg,標準差為0.39kg。今某醫院記錄了25名難產兒的出生體重,均數為3.42kg。問難產兒的出生體重與正常順產兒的出生體重有無差別?7第五章數值變量資料的假設檢驗229(1)建立假設,確定檢驗水準。

H0:難產兒與正常順產兒平均出生體重相同,即

=0=3.20

H1:難產兒與正常順產兒平均出生體重不相同,即

0

=0.05(2)選擇檢驗方法,計算檢驗統計量。

本例應用t檢驗,檢驗統計量為(3)確定P值,做出推斷結論。

u>2.58,故P<0.01,按

=0.05水準拒絕H0,接受H1,可認為難產兒與正常順產兒平均出生體重不同,難產兒平均出生體重較高。

7第五章數值變量資料的假設檢驗230二、配對資料的t檢驗配對資料類型:①配對設計:先將受試對象按非研究因素相同或相近配成對子,然后用隨機分組方法將各對中的2個受試對象分別分配到不同的處理組;②同一組受試對象實驗前后的比較;③同一批樣品分別用兩種不同的測量方法進行測量,比較其測量結果是否相同;④同一組受試對象身體不同部位、不同器官的某項特征進行比較。7第五章數值變量資料的假設檢驗231計算公式:式中,為差值d的樣本均數;為所代表的未知總體均數,當2種處理的效應相同或某種處理無作用時;為差值的標準差,為差值樣本均數的標準誤;n為對子數,為自由度。配對t檢驗7第五章數值變量資料的假設檢驗232例5.將20只按體重、月齡及性別配對的大白鼠隨機分入甲、乙2組,甲組給正常飼料,乙組飼料缺乏維生素E。10天后測定大白鼠肝臟的維生素A含量(IU/g),結果如下。問2組大白鼠肝臟維生素A含量是否有差別?配對t檢驗7第五章數值變量資料的假設檢驗233配對t檢驗7第五章數值變量資料的假設檢驗234(1)建立假設,確定檢驗水準

(2)計算統計量本例,,,,,配對t檢驗7第五章數值變量資料的假設檢驗235(3)確定P值,做出推斷結論以,查附表2t界值表,得,,,,按檢驗水準拒絕,接受,可認為2組大白鼠肝臟維生素A含量的差別有統計學意義,維生素E缺乏組的大白鼠肝臟維生素A含量低于正常飼料組。例5配對t檢驗7第五章數值變量資料的假設檢驗236

例6

有12名志愿受試者服用某減肥藥,服藥前和服藥一個療程后各測量一次體重(kg),數據如表4-2所示。試判斷此減肥藥是否有效。配對t檢驗7第五章數值變量資料的假設檢驗237(1)建立假設,確定檢驗水準

H0:

d=0,H1:d<0,=0.05

(2)計算統計量本例,,,,,配對t檢驗(3)確定P值,做出推斷結論以

=n-1=11,查附表2t界值表,得單側P>0.25,按

=0.05檢驗水準不拒絕H0,根據本資料尚不能認為該減肥藥有效。7第五章數值變量資料的假設檢驗238三、成組設計資料的兩樣本均數比較目的是推斷兩樣本各自所代表的總體均數是否相等。

H0:

1=

2

H1:

1

2

=0.05方法:(1)樣本含量較小時——t檢驗(2)樣本含量較大時——u檢驗7第五章數值變量資料的假設檢驗2391、樣本含量較小時——t檢驗應用條件:①兩樣本均來自正態總體;②兩總體方差相等(方差齊)。

=n1+n2-2成組設計的兩小樣本均數比較7第五章數值變量資料的假設檢驗240例7.將19只雌性大白鼠隨機分為2組,分別飼以高蛋白和低蛋白飼料8周,各鼠體重的增加克數如下,問不同飼料組大白鼠的增重有無差別?

高蛋白組(

):

1341461041191241611078311312997123

低蛋白組():

701181018510713294兩樣本t檢驗7第五章數值變量資料的假設檢驗241(1)建立假設,確定檢驗水準兩樣本t檢驗7第五章數值變量資料的假設檢驗242(2)計算統計量本例兩樣本t檢驗7第五章數值變量資料的假設檢驗243(3)確定P值,做出推斷結論

以,查附表2t界值表,得雙側,,,按檢驗水準不拒絕,可認為兩組雌性大白鼠增重的差別無統計學意義,尚不能認為兩種飼料對雌鼠的增重不同。兩樣本t檢驗7第五章數值變量資料的假設檢驗244成組設計的兩樣本幾何均數比較在醫學研究中,有些資料為對數正態分布資料和倍數資料,其平均水平宜用幾何均數表示。當成組設計的兩樣本幾何均數比較時,其檢驗統計量值計算公式為:

7第五章數值變量資料的假設檢驗245例8.將20份鉤端螺旋體患者的血清隨機分為2組,分別用標準株和水生株做凝溶試驗,結果見表4-3。試比較兩法測得的血清抗體平均效價有無差別。

成組設計的兩樣本幾何均數比較7第五章數值變量資料的假設檢驗246成組設計的兩樣本幾何均數比較7第五章數值變量資料的假設檢驗247(1)建立假設,確定檢驗水準

:兩總體幾何均數相等

:兩總體幾何均數不等(2)計算統計量本例成組設計的兩樣本幾何均數比較7第五章數值變量資料的假設檢驗248成組設計的兩樣本幾何均數比較7第五章數值變量資料的假設檢驗249(3)確定P值,做出推斷結論

以,查附表2t界值表,得雙側,,,按檢驗水準拒絕,接受,認為兩組抗體平均效價的差別有統計學意義,標準株組高于水生株組。成組設計的兩樣本幾何均數比較7第五章數值變量資料的假設檢驗2502.u檢驗:

應用條件:兩樣本含量均足夠大,一般要求n150,n250。公式:成組設計的兩大樣本均數比較7第五章數值變量資料的假設檢驗251例9.某醫師欲比較某地工人和農民全血膽堿脂酶活力,檢測工人143名,均數為3.52μmol/L,標準差為0.49μmol/L;檢測農民156名,均數為3.36μmol/L,標準差為0.53μmol/L。問該地工人與農民全血膽堿脂酶活力有無差別?

兩樣本u檢驗7第五章數值變量資料的假設檢驗252(1)建立假設,確定檢驗水準

(2)計算統計量本例,

例9兩樣本u檢驗7第五章數值變量資料的假設檢驗253例9(3)確定P值,做出推斷結論

,,按檢驗水準拒絕,接受,可認為該地工人與農民的全血膽堿脂酶活力不同,工人高于農民。兩樣本u檢驗7第五章數值變量資料的假設檢驗254第四節正態性檢驗醫學統計學中,許多統計方法僅適用于正態分布或近似正態分布資料。例如,用均數和標準差描述數值變量資料的分布特征,以及t、u檢驗和方差分析時,均要求樣本資料服從正態分布。因此,選定統計方法時,首先要檢驗資料是否服從正態分布。正態性檢驗(testofnormality)是推斷資料是否服從正態分布,或樣本是否來自正態分布總體的方法。7第五章數值變量資料的假設檢驗255正態性檢驗常用的方法圖示法:P-P圖或Q-Q圖矩法:

檢驗偏度系數和峰度系數W檢驗(Shapiro-Wilk檢驗)D檢驗(Kolmogorov-Smirnov檢驗)頻數分布擬合優度的

2檢驗7第五章數值變量資料的假設檢驗256第五節兩個方差的齊性檢驗兩個方差的齊性檢驗用于推斷兩樣本方差s12

和s22所分別代表的總體方差

12和

22是否相等。當s12

和s22分別代表的總體方差相等時稱兩樣本方差齊;反之,當s12

和s22分別代表的總體方差不等時稱兩樣本方差不齊。兩樣本的t檢驗要求兩樣本來自方差相等的總體,即方差齊。因此,在兩樣本t檢驗時,需先進行兩個方差的齊性檢驗。

7第五章數值變量資料的假設檢驗257兩樣本方差齊性檢驗方法F檢驗:式中,為較大的樣本方差,為較小的樣本方差,為分子的自由度,為分母的自由度,n1和n2分別為相應的樣本含量。

7第五章數值變量資料的假設檢驗258例10例10.來自正態分布總體的2個隨機樣本的血清IgA(u/ml)測定結果如下,試檢驗兩個方差的齊性。

肺氣腫組:健康組:7第五章數值變量資料的假設檢驗259(1)建立假設,確定檢驗水準(2)計算統計量(3)確定P值,做出推斷結論以,查附表3F界值表得,,按檢驗水準不拒絕,可認為兩總體方差相等,即兩樣本方差齊。例107第五章數值變量資料的假設檢驗260

若變量變換后總體方差齊性

可采用t檢驗(如兩樣本幾何均數的t檢驗,就是將原始數據取對數后進行t檢驗);

若變量變換后總體方差仍然不齊

可采用t

檢驗或Wilcoxon秩和檢驗。若兩總體方差不等(),?7第五章數值變量資料的假設檢驗261

(1)Cochran&Cox近似t檢驗(t‘

檢驗)

——調整t界值7第五章數值變量資料的假設檢驗2627第五章數值變量資料的假設檢驗263

例11為研究國產四類新藥阿卡波糖膠囊的降血糖效果,某醫院用40名II型糖尿病病人進行同期隨機對照試驗。試驗者將這些病人隨機等分到試驗組(用阿卡波糖膠囊)和對照組(用拜唐蘋膠囊),分別測得試驗開始前和8周后的糖化血紅蛋白HbA1c(%),其下降值如表3-5。問用兩種不同藥物的病人其HbA1c下降值是否不同?

對照組和試驗組HbA1c下降值(%)

7第五章數值變量資料的假設檢驗264

對照組方差是試驗組方差的3.77倍,經方差齊性檢驗,認為兩組的總體方差不等,故采用近似t檢驗。

(1)建立檢驗假設,確定檢驗水準(略)(2)計算檢驗統計量

7第五章數值變量資料的假設檢驗265(3)確定P值,作出推斷結論。查t界值表t0.05/2,19=2.093。

由t

=0.965<t

0.05/2=2.093得P>0.05。按

=0.05水準,不拒絕H0,還不能認為用兩種不同藥物的病人其HbA1c下降值不同。7第五章數值變量資料的假設檢驗266

(2)

Satterthwaite近似t檢驗:

Cochran&Cox法是對臨界值校正而Satterthwaite法則是對自由度校正。

7第五章數值變量資料的假設檢驗267以

=28.4

28、t=0.965查附表2的t界值表得0.20<P<0.40。結論同前。按Satterthwaite法對例11做檢驗,得7第五章數值變量資料的假設檢驗268(3).Welch法近似t檢驗:

Welch法也是對自由度進行校正。校正公式為7第五章數值變量資料的假設檢驗269對例11,如按Welch法,則

=29.4

29、t=0.965查附表2的t界值表得0.20<P<0.40。結論同前。7第五章數值變量資料的假設檢驗270第六節Ⅰ型錯誤和Ⅱ型錯誤

ATypeIerroristheerrorofrejectingthenullhypothesiswhenitistrue.TheprobabilityofcommittingaTypeIerrorisusuallydenotedby

.ATypeIIerroristheerrorofacceptingthenullhypothesiswhenitisfalse.TheprobabilityofmakingaTypeIIerrorisusuallydenotedby

.7第五章數值變量資料的假設檢驗271Conclusionsandconsequences

fortestingahypothesis

True

"StateofNature"

Conclusions

Donotreject

NullHypothesis

Reject

NullHypothesis

NullHypothesis(H0)Correctconclusionprob=1-

TypeIerrorprob=

AlternativeHypothesis(H1)TypeIIerrorprob=

Correctconclusionprob=1-

7第五章數值變量資料的假設檢驗272假設檢驗中可能發生的兩類錯誤7第五章數值變量資料的假設檢驗2737第五章數值變量資料的假設檢驗274稱為檢驗效能或把握度(poweroftest),即兩總體確有差別時,按水準能識別該差別的能力。如表示:若兩總體確有差別,理論上平均100次抽樣中,有95次能得出兩總體有差別的結論。在假設檢驗中,值的大小是事先確定的。嚴格地說,值也應事先確定,以保證一定檢驗效能()。7第五章數值變量資料的假設檢驗275檢驗效能(1-

)與以下因素有關:①檢驗水準

;②兩總體參數的差值

;③樣本含量n;④總體中的個體變異程度。7第五章數值變量資料的假設檢驗276Fig.1Therelationshipbetween“

”and“

7第五章數值變量資料的假設檢驗277Fig.2Therelationshipbetween“

”and“

7第五章數值變量資料的假設檢驗278Fig.3Therelationshipbetween

samplingerrorand“

7第五章數值變量資料的假設檢驗279下面通過抽樣實驗說明假設檢驗中的兩類錯誤的含義:7第五章數值變量資料的假設檢驗280第一類錯誤——抽樣實驗17第五章數值變量資料的假設檢驗281第一類錯誤——抽樣實驗27第五章數值變量資料的假設檢驗282第一類錯誤——抽樣實驗37第五章數值變量資料的假設檢驗283第一類錯誤——抽樣實驗7第五章數值變量資料的假設檢驗284第二類錯誤——抽樣實驗47第五章數值變量資料的假設檢驗285第二類錯誤——抽樣實驗57第五章數值變量資料的假設檢驗286第二類錯誤——抽樣實驗67第五章數值變量資料的假設檢驗287第二類錯誤——抽樣實驗7

從同一正態總體中以不同樣本量進行抽樣

設置不同的檢驗水準

值7第五章數值變量資料的假設檢驗288第二類錯誤——抽樣實驗8

從標準差不同的正態總體中以不同樣本量進行抽樣7第五章數值變量資料的假設檢驗289第二類錯誤——抽樣實驗9

從均數不同的正態總體中以不同樣本量進行抽樣7第五章數值變量資料的假設檢驗290第二類錯誤——抽樣實驗10從正態總體N(

1,22)中以n=20/n=10抽樣:t檢驗的檢驗功效(1-

)與

=1-0的關系從正態總體N(12,22)中以n=20進行抽樣:

t檢驗的檢驗功效(1-

)與

的關系從正態總體N(12,22)

/N(11,22)中以不同樣本量進行抽樣:t檢驗的檢驗功效(1-

)與樣本含量n的關系從正態總體N(11,22)中以n=20進行抽樣:

t檢驗的檢驗功效(1-

)與檢驗水準

的關系7第五章數值變量資料的假設檢驗291從正態總體N(

1,22)中以n=20抽樣

t檢驗的檢驗功效(1-

)與

=1-0的關系:

H0:

1=

0=10,H1:

1

0=10,

=0.05

=

1-

0Power1-

7第五章數值變量資料的假設檢驗292從正態總體N(

1,22)中以n=10抽樣

t檢驗的檢驗功效(1-

)與

=1-0的關系:

H0:

1=

0=10,H1:

1

0=10,

=0.05Power

17第五章數值變量資料的假設檢驗293標準差

Power1-

從正態總體N(12,

2)中以n=20抽樣

t檢驗的檢驗功效(1-

)與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論