數理統計課件:參數假設檢驗_第1頁
數理統計課件:參數假設檢驗_第2頁
數理統計課件:參數假設檢驗_第3頁
數理統計課件:參數假設檢驗_第4頁
數理統計課件:參數假設檢驗_第5頁
已閱讀5頁,還剩191頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

參數假設檢驗5.1假設檢驗的基本概念5.2正態總體參數的假設檢驗

假設檢驗5.3非正態總體參數的假設檢驗5.4假設檢驗與區間估計

參數估計和假設檢驗是數理統計的兩個主要內容.在第三章和第四章已經探討了關于參數估計的主要方法,包括點估計和區間估計.

在現實中,除去估計問題外,還有涉及到判斷假設是否正確的問題.

假設檢驗問題通過從有關總體中抽取一定量的樣本,利用樣本去檢驗總體分布是否具有某種特征.

在統計學中,假設檢驗主要分為以下兩類:

參數假設檢驗:總體的分布類型已知,對總體分布中的未知參數提出某種假設,然后利用樣本(即數據)對假設進行檢驗,最后根據檢驗的結果對所提出的假設做出成立與否的判斷.

非參數假設檢驗:總體的分布類型未知,利用樣本對總體的分布、分布的特性或總體的數字特征提出假設,并進行檢驗.5.1假設檢驗的基本概念為了說明假設檢驗問題,首先看幾個具體例子.例5.1.1某車間生產的鋼管直徑X服從正態分布N(μ,0.52),其中μ未知.按照規定,為確保該批鋼管能夠與其它零件匹配,生產的鋼管平均直徑應為100mm.現從一批鋼管中隨機抽取10根,測得其直徑的平均值為100.15mm

.目的:如何根據抽樣的結果判斷鋼管的平均直徑是否為μ=100問題:該批生產的鋼管是否符合規定?證據:鋼管直徑的平均值為100.15mm.

例5.1.2假設電視節目的收視服從伯努利分布.有人斷言某電視節目的收視率p

超過30%.為判斷該斷言正確與否,通過調查問卷的方式隨機調查了50人,調查結果顯示有10人觀看過該節目.目的:如何根據抽樣的結果判斷電視節目的收視率p

超過30%.問題:該斷言是否合適?證據:隨機調查了50人,調查結果顯示有10人觀看過該節目.例5.1.3根據以往經驗,某建筑材料的抗斷強度指標X服從正態分布,現在改變了該材料的生產配方并進行新的生產流程,從新材料中隨機抽取100件測其抗斷強度.目的:如何根據抽樣的結果判斷新材料的抗斷強度指標Y

是否仍服從正態分布?問題:新材料的抗斷強度指標Y

是否仍服從正態分布?證據:從新材料中隨機抽取100件測其抗斷強度..假設檢驗的基本任務通過從有關總體中抽取一定數量的樣本,利用樣本對未知總體分布的某些方面(如總體均值、總體方差、總體分布本身等等)的假設作出合理的判斷.

例5.1.1和例5.1.2都是需要對總體分布的參數做出檢驗,因此它們是參數假設檢驗.

例5.1.3是對總體分布的檢驗,是非參數假設檢驗.

結合這幾個例子,在本節中,我們將介紹假設檢驗的基本概念,并給出求解假設檢驗的步驟.5.1.1檢驗問題的提出例5.1.1某車間生產的鋼管直徑X服從正態分布N(μ,0.52),其中μ未知.按照規定,為確保該批鋼管能夠與其它零件匹配,生產的鋼管平均直徑應為100mm.現從一批鋼管中隨機抽取10根,測得其直徑的平均值為100.15mm

.根據題意:X~N(μ,0.52),記μ0=100.由于這種假設是人為加上的,不一定成立.當H0不成立時,另一種推斷為該批鋼管的均值已經不再是100mm,記作H1

:μ

100H0

:μ=100因此鋼管是否符合要求是指平均直徑是μ

=μ0

還是μ

μ0

.若相等就表示符合要求,否則就要進行停產檢查.根據以往經驗,我們可先假設該批鋼管符合要求,即μ

=100,記作第一步:我們提出一個假設它叫做原假設或零假設.另一個可能是叫做備擇假設或對立假設.該問題化為接受H0,還是接受H1.在數學上我們記為H1

:μ

100H0

:μ=100H0

:μ=100;H1

:μ

100設有參數分布族,其中Θ為參數空間.設X1,X

2,…,Xn是從上述分布族中的某總體抽取的樣本.在參數假設檢驗問題中,感興趣的是參數θ是否屬于參數空間Θ的某個非空真子集Θ0,則H0:θ∈Θ0稱為原假設或零假設.確切含義是:檢驗是否存在一個θ0∈Θ0使得X的分布為f(x,θ0)

.

記Θ1

Θ

-

Θ0,則命題H1:θ∈Θ1稱為H0的對立假設或備擇假設.注意:這個提法中將原假設H0放在中心位置,H0和H1的地位不一樣,位置不可更換.原因:我們關心的是θ∈Θ0是否成立.在假設檢驗問題中,我們需要利用樣本提供的信息(即數據)來檢驗原假設H0成立還是備擇假設H1成立.原假設H0寫在左邊,作為中心位置;備擇假設H1寫在右邊,作為陪襯地位.例5.1.1中,Θ0

取為{100},Θ1取為R-{100},H0是簡單假設,H1是復合假設;例5.1.2中,原假設中取Θ0

=[0.3,1],

備擇假設中取Θ1=[0,0.3),H0是復合假設,H1是復合假設;若Θ0或Θ1中只包含參數空間Θ中一個點,則稱為簡單假設;否則稱為復合假設.例如樣本抽自正態總體N(μ,σ2),其中σ2已知.參數空間如果則H0為簡單原假設,H1為復合備擇假設如果此時H0為復合原假設,H1為復合備擇假設.說明:原假設和備擇假設都是總體分布族的子分布族.5.1.2拒絕域、檢驗函數和隨機化檢驗繼續討論例5.1.1.例5.1.1

設X1,X

2,…,Xn為從正態總體N(μ,σ2)中抽取的樣本,其中σ2已知.考慮檢驗問題其中μ0為給定的常數.問題:接受H0還是接受H1?求μ的一個良好的點估計:是μ的UMVUE.若較大,認為樣本與原假設H0有差異,傾向于拒絕H0.若較小,認為樣本與原假設H0相近,傾向于接受H0.具體的說,確定一個常數,由X1,X

2,…,Xn算出樣本均值,若時,拒絕H0.若時,接受H0.統計量稱為檢驗統計量,它衡量數據(樣本)與原假設之間的差異程度,可以看成數據與原假設之間的一種距離.第二步:構造檢驗統計量稱為否定域,或叫做拒絕域.拒絕域是由樣本空間χ

中一切使的那些樣本X1,X

2,…,Xn構成.有了拒絕域,等價于將樣本空間χ分成不相交的兩部分D和.一旦有了樣本(X1,X

2,…,Xn

),當(X1,X

2,…,Xn

)∈D

時,拒絕H0;當

時,接受H0;稱

為接受域.第三步:確定拒絕域的形式.T

給出了一種法則,一旦有了樣本,就可以在拒絕H0或接受H0這兩個結論中選擇一個.稱這樣一種法則T為檢驗問題一個檢驗.稱用于分割出D

和的數值為假設檢驗的臨界值.只要臨界值

定下來,拒絕域(即否定域)也就確定了.因此,此問題中的檢驗可視為如下一種法則為了數學處理方便.引入檢驗函數

φ(x)的概念,φ(x)與檢驗T

是一一對應,在例5.1.1中由式給出的檢驗函數

φ(x)是定義在樣本空間χ上,取值于[0,1]上的函數.由定義可見,若φ(x)=1,則以概率1拒絕H0;若φ(x)=0,則以概率0拒絕H0.若φ(x)只取0和1這兩個值,稱這種檢驗為非隨機化檢驗.拒絕域可用檢驗函數表示如下若存在樣本點x,有0<φ(x)<1,則稱φ(x)為隨機化檢驗.隨機化檢驗在可靠性統計中常涉及.在例5.1.1中,如果樣本正好落在拒絕域與接受域的邊界上,而買方以此為由拒絕購買該批鋼管,此時廠方被拒絕的可能性大了,廠方覺得吃虧;如果廠方認為該批鋼管沒有問題,則買方收到不合格產品的可能性大了,買方覺得吃虧.以下討論假定φ(x)皆為非隨機化的檢驗函數,

除非特別聲明,不認為φ(x)為隨機化檢驗函數.此時,可以事先規定一個概率,使得該批鋼管以概率p0被接受.當概率p0給定后,可以借助裝著小球的盒子或者不均勻的骰子等來確定是否接受該批產品.此時檢驗函數為在確定拒絕域和檢驗函數后,我們需要確定臨界值.臨界值的確定基于以下原則:第四步:確定臨界值.由于在未獲得外部信息的情況下,我們通常更愿意相信原假設繼續成立,即狀態并未發生變化.當在原假設成立的情況下小概率事件頻繁出現時,我們才會傾向于相信原假設已經不成立,狀態發生了改變.基本思想:實際推斷原理,也稱小概率原理.5.1.3兩類錯誤和功效函數統計推斷是以樣本為依據,由于樣本的隨機性,不能保證統計推斷方法的絕對正確性,而只能以一定的概率去保證這種推斷的可靠性.在假設檢驗問題中可能犯兩類錯誤.(1)當原假設H0成立時拒絕原假設,稱這類錯誤為第一類錯誤(或棄真錯誤),其發生的概率稱為犯第一類錯誤的概率(或棄真概率);(2)原假設H0本來不正確,但卻接受了H0,稱這類錯誤為第二類錯誤(或取偽錯誤),其發生的概率稱為犯第二類錯誤的概率(或取偽概率)假設檢驗的兩類錯誤真實情況所作判斷接受

H0拒絕

H0H0

為真H0

為假正確正確第一類錯誤

(棄真錯誤)第二類錯誤

(取偽錯誤)犯第一類錯誤的概率=P{第一類錯誤}

=P{當H0為真時拒絕

H0}犯第二類錯誤的概率=P{第二類錯誤}

=P{當H0不真時接受

H0

}在確定了兩類錯誤的概念后,我們希望進一步用函數來刻畫這兩種概率.為此,需要引進功效函數的概念.設φ(x)是的一個檢驗函數,則函數稱為φ的功效函數,也稱為效函數或勢函數.若檢驗函數φ(x)為非隨機化檢驗,拒絕域為D,則此時功效函數表示當參數為θ時,拒絕原假設H0的概率.定義5.1.1(功效函數)利用功效函數計算兩類錯誤的概率.以和分別表示犯第一和第二類錯誤的概率,則犯第一類錯誤的概率為犯第二類錯誤的概率為說明1.當樣本容量確定后,犯兩類錯誤的概率不可能同時減少.2.假設檢驗的指導思想是控制犯第一類錯誤的概率不超過α,然后,盡可能的減少第二類錯誤的發生.這里就能看出假設檢驗原假設與備擇假設地位是不可互換的.一個好的檢驗φ(x),犯兩類錯誤的概率都應該較小.即:功效函數γφ(θ)

在Θ0中應該盡可能的小,

功效函數γφ(θ)在Θ1中應該盡可能的大.犯兩類錯誤的概率完全由功效函數決定,因此如果兩個檢驗有同一功效函數,則該檢驗在性質上也完全相同.Neyman—Pearson提出以下原則控制犯第一類錯誤概率的原則,即在保證犯第一類錯誤的概率不超過指定數值α(

0<α<1,通常取較小的數)的檢驗中,尋找犯第二類錯誤的概率盡可能小的檢驗.5.1.4顯著性檢驗若記:Sα表示由所有犯第一類錯誤的概率都不超過α的檢驗函數構成的類.只考慮Sα中的檢驗,在Sα中挑選“犯第二類錯誤的概率盡可能小的檢驗”.這種法則稱為控制犯第一類錯誤概率的法則.關于原假設與備擇假設的選取根據Neyman—Pearson原則,在原假設H0為真時,作出錯誤決定(即拒絕H0)的概率受到了控制.在控制犯第一類錯誤的概率α的原則下,使得采取拒絕H0

的決策變得較慎重,即H0得到特別的保護,不輕易被拒絕.因而,通常把有把握的、有經驗、不能輕易否定的命題作為原假設,或者盡可能使后果嚴重的錯誤成為第一類錯誤.把沒把握的、不能輕易肯定的命題作為備擇假設.原假設H0與H1地位不平等.既然我們不能同時控制一個檢驗的兩類錯誤,那么我們不妨先考慮一個簡單些的問題,僅僅去限制第一類錯誤:設φ(x)是檢驗問題的一個檢驗函數,而0≤α≤1.如果檢驗φ(x)犯第一類錯誤的概率總不超過α或者等價的:檢驗φ滿足γφ(θ)≤α,一切θ∈Θ0.則稱α是檢驗φ(x)的一個水平,而φ(x)稱為顯著性水平為α的檢驗,簡稱水平為α的檢驗.定義5.1.2(顯著性檢驗):按照上述定義,檢驗的水平不唯一.若α為檢驗φ(x)的水平,而α<α’<1,則α’也是檢驗φ(x)的水平.為避免這一問題,有時稱一個檢驗的最小水平為其真實水平,即檢驗φ的真實水平.習慣上把水平α取得比較小且標準化如α=0.01,0.05,0.10等.標準化是為了查表方便.水平的選取,對檢驗的性質有很大影響.若水平選的低,那么容許犯第一類錯誤概率很小.而為了達到這一點勢必大大縮小拒絕域,使接受域擴大,從而增加了犯第二類錯誤的概率.反之,若水平選的高,那么容許犯第一類錯誤概率很大.而為了達到這一點勢必擴大拒絕域,使接受域縮小,從而犯第二類錯誤的概率相應降低.當一個檢驗涉及雙方利益時,水平的選定常常是雙方協

議的結果.2犯兩種錯誤的后果一般在性質上有很大不同.如果犯第一類錯誤的后果在性質上很嚴重,就力求在合理的范圍內盡量減少犯這種錯誤的可能性,此時相應的水平取得更低一些.一般來說,試驗者在試驗前對問題的情況總不是一無所知.他對問題的了解使他對原假設是否能成立就有了一定的看法,這種看法可能影響他對水平的選擇.若水平α很小,原假設H0不會輕易被否定,如果樣本落入拒絕域,作出“拒絕原假設”的結論比較可靠.反之,當水平α很小時,如果樣本落入接受域,作出“接受原假設”的結論未必可靠.說明:在所選定的水平下沒有充分根據拒絕H0,但是,絕不意味著有充分根據說明它正確.(此時會犯第二類錯誤,其概率很大)說明:1.顯著性檢驗中拒絕原假設H0是在概率意義下進行嚴格推理得到的結論,因此拒絕原假設意味著有充分的證據表明原假設H0不成立;2.接受原假設H0并不意味著H0充分成立,只能說明在當前的樣本下沒有充分的證據拒絕H0的成立.當原假設

H0

成立時,回到例5.1.1:確定C.拒絕域為原假設H0

:μ=100;備擇假設H1

:μ

100進一步,有對于給定顯著性水平α,由標準正態分布分位數的定義,有即當原假設H0成立時,是概率為α的小概率事件,小概率事件在一次試驗中幾乎不可能發生.若在一次試驗中出現了,則有充分的證據表明“原假設H0成立”是錯誤的,因而拒絕H0;反之,若在一次抽樣中,有,就沒有充分的理由拒絕原假設H0,從而承認H0成立.借助顯著性水平的概念,由樣本觀察值計算得的觀察值時,可以將判斷準則T

改寫為第五步:根據樣本觀察值作出是否拒絕H0的判斷.例5.1.1中,根據題目條件得到由于0.95<1.96,因此不能拒絕原假設,可以認為該批生產的鋼管符合要求.且有對于給定顯著性水平α=0.05,查表得到在假設檢驗中,原假設是處于被保護的地位.這種保護是符合實際需求的.這是因為檢查鋼管直徑是否符合要求將會產生多余的成本.如果沒有充分的理由來支持鋼管直徑不符合要求,我們傾向于認為這批鋼管是符合要求的.鑒于原假設H0的特殊地位,在建立假設檢驗問題時,我們通常選擇有把握的、不能輕易改變的或存在已久的狀態作為原假設.除去該準則外,另一個選取原假設H0的準則是選取違反該條件后將產生嚴重后果的準則作為原假設,從而可以將出現重大錯誤的可能性控制在較小的范圍內.在實際問題中,情況將更為復雜.因此,關于如何選取原假設和備擇假設沒有一個絕對的標準,只能在實踐工作中積累經驗,根據實際情況去判斷如何選取.第一步:建立假設檢驗問題5.1.5假設檢驗的基本步驟根據實際問題的要求和已知信息提出原假設H0和備擇假設H1例5.1.1中:H0:μ=100;H1:μ

100第二步:構造檢驗統計量設密度函數f(x,

)的表達式已知,通常是基于參數

的極大似然估計構造一個檢驗統計量T=T(X1,X2,

…,Xn),并在原假設H0成立下,確定

T的精確分布或漸近分布.例5.1.1中:檢驗統計量為第三步:確定拒絕域的形式根據原假設H0和備擇假設H1的形式,分析并提出拒絕域的形式,以及待定的臨界值k.例5.1.1中:拒絕域的形式為其中k為臨界值,是一個待定的值.第四步:給定顯著性水平α

的值,確定臨界值k.例5.1.1中:臨界值為k=uα/2

,因此拒絕域為利用檢驗統計量的分布,由P{當H0為真時拒絕H0}

=

或≤

出發確定臨界值,從而確定拒絕域.若樣本觀察值(x1,x2,

…,xn)落入拒絕域,即(x1,x2,

…,xn)

D,則拒絕H0;否則無法拒絕H0.第五步:根據樣本觀察值作出是否拒絕H0的判斷.判斷的基本原理是:實際推斷原理即小概率原理.小概率事件在一次試驗中幾乎不可能發生.提出假設抽取樣本檢驗假設作出決策顯著性水平α根據統計調查的目的,提出原假設H0和備擇假設H1.拒絕還是不能拒絕H0

作業:習題5.1:5,7,8正態分布是概率統計中最常用的分布,關于它的兩個參數的假設檢驗在實際中經常遇到.例如:要考察某食品包裝生產線工作是否正常時,需要檢查包裝食品的平均重量是否達到標準要求,同時也要檢查生產食品的生產線工作狀態是否穩定.前者是均值的檢驗問題,而后者是方差的檢驗問題.5.2正態總體參數的顯著性檢驗設X1,X

2,…,Xn

是來自正態總體N(μ,σ2)的樣本,給定顯著性水平α,求下列三類檢驗問題:(1)(2)(3)檢驗問題(1)稱為雙邊檢驗檢驗問題(2)和(3)稱為單邊檢驗其中μ0

為已知常數.5.2.1單個正態總體均值的檢驗一單個正態總體方差已知,均值的假設檢驗首先:討論檢驗問題(1)(例5.1.1已經討論)

第一步:建立假設檢驗問題H0:

=

0

H1:

0第二步:構造檢驗統計量第三步:確定拒絕域的形式.第四步:確定臨界值.利用檢驗統計量的分布,由P{當H0為真時拒絕H0}

=

或≤

出發確定臨界值A,從而確定拒絕域.例5.1.1中:臨界值為k=uα/2

,拒絕域為u

/2?u

/2第五步:根據樣本觀察值作出是否拒絕H0的判斷.若樣本觀察值(x1,x2,

…,xn)落入拒絕域,即(x1,x2,

…,xn)

D,則拒絕H0;否則無法拒絕H0.判斷的基本原理是:實際推斷原理即小概率原理.小概率事件在一次試驗中幾乎不可能發生.其中A

為常數,待定.由于是μ

的無偏估計,當原假設H0為真,并考慮備擇假設H1,檢驗的拒絕域可取為如下形式討論檢驗問題(2)第一步:建立假設檢驗問題H0:

0

H1:

>

0取作為檢驗統計量.檢驗拒絕域的形式可取為其中k

為常數,待定.第二步:構造檢驗統計量第三步:確定拒絕域的形式.得到由于在原假設H0:

0成立下,有第四步:確定臨界值.在原假設H0:

0成立下,是一個小概率事件(概率不超過α),所以得到檢驗問題II的拒絕域為因此第五步:根據樣本觀察值作出是否拒絕H0的判斷.若,則拒絕原假設H0;若,則不拒絕原假設H0

.u

α右邊檢驗類似檢驗問題(2)的討論可得到檢驗問題(3)的拒絕域為討論檢驗問題(3)H0:

0

H1:

<

0單個正態總體均值的假設檢驗中,當方差已知時,無論是雙邊檢驗還是單邊檢驗,所選檢驗統計量的分布都與標準正態分布有關,上述假設檢驗方法稱為U

檢驗法.左邊檢驗?u

α檢驗參數條件原假設H0備擇假設H1檢驗統計量拒絕域μ方差已知μ=μ0μ≠

μ0|U|≥

uα/2μ≥μ0μ<

μ0U≤

-uαμ≤μ0μ>

μ0U≥

uα注意:拒絕域{U≤-u

α}的不等號“≤”的方向和備擇假設“H1:μ<

μ0”的不等號“<”的方向一致;拒絕域{U≥

uα}的不等號“≥”的方向和備擇假設“H1:μ>

μ0”的不等號“>”的方向一致.正態總體方差已知,關于總體均值的檢驗例5.2.1一臺方差是0.8克2的自動包裝機在流水線上包裝袋裝白糖,假定包裝機包裝的袋裝白糖的重量X~N(

2).按規定袋裝白糖重量的均值應為500克.隨機抽取了9袋,測得平均凈重為499.41克.在顯著性水平α=0.05下,問包裝機包裝的袋裝白糖是否符合規定?將包裝機包裝的袋裝白糖的重量視為總體X,則X~N(μ,σ2),其中σ2=0.8已知,μ

未知.提出假設檢驗統計量拒絕域為解:本例中,如果取α=0.05

.查表得計算得即抽樣數據落入了拒絕域中,于是拒絕原假設H0.即認為包裝機包裝的袋裝白糖不符合規定.在本例中,如果取顯著性水平α=0.04,則uα/2=2.054,這時|u|=1.98<2.054,說明樣本觀測值沒有落入拒絕域,因此,不能拒絕H0.這說明在不同的檢驗水平下可以得到不同的檢驗結果.這是因為降低犯第一類錯誤的概率,就會使得拒絕域減小,從而拒絕H0的機會變小,接受H0的機會變大.例5.2.2某織物強力指標X的均值21公斤.改進工藝后生產一批織物,今從中取30件,測得均值為21.55公斤.假設強力指標服從正態分布N(

,

2),且已知

=1.2公斤.問在顯著性水平

=0.01下,新生產織物比過去的織物強力是否有提高?解:因為21.55>21,我們懷疑新生產織物比過去的織物強力提高,即μ>21的正確性,希望通過數據信息進行嚴格推理證實,因此對織物強力提出假設提出假設檢驗統計量拒絕域為由樣本值計算表明,樣本觀測值落入拒絕域,故拒絕原假設H0.即,認為新生產織物比過去的織物強力有提高.例5.2.3設某種元件的壽命X服從正態分布N(

,1002),要求該種元件的平均壽命不得低于1000小時.生產者從一批該種元件中隨機抽取25件,測得平均壽命為950小時.在顯著性水平

=0.05下,判斷這批元件是否合格?解:因為950<1000,利用數據信息進行推理提出假設檢驗統計量拒絕域為由樣本值計算由于2.5<1.645,因此拒絕原假設,在顯著性水平

=0.05下,判斷這批元件不合格.實際問題中,方差

2已知的情形比較少見,一般只知X~N(μ,

2),而其中

2未知.當

2未知時,對給定的顯著性水平α,關于正態總體均值

的常見假設檢驗問題仍提出如下三種.(3)H0:

0

H1:

<

0

(1)

H0:

=

0

H1:≠0

(2)H0:

0

H1:

>

0雙邊檢驗右邊檢驗左邊檢驗其中C

為常數,待定.由于是μ

的無偏估計,當原假設H0為真,并考慮備擇假設H1,檢驗的拒絕域可取為如下形式討論檢驗問題(3)第一步:建立假設檢驗問題H0:

0

H1:

<

0此時不能作為檢驗統計量.第二步:構造檢驗統計量因為

σ2未知,上面拒絕域確定的檢驗,其犯第一類的概率不能被控制.自然的想法是用樣本方差S2代替總體方差σ2取作為檢驗統計量.由于檢驗拒絕域的形式可取為其中k

為常數,待定.第三步:確定拒絕域的形式.得到由于在原假設H0:

0成立下,有第四步:確定臨界值.在原假設H0:

0成立下,是一個小概率事件(概率不超過α

),所以得到檢驗問題III的拒絕域為因此第五步:根據樣本觀察值作出是否拒絕H0的判斷.若,則拒絕原假設H0;若,則不拒絕原假設H0

.左邊檢驗?t

α檢驗參數條件原假設H0備擇假設H1檢驗統計量拒絕域μ方差未知μ=μ0μ≠

μ0μ≤μ0μ>

μ0μ≥μ0μ<

μ0正態總體方差未知,關于總體均值的檢驗單個正態總體均值的假設檢驗中,當方差未知時,無論是雙邊檢驗還是單邊檢驗,所選檢驗統計量的分布都與t分布有關,上述假設檢驗方法稱為t

檢驗法.例5.2.4某工廠生產的一種螺絲釘的長度X服從正態分布N(

,

2),

2未知,規定其長度的均值是32.5毫米.現從該廠生產的一批產品中抽取6件,得平均長度為31.13毫米,標準差為1.12毫米.在顯著性水平α=0.01,問該工廠生產的這批螺絲釘的長度是否合格?解:(1)

提出假設H0:

=32.5

H1:

≠32.5(2)檢驗統計量為(4)查表得計算得(5)故不能拒絕原假設H0,認為工廠生產的這批螺絲釘的長度合格.(3)拒絕域為例5.2.5設某車間生產的鋼管直徑X服從正態分布N(

,

2),現從一批鋼管中隨機抽取10根,測得其平均直徑為100.15毫米,方差為0.5783毫米2.給定顯著性水平α=0.05,檢驗假設

H0:

=100

H1:

>100解:

(1)

檢驗統計量為(3)查表得計算得(4)故不能拒絕原假設H0,認為H0:

=100成立.(2)拒絕域為例5.2.6.某廠生產小型馬達,其說明書上寫著:這種小型馬達在正常負載下平均消耗電流不會超過0.8安培.現隨機抽取16臺馬達試驗,算得平均消耗電流為0.92安培,消耗電流的標準差為0.32安培.假設馬達所消耗的電流服從正態分布N(μ,σ2),σ2未知,在顯著性水平α=0.05下,對下面的假設進行檢驗.(1)H0:平均電流不超過0.8H1:平均電流超過0.8(2)H0:平均電流不低于0.8H1:平均電流低于0.8解:(1)

假設H0:μ≤

μ0=0.8H1:μ>μ0=0.8檢驗統計量為拒絕域為因此不能拒絕原假設,即不能否定廠方斷言,認為平均電流不超過0.8安培.查表得

tα(n?1)=t0.05(15)=1.7531拒絕域為計算得(2)H0:

0.8H1:

<0.8

因此不能拒絕原假設,即否定廠方斷言,認為平均電流不低于0.8安培.查表得?tα

(n-1)=?

t0.05(15)=?1.7531選用統計量拒絕域為計算得第二種原假設的設置方法是不輕易相信廠方的結論,屬于把廠方的斷言反過來設為原假設,屬于從消費者的角度即把平均電流不小于0.8設為原假設,此時廠方說的是假的而被拒絕的概率很小(不超過0.05).第一種原假設的設置方法是不輕易否定廠方的結論,屬于從廠方角度即把平均電流不超過0.8設為原假設,此時廠方說的是真的被拒絕這種錯誤的概率很小(不超過0.05);對問題的提法不同(把哪個假設作為原假設),統計檢驗的結果也會不同.由于假設檢驗是控制犯第一類錯誤的概率,因此拒絕原假設H0的決策是有道理的.而接受原假設H0只是因為沒有找到矛盾,根據目前的數據沒有理由拒絕原假設,只能接受原假設.例5.2.4,例5.2.5和例5.2.6都沒有拒絕原假設,用當前的數據信息無法證實我們的懷疑,但這時仍不能輕易接受,因為犯第二類錯誤的概率會很大.通常在實際問題中,我們需要通過增加樣本容量的方法繼續收集數據信息來進一步檢驗,此時犯第二類錯誤的概率會減小.設X1,X

2,…,Xn

為從正態總體N(μ,σ2)中抽取的樣本,給定檢驗水平α,求下列三類檢驗問題:(1)(2)(3)雙邊檢驗右邊檢驗其中為已知常數.5.2.2單個正態總體方差的檢驗左邊檢驗單個正態總體均值未知時的檢驗問題要比均值已知情況更常見,首先討論均值未知情形下,方差的假設檢驗問題.第一步:建立假設檢驗問題第二步:構造檢驗統計量均值μ未知,樣本方差是總體方差σ2的無偏估計且具有良好性質(是UMVUE).分析:S2的觀察值s2應該與

2比較接近.因此,當H0成立時,s2/

02的值應該在1附近擺動.s2/

2的值應該在1附近擺動.s2/

02過分小于1或過分大于1都是相差較大.當H0成立時,s2/

02與1相差較大是小概率事件.拒絕域的形式為:當原假設H0:σ2=σ02成立時,有故取檢驗統計量為檢驗拒絕域的形式為其中k1,k2

為常數,待定.第三步:確定拒絕域的形式.第四步:確定臨界值.對于給定顯著性水平α,有為方便,取因此有于是,拒絕域為第五步:根據樣本觀察值作出是否拒絕H0的判斷.若,則拒絕原假設H0;若,則不拒絕原假設H0

.假設檢驗中選取的檢驗統計量服從χ2分布的檢驗方法稱為χ2檢驗法.考慮均值未知情形下,方差的單邊假設檢驗問題.第一步:建立假設檢驗問題第二步:構造檢驗統計量由于均值μ未知,樣本方差是總體方差σ2的無偏估計且具有良好性質(是UMVUE).當H0成立時并考慮到備擇假設,S2的觀察值s2與σ02的比值s2/σ02應當偏大.于是,檢驗拒絕域的形式為其中k

為常數,待定.取作為檢驗統計量.第三步:確定拒絕域的形式.其中k

為常數,待定.注:

并不服從卡方分布,但是第一類錯誤仍可以被控制所以當H0:σ2≤σ02成立時故第四步:確定臨界值k故而要使只要由抽樣分布定理知所以,檢驗的拒絕域為第五步:根據樣本觀察值x1,x2,···,xn,計算統計量的觀察值,并與比較,作出判斷.若,則拒絕原假設;若,則不拒絕(接受)原假設.這是單邊χ2

檢驗.單邊檢驗(左邊檢驗)拒絕域為正態總體均值未知,關于總體方差σ2

的檢驗原假設H0備擇假設H1檢驗統計量拒絕域(μ未知)假設檢驗中選取的檢驗統計量的分布都與χ2分布有關,上述假設檢驗方法稱為稱為χ2檢驗法.例5.2.7某紡織車間生產的細紗支數服從正態分布,規定標準差是1.2.從某日生產的細紗中隨機抽取16根,測量其支數,得其標準差為2.1.給定顯著性水平

=0.05,問細紗的均勻度是否符合規定?解:提出假設檢驗統計量確定拒絕域:查表得拒絕域為經計算得由于45.94>27.488,因此在顯著性水平

=0.05下拒絕原假設,認為細紗的均勻度不符合規定.例5.2.8某種零件的長度服從正態分布,按規定其方差不得超過0.016.現從一批零件中隨機抽取25件測量其長度,得樣本方差為0.025.問能否由此判斷這批零件合格?(取顯著性水平

=0.01,

=0.05)解:提出假設檢驗統計量確定拒絕域:查表得拒絕域為經計算得由于37.5<42.98,因此在顯著性水平

=0.01下,不能拒絕原假設,可以認為這批零件合格.當

=0.05時,查表得拒絕域為由于37.5>36.415,因此在顯著性水平

=0.05下拒絕原假設,認為這批零件不合格.例5.2.8說明:對原假設作出的判斷,在不同的顯著性水平下可以得到不同的檢驗結果.這是因為降低犯第一類錯誤的概率,就會使得拒絕域減小,從而拒絕H0的機會變小,接受H0的機會變大.因此對原假設H0所作的判斷,與所取顯著性水平

的大小有關,

越小越不容易拒絕原假設H0.例5.2.9

某汽車配件廠在新工藝下對加工好的25個活塞的直徑進行測量,得樣本方差S2=0.00066.已知老工藝生產的活塞直徑的方差為0.00040.問進一步改革的方向應如何?解:一般進行工藝改革時,若指標的方差顯著增大,則改革需朝相反方向進行以減少方差;若方差變化不顯著,則需試行別的改革方案.設測量值X~

N(μ,σ2)需考察改革后活塞直徑的方差是否不大于改革前的方差?故待檢驗假設可設為:取檢驗統計量拒絕域D:落在D內,故拒絕H0.即改革后的方差顯著大于改革前的方差,因此下一步的改革應朝相反方向進行.當

未知時,檢驗統計量為該統計量服從χ2(n)分布,在

=

0已知下關于方差的假設檢驗見表.當

=

0已知時,

自然用

0替換

得檢驗統計量正態總體均值已知,關于總體方差σ2

的檢驗原假設H0備擇假設H1檢驗統計量拒絕域(μ已知)5.2.3兩個正態總體均值差的檢驗設X1,X

2,…,Xm是來自正態總體N(μ1,σ12)的樣本,

Y1,Y

2,…,Yn是來自正態總體N(μ2,σ22)的樣本,且樣本X1,X

2,…,Xm

和Y1,Y

2,…,Yn相互獨立,分別表示兩個樣本的樣本均值和樣本方差(1)(2)(3)雙邊檢驗單邊檢驗給定顯著性水平α,討論下列三類檢驗問題:分幾種情況討論一

方差已知條件下,兩個正態總體均值差的檢驗首先考慮雙邊檢驗問題(1)因分別為μ1,μ2的無偏估計,又由的獨立性及得的無偏估計(UMVUE)

.檢驗的拒絕域可取為如下形式其中C

為常數,待定.且當成立時因此取作為檢驗統計量.檢驗拒絕域的等價形式可取為其中k

為常數,待定.給定顯著性水平為α,有得到.

因此檢驗的拒絕域為因此,在給定顯著性水平α下,檢驗問題I的檢驗為若,則拒絕原假設;若,則不拒絕(接受)原假設.兩樣本U

檢驗原假設H0備擇假設H1檢驗統計量拒絕域(σ12,σ22已知)兩正態總體方差均已知,關于總體均值差的檢驗其中因此取T作為檢驗統計量.兩樣本t

檢驗原假設H0備擇假設H1檢驗統計量拒絕域(σ12=σ22未知)兩正態總體方差均未知但相等,關于均值差的檢驗例5.2.10

設甲乙兩廠生產同樣的燈泡,其壽命分別服從正態分布N(μ1,902)與N(μ2,962),現從兩廠生產的燈泡中隨機的各取60只,測得平均壽命甲廠為1150小時,乙廠為1100小時,在顯著性水平

=0.05下,能否認為兩廠生產的燈泡壽命無顯著差異?檢驗統計量為解:提出假設H0:μ1=μ2

H1:μ1

≠μ2

一般來說,兩個正態總體均值差的顯著性檢驗,其實際意義是一種選優的統計方法.拒絕域為查表得計算得由于2.94>1.96,因此拒絕原假設,即在顯著性水平α=0.05下,認為兩廠生產的燈泡壽命有顯著差異.例5.2.11

為研究正常成年男女血液紅細胞平均數的差別,檢驗某地正常成年男子156人,女子74人,計算男女紅細胞的平均數和樣本標準差分別為男:女:假定正常成年男女紅細胞數分別服從正態分布N(μ1,σ2)與N(μ2,

σ2),且相互獨立,在顯著性水平α=0.01下,檢驗正常成年人紅細胞數是否與性別有關.解:檢驗問題為檢驗統計量為檢驗的拒絕域為其中查表得計算得到因此拒絕H0,即在顯著性水平α=0.01下,認為正常成年人的紅細胞數與性別有關.例5.2.12某物質在處理前和處理后分別抽樣分析其含脂率如下:處理前:(X)0.19,0.18,0.21,0.30,0.41,0.12,0.27處理后:(Y)0.15,0.13,0.07,0.24,0.19,0.06,0.08,0.12假定處理前后的含脂率都服從正態分布,且方差相同,相互獨立,在顯著性水平α=0.05下,處理前后的含脂率的平均值是否有顯著變化?.檢驗統計量為代入T中,得T的觀測值t為故在顯著水平0.05下拒絕H0,即認為處理前后含脂率的平均值有顯著變化.解:檢驗問題為記,則且Z1,Z

2,…,Zn獨立同分布,因此Z1,Z

2,…,Zn可視為從總體抽取的樣本,且于是對于如下配對的問題,換個角度思考:三

方差均未知,但樣本容量m=n時,總體均值差的檢驗因此可以利用單個正態總體均值的t

檢驗方法,檢驗問題為用于配對試驗!!檢驗的拒絕域為成對比較問題原假設H0備擇假設H1檢驗統計量拒絕域(σ12

,σ22未知,m=n)兩正態總體方差均未知,但m=n,關于均值差的檢驗一般來說,兩個正態總體均值差的顯著性檢驗,其實際意義是一種選優的統計方法,至于多個正態總體均值之間差異的顯著性檢驗,在方差分析以及正交試驗設計內容中會進一步介紹.5.2.4兩個正態總體方差比的檢驗設X1,X

2,…,Xm

是來自正態總體N(μ1,σ12)的樣本,

Y1,Y

2,…,Yn

是來自正態總體N(μ2,σ22)的樣本,且樣本X1,X

2,…,Xm

和Y1,Y

2,…,Yn獨立,分別表示兩個樣本的樣本均值和樣本方差給定顯著性水平α,討論下列三類檢驗問題:(1)(2)(3)雙邊檢驗單邊檢驗首先考慮雙邊檢驗問題(1)主要討論μ1,μ2未知時,方差比的檢驗.由于和

分別是和的無偏估計,并具有優良性質(UMVUE).接近1(H0下)檢驗的拒絕域可取為如下形式其中c1

c2

為常數,待定.在成立條件下檢驗統計量檢驗的拒絕域為原假設H0備擇假設H1檢驗統計量拒絕域F

Fα/2(m-1,n-1)或F

F1-α/2(m-1,n-1)

F

F1-α

(m-1,n-1)

F

Fα/

(m-1,n-1)兩正態總體均值未知,關于總體方差比的檢驗(μ1

μ2未知)假設檢驗中選取的檢驗統計量的分布都與F分布有關,這種檢驗方法稱為F

檢驗法.原假設H0備擇假設H1檢驗統計量拒絕域F*≥

Fα/2(m,n)或F*≤

F1-α/2(m,n)

F*≤

F1-α

(m,n)

F*≥

Fα/

(m,n)兩正態總體均值已知,關于總體方差比的檢驗(μ1

μ2已知)例5.2.14甲乙兩臺機器加工同種零件,分別從兩臺機器加工的零件中隨機抽取8個和9個測量其直徑,得樣本均值分別為,樣本方差分別為

假定零件直徑分別服從正態分布

,(1)在顯著性水平

=0.1下,問方差是否相等?(2)在顯著性水平

=0.1下,問均值是否相等?解:(1)提出假設檢驗統計量為由于0.27<0.92<3.50查表得計算得拒絕域為因此不能拒絕原假設,在顯著性水平α=0.1下,可以認為兩臺機器生產的零件直徑的方差相等。(2)提出假設

H0:μ1=μ2H1:μ1≠μ2

根據(1)得到兩臺機器生產的零件直徑的方差相等,故取檢驗統計量為拒絕域為拒絕域為查表得計算得由于1.71<1.7531因此不能拒絕原假設,在顯著性水平α=0.1下,可以認為兩臺機器生產的零件直徑的均值相等.例5.2.15分別用國產測量儀器和進口同類測量儀器測量某物體11次,分別得11個數據.計算得兩組數據的樣本方差分別為

,假定國產和進口測量儀器的測量值分別服從正態分布

.在顯著性水平

=0.05下,問國產測量儀器是否比進口的同類測量儀器好?解:提出假設檢驗統計量為拒絕域為查表得計算得由于0.295<0.336拒絕域為因此拒絕原假設,即在顯著性水平α=0.05下,認為國產測量儀器比進口的同類測量儀器好.作業:習題5.2:5,7,9,12,15,

17,21

在上一節中,我們已經介紹了正態總體參數假設檢驗問題的有關方法.然而,現實中許多分布并非正態分布,因此需要借助其它分布下的假設檢驗問題來進行判斷.

本節我們將講解非正態總體分布的參數假設檢驗問題.5.3非正態總體參數的假設檢驗設總體X服從指數分布,其密度函數為5.3.1小樣本方法一指數分布參數的假設檢驗其中,λ>0為未知參數,X1,X2,···,Xn是來自總體X的樣本.其中λ0

為已知常數.對參數λ提出如下幾種假設檢驗問題.(1)(2)(3)雙邊檢驗單邊檢驗由于是1/λ的無偏估計,因此應當接近1當原假設成立時,接近1,既不太大也不太小,于是檢驗拒絕域的形式為首先:討論檢驗問題(1)其中A1為適當小的正數,A2為適當大的正數,且A1<A2,均由顯著性水平α

確定.拒絕域的等價形式為其中C1

C2

為常數,待定.由于,因此當成立時對于給定的顯著性水平α通常取由此有因此檢驗問題I的拒絕域為于是,檢驗問題(1)的檢驗法為若,則拒絕原假設H0;若,則不拒絕原假設H0

.由于是1/λ的無偏估計,因此應當接近1當原假設成立并考慮備擇假設,偏大于是檢驗拒絕域的形式為拒絕域的等價形式為其中C

為常數,由顯著性水平α

確定.討論檢驗問題(2)且由此有因此檢驗問題(2)的拒絕域為當H0

:λ

λ0

成立時檢驗問題(2)的拒絕域為檢驗問題(3)的拒絕域為前面討論的小樣本情況下的假設檢驗問題,利用有關分布的特性構造了各種檢驗統計量,并利用與檢驗統計量有關隨機變量的精確分布,求出了具有指定水平的檢驗.然而,檢驗總體參數的統計量的精確分布,通常很難找到或者很復雜不便于使用.此時,往往借助于樣本容量n

充分大時統計量的極限分布對總體參數做近似檢驗,而這種檢驗所用的樣本必須是大樣本.但是沒有一個標準可用來決定樣本容量多大就算是大樣本,因為這與所采用的統計量趨于它的極限分布的速度快慢有關,沒有一個標準的答案.一般的,n越大近似檢驗就越好,而且使用上至少要求n不小于30最好大于50或者100.本章開始曾以電視節目收視率的問題引入了假設檢驗的基本概念.事實上此類問題是關于兩點分布和二項分布中參數p的假設檢驗問題.當樣本容量增大時,可以通過極限分布來對樣本進行檢驗.在本節中我們以二項分布為例來介紹大樣本情況下利用中心極限定理進行假設檢驗的方法.5.3.2大樣本方法設總體X服從兩點分布,即X~

B(1,p),0<p<1,

X1,X

2,…,Xn

是來自總體X的樣本,對給定的顯著性水平α,檢驗假設(1)(2)(3)其中p0是已知常數,且0<p0<1.(1)由于,根據中心極限定理當原假設成立時,統計量的極限分布為標準正態分布N(0,1),即當n趨于∞時于是當H0

成立且n

充分大時,有若,則拒絕原假設;若,則不拒絕(接受)原假設.(2)(3)若,則拒絕原假設;若,則不拒絕(接受)原假設.若,則拒絕原假設;若,則不拒絕(接受)原假設.例5.3.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論