




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
模塊六 假設檢驗主要內容知識點一:假設檢驗的基本問題知識點二:總體均值的檢驗知識點三:總體比例的檢驗知識點四:總體方差的檢驗假設檢驗在統計方法中的地位統計方法描述統計推斷統計參數估計假設檢驗學習目標假設檢驗的基本思想和原理假設檢驗的步驟總體均值的檢驗總體比例的檢驗總體方差的檢驗知識點一假設檢驗的基本問題一.原假設與備擇假設備
二.拒絕域和檢驗統計量
三.兩類錯誤和顯著性水平四.單側檢驗與雙側檢驗假設問題的提出例:由統計資料得知,2011年某地新生兒的平均體重是3190克,現從2012年的新生兒中隨機抽取100個,測得平均體重為3210克,問
2012年的新生兒與2011年相比,體重有無顯著差異?什么是假設?(hypothesis)對總體參數的具體數值所作的陳述總體參數包括總體均值、比例、方差等分析之前必需陳述我認為這種新藥的療效比原有的藥物更有效!什么是假設檢驗?(hypothesis
test)先對總體的參數(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的過程有參數檢驗和非參數檢驗邏輯上運用反證法,統計上依據小概率原理假設檢驗基本原理假設檢驗的基本依據—小概率原理:小概率事件在一次試驗中幾乎不可能發生。小概率事件在一次試驗中是幾乎不可能發生的。如果對總體的某個假設是真實的,那么不利于或不能支持這一假設的小概率事件A在一次試驗中是幾乎不可能發生的;如果在一次試驗中事件A竟然發生了,我們就有理由懷疑這一假設的真實性,拒絕這一假設。假設檢驗的基本思想前提:承認
原假設小概率事件發生大概率事件發生拒絕原假設不拒絕原假設進行一次實驗假設檢驗的過程抽取隨機樣本‘x
=
20均值
總體
提出假設我認為人口的平均年齡是50歲作出決策拒絕假設別無選擇!假設的表達式:原假設與備擇假設原假設(null
hypothesis)又稱“0假設”,研究者想收集證據予以反對的假設統計語言是用一個等式或不等式表示問題的原假設??偸怯蟹?,£
或?表示為H0H0
:m
=某一數值指定為符號=,£
或?例如,H0
:m
=10cm備擇假設(alternative
hypothesis)研究者想收集證據予以支持的假設也稱“研究假設”總是有符號?,<或>表示為H1H1
:m
<某一數值,或m
>某一數值例如,H1
:m
<10cm,或m
>10cm提出假設(例題分析)【例】一種零件的生產標準是直徑應為10cm,為對生產過程進行控制,質量監測人員定期對一臺加工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和被擇假設解:研究者想收集證據予以證明的假設應該是“生產過程不正?!薄=⒌脑僭O和備擇假設為H0
:
m
=
10cm
H1
:
m
?
10cm提出假設(例題分析)【例】某品牌洗滌劑在它的產品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發,有關研究人員要通過抽檢其中的一批產品來驗證該產品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設和備擇假設為H0
:
m
?
500
H1
:
m
<
500500g綠葉洗滌劑提出假設(例題分析)【例】一家研究機構估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設解:研究者想收集證據予以支持的假設是
“該城市中家庭擁有汽車的比例超過30%”。建立的原假設和備擇假設為H0:
m
£
30%H1:
m
>
30%提出假設(結論與建議)原假設和備擇假設是一個完備事件組,而且相互對立在一項假設檢驗中,原假設和備擇假設必有一個成立,而且只有一個成立先確定備擇假設,再確定原假設等號“=”總是放在原假設上因研究目的不同,對同一問題可能提出不同的假設(也可能得出不同的結論)假設檢驗的目的主要是收集證據拒絕原假設雙側檢驗與單側檢驗備擇假設沒有特定的方向性,并含有符號“?”的假設檢驗,稱為雙側檢驗或雙尾檢驗(two-tailed
test)備擇假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗
(one-tailed
test)備擇假設的方向為“<”,稱為左側檢驗備擇假設的方向為“>”,稱為右側檢驗雙側檢驗與單側檢驗雙側檢驗與單側檢驗(假設的基本形式)假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0
:m
=
m0H0
:m
?
m0H0
:m
£
m0備擇假設H1
:m
≠m0H1
:m
<
m0H1
:m
>
m0兩類錯誤與顯著性水平假設檢驗中的兩類錯誤第Ⅰ類錯誤(棄真錯誤)原假設為真時拒絕原假設第Ⅰ類錯誤的概率記為a被稱為顯著性水平第Ⅱ類錯誤(取偽錯誤)原假設為假時未拒絕原假設第Ⅱ類錯誤的概率記為b
(Beta)P{拒絕H
0
H
0為真}=abaP{接受H
0
H
0不真}=bH0:無罪假設檢驗中的兩類錯誤(決策結果)假設檢驗就好像一場審判過程統計檢驗過程陪審團審判H0
檢驗決策實際情況裁決實際情況H0為真H0為假無罪有罪未拒絕H0正確決策(1
–
a)第Ⅱ類錯誤(b
)無罪正確錯誤拒絕H0第Ⅰ類錯誤(a
)正確決策
(1-b
)有罪錯誤正確a
錯誤和b
錯誤的關系ba你不能同時減少兩類錯誤!a和b
的關系就像翹翹板,a小b
就大,
a大b
就小對于一定的樣本容量n,不能同時做到兩類錯誤的概率都很小。如果減小α錯誤,就會增大犯β錯誤的機會;若減小β錯誤,也會增大犯α錯誤的機會。使α、β 同時變小的辦法就是增大樣本容量。一般地說,哪一類錯誤所帶來的后果越嚴重,危害越大,在假設檢驗中就應當把哪一類錯誤作為首要的控制目標。但在假設檢驗中,一般均首先控制犯α錯誤概率。兩類錯誤關系顯著性水平a(significant
level)假設檢驗中發生第Ⅰ類錯誤的概率原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域當原假設正確時,檢驗統計量落在拒絕域的概率表示為a
(alpha)常用的a
值有0.01,0.05,0.10由研究者事先確定假設檢驗中的小概率原理什么小概率?在一次試驗中,一個幾乎不可能發生的事件發生的概率在一次試驗中小概率事件一旦發生,我們就有理由拒絕原假設3.
小概率由研究者事先確定什么是小概
率?統計量與拒絕域對樣本估計量的標準化依據原假設H0為真點估計量的抽樣分布檢驗統計量(test
statistic)根據樣本觀測結果計算得到的,并據以對原假設和備擇假設作出決策的某個樣本統計量標準化的檢驗統計量點估計量的抽樣標準差點估計量—假設值標準化檢驗統計量=拒絕域1、能夠拒絕原假設的檢驗統計量的所有可能取值的集合。2、是由顯著性水平a
所圍成的區域。3、根據顯著性水平確定的拒絕域的邊界值,稱為臨界值。顯著性水平和拒絕域(雙側檢驗)抽樣分布0臨界值臨界值a/2a/2樣本統計量拒絕H0拒絕H01
-
a置信水平顯著性水平和拒絕域(雙側檢驗)0臨界值臨界值a
/2a
/2樣本統計量拒絕H0拒絕H0抽樣分布1
-
a置信水平顯著性水平和拒絕域(雙側檢驗)0臨界值臨界值a
/2a
/2樣本統計量拒絕H0拒絕H0抽樣分布1
-
a置信水平顯著性水平和拒絕域(雙側檢驗)0臨界值臨界值a
/2a
/2樣本統計量拒絕H0拒絕H0抽樣分布1
-
a置信水平顯著性水平和拒絕域(單側檢驗)0臨界值a樣本統計量拒絕H0抽樣分布1
-
a置信水平顯著性水平和拒絕域(左側檢驗)臨界值樣本統計量抽樣分布拒絕H0a1
-
a置信水平0觀察到的樣本統計量顯著性水平和拒絕域(左側檢驗)0臨界值樣本統計量抽樣分布拒絕H0a1
-
a置信水平顯著性水平和拒絕域0臨界值a樣本統計量拒絕H0抽樣分布1
-
a(右側檢驗)置信水平顯著性水平和拒絕域0a樣本統計量拒絕H0抽樣分布1
-
a(右側檢驗)置信水平臨界值觀察到的樣本統計量顯著性水平和拒絕域(右側檢驗)0臨界值樣本統計量抽樣分布置信水平拒絕H0a1
-
a決策規則給定顯著性水平a,查表得出相應的臨界值za或za/2,ta或ta/2將檢驗統計量的值與a
水平的臨界值進行比較作出決策雙側檢驗:I統計量I>臨界值,拒絕H0左側檢驗:統計量<-臨界值,拒絕H0右側檢驗:統計量>臨界值,拒絕H0利用P值進行決策p-值是一個概率值,它是用于確定是否拒絕H0的另一種方法。如果假定原假設H0為真,那么所得樣本結果出現實際觀測結果那么極端的概率,稱為p-值,也稱為觀察到的顯著性水平。指在某個總體的多個樣本中,某一類數據出現的經常程度。當原假設正確時,得到所觀測的數據的概率5-43假設檢驗的P值(右側檢驗中)P值表示所觀察到的樣本對原假設的支持程度。P值越小,說明拒絕原假設的證據越強P值H0檢驗統計量的觀察值5-44P值的計算單側檢驗中,P值通常為統計量分布曲線從檢驗統計量的觀察值到拒絕區域這一側的面積。設檢驗的統計量為z,zc是計算得統計量的值。左側檢驗時,P值=
P{z
£
zc
}右側檢驗時,P值=
P{z
?
zc}雙側檢驗中,P值=單側P值的2倍。即:P值=2P{z
≥
zc},當
zc在右側時;或
P值=2P{z
≤
zc
},當
zc
在左側時。若p-值<a若p-值>a,拒絕H0;,不拒絕H0;P值——拒絕原假設的最小顯著性水平;——觀察到的顯著性水平(實測的顯著性水平)檢驗的顯著性水平是事先設定的拒絕原假設時所犯錯誤的概率的最大允許值。P值是根據觀察樣本實際計算的拒絕原假設時所犯錯誤的概率值。利用P
值進行決策5-46P值與的關系顯著性水平(圖)“統計量的實現值比臨界值更極端”=“p值小于α”5-47假設檢驗的P值(例-右側)H0:;H1:X
=
1000結論:由于P值小于給定的顯著性水平0.05,所以應該拒絕H0ns0x
-
X檢驗統計量:Z
==1050
-1000=2.5100
25P值=P{Z≥2.5}=0.0062X
>
10000.050.050檢驗統計量的觀察值5-48t
檢驗中P值的計算(左側)2;.
3)H1:X
=
2
.
3(或
X
?例,H0:檢驗統計量:X
<
2.3n
0
.0367
5S
*t
=
x
-
2
3
=
2
.18
-
2 3
=
-7
.3030.010.010檢驗統計量的觀察值P值=P{t
≤-7.303}=0.000935結論:P值小于給定的顯著性水平0.01,故應拒絕H05-49假設檢驗的P值(雙側)(1)H0:X
=
1000
;H1:X
?
1000ns0x
-
X檢驗統計量:Z
==1050
-1000=2.5100
25P值=2
P{Z≥2.5}=2×0.0062=0.0124結論:P值<a=0.05,所以應該拒絕H00.0250.0250.0250.0250檢驗統計量的觀察值P值5-50假設檢驗的兩種判斷方法的比較拒絕原假設不能拒絕原假設比較
作出結論檢驗的P值檢驗統計量觀察值臨界值給定顯著性水平樣本假設檢驗的步驟一個完整的假設檢驗過程,通常包括以下四個步驟:提出原假設(Null
hypothesis)與備擇假設(Alternative
hypothesis)確定適當的檢驗統計量,并計算檢驗統計量的值根據顯著性水平α,查表求臨界值作出統計決策假設檢驗的步驟第一步:建立原假設H0和備擇假設H1。原假設應該是希望犯第Ι類錯誤概率小的假設。常用的假設形式
:H
0
:m
=m
0
,H
1
:m
?m
0
(雙邊備擇假設)H
0
:m
£
m
0
,H
1
:m
>m
0
(右單邊備擇假設)H
0
:m
?m
0
,H
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家庭裝修水電安裝合同協議書
- ××超市防火墻規定
- 父母的辛勞感悟話題作文(12篇)
- 能源領域在職表現與工作年限證明(7篇)
- 2025年枕頭項目立項申請報告
- 農村畜牧育種技術合作協議
- 2025年大學英語四級考試模擬試卷:翻譯技巧與案例分析
- 2025年寧夏回族自治區公務員遴選考試時事政治試題
- 2025年整熨洗滌設備:洗衣房設備項目立項申請報告
- 社區農村合作農業種植合作協議
- 股權買賣協議范本
- 復方利多卡因乳膏課件
- 土木工程學院社會評機制及實施辦法
- 高填方、高邊坡及軟基路基監測方案
- 002TD-SCDMA 無線網絡關鍵技術
- 廣西融水良基礦業有限公司汪洞江可金高嶺土礦新增資源儲量采礦權出讓收益評估報告
- 精品灌溉引水工程施工組織設計
- 救護車注冊登記審批表
- 口腔頜面部手術的麻醉PPT學習教案
- 平衡與協調訓練PPT課件
- 年普通高校(中專招生考生體格檢查表
評論
0/150
提交評論