《假設檢驗》講義_第1頁
《假設檢驗》講義_第2頁
《假設檢驗》講義_第3頁
《假設檢驗》講義_第4頁
《假設檢驗》講義_第5頁
已閱讀5頁,還剩58頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《假設檢驗》講義客觀現象數量表現統計總體數量特征統計研究的程序統計研究目的統計設計統計調查統計整理推斷分析描述分析2008-2009假設檢驗在統計方法中的地位統計方法描述統計推斷統計參數估計假設檢驗2008-2009學習目標假設檢驗的基本思想和原理

假設檢驗的步驟總體均值的檢驗總體比例的檢驗

P值的計算與應用用Excel進行檢驗2008-20096.1假設檢驗的基本問題假設的陳述兩類錯誤與顯著性水平統計量與拒絕域利用P值進行決策2008-2009什么是假設?(hypothesis)對總體參數的具體數值所作的陳述總體參數包括總體均值、比例、方差等分析之前必需陳述我認為這種新藥的療效比原有的藥物更有效!假設的陳述2008-2009什么是假設檢驗?(hypothesistest)先對總體的參數(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的過程有參數檢驗和非參數檢驗邏輯上運用反證法,統計上依據小概率原理2008-2009原假設(nullhypothesis)研究者想收集證據予以反對的假設又稱“0假設”總是有符號

,或表示為H0H0:

=某一數值

指定為符號=,或

例如,H0:

10cm2008-2009研究者想收集證據予以支持的假設也稱“研究假設”總是有符號

,

或表示為

H1H1:

<某一數值,或某一數值例如,H1:

<10cm,或10cm備擇假設(alternativehypothesis)2008-2009【例】一種零件的生產標準是直徑應為10cm,為對生產過程進行控制,質量監測人員定期對一臺加工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和備擇假設提出假設解:研究者想收集證據予以證明的假設應該是“生產過程不正常”。建立的原假設和備擇假設為H0:

10cmH1:

10cm2008-2009【例】某品牌洗滌劑在它的產品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發,有關研究人員要通過抽檢其中的一批產品來驗證該產品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設和備擇假設為

H0:

500H1:

<500500g2008-2009【例】一家研究機構估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設解:研究者想收集證據予以支持的假設是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設和備擇假設為

H0:

30%H1:

30%2008-2009原假設和備擇假設是一個完備事件組,而且相互對立在一項假設檢驗中,原假設和備擇假設必有一個成立,而且只有一個成立先確定備擇假設,再確定原假設等號“=”總是放在原假設上因研究目的不同,對同一問題可能提出不同的假設(也可能得出不同的結論)提出假設的結論與建議2008-2009備擇假設沒有特定的方向性,并含有符號“”的假設檢驗,稱為雙側檢驗或雙尾檢驗(two-tailedtest)備擇假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗(one-tailedtest)備擇假設的方向為“<”,稱為左側檢驗

備擇假設的方向為“>”,稱為右側檢驗

雙側檢驗與單側檢驗2008-2009假設的形式假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0:m=m0H0

:m

m0H0:m

m0備擇假設H1:m≠m0H1

:m<m0H1:m>m02008-2009假設檢驗中的兩類錯誤第Ⅰ類錯誤(棄真錯誤)原假設為真時拒絕原假設第Ⅰ類錯誤的概率記為被稱為顯著性水平第Ⅱ類錯誤(取偽錯誤)原假設為假時未拒絕原假設第Ⅱ類錯誤的概率記為(Beta)兩類錯誤與顯著性水平2008-2009H0:

無罪陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假未拒絕H0正確決策(1–a)第Ⅱ類錯誤(b)拒絕H0第Ⅰ類錯誤(a)正確決策(1-b)假設檢驗就好像一場審判過程統計檢驗過程決策結果2008-2009錯誤和

錯誤的關系你不能同時減少兩類錯誤!和的關系就像翹翹板,小就大,大就小2008-2009影響錯誤的因素1. 總體參數的真值隨著假設的總體參數的減少而增大2. 顯著性水平當減少時增大3. 總體標準差

當增大時增大4. 樣本容量n當n

減少時增大2008-2009顯著性水平

(significantlevel)1. 是一個概率值2. 原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域3. 表示為(alpha)常用的值有4. 由研究者事先確定2008-2009假設檢驗中的小概率原理什么是小概率?1. 在一次試驗中,一個幾乎不可能發生的事件發生的概率2. 在一次試驗中小概率事件一旦發生,我們就有理由拒絕原假設3. 小概率由研究者事先確定2008-2009根據樣本觀測結果計算得到的,并據以對原假設和備擇假設作出決策的某個樣本統計量對樣本估計量的標準化結果原假設H0為真點估計量的抽樣分布檢驗統計量(teststatistic)統計量與拒絕域標準化的檢驗統計量2008-2009拒絕域能夠拒絕原假設的檢驗統計量的所有可能取值的集合。由顯著性水平圍成的區域。如果檢驗統計量的具體數值落在了拒絕域內,就拒絕原假設,否則就不拒絕原假設。根據給定的顯著性水平確定的拒絕域的邊界值,稱為臨界值。(查表所得)2008-2009顯著性水平和拒絕域抽樣分布0臨界值臨界值a/2a/2樣本統計量拒絕H0拒絕H01-置信水平雙側檢驗

2008-20090臨界值臨界值a/2

a/2樣本統計量拒絕H0拒絕H0抽樣分布1-置信水平雙側檢驗2008-20090臨界值臨界值

a/2a/2樣本統計量拒絕H0拒絕H0抽樣分布1-置信水平2008-2009單側檢驗

0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平2008-2009左側檢驗

0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平觀察到的樣本統計量2008-20090臨界值a樣本統計量拒絕H0抽樣分布1-置信水平2008-2009右側檢驗

0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平觀察到的樣本統計量2008-20090臨界值a樣本統計量抽樣分布1-置信水平拒絕H02008-2009決策規則給定顯著性水平,查表得出相應的臨界值z或z/2,t或t/2將檢驗統計量的值與水平的臨界值進行比較作出決策雙側檢驗:I統計量I>臨界值,拒絕H0左側檢驗:統計量<-臨界值,拒絕H0右側檢驗:統計量>臨界值,拒絕H02008-2009什么是P值(P-value)在原假設為真的條件下,檢驗統計量的觀察值大于或等于其計算值的概率雙側檢驗為分布中兩側面積的總和反映實際觀測到的數據與原假設H0之間不一致的程度被稱為觀察到的(或實測的)顯著性水平決策規則:若p值<,拒絕H0利用P值進行決策2008-2009雙側檢驗的P值/

2/

2Z拒絕H0拒絕H00臨界值計算出的樣本統計量計算出的樣本統計量臨界值P

值1/2P

值1/22008-2009左側檢驗的P值0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平計算出的樣本統計量P

值2008-2009右側檢驗的P值0臨界值a拒絕H0抽樣分布1-置信水平計算出的樣本統計量P值2008-2009假設檢驗步驟的總結陳述原假設和備擇假設從所研究的總體中抽出一個隨機樣本確定一個適當的檢驗統計量,并利用樣本數據算出其具體數值確定一個適當的顯著性水平,并計算出其臨界值,指定拒絕域將統計量的值與臨界值進行比較,作出決策統計量的值落在拒絕域,拒絕H0,否則不拒絕H0也可以直接利用P值作出決策2008-20096.2總體均值的檢驗大樣本的檢驗方法小樣本的檢驗方法2008-2009一個總體參數的檢驗z檢驗(單尾和雙尾)t檢驗(單尾和雙尾)z檢驗(單尾和雙尾)

2檢驗(單尾和雙尾)均值一個總體比例方差2008-2009總體均值的檢驗(作出判斷)是否已知小樣本容量n大是否已知否t檢驗否z檢驗是z檢驗

是z檢驗2008-2009總體均值的檢驗(大樣本)假定條件正態總體或非正態總體大樣本(n30)使用z檢驗統計量2已知:2未知:大樣本的檢驗方法)1,0(~0Nnxzsm-=)1,0(~0Nnsxzm-=2008-2009總體均值的檢驗(2

已知)【例】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為。取顯著性水平,檢驗該天生產的飲料容量是否符合標準要求?雙側檢驗綠色健康飲品綠色健康飲品2552552008-2009由題已知H0

:=255H1

255n

=40σ=5臨界值(c):檢驗統計量:z01.96-1.960.025拒絕H0拒絕H00.025決策:結論:

不拒絕H0樣本提供的證據表明:該天生產的飲料符合標準要求01.14052558.2550=-=-=nxzsm2008-2009

用Excel計算P值第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數)第2步:在函數分類中點擊“統計”,并在函數名的菜單下選擇“NORMSDIST”,然后確定第3步:將z

的絕對值錄入,得到的函數值為

P值=2(1-)=

P值遠遠大于,故不拒絕H02008-2009【例】(2未知)

一種機床加工的零件尺寸絕對平均誤差允許值為。生產廠家現采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產的零件中隨機抽取50個進行檢驗。利用這些樣本數據,檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低?(=0.01)

左側檢驗50個零件尺寸的誤差數據(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗(2

未知)2008-2009由題已知H0

H1

n=50臨界值(c):檢驗統計量:拒絕H0新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結論:-2.33z0拒絕H00.016061.250365749.035.13152.1-=-=z2008-20090-2.33a=0.05z拒絕H0抽樣分布1-計算出的樣本統計量=-2.6061P值P=0.004579

2008-2009用Excel計算P值(z檢驗)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數)第2步:在函數分類中點擊“統計”,并在函數名的菜單下選擇“ZTEST”,然后確定第3步:在所出現的對話框Array框中,輸入原始數據所在區域;在X后輸入參數的某一假定值(這里為);在Sigma后輸入已知的總體標準差(若未總體標準差未知則可忽略不填,系統將自動使用樣本標準差代替)第4步:用1減去得到的函數值即為P值

P值=1-0.995421023=

P值<,拒絕H02008-2009【例】(2未知)

某一小麥品種的平均產量為5200kg/hm2。一家研究機構對小麥品種進行了改良以期提高產量。為檢驗改良后的新品種產量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產量為5275kg/hm2,標準差為120/hm2。試檢驗改良后的新品種產量是否有顯著提高?(=0.05)右側檢驗2008-2009H0

5200H1

:>5200n=36臨界值(c):檢驗統計量:拒絕H0

(P

=0.000088<=0.05)改良后的新品種產量有顯著提高決策:結論:z0拒絕H00.051.64575.33612052005275=-=z2008-2009抽樣分布P=0.000088

01.645a=0.05拒絕H01-計算出的樣本統計量=3.75P值2008-2009總體均值(大樣本)的檢驗方法的總結假設雙側檢驗左側檢驗右側檢驗假設形式H0:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0統計量已知:未知:拒絕域P值決策拒絕H02008-2009總體均值的檢驗(小樣本)假定條件總體服從正態分布小樣本(n<

30)檢驗統計量2已知:2未知:小樣本的檢驗方法)1,0(~0Nnxzsm-=)1(~0--=ntnsxtm2008-2009總體均值(小樣本)檢驗方法的總結假設雙側檢驗左側檢驗右側檢驗假設形式H0

:m=m0H1:

mm0H0:mm0H1:

m<m0H0:

mm0

H1:

m>m0統計量已知:未知:拒絕域P值決策拒絕H0注:已知的拒絕域同大樣本2008-2009【例】

一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產企業在購進配件時,通常是經過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進。現對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產的配件長度服從正態分布,在的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.32008-2009由題已知H0

:=12H1

12df=10-1=9臨界值(c):檢驗統計量:不拒絕H0該供貨商提供的零件符合要求決策:結論:t02.262-2.2620.025拒絕H0拒絕H00.0257035.0104932.01289.11-=-=t2008-2009用Excel計算P值(t檢驗)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數)第2步:在函數分類中點擊“統計”,并在函數名的菜單下選擇“TDIST”,然后確定第3步:在出現對話框的X欄中輸入計算出的t的絕對值,在Deg-freedom(自由度)欄中輸入本例的自由度9,在Tails欄中輸入2(表明是雙側檢驗,如果是單側檢驗則在該欄輸入1)第4步:P值=

P值>,故不拒絕H0

2008-20096.3總體比例的檢驗大樣本的檢驗方法2008-2009總體比例檢驗假定條件總體服從二項分布可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論