




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第9章假設檢驗研究內容1
假設檢驗的基本問題2假設檢驗的基本步聚3常用參數的假設檢驗1、假設檢驗的基本思想和原理2、假設檢驗的步驟3、一個總體參數的檢驗4、兩個總體參數的檢驗5、P值的計算與應用6、用Excel進行檢驗本章重點與難點假設檢驗在統計方法中的地位統計方法描述統計推斷統計參數估計假設檢驗(一)假設檢驗問題的提出(二)兩類假設(三)統計量與拒絕域(四)利用P值進行決策一、假設檢驗的基本問題什么是假設?(hypothesis)對總體參數的具體數值所作的陳述總體參數包括總體均值、比率、方差等分析之前必須陳述以樣本統計量來驗證假設的總體參數是否成立,用于判別一個總體是否屬于原先已經明確的總體,或者與原先已經明確的總體是否有差異,借以決定采取適當決策的統計方法我認為這種新藥的療效比原有的藥物更有效!什么是假設檢驗?(hypothesistest)先對總體的參數(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的過程有參數檢驗和非參數檢驗邏輯上運用反證法,統計上依據小概率原理假設檢驗的基本思想...因此我們拒絕假設
=50...如果這是總體的假設均值樣本均值m=50抽樣分布H0這個值不像我們應該得到的樣本均值...20總體假設檢驗的過程抽取隨機樣本均值
x
=20我認為人口的平均年齡是50歲提出假設
拒絕假設別無選擇!
作出決策(二)兩類假設:原假設與備擇假設
原假設(nullhypothesis)研究者想收集證據予以反對的假設又稱“0假設”總是有符號
,或表示為H0H0:
=某一數值
指定為符號=,或
例如,H0:
10cm研究者想收集證據予以支持的假設也稱“研究假設”總是有符號
,
或表示為
H1H1:
<某一數值,或某一數值例如,H1:
<10cm,或
10cm備擇假設(alternativehypothesis)【例】一種零件的生產標準是直徑應為10cm,為對生產過程進行控制,質量監測人員定期對一臺加工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和被擇假設提出假設解:研究者想收集證據予以證明的假設應該是“生產過程不正常”。建立的原假設和備擇假設為
H0:
10cmH1:
10cm【例】某品牌洗滌劑在它的產品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發,有關研究人員要通過抽檢其中的一批產品來驗證該產品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設提出假設解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設和備擇假設為
H0:
500H1:
<500500g【例】一家研究機構估計,某城市中家庭擁有汽車的比率超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設提出假設解:研究者想收集證據予以支持的假設是“該城市中家庭擁有汽車的比率超過30%”。建立的原假設和備擇假設為
H0:
30%H1:
30%原假設和備擇假設是一個完備事件組,而且相互對立在一項假設檢驗中,原假設和備擇假設必有一個成立,而且只有一個成立先確定備擇假設,再確定原假設等號“=”總是放在原假設上因研究目的不同,對同一問題可能提出不同的假設(也可能得出不同的結論)提出假設備擇假設沒有特定的方向性,并含有符號“”的假設檢驗,稱為雙側檢驗或雙尾檢驗(two-tailedtest)備擇假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗(one-tailedtest)備擇假設的方向為“<”,稱為左側檢驗
備擇假設的方向為“>”,稱為右側檢驗
雙側檢驗與單側檢驗
雙側檢驗與單側檢驗(假設的形式)假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0:m
=m0H0:m
m0H0:m
m0備擇假設H1:m
≠m0H1:m
<m0H1:m
>m0(三)小概率事件原理與兩類錯誤
假設檢驗中的兩類錯誤1. 第Ⅰ類錯誤(棄真錯誤)原假設為真時拒絕原假設第Ⅰ類錯誤的概率記為被稱為顯著性水平2. 第Ⅱ類錯誤(取偽錯誤)原假設為假時未拒絕原假設第Ⅱ類錯誤的概率記為(Beta)H0:無罪假設檢驗中的兩類錯誤(決策結果)陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假未拒絕H0正確決策(1–a)第Ⅱ類錯誤(b)拒絕H0第Ⅰ類錯誤(a)正確決策(1-b)假設檢驗就好像一場審判過程統計檢驗過程
錯誤和
錯誤的關系你不能同時減少兩類錯誤!和的關系就像翹翹板,小就大,大就小影響
錯誤的因素1. 總體參數的真值隨著假設的總體參數的減少而增大2. 顯著性水平當減少時增大3. 總體標準差當增大時增大4. 樣本容量n當n
減少時增大顯著性水平(significantlevel)1. 是一個概率值2. 原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域3. 表示為
(alpha)常用的
值有0.01,0.05,0.104. 由研究者事先確定假設檢驗中的小概率原理什么是小概率?1. 在一次試驗中,一個幾乎不可能發生的事件發生的概率2. 在一次試驗中小概率事件一旦發生,我們就有理由拒絕原假設3. 小概率由研究者事先確定根據樣本觀測結果計算得到的,并據以對原假設和備擇假設作出決策的某個樣本統計量對樣本估計量的標準化結果原假設H0為真點估計量的抽樣分布檢驗統計量(teststatistic)標準化的檢驗統計量顯著性水平和拒絕域(雙側檢驗)抽樣分布0臨界值臨界值a/2a/2
樣本統計量拒絕H0拒絕H01-置信水平顯著性水平和拒絕域(雙側檢驗)0臨界值臨界值a/2
a/2
樣本統計量拒絕H0拒絕H0抽樣分布1-置信水平顯著性水平和拒絕域(雙側檢驗)0臨界值臨界值
a/2a/2
樣本統計量拒絕H0拒絕H0抽樣分布1-置信水平顯著性水平和拒絕域(雙側檢驗)0臨界值臨界值a/2
a/2
樣本統計量拒絕H0拒絕H0抽樣分布1-置信水平顯著性水平和拒絕域(單側檢驗)0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平顯著性水平和拒絕域(左側檢驗)0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平觀察到的樣本統計量顯著性水平和拒絕域(左側檢驗)0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平顯著性水平和拒絕域(右側檢驗)0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平觀察到的樣本統計量顯著性水平和拒絕域(右側檢驗)0臨界值a樣本統計量抽樣分布1-置信水平拒絕H0決策規則給定顯著性水平,查表得出相應的臨界值z或z/2,t或t/2將檢驗統計量的值與水平的臨界值進行比較作出決策雙側檢驗:I統計量I>臨界值,拒絕H0左側檢驗:統計量<-臨界值,拒絕H0右側檢驗:統計量>臨界值,拒絕H0什么是P值?(P-value)在原假設為真的條件下,檢驗統計量的觀察值大于或等于其計算值的概率雙側檢驗為分布中兩側面積的總和反映實際觀測到的數據與原假設H0之間不一致的程度被稱為觀察到的(或實測的)顯著性水平決策規則:若p值<,拒絕H0雙側檢驗的P值/
2/
2Z拒絕H0拒絕H00臨界值計算出的樣本統計量計算出的樣本統計量臨界值1/2P值1/2P值左側檢驗的P值0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平計算出的樣本統計量P值右側檢驗的P值0臨界值a拒絕H0抽樣分布1-置信水平計算出的樣本統計量P值(四)置信區間與假設檢驗的關系聯系1、兩者的推斷結果都有一定的可信程度,同時具備相應的風險2、對同一問題的參數進行推斷,使用同一樣本,同一統計量和抽樣分布,兩者可以互換區別1、區間估計通常求得的是一樣本估計值為中心的雙側置信區間,而假設檢驗以假設總體參數值為基準,不僅有雙側檢驗也有單側檢驗2、區間估計立足于大概率,而假設檢驗立足于小概率二、假設檢驗的基本步聚
假設檢驗步驟的總結1、提出假設:原假設和備擇假設2、選擇顯著性水平,從而確定拒絕域或臨界點3、確定樣本的統計量和分布4、計算檢驗統計量并由此作出決策確定一個適當的檢驗統計量,并利用樣本數據算出其具體數值,將統計量的值與臨界值進行比較,作出決策統計量的值落在拒絕域,拒絕H0,否則不拒絕H0也可以直接利用P值作出決策(一)總體均值的假設檢驗(二)兩個總體平均數之差的檢驗(三)總體比率的假設檢驗(四)總體方差的假設檢驗三常用參數的假設檢驗一個總體參數的檢驗z檢驗(單尾和雙尾)
t檢驗(單尾和雙尾)z
檢驗(單尾和雙尾)
2檢驗(單尾和雙尾)均值一個總體比率方差總體均值的檢驗(作出判斷)是否已知小樣本容量n大是否已知否
t檢驗否z檢驗是z檢驗
是z檢驗總體均值的檢驗(大樣本)1.假定條件正態總體或非正態總體大樣本(n30)使用z檢驗統計量2
已知:2
未知:總體均值的檢驗(2
未知)(例題分析)【例9-1】現在環境保護已經成為大趨勢,生產過程中往往由回收材料制造,然而大部分回收材料制造產品比直接用原材料生產產品更昂貴,只有報紙回收生產新報紙是有利可圖的,金融分析師指出,如果從每個家庭平均每周報紙收集超過2磅,則能賺取利潤。現隨機抽取148戶舊報紙的重量,得到如下信息:是否有理由證明金融公司的說法是正確的?(=0.05)【例9-2】某運動鞋制造商聲稱男運動鞋平均價格小于80美元,為了證實他的想法,有人隨機挑選了36雙男運動鞋,價格如下表如示:是否有足夠的證據證明研究者的聲明?取顯著性水平=0.1=19.236雙男運動鞋數據
604570906555607570755090805095857560957085401108055901207085808560809045110H0
:
=80H1
:
<80=0.1;n
=36臨界值(c):檢驗統計量:拒絕H0男運動鞋平均價格小于80美元決策:結論:-1.28z0拒絕H00.1總體均值的檢驗(z檢驗)(P值的計算與應用)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數)第2步:在函數分類中點擊“統計”,并在函數名的菜單下選擇“NORMSDIST”,然后確定第3步:將z的絕對值1.56錄入,得到的函數值為
0.0594
P值遠遠小于,故拒絕H0總體均值的檢驗(z檢驗)(P值的圖示)0-2.33a=0.01z拒絕H0抽樣分布1-計算出的樣本統計量=2.6061P值P=0.004579
總體均值的檢驗(z檢驗)(P值的圖示)抽樣分布P=0.00008801.645a=0.05拒絕H01-計算出的樣本統計量=3.75P值總體均值的檢驗(大樣本檢驗方法的總結)假設雙側檢驗左側檢驗右側檢驗假設形式H0:m=m0H1:
mm0H0:mm0H1:m<m0H0:
m
m0
H1:
m>m0統計量已知:未知:拒絕域P值決策拒絕H0總體均值的檢驗(小樣本)1.假定條件總體服從正態分布小樣本(n<
30)檢驗統計量2
已知:2
未知:總體均值的檢驗(小樣本檢驗方法的總結)假設雙側檢驗左側檢驗右側檢驗假設形式H0:m=m0H1:
mm0H0:mm0H1:
m<m0H0:
mm0
H1:
m>m0統計量
已知:未知:拒絕域P值決策拒絕H0注:
已知的拒絕域同大樣本總體均值的檢驗【例9-3】某電腦愛好者聲稱4M寬帶的實際網速僅為理論的一半(即256kb/s),某研究者為了檢驗他的聲明是否可靠,隨機抽取25臺4M寬帶的電腦進行測試,測得其平均網速為253kb/s,標準差為10.8kb/s,取顯著性水平為0.05,問題否有足夠的證據拒絕這個聲明?總體均值的檢驗H0
:≥256H1
:
<256=0.05df
=25-1=24臨界值(c):檢驗統計量:不拒絕H0即4M寬帶的速度只有聲稱的半
決策:結論:t0-1.713拒絕
H00.025(二)兩個總體均值之差的檢驗(獨立大樣本)1.假定條件兩個樣本是獨立的隨機樣本正態總體或非正態總體大樣本(n130和n230)檢驗統計量12
,
22
已知:12
,22
未知:兩個總體均值之差的檢驗(大樣本檢驗方法的總結)假設雙側檢驗左側檢驗右側檢驗假設形式H0:m1-m2=0H1:m1-m20
H0:m1-m20H1:m1-m2<0H0:m1-m20
H1:m1-m2>0統計量12
,
22
已知12
,
22
未知拒絕域P值決策拒絕H0兩個總體均值之差的檢驗
【例9-4】美國大學教授協會對大學教授的薪水進行研究,結論認為公立學校和私立學校教授薪水不存在差異,從隨機抽取的35名公立機構和30名私立機構教授工資進行了調查,獨立抽取了具有同類工作經驗的兩個隨機樣本,并記錄下兩個樣本的均值、方差等資料如右表。在顯著性水平為0.05的條件下,能否認為教授協會的聲明是否正確。
兩個樣本的有關數據
私立機構公立機構n1=35n1=30x1=88.19x2=73.2S12=687S22=574兩個總體均值之差的檢驗H0
:1-2=0H1
:1-2
0=0.05n1=35,n2
=30臨界值(c):檢驗統計量:決策:結論:
拒絕H0公立學校與私立學校的教授薪水存在顯著差異
z01.96-1.960.025拒絕H0拒絕H00.025兩個總體均值之差的檢驗(12,
22
已知)假定條件兩個獨立的小樣本兩個總體都是正態分布12,
22已知檢驗統計量兩個總體均值之差的檢驗(12,22
未知但12=22)假定條件兩個獨立的小樣本兩個總體都是正態分布12、
22未知但相等,即12=22檢驗統計量其中:自由度:兩個總體均值之差的檢驗(12,
22
未知且不相等1222)假定條件兩個總體都是正態分布12,
22未知且不相等,即1222樣本容量相等,即n1=n2=n檢驗統計量自由度:兩個總體均值之差的檢驗(12,
22
未知且不相等1222)假定條件兩個總體都是正態分布12,22未知且不相等,即1222樣本容量不相等,即n1n2檢驗統計量自由度:兩個總體均值之差的檢驗
【例】甲、乙兩臺機床同時加工某種同類型的零件,已知兩臺機床加工的零件直徑(單位:cm)分別服從正態分布,并且有12=22
。為比較兩臺機床的加工精度有無顯著差異,分別獨立抽取了甲機床加工的8個零件和乙機床加工的7個零件,通過測量得到如下數據。在=0.05的顯著性水平下,樣本數據是否提供證據支持
“兩臺機床加工的零件直徑不一致”的看法?兩臺機床加工零件的樣本數據
(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2兩個總體均值之差的檢驗H0
:1-2
=0H1
:1-2
0=0.05n1=8,n2
=7臨界值(c):檢驗統計量:決策:結論:
不拒絕H0沒有理由認為甲、乙兩臺機床加工的零件直徑有顯著差異
t02.160-2.1600.025拒絕H0拒絕H00.025兩個總體均值之差的檢驗第1步:將原始數據輸入到Excel工作表格中第2步:選擇“工具”下拉菜單并選擇“數據分析”選項第3步:在“數據分析”對話框中選擇
“t-檢驗:雙樣本等方差假設”第4步:當對話框出現后在“變量1的區域”方框中輸入第1個樣本的數據區域在“變量2的區域”方框中輸入第2個樣本的數據區域在“假設平均差”方框中輸入假定的總體均值之差在“”方框中輸入給定的顯著性水平(本例為0.05)
在“輸出選項”選擇計算結果的輸出位置,然后“確定”兩個總體均值之差的估計【例9-5】中國男性與女性的看電視時間有差異,一般而言,女性更偏好于看電視,研究人員隨機抽取9位男性和女性平均日看電視時間,現根據以下數據說明以上論斷是否正確。方差未知且不相等。取顯著性水平0.05。男性與女性看電視時間男性女性18216818317717717218017917617118117617117317517917217417618021兩個總體均值之差的檢驗H0
:1-2
≤0H1
:1-2
>0=0.05n1=10,n2
=10臨界值(c):檢驗統計量:決策:結論:
拒絕H0女性看電視時間顯著大于男性
t0-1.73拒絕H00.05(三)總體比率假設檢驗1.假定條件總體服從二項分布可用正態分布來近似(大樣本)檢驗的z統計量0為假設的總體比率總體比率的檢驗(檢驗方法的總結)假設雙側檢驗左側檢驗右側檢驗假設形式H0:=0H1:
0H0:0H1:
<0H0
:
0
H1:
>0統計量拒絕域P值決策拒絕H0總體比率的檢驗【例9-6】節食者聲稱,有60%的人通過節食來避免過度肥胖。某人為了驗證節食者的論斷是否正確,隨機選取200人,發現有128人通過節食避免了肥胖,在0.05的顯著性水平上,是否有證據拒絕節食者的聲明。雙側檢驗總體比率的檢驗H0
:
p=60%H1
:
p
60%=
0.05n
=
200臨界值(c):檢驗統計量:不拒絕H0節食者的聲明是正確的。
決策:結論:z01.96-1.960.025拒絕H0拒絕H00.025假定條件兩個總體都服從二項分布可以用正態分布來近似檢驗統計量檢驗H0:1-2=0檢驗H0:1-2=d0兩個總體比率之差的檢驗兩個總體比率之差的檢驗假設雙側檢驗左側檢驗右側檢驗假設形式H0:1-2=0H1:1-20H0
:1-20
H1:1-2<0
H0:1-20
H1:1-2>0
統計量拒絕域P值決策拒絕H0總體比率的檢驗【例9-7】某研究機構對托兒所的疫苗接種情況進行調查,發現34所小型托兒所有12家的疫苗接種率小于80%,24家大型托兒所有17家的疫苗接種率小于80%,在顯著性水平
=0.05的情況下,檢驗大型托兒所和小型托兒所的疫苗接種率是否有差異。雙側檢驗兩個總體比率之差的檢驗H0
:1-2
=0H1
:1-2≠0=0.05n1=34,n2=24臨界值(c):檢驗統計量:決策:結論:
拒絕H0大型托兒所和小型托兒所的疫苗接種率存在顯著差異
z01.96-1.960.025拒絕H0拒絕H00.025兩個總體比率之差的檢驗
【例9-8】開車時發短信。2014年一個對1000名司機的調查發現,29%的人在開車時會發短信,2013年對1000名司機調查發現,只有17%的人在開車時發短信,在顯著性水平=0.01,能否說明發信息的比例在上升?21netnet兩個總體比率之差的檢驗H0
:1-2
≤0H1
:1-2>0=0.01n1=1000,n2=1000臨界值(c):檢驗統計量:決策:結論:
拒絕H0樣本提供的證據支持調查者的看法
2.33Z0拒絕域總體方差的檢驗(2檢驗)
檢驗一個總體的方差或標準差假設總體近似服從正態分布使用2分布檢驗統計量樣本方差假設的總體方差總體方差的檢驗(檢驗方法的總結)假設雙側檢驗左側檢驗右側檢驗假設形式H0:2=02H1:
202H0:202H1:2<02H0:
202H1:2>02統計量拒絕域P值決策拒絕H0【例9-9】某運動商品制造商聲稱某種釣魚線強度的方差為15.9,現隨機抽取15個釣魚線,發現其強度為21.8,是否有足夠的證據拒絕制造商的說法?(假設總體服從正態分布)H0
:2=15.9H1
:2
15.9
=0.05df
=
15-1=14臨界值(s):2026.1195.629
/2=0.025統計量:不拒絕H0制造商的聲明是正確的決策:結論:兩個總體方差比的檢驗(F
檢驗)假定條件兩個總體都服從正態分布,且方差相等兩個獨立的隨機樣本檢驗統計量兩個總體方差比的F
檢驗(臨界值)FF1-F拒絕H0方差比F檢驗示意圖拒絕H0兩個總體方差比的檢驗假設雙側檢驗左側檢驗右側檢驗假設形式H0:12/22=1H1:
12/221H0:12/221H1:12/22<1
H0:12/221
H1:12/22>1
統計量拒絕域總體方差的檢驗【例9-10】醫療機構研究吸煙者的心跳頻率與不吸煙者的心跳頻率是否有差異,隨機挑選了兩個人群,其中隨機抽取26名吸煙者和36名不吸煙者,測得其方差分別為36和10.在0.05的顯著性水平下,松驗是否有差異。總體方差的檢驗H0
:12=22
H1
:12
22
=0.05統計量:拒絕H0吸煙者與不吸煙者的心跳頻率具有顯著性差異
決策:結論:兩個總體方差比的檢驗【例】一家房地產開發公司準備購進一批燈泡,公司打算在兩個供貨商之間選擇一家購買。這兩家供貨商生產的燈泡平均使用壽命差別不大,價格也很相近,考慮的主要因素就是燈泡使用壽命的方差大小。如果方差相同,就選擇距離較近的一家供貨商進貨。為此,公司管理人員對兩家供貨商提供的樣品進行了檢測,得到的數據如右表。檢驗兩家供貨商燈泡使用壽命的方差是否有顯著差異
(=0.05)兩家供貨商燈泡使用壽命數據樣本1650569622630596637628706617624563580711480688723651569709632樣本2568540596555496646607562589636529584681539617兩個總體方差比的檢驗第1步:選擇“工具”下拉菜單,并選擇“數據分析”選項第3步:在分析工具中選擇“F檢驗-雙樣本方差”第4步:當出現對話框后
在“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論