假設檢驗《統計學原理》課件_第1頁
假設檢驗《統計學原理》課件_第2頁
假設檢驗《統計學原理》課件_第3頁
假設檢驗《統計學原理》課件_第4頁
假設檢驗《統計學原理》課件_第5頁
免費預覽已結束,剩余71頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

假設檢驗,假設檢驗在統計方法中的地位,參數估計和假設檢驗,參數估計和假設檢驗是統計推斷的兩個組成部分,都是利用樣本對總體進行某種推斷,但推斷的角度不同。參數估計討論的是用樣本統計量估計總體參數的方法。假設檢驗討論的是用樣本信息去檢驗對總體參數的某種假設是否成立的程序和方法。,一、假設檢驗的一般問題,1、什么是假設檢驗2、假設檢驗的基本思想3、雙側檢驗和單側檢驗4、假設檢驗中的拒絕域和接受域5、假設檢驗的兩類錯誤6、假設檢驗的步驟,1、什么是假設檢驗,假設檢驗是推論統計的重要內容,是先對總體的未知數量特征作出某種假設,然后抽取樣本,利用樣本信息對假設的正確性進行判斷的過程。,統計假設有參數假設、總體分布假設、相互關系假設(兩個變量是否獨立,兩個分布是否相同)等。參數假設是對總體參數的一種看法。總體參數包括總體均值、總體比例、總體方差等。分析之前必需陳述。,我認為該企業生產的零件的平均長度為4厘米!,參數假設檢驗,參數假設檢驗是通過樣本信息對關于總體參數的某種假設合理與否進行檢驗的過程。即先對未知的總體參數的取值提出某種假設,然后抽取樣本,利用樣本信息去檢驗這個假設是否成立。如果成立就接受這個假設,如果不成立就放棄這個假設。下面主要討論參數假設檢驗的問題。舉例如下:,參數假設檢驗舉例,例1:根據1989年的統計資料,某地女性新生兒的平均體重為3190克。為判斷該地1990年的女性新生兒體重與1989年相比有無顯著差異,從該地1990年的女性新生兒中隨機抽取30人,測得其平均體重為3210克。從樣本數據看,1990年女新生兒體重比1989年略高,但這種差異可能是由于抽樣的隨機性帶來的,也許這兩年新生兒的體重并沒有顯著差異。究竟是否存在顯著差異?可以先假設這兩年新生兒的體重沒有顯著差異,然后利用樣本信息檢驗這個假設能否成立。這是一個關于總體均值的假設檢驗問題。,參數假設檢驗舉例,例2:某公司進口一批鋼筋,根據要求,鋼筋的平均拉力強度不能低于2000克,而供貨商強調其產品的平均拉力強度已達到了這一要求,這時需要進口商對供貨商的說法是否真實作出判斷。進口商可以先假設該批鋼筋的平均拉力強度不低于2000克,然后用樣本的平均拉力強度來檢驗假設是否正確。這也是一個關于總體均值的假設檢驗問題。,參數假設檢驗舉例,例3:某種大量生產的袋裝食品,按規定每袋重量不得少于250克,現從一批該種食品中任意抽取50袋,發現有6袋重量低于250克。若規定食品不符合標準的比例達到5就不得出廠,問該批食品能否出廠。可以先假設該批食品的不合格率不超過5,然后用樣本不合格率來檢驗假設是否正確。這是一個關于總體比例的假設檢驗問題。,2、假設檢驗的基本思想,假設檢驗所依據的基本原理是小概率原理。什么是小概率?概率是01之間的一個數,因此小概率就是接近0的一個數著名的英國統計家RonaldFisher把20分之1作為標準,也就是0.05,從此0.05或比0.05小的概率都被認為是小概率Fisher沒有任何深奧的理由解釋他為什么選擇0.05,只是說他忽然想起來的,什么是小概率原理?,小概率原理發生概率很小的隨機事件(小概率事件)在一次實驗中幾乎是不可能發生的。根據這一原理,可以先假設總體參數的某項取值為真,也就是假設其發生的可能性很大,然后抽取一個樣本進行觀察,如果樣本信息顯示出現了與事先假設相反的結果且與原假設差別很大,則說明原來假定的小概率事件在一次實驗中發生了,這是一個違背小概率原理的不合理現象,因此有理由懷疑和拒絕原假設;否則不能拒絕原假設。檢驗中使用的小概率是檢驗前人為指定的。,小概率原理舉例:,某工廠質檢部門規定該廠產品次品率不超過4方能出廠。今從1000件產品中抽出10件,經檢驗有4件次品,問這批產品是否能出廠?如果假設這批產品的次品率P4,則可計算事件“抽10件產品有4件次品”的出現概率為:可見,概率是相當小的,1萬次實驗中可能出現4次,然而概率如此小的事件,在一次實驗中居然發生了,這是不合理的,而不合理的根源在于假設次品率P4,因而認為假設次品率P4是不能成立的,故按質檢部門的規定,這批產品不能出廠。,假設檢驗的基本思想,.因此我們拒絕假設=50,樣本均值,=50,抽樣分布,H0,假設檢驗的兩個特點:,第一,假設檢驗采用邏輯上的反證法,即為了檢驗一個假設是否成立,首先假設它是真的,然后對樣本進行觀察,如果發現出現了不合理現象,則可以認為假設是不合理的,拒絕假設。否則可以認為假設是合理的,接受假設。,第二,假設檢驗采用的反證法帶有概率性質。所謂假設的不合理不是絕對的,而是基于實踐中廣泛采用的小概率事件幾乎不可能發生的原則。至于事件的概率小到什么程度才算是小概率事件,并沒有統一的界定標準,而是必須根據具體問題而定。如果一旦判斷失誤,錯誤地拒絕原假設會造成巨大損失,那么拒絕原假設的概率就應定的小一些;如果一旦判斷失誤,錯誤地接受原假設會造成巨大損失,那么拒絕原假設的概率就應定的大一些。小概率通常用表示,又稱為檢驗的顯著性水平。通常取0.05或0.01,即把概率不超過0.05或0.01的事件當作小概率事件。,原假設和備擇假設,假設檢驗中,我們稱作為檢驗對象的待檢驗假設為原假設或零假設,用H0表示。原假設的對立假設稱為備擇假設或備選假設,用H1表示。例如,設為總體均值的某一確定值。(1)對于總體均值是否等于某一確定值的原假設可以表示為:H0:(如H0:3190克)其對應的備擇假設則表示為:H1:(如H1:3190克),原假設和備擇假設,(2)對于總體均值X是否大于某一確定值X0的原假設可以表示為:H0:XX0(如H0:X2000克)其對應的備擇假設則表示為:H1:XX0(如H1:X2000克)(3)對于總體均值X是否小于某一確定值X0的原假設可以表示為:H0:XX0(如H0:X5)其對應的備擇假設則表示為:H1:XX0(如H1:X5)注意:原假設總是有等號:或或。,3、雙側檢驗和單側檢驗,根據假設的形式不同,假設檢驗可以分為雙側假設檢驗和單側假設檢驗。若原假設是總體參數等于某一數值,如H0:XX0,即備擇假設H1:XX0,那么只要XX0和XX0二者中有一個成立,就可以否定原假設。這種假設檢驗稱為雙側檢驗。若原假設是總體參數大于等于或小于等于某一數值,如H0:XX0(即H1:XX0);或H0:XX0(即H1:XX0),那么對于前者當XX0時,對于后者當XX0時,可以否定原假設。這種假設檢驗稱為單側檢驗。可以分為左側檢驗和右側檢驗。,雙側檢驗與單側檢驗(假設的形式),4、假設檢驗中的拒絕域和接受域,在規定了檢驗的顯著性水平后,根據容量為n的樣本,按照統計量的理論概率分布規律,可以確定據以判斷拒絕和接受原假設的檢驗統計量的臨界值。臨界值將統計量的所有可能取值區間分為兩個互不相交的部分,即原假設的拒絕域和接受域。對于正態總體,總體均值的假設檢驗可有如下圖示:,正態總體,總體均值假設檢驗圖示:(1)雙側檢驗,設H0:XX0,H1:XX0,有兩個臨界值,兩個拒絕域,每個拒絕域的面積為/2。也稱雙尾檢驗。,雙側檢驗示意圖,X0,雙側檢驗示意圖(顯著性水平與拒絕域),雙側檢驗示意圖(顯著性水平與拒絕域),觀察到的樣本統計量,雙側檢驗示意圖(顯著性水平與拒絕域),觀察到的樣本統計量,雙側檢驗示意圖(顯著性水平與拒絕域),觀察到的樣本統計量,(2)單側檢驗有一個臨界值,一個拒絕域,拒絕域的面積為。分為左側檢驗和右側檢驗兩種情況。單側檢驗示意圖(顯著性水平與拒絕域),左側檢驗,設H0:XX0,H1:XX0;臨界值和拒絕域均在左側。也稱下限檢驗。,X0,左側檢驗示意圖(顯著性水平與拒絕域),左側檢驗示意圖(顯著性水平與拒絕域),觀察到的樣本統計量,右側檢驗,設H0:XX0,H1:XX0;臨界值和拒絕域均在右側。也稱上限檢驗。,X0,右側檢驗示意圖(顯著性水平與拒絕域),右側檢驗示意圖(顯著性水平與拒絕域),觀察到的樣本統計量,5、假設檢驗的兩類錯誤,根據假設檢驗做出判斷無非下述四種情況:1、原假設真實,并接受原假設,判斷正確;2、原假設不真實,且拒絕原假設,判斷正確;3、原假設真實,但拒絕原假設,判斷錯誤;4、原假設不真實,卻接受原假設,判斷錯誤。假設檢驗是依據樣本提供的信息進行判斷,有犯錯誤的可能。所犯錯誤有兩種類型:第一類錯誤是原假設H0為真時,檢驗結果把它當成不真而拒絕了。犯這種錯誤的概率用表示,也稱作錯誤(error)或棄真錯誤。第二類錯誤是原假設H0不為真時,檢驗結果把它當成真而接受了。犯這種錯誤的概率用表示,也稱作錯誤(error)或取偽錯誤。,假設檢驗的兩類錯誤正確決策和犯錯誤的概率可以歸納為下表:,假設檢驗中各種可能結果的概率,假設檢驗兩類錯誤關系的圖示以單側上限檢驗為例,設H0:XX0,H1:XX0,從上圖可以看出,如果臨界值沿水平方向右移,將變小而變大,即若減小錯誤,就會增大犯錯誤的機會;如果臨界值沿水平方向左移,將變大而變小,即若減小錯誤,也會增大犯錯誤的機會。,圖(a)XX0H0為真圖(b)XX1X0H0為偽,錯誤和錯誤的關系,在樣本容量n一定的情況下,假設檢驗不能同時做到犯和兩類錯誤的概率都很小。若減小錯誤,就會增大犯錯誤的機會;若減小錯誤,也會增大犯錯誤的機會。要使和同時變小只有增大樣本容量。但樣本容量增加要受人力、經費、時間等很多因素的限制,無限制增加樣本容量就會使抽樣調查失去意義。因此假設檢驗需要慎重考慮對兩類錯誤進行控制的問題。,兩類錯誤的控制準則,假設檢驗中人們普遍執行同一準則:首先控制棄真錯誤(錯誤)。假設檢驗的基本法則以為顯著性水平就體現了這一原則。兩個理由:統計推斷中大家都遵循統一的準則,討論問題會比較方便。更重要的是:原假設常常是明確的,而備擇假設往往是模糊的。如H0:XX0很清楚,而H1:XX0則不太清楚,是XX0還是XX0?大多少小多少都不清楚。對含義清晰的數量標準進行檢驗更容易被接受。因此,第一類錯誤成為控制兩類錯誤的重點。,6、假設檢驗的步驟,根據研究需要提出原假設H0和備擇假設H1確定適當的檢驗統計量確定顯著性水平和臨界值及拒絕域根據樣本數據計算檢驗統計量的值(或P值)將檢驗統計量值與臨界值比較,作出拒絕或接受原假設的決策,假設檢驗的步驟根據研究需要提出原假設H0和備擇假設H1,應該注意:對任一假設檢驗問題,其所有可能結果均應包括在所提出的兩個對立假設中,原假設與對立假設總有一個、也只能有一個成立。原假設一定要有等號:或或。原假設不是隨意提出的,應該本著“不輕易拒絕原假設”的原則。,雙側檢驗原假設與備擇假設的確定,雙側檢驗屬于決策中的假設檢驗。即不論是拒絕H0還是接受H0,都必需采取相應的行動措施。例如,某種零件的尺寸,要求其平均長度為10厘米,大于或小于10厘米均屬于不合格。待檢驗問題是該企業生產的零件平均長度是10厘米嗎?(屬于決策中的假設)則建立的原假設與備擇假設應為H0:X=10H1:X10,單側檢驗原假設與備擇假設的確定,應區別不同情況采取不同的建立假設方法。對于檢驗某項研究是否達到了預期效果一般是將研究的預期效果(希望、想要證明的假設)作為備擇假設H1,將認為研究結果無效作為原假設H0。先確立備擇假設H1。因為只有當檢驗結果與原假設有明顯差別時才能拒絕原假設而接受備擇假設,原假設不會輕易被拒絕,就使得希望得到的結論不會輕易被接受,從而減少結論錯誤。例如,有研究預計,采用新技術生產后將會使某產品的使用壽命明顯延長到1500小時以上。則建立的原假設與備擇假設應為:H0:X1500H1:X1500例如,有研究預計,改進生產工藝后會使某產品的廢品率降低到2%以下。則建立的原假設與備擇假設應為:H0:X2%H1:X2%,單側檢驗原假設與備擇假設的確定,對于檢驗某項聲明的有效性一般可將所作的聲明作為原假設。將對該聲明的質疑作為備擇假設。先確立原假設H0。因為除非有證據表明“聲明”無效,否則就應認為該“聲明”是有效的。例如,某燈泡制造商聲稱,該企業生產的燈泡平均使用壽命在1000小時以上。通常除非樣本能提供證據表明使用壽命在1000小時以下,否則就應認為廠商的聲稱是正確的。建立的原假設與備擇假設應為:H0:X1000H1:X5)2.使用Z統計量P0為假設的總體成數。分母為樣本成數的抽樣標準差,一般采用P0計算,也有人認為可以用樣本成數p計算。,總體成數的檢驗(雙側檢驗舉例),【例9】某研究者估計本市居民家庭的電腦擁有率為30%。現隨機抽查了200個家庭,其中68個家庭擁有電腦。試問研究者的估計是否可信?(=0.05),解:已知:P0=0.3,n=200,提出假設:假定估計可信H0:P0=0.3H1:p00.3=0.05雙側檢驗/2=0.025得臨界值:Z0.025=1.96,計算檢驗統計量值:,Z值落入接受域,在=0.05的水平上接受H0,有證據表明研究者的估計可信,決策:,結論:,得兩個拒絕域:(-,-1.96)和(1.96,),總體成數的檢驗(單側檢驗舉例),【例10】某公司估計有75%以上的消費者滿意其產品的質量。某調查公司受該公司委托調查此估計是否屬實。現隨機抽查了625位消費者,其中表示對該公司產品滿意的有500人。試問該公司的估計是否屬實?(=0.05),解:已知:P0=0.75,n=625,提出假設:假定滿意者不超過75H0:P0.75H1:P0.75=0.05右檢驗臨界值為正得臨界值:Z0.05=1.645,計算檢驗統計量值:,Z值落入拒絕域,在=0.05的水平上拒絕H0,接受H1,有證據表明該公司的估計屬實,決策:,結論:,得拒絕域:(1.645,),關于單側檢驗如何建立假設,單側檢驗應區別不同情況采取不同的建立假設方法。可以把希望(想要)證明的假設作為備擇假設,將相反情況作為原假設。由于原假設不容易被拒絕,因此只有檢驗結果與原假設有明顯差別時才能拒絕原假設而接受備擇假設,這就使得希望得到的結論不是輕易被接受,從而減少結論錯誤。,還可以考慮統計量取值的正負,使統計量(Z)與臨界值(Z)位于同一方向。當統計量值為負時,通常選XX0為原假設,XX0為備擇假設,強調雖然統計量值小于X0,但不能馬上斷定XX0,需要經過檢驗才能確定。反之當統計量值為正時,通常選XX0為原假設,也是為了不輕易接受XX0的結論,從而避免結論錯誤。,四、區間估計與假設檢驗的關系,抽樣估計與假設檢驗都是統計推斷的重要內容。參數估計是根據樣本統計量估計總體參數的真值;假設檢驗是根據樣本統計量來檢驗對總體參數的先驗假設是否成立。區間估計與假設檢驗的主要區別1.區間估計通常求得的是以樣本估計值為中心的雙側置信區間,而假設檢驗以假設總體參數值為基準,不僅有雙側檢驗也有單側檢驗;2.區間估計立足于大概率,通常以較大的把握程度(置信水平)1-去保證總體參數的置信區間。而假設檢驗立足于小概率,通常是給

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論