單變量推論統計:假設檢驗_第1頁
單變量推論統計:假設檢驗_第2頁
單變量推論統計:假設檢驗_第3頁
單變量推論統計:假設檢驗_第4頁
單變量推論統計:假設檢驗_第5頁
已閱讀5頁,還剩55頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第七講 假設檢驗,第一節 假設檢驗的基本問題,一、假設檢驗的基本概念 對總體的概率分布或分布參數作出某種“假設”,根據抽樣得到的樣本觀測值,運用社會統計的分析方法,檢驗這種“假設”是否正確,從而決定接受或拒絕“假設”,這就是本講要討論的假設檢驗問題。,1、什么是假設?,假設:定義為一個調研者或管理者對被調查總體的某些特征所做的一種假定或猜想。本講所討論的假設都是經驗假設,而非理論假設。是對總體參數的一種假設。 常見的是對總體均值或比例和方差的檢驗; 在分析之前,被檢驗的參數將被假定取一確定值。,我認為到KFC消費的人平均花費15元!,2、社會調查中常見的假設檢驗問題,根據以往資料,某地女青年的

2、平均初婚年齡=20歲,但今年根據100名女青年的隨機抽樣調查, =21歲,問能否認為該地女青年的初婚年齡比以往有所推遲? 根據隨機抽樣調查,文化程度高的家庭,平均子女數也要少些。兩者呈負相關r=-0.3。問這樣的結論是否具有普遍意義? 可見,假設的內容,都是數量化的內容(=20?r=-0.3),而驗證的依據,都是憑借抽樣調查所得到的結果。(抽樣必須從總體隨機抽取),什么是假設?,對總體參數的一種看法 總體參數包括總體均值、比例、方差等 分析之前必需陳述,概念 事先對總體參數或分布形式作出某種假設 然后利用樣本信息來判斷原假設是否成立 類型 參數假設檢驗(檢驗法、t檢驗法等) 非參數假設檢驗(在

3、總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法,在推斷過程中不涉及有關總體分布的參數,如卡方檢驗) 3. 特點 采用邏輯上的反證法 依據統計上的小概率原理,什么是假設檢驗?,假設檢驗的基本思想,3. 小概率原理,小概率原理是假設檢驗的基本依據,即認為小概率事件在一次試驗中幾乎是不可能發生的。當進行假設檢驗時,先假設H0正確,在此假設下,若小概率事件A出現的概率很小,例如P(A)=0.01,經過取樣試驗后,A出現了,則違反了上述原理,我們認為這是一個不合理的結果。例如,我們每天從電視、報紙上都能看到交通事故的發生,但人們絕不會因此而放棄交通工具的使用。“套中人”每天帶

4、雨傘、雨鞋而被視作怪人。可見,人們總是在不自覺地運用小概率原理。,這時,我們只能懷疑作為小概率事件A的前提假設H0的正確性,于是否定H0。反之,如果試驗中A沒有出現,我們就沒有理由否定假設H0,從而做出接受H0的結論。 下面我們通過實例來說明假設檢驗的基本思想及推理方法。,4、原假設和備擇假設,原假設H0 是關于總體均值而非樣本統計量的假設 總是假設原假設是正確的 原假設可能被接受也可能被拒絕 備擇假設H1 是原假設的對立 備擇假設可能被接受也可能被拒絕 備擇假設是試圖要建立的檢驗,二、假設檢驗的基本思路與方法,假設檢驗的步驟 提出原假設和備擇假設 確定適當的檢驗統計量 規定顯著性水平 計算檢

5、驗統計量的值 作出統計決策,(1)建立假設,(2)求抽樣分布,(4)計算檢驗統計量,(3)選擇顯著性水平和否定域,(5)判定,所所 包有含統 的計 步檢 驟驗,根據以往多年的統計表明,宜賓學院社會統計學的平均成績為90分,隨機抽取100個學生,其平均成績為80分,問今年宜賓學院社會統計學成績是否下降?,提出原假設和備擇假設, 什么是原假設?(Null Hypothesis) 1. 待檢驗的假設,又稱“0假設” 2. 如果錯誤地作出決策會導致一系列后果 3. 總是有等號 , 或 4. 表示為 H0 H0: 某一數值 指定為 = 號,即 或 例如, H0: 3190(元),為什么叫0假設,什么是備

6、擇假設?(Alternative Hypothesis) 1. 與原假設對立的假設 2. 總是有不等號: , 或 3. 表示為 H1 H1: 某一數值,或 某一數值 例如, H1: 3910(元),或 3910(元),提出原假設和備擇假設,什么檢驗統計量? 用于假設檢驗問題的統計量 選擇統計量的方法與參數估計相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知 檢驗統計量的基本形式為,確定適當的檢驗統計量,規定顯著性水平,什么是顯著性水平? 1. 是一個概率值 2. 原假設為真時,拒絕原假設的概率 被稱為抽樣分布的拒絕域 3. 表示為 (alpha) 常用的 值有0.01, 0.05, 0.

7、10 4. 由研究者事先確定,作出統計決策,計算檢驗的統計量 根據給定的顯著性水平,查表得出相應的臨界值Z或Z/2 將檢驗統計量的值與 水平的臨界值進行比較 得出接受或拒絕原假設的結論,兩類錯誤分析,小概率原理是假設檢驗的基本依據,然而,對于小概率事件,無論其概率多么小,還是可能發生的,所以,利用小概率原理為基礎的假設檢驗方法進行檢驗,可能會做出錯誤的判斷,主要有兩種形式 (1)原假設H0實際是正確的,但卻錯誤地拒絕了H0,這樣就犯了“棄真”的錯誤,通常稱為第一類錯誤。由于僅當所考慮的小概率事件A發生時才拒絕H0,所以犯第一類錯誤的概率就是條件概率: (2)原假設H0實際是不正確的,但是卻錯誤

8、地接受了H0,這樣就犯了“納偽”的錯誤,通常稱為第二類錯誤。犯第二類錯誤的概率記為。,我們自然希望犯這兩類錯誤的概率越小越好。但當樣本容量n確定后,犯這兩類錯誤的概率不可能同時被控制,通常在我們根據歷史經驗選取恰當的顯著性水平后,通過擴大樣本容量n的方式來使第二類錯誤的概率減小。,H0: 無罪,假設檢驗中的兩類錯誤 (決策結果),假設檢驗就好像一場審判過程,統計檢驗過程, 錯誤和 錯誤的關系,第二節 單一總體參數的假設檢驗,建立假設的三種情況:,農村居民月人均收入水平的評估,檢驗中學老師對學生平均成績承諾的有效性:,中學老師對學生學習成績的承諾,統計報表的驗證:,統計數據是否真實的依據,雙側檢

9、驗與單側檢驗 (假設的形式),根據否定域位置的不同,可以將假設檢驗分為雙側檢驗和單側檢驗。,在統計中,必須把否定域分配到抽樣分布的兩端的檢驗,被稱為雙側檢驗。,在統計中,可以事先能預測偏差方向,因而可以把否定域集中到抽樣分布更合適的一端的檢驗,被稱為單側檢驗。,雙側檢驗和單側檢驗,雙側檢驗(原假設與備擇假設的確定),雙側檢驗屬于決策中的假設檢驗。也就是說,不論是拒絕H0還是接受H0,我們都必需采取相應的行動措施。 例如,某單位職工上月平均收入為2100元,本月大于或小于2100元均屬于發生變化。 建立的原假設與備擇假設應為 H0: = 2100 H1: 2100,雙側檢驗(確定假設的步驟),1

10、. 某單位職工上月平均收入為2100元,本月調查了100名職工,平均收入為2200元,標準差為15元。問該單位職工本月平均收入與上月相比是否有變化? 2. 步驟 從統計角度陳述問題 ( = 2100) 從統計角度提出相反的問題 ( 2100) 必需互斥和窮盡 提出原假設 ( = 2100) 提出備擇假設 ( 2100) 有 符號,雙側檢驗(確定假設的步驟),1. 某單位職工上月平均收入為2100元,本月調查了100名職工,平均收入為2200元,標準差為15元。問該單位職工本月平均收入與上月相比是否有變化? 解首先建立虛無假設(H0)和研究假設(H1)即有H0 :=2100 H1 : 2100

11、選擇顯著性水平=0.05,查標準正態分布得 由于Z=6.67 所以,拒絕虛無假設,即從總體上說,該單位職工平均收入與上月相比有變化。,雙側檢驗(顯著性水平與拒絕域 ),雙側檢驗(顯著性水平與拒絕域 ),雙側檢驗(顯著性水平與拒絕域 ),雙側檢驗(顯著性水平與拒絕域 ),例 一位研究者試圖檢驗某一社會調查所運用 的抽樣程序,該項調查是由一些缺乏經驗的訪問員進 行的。研究者懷疑屬于干部和知識分子的家庭抽得過 多。過去的統計資料表明,該街區的家庭收入是7500 元,標準差是1500元;此次調查共抽取100個家庭樣 本平均收入是7900元。問:該研究人員是否有理由懷 疑該樣本有偏估?(選用=0.05)

12、,總體均值和成數的單樣本檢驗,1已知,對總體均值的檢驗,實際上是要檢驗“隨機抽樣”這個零假設,解 根據題意,可做如下假設,并做單側檢驗 因=0.05,查表得Z 0.05=1.65,故否定域為 根據中心極限定理,檢驗統計量 計算得 檢驗統計量Z的計算表明,樣本均值比總體均值大267個 標準差( ),超過了顯著性水平規定的臨界值,調查者應該 否定“隨機抽樣”的零假設。也就是說,由于抽樣在程序上不合要 求,這項社會調查有必要重新組織。,中心極限定理實際解決了大樣本均值的檢驗問 題。假定樣本比較大(n50,這在社會調查中一般 都能得到滿足),樣本均值的抽樣分布就與總體分布 無關,而服從正態分布。當H0

13、成立時,樣本均值的 觀察值比較集中地分布在總體均值周圍;當H0不 成立時, 將對有明顯偏離的趨勢。因而,我們 可以在選定的顯著性水平上,通過計算檢驗統計量 Z,對零假設進行檢定。 注:當未知時,只要樣本量很大,就可用S 來代替 。但對于小樣本,Z檢驗就要用 t 檢驗來 替代了,而且還必須嚴格限于正態總體。,解 根據題意,可作如下的假設,并做雙側檢驗 H0:2330元 H1:2330元 因0.05,查正態分布表得Z/21.96,故否定域|Z|1.96 計算檢驗統計量 Z 1.20196 所以,不能認為該單位人均月收入不是2330元,即不能 認為該統計報表有誤。,例 某單位統計報表顯示,人均月收入

14、為2330元,為了驗證 該統計報表的正確性,作了共81人的抽樣調查,樣本人均月收入 為2350元,標準差為150元,問能否說明該統計報表顯示的人均 收入的數字有誤(取顯著性水平0.05)。,此乃“總體均值”零假設的檢驗,為了驗證統計報表的正確性,作了共五十人的抽樣調查,人均收入的結果有: ,問能否證明統計報表中人均收入=880元是正確的(顯著性水平=0.05)。,單側檢驗(原假設與備擇假設的確定),檢驗研究中的假設 將所研究的假設作為備擇假設H1 將認為研究結果是無效的說法或理論作為原假設H0。或者說,把希望(想要)證明的假設作為備擇假設 先確立備擇假設H1,單側檢驗(原假設與備擇假設的確定)

15、,例如,根據抽樣調查,九個人的平均初婚年齡是23.5歲,該地區平均初婚年齡是否超過20歲? 屬于研究中的假設 建立的原假設與備擇假設應為 H0: 20 H1: 20,單側檢驗(原假設與備擇假設的確定),檢驗某項聲明的有效性 將所作出的說明(聲明)作為原假設 對該說明的質疑作為備擇假設 先確立原假設H0 除非我們有證據表明“聲明”無效,否則就應認為該“聲明”是有效的,2.小樣本總體均值的檢驗(學生t分布) 中心極限定理解決了大樣本均值的檢驗問題。但是當n較小時,用這種方法求出的概率可能是錯誤的,有必要做某種修正。于是有人設計了另一種檢驗統計量,這個統計量最初是由戈塞特(1876一1937)用筆名

16、“學生”發表,所以這個統計量的抽樣分布稱為學生t分布。比較t和Z,我們注意到它們的分子相同,而分母卻稍有不同:為S所代替(這一點無須解釋);根號下是n1。,當Z為t替代時,雖用因子n1所導致的修正看起 來不大,但在樣本容量較小時,這種修正就會起很大 作用了。所以當不知道值、且樣本容量較小時,我 們應該考慮應用t分布而不是Z分布。,采用n1的原因:樣本數據的離散程度小于總體數據的離散程度。 n1實際為自由度數k。,例 已知初婚年齡服從正態分布。根據10人的調 查有 = 23.5歲,S=3歲,問是否可以認為該地區的平 均初婚年齡已超過20歲?(=0.01) 解 H0:=20;H1:20 因為n小,

17、又不知值,因此用t檢驗 對自由度9來講,單側檢驗和顯著性水平0.01,查 表知否定域為t值等于或大于 2.821。再計算檢驗統計量,因此拒絕H0,即可以認為在顯著性水平為0.01的條件下,該地區的初婚年齡已超過20歲。,單側檢驗(顯著性水平與拒絕域 ),左側檢驗(顯著性水平與拒絕域 ),左側檢驗(顯著性水平與拒絕域 ),右側檢驗(顯著性水平與拒絕域 ),右側檢驗(顯著性水平與拒絕域 ),提出原假設: H0: 25% 選擇備擇假設: H1: : 25%,學生中經常上網的人數超過25%嗎? (屬于研究中的假設,先提出備擇假設),右側檢驗(例子),3.大樣本成數的檢驗 有時,需要對總體中具有某種特征

18、的單位在總體中所占的的比例 p(即總體成數)作顯著性檢驗,如人口中的失業率、學齡兒童中的失學率等等。成數檢驗與二項檢驗的聯系是不言而愈的。因為在二項檢驗中,隨機 變量是樣本的“成功”次數x。而在成數檢驗中,隨機變量是樣本的“成功”比例 (即樣本成數),這樣在 n 一定的情況下,顯然有,既然 是一個隨機變量,那么把具體概率賦予樣本成數的每一個取值,我們就得到了樣本成數的抽樣分布。根據中心極限定理,我們不難想見,當n足夠大時,樣本成數的抽樣分布也服從正態分布。由于數學 上很容易證明 , ,這樣一來,對于大樣本(n30,np5),成數的檢驗統計量 Z 可表示為,例 某地區成年男性中吸煙者占64%,經

19、過戒煙宣傳后進行抽樣調查,發現100名被調查者中,有55人是吸煙者,試問戒煙宣傳是否有成效(=0.05),解 已知n10030,npl000.64645,故可使用正態檢驗。又知 0.55,p0.64,q0.36,則 H0: p=0.64 H1: p0.64 據題意,選擇單側檢驗,因0.05,查正態分布表得否定域為 |Z|165 。再計算檢驗統計量 因此,否定零假設,即認為戒煙宣傳收到了顯著成效。,練習:,1. 為了檢驗統計報表的正確性,作了共50人的抽樣調查,人 均收入為871元,標準差為21元,問能否證明統計報表中人均收入880元是正確的? (=0.05) 2. 許多人在周末睡懶覺以彌補工作日的睡眠不足。最佳睡眠協 會的報告說,我們之中有61%的人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論