




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
剖析假設檢驗的兩類錯誤并舉例說明組長:胡立文PPT制作:吳思遠演講人:胡立文組員:胡立文、吳思遠、林君豪、白魯寧、殷妃、陳芷琳剖析假設檢驗的兩類錯誤并舉例說明組長:胡立文1在假設檢驗時,根據檢驗結果做出的判斷,即拒絕H0或不拒絕H0并不是100%的正確,可能發生兩種錯誤在假設檢驗時,根據檢驗結果做出的判斷,即拒絕H0或不拒絕H02第一類錯誤—棄真錯誤即H0本來正確,卻拒絕了它,犯這類錯誤的概率不超過α,即P{拒絕H0/H0為真}≤α可能產生的原因:1.樣本中極端數值2.采用決策標準較寬松第一類錯誤—棄真錯誤即H0本來正確,卻拒絕了它,犯這類錯誤的3第二類錯誤—取偽錯誤即H0本不真,卻接受了他,犯這類錯誤的概率記為β,即P{接受H0/H1為真}=β可能產生原因:1:實驗設計不靈敏2.樣本數據變異性過大3.處理效應本身比較小第二類錯誤—取偽錯誤即H0本不真,卻接受了他,犯這類錯誤的概4兩類錯誤的關系1:α與β是在兩個前提下的概率,所以α+β不一定等于12:在其他條件不變的情況下,α與β不能同時增加或減少兩類錯誤的關系1:α與β是在兩個前提下的概率,所以α+β不一5案例說明例子:一個公司有員工3000人(研究的總體),為了檢驗公司員工工資統計報表的真實性,研究者作了50人的大樣本隨機抽樣調查,人均收入的調查結果是:X(樣本均值)=871元;S(標準差)=21元問能否認為統計報表中人均收入μ0=880元的數據是真實的?(顯著性水平α=0.05)案例說明例子:一個公司有員工3000人(研究的總體),為6研究假設原假設H0:調查數據871元與報表數據880元之間沒有顯著性差異,公司員工工資均值的真實情況為880元;假設H1:調查數據和報表數據之間有顯著性的差異,公司員工工資均值的真實情況不是880元。研究假設原假設H0:調查數據871元與報表數據8807α錯誤出現原因我們只抽了一個樣本,而個別的樣本可能是特殊的,不管你的抽樣多么符合科學抽樣的要求。理論上講,在3000個員工中隨機抽取50人作為調查樣本,有很多種構成樣本的可能性,相當于3000選50,這個數目是很大的。這樣,在理論上就有存在很多個樣本平均數。也就是說,由于小概率事件的出現,我們把本來真實的原假設拒絕了。這就是α錯誤出現的原因。α錯誤出現原因我們只抽了一個樣本,而個別的樣本可能是特殊的8β錯誤出現原因第二個問題是,統計檢驗的邏輯犯了從結論推斷前提的錯誤。命題B是由命題A經演繹推論出來的,或寫作符號A→B,命題C是我們在檢驗中所依據操作法則。如果A是真的,且我們從A到B的演繹推論如果也是正確的,那么B可能是真實的。相反,如果結果B是真實的,那么就不能得出A必定是真實的結論。這就是β錯誤出現的原因。β錯誤出現原因第二個問題是,統計檢驗的邏輯犯了從結論推斷前9出現兩類錯誤的概率計算α錯誤是由實際推斷原理引起的,即“小概率事件不會發生”的假定所引起的,所以有理由將所有小概率事件發生的概率之和或者即顯著性水平(α=0.05)看作α錯誤發生的概率,換言之,α錯誤發生的概率為檢驗所選擇的顯著性水平。如果是單側檢驗,棄真錯誤的概率則為α/2。出現兩類錯誤的概率計算α錯誤是由實際推斷原理引起的,即“小10β錯誤的概率的計算犯β錯誤的概率的計算是比較復雜的,由于β錯誤的出現原因是屬于邏輯上的,所以在總體參數不知道的情況下是無法計算它出現概率的大小的。我們在以上例子的基礎上進一步設計:這個公司職員的實際工資不是880元,而是是870元,原假設為偽,仍然假設實際工資是880元。這樣我們就可以在總體均值為870元和880元兩種情況下,分別作出兩條正態分布曲線(A線和B線),見下圖。β錯誤的概率的計算犯β錯誤的概率的計算是比較復雜的,由于β錯11剖析假設檢驗的兩類錯誤并舉例說明課件12犯β錯誤的概率大小就是相對正態曲線A而言,圖1中陰影部分的面積:ZX1=1.41;ZX2=5.59查標準正態分布表可知,β=Φ(ZX2)-Φ(ZX1)=0.0793結果表明,如果總體的真值為870元,而虛無假設為880元的話,那么,平均而言每100次抽樣中,將約有8次把真實情況當作880元被接受,即犯β錯誤的概率大小是0.0793。犯β錯誤的概率大小就是相對正態曲線A而言,圖1中陰影13對相關命題的說明命題1:在統計檢驗中,在樣本容量一定的條件下,α錯誤和β錯誤不可能同時減小。這個命題可以借助前面的圖形1來理解,一旦正態分布A的拒絕域減小即α錯誤減小,則(21Χ?Χ)這個區域將增大,而圖A上陰影部分的面積(β錯誤)也將增大。對相關命題的說明命題1:在統計檢驗中,在樣本容量一定的條件14命題2:真實的總體參數(μ)與假設的總體參數(μ0)之間的差異(△μ)越小,犯β錯誤的概率越大。這個命題也可以從圖形1得到說明。因為△μ越小,兩個正態圖就相距越近,陰影部分面積就增大。命題2:真實的總體參數(μ)與假設的總體參數(μ0)之間的15命題3:犯α錯誤的概率和犯β錯誤的概率之和不為1。α錯誤的概率是在圖A上被指示的顯著性水平的大小,而β錯誤的概率是圖A上陰影部分的面積。既然假設的總體均值并不與真值相等(這是錯β誤產生的前提),圖A與圖B就不可能重合,因此α和之β和不可能為1。命題3:犯α錯誤的概率和犯β錯誤的概率之和不為116兩類錯誤的危害犯第一類錯誤的危害較大,由于報告了本來不存在的現象,則因此現象而衍生出的后續研究、應用的危害將是不可估量的。想對而言,第二類錯誤的危害則相對較小,因為研究者如果對自己的假設很有信心,可能會重新設計實驗,再次來過,直到得到自己滿意的結果(但是如果對本就錯誤的觀點堅持的話,可能會演變成第一類錯誤)。兩類錯誤的危害犯第一類錯誤的危害較大,由于報告了本來不存在的17假設檢驗時應注意的事項要有嚴密的抽樣研究設計,樣本必須是從同質總體中隨機抽取的;要保證組間的均衡性和資料的可比性。根據現有的資料的性質,設計類型,樣本含量大小,正確選用檢驗方法對差別有無統計學意義的判斷不能絕對化,因檢驗水準只是人為規定的界限,是相對的。差別有統計意義時,是指無效假設H0被接受的可能性只有5%或不到5%,甚至不到1%,根據小概率事件一次不可能拒絕H0,但尚不能排除有5%或1%出現的可能,所以可能產生第一類錯誤:同樣,若不拒絕H0,可能產生第二類錯誤假設檢驗時應注意的事項要有嚴密的抽樣研究設計,樣本必須是從同18剖析假設檢驗的兩類錯誤并舉例說明課件19剖析假設檢驗的兩類錯誤并舉例說明組長:胡立文PPT制作:吳思遠演講人:胡立文組員:胡立文、吳思遠、林君豪、白魯寧、殷妃、陳芷琳剖析假設檢驗的兩類錯誤并舉例說明組長:胡立文20在假設檢驗時,根據檢驗結果做出的判斷,即拒絕H0或不拒絕H0并不是100%的正確,可能發生兩種錯誤在假設檢驗時,根據檢驗結果做出的判斷,即拒絕H0或不拒絕H021第一類錯誤—棄真錯誤即H0本來正確,卻拒絕了它,犯這類錯誤的概率不超過α,即P{拒絕H0/H0為真}≤α可能產生的原因:1.樣本中極端數值2.采用決策標準較寬松第一類錯誤—棄真錯誤即H0本來正確,卻拒絕了它,犯這類錯誤的22第二類錯誤—取偽錯誤即H0本不真,卻接受了他,犯這類錯誤的概率記為β,即P{接受H0/H1為真}=β可能產生原因:1:實驗設計不靈敏2.樣本數據變異性過大3.處理效應本身比較小第二類錯誤—取偽錯誤即H0本不真,卻接受了他,犯這類錯誤的概23兩類錯誤的關系1:α與β是在兩個前提下的概率,所以α+β不一定等于12:在其他條件不變的情況下,α與β不能同時增加或減少兩類錯誤的關系1:α與β是在兩個前提下的概率,所以α+β不一24案例說明例子:一個公司有員工3000人(研究的總體),為了檢驗公司員工工資統計報表的真實性,研究者作了50人的大樣本隨機抽樣調查,人均收入的調查結果是:X(樣本均值)=871元;S(標準差)=21元問能否認為統計報表中人均收入μ0=880元的數據是真實的?(顯著性水平α=0.05)案例說明例子:一個公司有員工3000人(研究的總體),為25研究假設原假設H0:調查數據871元與報表數據880元之間沒有顯著性差異,公司員工工資均值的真實情況為880元;假設H1:調查數據和報表數據之間有顯著性的差異,公司員工工資均值的真實情況不是880元。研究假設原假設H0:調查數據871元與報表數據88026α錯誤出現原因我們只抽了一個樣本,而個別的樣本可能是特殊的,不管你的抽樣多么符合科學抽樣的要求。理論上講,在3000個員工中隨機抽取50人作為調查樣本,有很多種構成樣本的可能性,相當于3000選50,這個數目是很大的。這樣,在理論上就有存在很多個樣本平均數。也就是說,由于小概率事件的出現,我們把本來真實的原假設拒絕了。這就是α錯誤出現的原因。α錯誤出現原因我們只抽了一個樣本,而個別的樣本可能是特殊的27β錯誤出現原因第二個問題是,統計檢驗的邏輯犯了從結論推斷前提的錯誤。命題B是由命題A經演繹推論出來的,或寫作符號A→B,命題C是我們在檢驗中所依據操作法則。如果A是真的,且我們從A到B的演繹推論如果也是正確的,那么B可能是真實的。相反,如果結果B是真實的,那么就不能得出A必定是真實的結論。這就是β錯誤出現的原因。β錯誤出現原因第二個問題是,統計檢驗的邏輯犯了從結論推斷前28出現兩類錯誤的概率計算α錯誤是由實際推斷原理引起的,即“小概率事件不會發生”的假定所引起的,所以有理由將所有小概率事件發生的概率之和或者即顯著性水平(α=0.05)看作α錯誤發生的概率,換言之,α錯誤發生的概率為檢驗所選擇的顯著性水平。如果是單側檢驗,棄真錯誤的概率則為α/2。出現兩類錯誤的概率計算α錯誤是由實際推斷原理引起的,即“小29β錯誤的概率的計算犯β錯誤的概率的計算是比較復雜的,由于β錯誤的出現原因是屬于邏輯上的,所以在總體參數不知道的情況下是無法計算它出現概率的大小的。我們在以上例子的基礎上進一步設計:這個公司職員的實際工資不是880元,而是是870元,原假設為偽,仍然假設實際工資是880元。這樣我們就可以在總體均值為870元和880元兩種情況下,分別作出兩條正態分布曲線(A線和B線),見下圖。β錯誤的概率的計算犯β錯誤的概率的計算是比較復雜的,由于β錯30剖析假設檢驗的兩類錯誤并舉例說明課件31犯β錯誤的概率大小就是相對正態曲線A而言,圖1中陰影部分的面積:ZX1=1.41;ZX2=5.59查標準正態分布表可知,β=Φ(ZX2)-Φ(ZX1)=0.0793結果表明,如果總體的真值為870元,而虛無假設為880元的話,那么,平均而言每100次抽樣中,將約有8次把真實情況當作880元被接受,即犯β錯誤的概率大小是0.0793。犯β錯誤的概率大小就是相對正態曲線A而言,圖1中陰影32對相關命題的說明命題1:在統計檢驗中,在樣本容量一定的條件下,α錯誤和β錯誤不可能同時減小。這個命題可以借助前面的圖形1來理解,一旦正態分布A的拒絕域減小即α錯誤減小,則(21Χ?Χ)這個區域將增大,而圖A上陰影部分的面積(β錯誤)也將增大。對相關命題的說明命題1:在統計檢驗中,在樣本容量一定的條件33命題2:真實的總體參數(μ)與假設的總體參數(μ0)之間的差異(△μ)越小,犯β錯誤的概率越大。這個命題也可以從圖形1得到說明。因為△μ越小,兩個正態圖就相距越近,陰影部分面積就增大。命題2:真實的總體參數(μ)與假設的總體參數(μ0)之間的34命題3:犯α錯誤的概率和犯β錯誤的概率之和不為1。α錯誤的概率是在圖A上被指示的顯著性水平的大小,而β錯誤的概率是圖A上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025雇傭勞動合同書范本
- 政府購買公共服務合同的性質分析研究 工商管理專業
- 2025辦公空間轉租合同范本
- 2025頂級度假村裝飾工程總承包合同
- 2025商業辦公空間設計施工合同示范文本 合同范本
- 2025汽車轉讓合同范本
- 2025原材料采購合同書范本
- 2025租房合同中關于租房定金的協議
- 2025中介服務合同模板
- 2025機械設備租賃合同模板參考
- 2024年飯店轉讓合同簡單版(三篇)
- 大數據與會計社會實踐報告
- 小學一二年級必背古詩詞73首帶拼音
- 《陸上風電場工程概算定額》NBT 31010-2019
- 2024年信陽職業技術學院單招職業適應性測試題庫帶答案
- 生物醫學電子學智慧樹知到期末考試答案章節答案2024年天津大學
- 《電磁學》梁燦彬課后答案解析
- 2024年山東省事業單位歷年面試題目及答案解析50套
- 富血小板血漿治療術知情同意書
- Charter開發與立項流程(CDP)
- 中華民族共同體概論課件第三講文明初現與中華民族起源(史前時期)
評論
0/150
提交評論