




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統計推斷和假設檢驗統計推斷從數據得到對現實世界的結論的過程2估計 總體代表我們所關心的那局部世界。而在利用樣本中的信息來對總體進行推斷之前人們往往對代表總體的變量假定了分布族。(描述數據時不用假定)比方假定人們的身高屬于正態分布族;在抽樣調查時假定了二項分布族等等(這些假定可能有風險!)。這些模型根本上是根據“經驗來假定的,僅僅是對現實世界的一個近似。3估計 在假定了總體分布族之后,進一步對總體的認識就是要在這個分布族中選擇一個適合于我們問題的成員由于分布族成員是由參數確定的,如果參數能夠估計,對總體的具體分布就知道得差不多了。 4估計量是用來估計的統計量 我們知道,統計量是樣本的不包含未知參
2、數的函數。樣本均值、樣本標準差都是統計量。由于樣本是隨機的,統計量也是隨機變量。用于估計總體參數的統計量稱為估計量;樣本均值和標準差都是總體均值和標準差的常用估計量。5點估計和區間估計點估計(point estimation)就是用估計量的實現值來近似相應的總體參數。區間估計(interval estimation) 是包括估計量在內有時是以估計量為中心的一個區間;被認為很可能包含總體參數。點估計給出一個數字,用起來很方便;而區間估計給出一個區間,說起來留有余地;不象點估計那么絕對。無偏估計(大樣本性質) 6區間估計 注意置信區間的論述是由區間和置信度兩局部組成。置信區間是對參數給出的一個范圍
3、置信度為其可信程度(大樣本意義)有些新聞媒體報道一些調查結果只給出百分比和誤差即置信區間,比方 “收視率為53%3%; 不給出置信度,也不給出被調查的人數這是不負責的表現。7區間估計 降低置信度可以使置信區間變窄顯得“精確,有誤導讀者之嫌。如果給出被調查的人數,那么內行可以由此推算出置信度,反之亦然。8一個描述性例子 一個有10000個人答復的調查顯示,同意某種觀點的人的比例為70%有7000人同意,可以算出總體中同意該觀點的比例的95%置信區間為0.691,0.709;另一個調查聲稱有70%的比例反對該種觀點,還說總體中反對該觀點的置信區間也是(0.691,0.709)。9一個描述性例子 實
4、際上,第二個調查隱瞞了置信度等價于隱瞞了樣本量。如果第二個調查僅僅調查了50個人,有35個人反對該觀點。根據后面的公式可以算出,第二個調查的置信區間的置信度僅有11%。10區間估計的意義 置信度的概念大量重復抽樣時的一個漸近概念。類似于“我們目前得到的區間比方上面的75%3%以概率0.95覆蓋真正的比例p的說法是錯誤的。實際上應該說“重復類似的抽樣所得到的大量區間中有大約95%的覆 蓋真實比例(其值可能永遠未知)。11區間估計的意義 這里的區間72%,78%是固定的,而總體比例p也是固定的值。因此只有兩種可能:或者該區間包含總體比例,或者不包含;這當中沒有任何概率可言。至于區間72%,78%是
5、否覆蓋真實比例,除非一個不漏地調查所有的人,否那么永遠也無法知道。 12假設檢驗 在假設檢驗中,一般要設立一個原假設;而設立該假設的動機主要是企圖利用人們掌握的反映現實世界的數據來找出假設和現實的矛盾,從而否認這個假設。13假設檢驗 在多數統計教科書中除了理論探討之外,假設檢驗都是以否認原假設為目標。如否認不了,那就說明證據缺乏,無法否認原假設。但這不能說明原假設正確。很多教科書在這個問題上不適當地用“接受原假設的說法,犯了明顯的低級邏輯錯誤。 14假設檢驗的過程和邏輯 首先要提出一個原假設,比方某正態總體的均值等于5m=5。這種原假設也稱為零假設null hypothesis,記為H0與此同
6、時必須提出對立假設,比方總體均值大于5m5。對立假設又稱為備選假設或備擇假設alternative hypothesis記為記為H1或Ha15假設檢驗的過程和邏輯 根據零假設不是備選假設!,我們可以得到該檢驗統計量的分布;然后再看這個統計量的數據實現值realization屬不屬于小概率事件。也就是說把數據代入檢驗統計量,看其值是否落入零假設下的小概率范疇如果確實是小概率事件,那么我們就有可能拒絕零假設,否那么我們說沒有足夠證據拒絕零假設。16假設檢驗的過程和邏輯 注意:零假設和備選假設在我們涉及的假設檢驗中并不對稱。檢驗統計量的分布是從零假設導出的, 因此, 如果有矛盾, 當然就不利于零假設
7、了。不發生矛盾也不說明備選假有問題。 17假設檢驗的過程和邏輯 檢驗統計量在零假設下,等于這個樣本的數據實現值或在備選假設方向上更加極端值的概率稱為p-值p-value。顯然得到很小p-值意味著小概率事件發生了。如果小概率事件發生,是相信零假設,還是相信數據呢?當然是相信數據。于是就拒絕零假設。但事件概率小并不意味著不會發生,僅僅發生的概率很小罷了。拒絕正確零假設的錯誤常被稱為第一類錯誤type I error。18假設檢驗的過程和邏輯 不僅有第一類錯誤,還有第二類錯誤;那是備選假設正確時反而說零假設正確的錯誤,稱為第二類錯誤type II error。如要“接受零假設就必須給出第二類錯誤的概
8、率. 但對于目前面對的問題, 無法計算它.19假設檢驗的過程和邏輯 零假設和備選假設哪一個正確,這是確定性的,沒有概率可言。而可能犯錯誤的選項是人。涉及假設檢驗的犯錯誤的概率就是犯第一類錯誤的概率和犯第二類錯誤的概率。負責的態度是無論做出什么決策,都應該給出犯錯誤的概率。20假設檢驗的過程和邏輯 到底p-值是多小才能夠拒絕零假設呢?也就是說,需要有什么是小概率的標準。這要看具體應用的需要。但在一般的統計書和軟件中,使用最多的標準是在零假設下或零假設正確時抽樣所得的數據拒絕零假設的概率應小于0.05也可能是0.01,0.005,0.001等等。21假設檢驗的過程和邏輯 這種事先規定的概率稱為顯著
9、性水平(significant level),用字母a來表示。當p-值小于或等于a時,就拒絕零假設。所以,a是所允許的犯第一類錯誤概率的最大值。當p-值小于或等于a時,我們說這個檢驗是顯著的(significant)。22假設檢驗的過程和邏輯 歸納起來,假設檢驗的邏輯步驟為:第一: 寫出零假設和備選假設;第二: 確定檢驗統計量;第三: 確定顯著性水平a;第四: 根據數據計算檢驗統計量的實現值;第五: 根據這個實現值計算p-值;第六: 進行判斷:如果p-值小于或等于a,就拒絕零假設,這時犯錯誤的概率最多為a;如果p-值大于a,就不拒絕零假設,因為證據缺乏。 23假設檢驗的過程和邏輯 實際上,計算
10、機軟件僅僅給出p-值,而不給出a。這有很多方便之處。比方a=0.05,而假定我們得到的p-值等于0.001。這時我們如果如果采用p-值作為新的顯著性水平,即a=0.001,于是可以說,我們拒絕零假設,顯著性水平為0.001。拒絕零假設時犯錯誤的概率實際只是千分之一而不是百分之五。在這個意義上,p-值又稱為觀測的顯著性水平observed significant level。在統計軟件輸出p-值的位置,有的用“p-value,有的用significant的縮寫“Sig就是這個道理。24假設檢驗的例子 汽車廠商聲稱其發動機排放標準的一個指標平均低于20個單位。在抽查了10臺發動機之后,得到下面的排
11、放數據:17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。該樣本均值為21.13。究竟能否由此認為該指標均值超過20?這次我們的假設檢驗問題就是25假設檢驗的例子 檢驗統計量為為什么用這個?我們可以發現p-值為0.1243,因此,我們沒有證據否認零假設(如果顯著性水平小于它)。2627兩個變量的均值比較 兩個學校高中學生的身高均值比較(hight21.sav). H0:m1=m2= H1:m1m228SPSS輸出 P值0.001/2=0.000529為什么不能“接受零假設 其實可以,比方下面兩種情況:1. 備選假設也是單點分布,這時可以負責地算
12、出犯第二類錯誤的概率。2. 貝葉斯檢驗情況這是一種決策觀點但在經典統計中的絕大多數情況都不可以。30從一個例子看“接受零假設 數據 rice.sav一個大米加工廠賣給一個超市一批標明10kg重的大米。而該超市疑心該廠家缺斤短兩,對10包大米進行了稱重,得到下面結果單位:千克9.93 9.83 9.76 9.95 10.07 9.89 10.03 9.97 9.89 9.87這里假定打包的大米重量服從正態分布。由于發生分歧,于是各方同意用這個數據進行關于大米重量均值m的t檢驗;以廠家所說的平均重量為10kg作為零假設,而以超市疑心的份量缺乏10kg作為備選假設:311.超市的檢驗 于是,超市、加
13、工廠老板和該老板的律師都進行了檢驗。結果是:超市用全部數據進行t檢驗,得到拒絕零假設的結論。他們根據計算得到:樣本均值為9.92kg,而p-值為0.0106。因此超市認為,對于顯著性水平a=0.05,應該拒絕零假設。322. 加工廠老板的檢驗大米加工廠老板只用2個數據,得到“接受零假設的結論。大米加工廠老板也懂些統計,他只取了上面樣本的頭兩個個數目9.93和9.83進行同樣的t檢驗。通過對這兩個數進行計算得到:樣本均值為9.88kg, 而p-值為0.1257. 雖然樣本均值不如超市檢驗的大, 但p-值大大增加。加工廠老板于是下了結論:對于水平a0.05,“接受零假設,即加工廠的大米平均重量確實為10kg。 333.加工廠老板律師的檢驗大米加工廠老板的律師用了全部數據,但不同的檢驗方法,得到“接受零假設的結論。大米加工廠老板的律師說可以用全部數據。他利對于連續變量比例的檢驗,也就是關于中位數的符號檢驗注意對于正態分布,對中位數的檢驗等價于對均值的檢驗。根據計算,得到該檢驗的p-值為0.0547。所以這個律師說在顯著性水平a=0.05時,應該“接受零假設。還說,“既然三個檢驗中有兩個都接受零假設,就應該接受。34如何評價?加工廠老板實際上減少了作為證據的數據,因此只得到“證據缺乏,無法拒絕零假設的結論。但加工廠老板利用一些錯誤的統計教科書的說法,把“證據缺乏以拒絕零假設改成“接受零
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年數控超精密磨床項目申請報告
- 2025年炔烴項目立項申請報告
- 教育行業教學經歷證明書(6篇)
- 品牌宣傳推廣合同協議
- 巧克力包裝機設計-課程設計
- 食品加工工藝與設備案例分析題
- 2025年電商數據分析與電商運營管理專業電子商務師(初級)職業技能鑒定試卷
- 快樂讀書讀后感作文5篇
- 個人實習證明書標題實習經歷證明書(8篇)
- 2025年初中化學九年級上冊期中測試卷:化學與環境問題探究試題
- 珠寶公司文件管理制度
- 2025-2030年中國3C數碼充電器行業市場深度調研及市場供需與投資價值研究報告
- 2024年黃岡團風縣招聘城區社區工作者真題
- 2026屆云南三校高考備考聯考卷(一)化學試卷+答案
- 2025年山東省高考歷史試卷真題
- 2025至2030中國農膜行業發展分析及發展前景與投資報告
- 2025圖解《政務數據共享條例》V1.0學習解讀
- 2024中國農業銀行分行年度營銷宣傳方案
- 2025電商平臺店鋪轉讓合同模板
- 2025長城汽車人才測評答案
- 2021利達JB-QG-LD988EL JB-QT-LD988EL 火災報警控制器 消防聯動控制器調試手冊
評論
0/150
提交評論