




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第11章假設檢驗本章主要闡述假設檢驗的基本問題、正態總體的參數檢驗、正態總體方差檢驗、檢定法、符號檢驗法、等級檢驗法、趨勢性與隨機性檢驗。其核心是怎樣根據隨機樣本對某一統計假設作出接受或拒絕的統計決策。11.1
假設檢驗的基本問題11.1.1.假設檢驗的意義假設檢驗是以樣本統計量來驗證假設的總體參數是否成立,借以決定采取適當行動的統計方法,又稱假設檢定或假設測驗。包括假設和檢驗兩個基本環節。統計假設:對總體參數作出假設,這種假設可能正確,也可能是錯誤的。統計檢驗:檢驗所作的統計假設是否成立,作出接受或作出拒絕的結論。11.1.2假設檢驗的程序1.提出原假設H0和備選假設H1。原假設H0:是假設未知參數等于某一具體的值,是需要接受檢驗的假設。備選假設H1:又稱替代假設或備擇假設,是原假設的對立假設。關于總體平均數的假設有三種狀況:①H0:u=u0;H1:u≠u0;(雙尾檢驗)②H0:u≥u0;H1:u<u0;(單尾檢驗)③H0:u≤u0;H1:u>u0;(單尾檢驗)2.確定樣本統計量及其分布。樣本統計量有樣本均值、樣本比率、樣本方差等,不同的樣本統計量具有不同的分布,用于檢驗不同的統計假設。3.選擇顯著水平。顯著水平a:原假設是正確的,發生的概率大1-a,而不發生的概率a則小
。a
常取0.05或0.01。顯著水平的選擇存在著犯兩種錯誤的可能性:第一類為棄真錯誤:原假設本是正確的,由于a值選擇過大,拒絕了原假設。第二類為取偽錯誤:原假設本是錯誤的,由于a值選擇過小,接受了原假設。4.計算檢驗統計量或構建置信區間。根據樣本統計量的數據和被假設的總體參數,計算檢驗統計量;或者根據樣本統計量和置信概率構建置信區間,作為檢驗決策的依據。檢驗統計量的基本計算公式為:
5.作出統計決策。雙尾檢驗:檢驗統計量落在接受區域內,接受原假設,反之,則拒絕原假設。單尾檢驗:檢驗統計量的絕對值大于臨界絕對值,拒絕原假設。反之,接受原假設。11.1.3假設檢驗的方法假設檢驗的方法有參數假設檢驗和非參數假設檢驗兩類。1.有參數假設檢驗.是指在已知總體分布的條件下,對總體均值、總體比率、總體方差等參數進行假設檢驗。有參數檢驗的方法主要有Z檢驗、t檢驗、F檢驗等等。2.非參數假設檢驗.。是在不考慮原總體分布或不作關于分布假定的前提下,進行統計檢驗和判斷分析的一系列方法的總稱。
主要應用于以下兩個方面:(1)凡要求解決的問題不符合參數假設檢驗條件時,采用非參數假設檢驗。(2)采用列名尺度和順序尺度計量的現象,需要進行檢驗時,采用非參數假設檢驗。非參數統計方法主要有的獨立性檢驗、的一致性檢驗、的吻合性檢驗、正負符合檢定法、各種等級檢定法、游程檢驗法等。11.2一個正態總體的參數檢驗11.2.1總體方差已知的均值檢驗。若總體為正態分布,且總體方差已知,則可先計算檢驗統計量Z:
其次選擇顯著水平a,查Z分表,求得兩個臨界值,若檢驗統計量Z落在兩個臨界值構成的區域內,則可作出接受原假設的決策;否則拒絕原假設。圖8-1假設檢驗示意圖(雙尾檢驗)
11.2.2總體方差未知的均值檢驗當總體為正態分布,總體方差未知,n>30時,可用樣本方差代替總體方差,采用Z檢驗。當樣本容量n<30,則需要采用t檢驗。由于總體方差未知,則可用樣本方差先估計總體方差,再計算檢驗統計量t進行假設檢驗。
它服從自由度為n-1的t分布。
11.2.3.總體比率的假設檢驗在單個總體比例的假設檢驗中,當樣本容量n大于30,np和n(1—p)兩者都大于5時,樣本比率p的抽樣分布近似正態分布,可采用Z檢驗。檢驗統計量為:
其中p0為假設的總體比率,p為樣本比率。
11.3兩個正態總體的參數檢驗
11.3.1兩個總體平均數之差的檢驗1.
樣本容量n>30,采用Z檢驗。在檢驗兩個總體平均數之差的假設時,無論總體是否服從正態分布,當樣本容量n>30時,來自兩個總體的樣本平均數之差趨近于正態分布,故可采用Z檢驗,檢驗統計量為:
若兩個總體方差未知,n>30時,可用樣本方差代替或估計總體方差。(2)樣本容量n<30,兩個正態總體方差未知,采用t檢驗。如果兩個正態總體方差已知,而樣本容量n<30時,仍可采用Z檢驗。如果兩個正態總體的方差相等而又未知,且n<30,則采用t分布檢驗。首先利用兩個樣本的方差求出它們共同方差的估計值。即:檢驗統計量為:當時μ1=μ2,t服從自由度為n1+n2的t分布。在給定的顯著水平a的條件下,查t分布表,得出臨界值ta/2,當│t│≥│ta/2│時,拒絕原假設H0,反之則接受原假設H0。
11.3.2兩個總體比率之差的檢驗當樣本容量較大時,來自兩個總體的樣本比率之差的抽樣分布近似服從正態分布。若兩個總體的比率P大體相同時,可求兩個樣本比率的聯合估計值,代替未知的總體比率值;再檢驗統計量Z值進行兩個總體比率之差的檢驗:
11.4正態總體方差的假設檢驗11.4.1單個正態總體方差的假設檢驗采用χ2分布檢驗,有兩種檢驗方法:1.根據樣本方差S2和給定的顯著水平a,建立總體方差的置信區間,若假設的總體方差σ2
落在置信區間內,則接受原假設,反之,則拒絕原假設。總體方差估計的置信區間為:2.根據樣本方差和假設的總體方差,計算檢驗統計量χ2,然后根據給定的顯著水平α查χ2分布的兩個臨界值,若檢驗統計量落在兩個臨界值的區域內,則接受原假設,反之,則拒絕原假設。計算式為:接受區域:
11.4.2兩個正態總體方差比的假設檢驗采用服從F分布的統計量來檢驗兩個總體方差是否相等或同質的問題。有兩種檢驗方法。1.根據兩個樣本方差建立兩個總體之比的置信區間,然后觀察
是否落在置信區間內,則可作出接受或拒絕原假設的決策。其置信區間為:
Fa/2根據自由度(n1-l,n2-1)和顯著水平a/2從F分布表中查得,F1-a/2/2則根據自由度(n2
-l
,n1-l)和顯著水平a/2從F分布表中查得F值后再取倒數。2.直接計算兩個樣本方差的檢驗統計量
,再與F分布的理論臨界值Fa/2或F1-a/2比較,若F1-a/2<F<Fa/2,則接受原假設;若F<F1-a/2或
F>Fa/2,則拒絕原假設。11.5χ2檢定法11.5.1χ2檢驗的基本原理為了了解某變量出現的實際次數(Oi)與理論次數(Ei)之間是否具有一致性,可采用χ2檢驗。χ2統計量定義為:
數理統計已證明,在大量的試驗中若實際次數分布與理論次數分布相一致時,統計量χ2就服從分布。如果實際結果和理論假設不一致,其統計量χ2值很大,當大到按χ2分布出現的概率很小時,就可判斷實際結果和理論假設不一致。χ2檢驗就是利用這一基本原理。χ2檢驗可用于獨立性檢驗,一致性檢驗和吻合性檢驗。應用時應注意:1.卡方檢驗都是單尾檢驗。2.要求實際次數和理論次數必須為絕對次數,不能采用相對次數或頻率。3.要求所有觀察值的理論次數都需大于等于5,否則需合并。4.樣本太小(n<20),χ2檢驗不能使用;樣本太大,又會使檢驗失效。11.5.2χ2的獨立性檢驗χ2的獨立性檢驗用于判別兩個變量或兩種分類標準是否有聯系的問題,如果兩者之間沒有聯系,則兩個變量或兩種分類標準是相互獨立的。檢驗兩個變量之間是否有聯系,通常要將研究對象按兩個變量進行交錯分類,編制兩向分類的列聯表,如表設n為樣本容量(總次數),變量x1各組的次數合計為ni,組數為,變量χ2各組的次數合計為nj,組數為C;兩個變量交叉分組的實際次數用Oij表示,理論次數用Eij表示,則檢驗統計量χ2為:
其中:理論次數
當顯著水平為a時,根據自由度(γ-1)(γ-C)查χ2分布表,得χ21-α臨界值,則:
χ2>χ21-α兩變量間有聯系(不是獨立的)
χ2<χ21-α
兩變量間獨立的χ2的獨立性檢驗,當兩個變量的分類都只有兩類時,從而形成了2×2的列聯表,若用a、b、c、d分別表示其觀察值,則χ2統計量的簡便公式為:由χ2于分布是一個連續變量分布,而2×2的列聯表中用的是離散的方法,其自由度為1,因此1934年耶莎(Yate)提出了修正公式:11.5.3χ2的一致性檢驗χ2的一致性檢驗用于判斷兩個或兩個以上的樣本比率是否具有顯著的差別,或者說檢驗兩個或兩個以上的獨立隨機樣本是否來自一致的總體。其統計量和決策法則均與的χ2獨立性檢驗一樣,但二者的不同之處有兩點:1.獨立性檢驗僅自一總體中抽取樣本,而一致性檢驗是由不同總體分別抽取樣本;2.獨立性檢驗是檢驗不同分類標準間是否互相獨立,而一致性檢驗是檢驗不同的隨機樣本所來自的總體是否具有一致性。11.5.4χ2的吻合性檢驗χ2的吻合性檢驗又稱擬合優度或適合度檢驗。主要用于檢驗某變量的實際次數分布與理論分布是否相吻合,亦即判別某變量是否服從于某一理論分布。檢驗的統計量χ2仍為:自由度v=k-1(k為組數),若總體σ、μ等m個參數未知,須先作估計再求理論次數,則自由度v=(k-m-1)。檢驗的決策法則為:χ2>χ2(1-α,ν),次數分配不適合某理論分布。χ2>χ2(1-α,ν),次數分配適合某理論分布。理論次數由Ei=nPi確定,其中pi為按某種理論分布計算的概率或頻率。11.6符號檢驗法符號檢驗法又稱正負檢驗法,主要用于對總體中位數M是否為特定的值M0進行檢驗。
11.6.1單一樣本中位數的符號檢驗設樣本來自的總體的中位數為M0,D為樣本內各觀察值x與M0的離差,即D=x—M0,若有一個D為0,則刪去。當D=x—M0的正負符號數目的概率均等(均為1/2)時,就可接受中位數M=M0的假設。當正號或負號出現的次數超過了應有的理論次數時,就可否定中位數M=M0的假設。
令檢驗統計量S為正號或負號中出現較少者的次數,則可視為在n次獨立試驗中成功的次數,故S分布為成功概率p=1/2的二項分布,當S值很小,表示中位數M可能不為M0。1.當樣本容量n較小,采用二項分布處理,拒絕M=M0的條件為:2.當樣本容量n較大,采用Z分布處理,拒絕M=M0的條件為:以上均為單尾檢驗,若作雙尾檢驗,只需將顯著水平a改為a/2即可。11.6.2兩個獨立樣本的符號檢驗兩個獨立樣本的符號檢驗用于檢驗抽自兩個總體的獨立樣本的中位數是否相同。檢驗的方法是將兩個樣本的觀察值統一按照順序排列,找出中位數(M0),并分別計算各樣本的D=x—M0的正、負符號數目,并整理成列聯表的形式,采用χ2檢驗:若:χ2<χ21-α,兩個總體中位數相同。
χ2>
χ21-α,兩個總體中位數不同。
11.6.3兩個有聯系樣本的符號檢驗兩個有聯系樣本的符號檢驗主要用于對某種處理或試驗進行比較,用以說明這種處理或試驗是否具有顯著的效應。檢驗時,要求兩個有聯系的樣本有n對成對的樣本觀察值(x1,y1),(x2,y2),……,(xn,yn),然后計算觀察值之差xi-yi再計算這些觀察值之差M0的正負符號數目S+或S-,即可采用下列方法檢驗這種處理或試驗是否具有顯著的效應。1.n小,采用二項分布檢驗:效應顯著
其中S為S+、S-中的較小者。雙尾檢驗將a改為a/2。
2.n大,采用Z分布檢驗:
效應顯著
11.7等級檢驗法
11.7.1符號等級檢驗法符號等級檢定法不僅要考慮觀察值與平均數或中位數之差的正負號,同時還要考慮其差額的大小,故檢驗的效率比單純的符號檢定法要高一些,又稱威爾科克森檢驗法,可用于檢驗總體中位數M是否為特定值M0,也可用于兩個有聯系的樣本的比較。設x為觀察值,M0為中位數的特定值。則單一樣本的符號等級檢法的步驟為:1.求D=x—M0,并刪去D=0者,使有效樣本大小為n。2.排定|D|的等級,如絕對值有兩個或兩個以上相同的,則先給每個|D|一個順序等級,再求其平均數代表它們的相同等級。3.分別求算D的正、負等級之和T+,T-;且檢查4.以統計量T表示T+或T-二者中的較小者。5.作出檢驗決策。決策法則因樣本大小不同而不同:
(1)當5≤n≤30,T≤Ta時,則M≠M0;或T≤Ta-2,則M≠M0。(2)當n>30,采用正態分布,計算統計量:若Z<-Z(1-a),則M≠M0;或Z<-Z(1-a/2),M≠M0。11.7.2曼—惠特尼U檢驗這種檢驗方法是建立在等級和的基礎上的檢驗,常用于兩個獨立樣本的比較,以檢驗兩個總體是否具有相同的分布,或者檢驗兩個獨立樣本所來自總體的中位數是否相等。它有兩個基本假定:一是兩總體均為連續分布,且變異程度相同;二是兩個獨立樣本均為隨機樣本。其檢驗的步驟為:1.將兩個樣本混合排列,按觀察值大小編上等級;2.分別計算兩個樣本的等級和,即T1,T2。3.計算兩個樣本的統計量U1,U2。U1+U2=n1n2,故取U1,U2中的小者作為檢驗統計量U。
4.作出檢驗決策。當n1,n2均≤20時,根據a、n1、n2查曼—惠特尼檢驗臨界值表,決策法則為:U≤U(a),兩個總體不具有相同分布(中位數不同)U≤U(a/2),兩個總體不具有相同分布(中位數不同)當n1,n2中有一個大于20時,采用Z檢驗:Z<-Z(1-a),
兩個總體不具有相同分布(中位數不同)。Z<-Z(1-a/2),兩個總體不具有相同分布(中位數不同)。11.7.3多個樣本的等級檢驗法多個樣本的等級檢驗法又稱克羅斯考爾—瓦里斯單因素方差分析法,它也是建立在等級和基礎之上的非參數檢驗方法。它同樣要求研究的變量是連續的,計量的水準至少是順序的。檢驗時,等級的編排與等級和的計算同曼—惠特尼U檢驗相同,但檢驗的統計量為H:
其中:Ti為各樣本的等級和,ni為各樣本容量,n為各樣本容量的總和。
H是近似于自由度為k-1的χ2分布,故可利用χ2分布進行檢驗。決策法則為:H>χ21-2:k個總體的中位數不相同。H<χ21-2
:k個總體的中位數相同。11.8趨勢性與隨機性檢驗11.8.1趨勢性檢驗趨勢性檢驗在于判別某種序列是否具有增加或減少的趨勢性(傾向性),在實際工作中,某些數列的發展趨勢往往不夠明顯,難以運用圖表判別序列是否具有趨勢性,可采用LOX-stuart趨勢性檢驗法進行檢驗。基本程序為:1.建立假設,有三種情形:(1)H0:無增長趨勢;H1:有增長趨勢(2)H0:無減少趨勢;H1:有減少趨勢(3)H0:無趨勢性H1:有趨勢性2.數據配對。具體做法取xi和xi+c組成一對,這里c為:
n/2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 室外健身點管理制度
- 家政員薪酬管理制度
- 應加強合同管理制度
- 張掖市保潔管理制度
- 往來帳對帳管理制度
- 微商城銷售管理制度
- 快遞寄存點管理制度
- 怎樣編考勤管理制度
- 總醫院績效管理制度
- 總裁辦績效管理制度
- GB/T 44198-2024空間站科學實驗系統集成與驗證要求
- 中考物理最后一課
- 2024年四川省涼山州“千名英才.智匯涼山”行動第二批引才395人歷年(高頻重點復習提升訓練)共500題附帶答案詳解
- 安徽省馬鞍山市2024-2025學年高一數學下學期期末考試試題含解析
- 【解決方案】動力環境監控系統【動環監控】
- 勞務班組施工合同范本(2024版)
- 四川省眉山市2023-2024學年高一下學期期末考試英語試題(無答案)
- 北京市西城區2023-2024學年五年級下學期期末數學試卷
- 湖南建筑工程定額
- 四川省成都天府新區2024年八年級下學期末物理試題附答案
- (完整版)增值稅申報表帶公式模板
評論
0/150
提交評論