




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
` 卡方檢驗8_八、卡方檢驗卡方檢驗基礎擬合問題-單個樣本率與總體率的比較相關問題-兩個樣本率或構成比的比較兩分類變量間關聯程度的度量一致性檢驗與配對卡方檢驗分層卡方檢驗小結
內容提要8_八、卡方檢驗
2檢驗是以2分布為基礎的一種假設檢驗方法,主要用于分類變量,根據樣本數據推斷總體的分布與期望分布是否有顯著差異,或推斷兩個分類變量是否相關或相互獨立。其原假設為:
H0:觀察頻數與期望頻數沒有差別卡方檢驗基礎8_八、卡方檢驗
首先假設H0成立,計算出2值,它表示觀察值與理論值之間的偏離程度。根據2分布,2統計量以及自由度可以確定在H0成立的情況下獲得當前統計量及更極端情況的概率P。如果P很小,說明觀察值和理論值偏離程度太大,應當拒絕原假設,表示比較資料之間有顯著性差異;否則就不能拒絕原假設,尚不能認為樣本所代表的實際情況與理論假設有差別。卡方檢驗基礎
2檢驗的基本思想8_八、卡方檢驗
2值的計算:由英國統計學家KarlPearson首次提出,故被稱為Pearson
2。卡方檢驗基礎8_八、卡方檢驗
當n比較大時,
2統計量近似服從k-1個自由度的2分布。在自由度固定時,每個2值與一個概率值(P值)相對應,此概率值即為在H0成立的前提下,出現這樣一個樣本或偏離假設總體更遠的樣本的概率。如果P值小于或等于顯著性水準,則拒絕H0,接受H1,即觀察頻數與期望頻數不一致。如果P值大于顯著性水準,則不拒絕H0,認為觀察頻數與期望頻數無顯著性差異。P值越小,說明H0假設正確的可能性越小;P值越大,說明H0假設正確的可能性越大。卡方檢驗基礎-卡方分布8_八、卡方檢驗卡方檢驗基礎
利用單樣本均值比較的t檢驗,可以檢驗樣本所在總體的均值與已知值是否存在顯著性差異,即樣本均值與已知值的差異,是由于樣本所在總體的均值和已知值確實有差別,還是由于隨機抽樣引起的差異。這是針對連續性變量而言,如果是分類變量,就不能使用進行均值比較的t檢驗,而應該使用進行率比較的卡方檢驗。8_八、卡方檢驗
檢驗某個連續變量的分布是否與某種理論分布一致,如是否符合正態分布,Possion分布等檢驗某個分類變量各類的出現概率是否等于指定概率檢驗兩個分類變量是否相互獨立,如吸煙是否與呼吸道疾病有關檢驗控制某種或某幾種分類變量因素的作用之后,另兩個分類變量是否獨立,如上例控制年齡、性別之后,吸煙是否與呼吸道疾病有關檢驗兩種方法的結果是否一致,如兩種診斷方法對同一批人進行診斷,其診斷結果是否一致卡方檢驗基礎-用途8_八、卡方檢驗
例1某公司經營多年,形成了一套成熟的企業文化和管理體系,例如根據多年的運營經驗,經理層、監察員、辦事員三種職務類別的比例大約在15:5:80為宜,這樣運行效率最高。兩年前公司原管理層集體退居二線,新任管理層上任后對公司進行了較大的變動,有員工擔心這是否已經導致了職務類別比例的失調,影響到公司的高效運行。目前三種職務的人數比為84:27:363,如何用數據分析來解決此類問題呢?(數據見employeedata.sav)擬合問題-樣本率與已知總體率的比較8_八、卡方檢驗擬合問題-樣本率與已知總體率的比較
這是一個樣本構成比與已知總體構成比進行比較的統計學問題,可以用卡方檢驗來解決。8_八、卡方檢驗擬合問題-樣本率與已知總體率的比較
注意,此處數值的排列順序和數據文件中各類別的排列順序應當相同,因為他們存在一一對應的關系。8_八、卡方檢驗擬合問題-樣本率與已知總體率的比較分析結果
給出了樣本中三個職務級別的觀察頻數、期望頻數以及殘差。8_八、卡方檢驗擬合問題-樣本率與已知總體率的比較分析結果
此為單樣本
2檢驗的結果,
2值為3.492,P=0.174,故可認為觀察頻數和期望頻數沒有顯著差別。8_八、卡方檢驗
注意:
本例使用的數據是原始數據,一個案例代表一個員工的情況。但如果數據是頻數格式,即每一行代表一個水平,另外用一個頻數變量代表該水平的頻數。此時在分析時要首先告訴SPSS具體哪一個變量是頻數變量。如何實現呢?利用數據準備中的WeightCases即可。擬合問題-樣本率與已知總體率的比較8_八、卡方檢驗
例2某婦女聯合會向工會提出質疑,認為該公司在對女性員工的職位安排上存在歧視,因為該公司216名女性雇員中,只有10人為經理,其余206名為辦事員;而258名男性雇員中,74名為經理。但是工會說,男女間職位類別比例的差異,只是一個隨機誤差,并不是真的存在性別歧視。哪種說法才是正確的呢?(數據見employeedata.sav)相關問題-兩個率或構成比的比較8_八、卡方檢驗相關問題-兩個率或構成比的比較
這是一個比較兩個性別的職位構成比是否相同的統計學問題,要用Descriptive中的Crosstabs實現,與單個率的比較不同。8_八、卡方檢驗相關問題-兩個率或構成比的比較
分別指定行列變量到Row(s)和Columns中。8_八、卡方檢驗相關問題-兩個率或構成比的比較8_八、卡方檢驗相關問題-兩個率或構成比的比較8_八、卡方檢驗相關問題-兩個率或構成比的比較分析結果
可見,性別和職位不獨立,女性更容易成為辦事員,而男性更容易得到經理和監察員的職位。8_八、卡方檢驗相關問題-兩個率或構成比的比較
需要注意的是,卡方檢驗僅僅告知使用者各類別的構成和分布是否相同,本例中的職務是無序分類變量,監察員和辦事員不能比較大小順序,因此可以進行卡方檢驗。如果為有序分類變量的話,則卡方檢驗并不合適,而應用秩和檢驗。8_八、卡方檢驗連續性校正
2檢驗:
僅適用于四格表資料,在n>40,所有期望頻數均大于1,只有1/5單元格的期望頻數大于1小于5時;Fisher精確概率法:
在樣本含量<40或有格子的期望頻數<1的列聯表,應該采用該法;似然比
2檢驗:
當n>40,最小期望頻數>5時,結論與Pearson
2基本一致;相關問題-兩個率或構成比的比較
幾種卡方檢驗的比較:8_八、卡方檢驗兩分類變量間關聯程度的度量
卡方檢驗可以從定性的角度說明兩個變量是否存在關聯,當拒絕原假設時,在統計上有把握認為兩個變量存在相關。但接下來的問題是,如果兩變量之間存在相關性,它們之間的關聯程度有多大?針對不同的變量類型,在SPSS中可以計算各種各樣的相關指標,而且Crosstabs過程也對此提供了完整的支持,此處只涉及兩分類變量間關聯程度的指標,更系統的相關程度指標見相關與回歸一章。8_八、卡方檢驗兩分類變量間關聯程度的度量相對危險度RR:是一個概率的比值,指試驗組人群反應陽性概率與對照組人群反應陽性概率的比值。數值為1,表明試驗因素與反應陽性無關聯;小于1時,表明試驗因素導致反應陽性的發生率降低;大于1時,表明試驗因素導致反應陽性的發生率增加。優勢比OR:是一個比值的比,是反應陽性人群中試驗因素有無的比例與反應陰性人群中試驗因素有無的比例之比。當關注的事件發生概率比較小時(<0.1),優勢比可作為相對危險度的近似。8_八、卡方檢驗兩分類變量間關聯程度的度量
例3
某公司實行數據庫營銷,其雜志銷售部每個月向數據庫中的人們發送征訂郵件,但是回應率極低。經研究發現,報紙訂閱(News)和郵件回應Response有相關性,該部門經理想了解報紙訂閱回應者回郵件的概率是非訂閱者的幾倍。數據文件見demo.sav。8_八、卡方檢驗兩分類變量間關聯程度的度量8_八、卡方檢驗兩分類變量間關聯程度的度量
分別指定行列變量到Row(s)和Columns中。8_八、卡方檢驗選中可得到RR值兩分類變量間關聯程度的度量8_八、卡方檢驗兩分類變量間關聯程度的度量分析結果
這就是兩變量的四格表。8_八、卡方檢驗兩分類變量間關聯程度的度量分析結果
結果顯示,報紙訂閱者對于郵件的回應概率是非報紙訂閱者的1.668倍,或者說無回應的概率是非報紙訂閱者的0.94倍。而OR值為1.774。8_八、卡方檢驗在Pearson卡方檢驗中,對行變量和列變量的相關性作檢驗,其中行變量和列變量是一個事物的兩個不同屬性。在實際中,還有一種列聯表,其行變量和列變量反映的是一個事物的同一屬性的相同水平,只是對該屬性各水平的區分方法不同。其特征是:行的數目和列的數目總是相同的。如果希望檢驗這兩種區分同一屬性的方法給出的結果是否一致,則不應當使用Pearson
2檢驗,而應該采用Kappa一致性檢驗對兩種方法一致程度進行評價。一致性檢驗8_八、卡方檢驗
一般認為,當Kappa≥0.75時,表明兩者一致性較好;
0.75>Kappa≥0.4時,表明一致性一般;
Kappa<0.4時,表明兩者一致性較差。一致性檢驗8_八、卡方檢驗
例4某實驗室分別用乳膠凝集法和免疫熒光法對58名可疑系統性紅斑狼瘡患者血清中抗核抗體進行測定,結果見下表,問兩種方法的檢測結果有無差別?(數據見McNemar.sav)免疫熒光法
乳膠凝集法
合計+
-+111223
-23335
合計134558兩種方法的檢測結果配對卡方檢驗8_八、卡方檢驗不能忘記哦!配對卡方檢驗8_八、卡方檢驗在此選入頻數變量即可進行下一步的分析。配對卡方檢驗8_八、卡方檢驗配對卡方檢驗8_八、卡方檢驗配對卡方檢驗選中可進行配對卡方檢驗8_八、卡方檢驗配對卡方檢驗分析結果8_八、卡方檢驗配對卡方檢驗分析結果
如果在statistics子對話框中勾選上Kappa復選框,則有以下結果:8_八、卡方檢驗
注意:
Kappa檢驗會利用列聯表的全部信息,而McNemar檢驗只會利用非主對角線單元格上的信息。因此,對于一致性較好,即絕大多數數據都在主對角線的大樣本列聯表,McNemar檢驗可能會失去實用價值。配對卡方檢驗8_八、卡方檢驗
例5
某零售連鎖店對3家分店的客戶滿意度進行了調查,現希望分析尋求幫助和性別之間有無聯系。(數據見cmh.sav)分層卡方檢驗8_八、卡方檢驗分層卡方檢驗選入分層變量store8_八、卡方檢驗分層卡方檢驗進行分層卡方檢驗8_八、卡方檢驗分層卡方檢驗
首先給出的是層間差異的檢驗,結果顯示,不同分店間,gender與contact的聯系是相同的。分析結果8_八、卡方檢驗分層卡方檢驗
分層卡方檢驗結果,即考慮了分層因素的影響以后,對gender與contact的檢驗結果,共給出CMH
2檢驗和MH
2檢驗兩種結果,前者是后者的改進,可見P值均小于0.05,即可認為性別與求助有關。分析結果8_八、卡方檢驗分層卡方檢驗
結果顯示,ORMH
值為0.636,表明去除了不同分店的混雜效應以后,和女性相比,男性顧客尋求幫助的優勢比為0.636,或者說更不容易尋求幫助。分析結果8_八、卡方檢驗1.卡方檢驗是以
2分布為基礎的一種常用假設檢驗方法,常用作計數資料的顯著性檢驗。其基本思想是:首先假設觀察頻數與期望頻數沒有差別。而統計量
2值表示觀察值與理論值之間的偏離程度。當n比較大時,2統計量近似服從k-1個自由度的2分布。在自由度固定時,每個2值與一個概率值相對應,此概率即為在H0假設成立的前提下,出現這樣一個樣本或更大差別樣本的概率。如果P值小于或等于顯著性水準,則應拒絕H0,接受H1。小結8_八、卡方檢驗2.關聯程度的測量:卡方檢驗從定性的角度分析是否存在相關,而各種關聯指標從定量的角度分析相關的程度大小。不同的指標適合不同類型的變量。RR值是一個概率的比值,是指試驗組人群反應陽性概率與對照組人群反應概率的比值。用于反映試驗因素與反應陽性的關聯程度。OR值是比值的比。是反應陽性人群中試驗因素有無的比例與反應陰性人群中試驗因素有無的比例之比。在下列兩個條件均滿足時,可用于估計RR值:①所關注的事件發生概率比較小(<0.1),②所設計的研究是病例對照研究。小結8_八、卡方檢驗3.Kap
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教學課件小圖案
- 易捷加油站運營及服務知識考試試卷
- 教學課件截圖模板下載
- 2024-2025學年云南省騰沖市第八中學高一下學期期中生物試題及答案
- 臺階教學設計和教學課件
- 染整過程中織物光澤度變化研究考核試卷
- 農產品營銷中的農民合作社發展模式考核試卷
- 農業機械產業循環經濟評價體系考核試卷
- 心房顫動課件
- 信用評級結果在信貸市場中的信息傳遞效率研究考核試卷
- TSG Z7002-2022特種設備檢測機構核準規則
- 裝修售后維修合同協議
- 2025年數字經濟下的創業政策調整策略試題及答案
- 第30課 在線安全防范-2024-2025學年三年級全一冊《信息技術》教案
- 政治 (道德與法治)八年級下冊自由平等的追求教案
- 山東省濟南市高新區學卷B2024-2025學年數學五下期末教學質量檢測試題含答案
- 訂單外發合同協議
- 山東省2024年藝術類本科批音樂類第1次志愿投檔情況表(公布)
- 《公路運營領域重大事故隱患判定標準》知識培訓
- 護理核心制度
- GB/T 45234.302-2025太陽能熱發電站第3-2部分:系統與部件大尺寸拋物面槽式集熱器通用要求與測試方法
評論
0/150
提交評論