實驗67社會統計學實驗-非參數檢驗_第1頁
實驗67社會統計學實驗-非參數檢驗_第2頁
實驗67社會統計學實驗-非參數檢驗_第3頁
實驗67社會統計學實驗-非參數檢驗_第4頁
實驗67社會統計學實驗-非參數檢驗_第5頁
已閱讀5頁,還剩23頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1參數假設檢驗要求總體的分布類型已知參數假設檢驗要求總體的分布類型已知非參數假設檢驗就是總體分布類型未知條件,對總體某非參數假設檢驗就是總體分布類型未知條件,對總體某些非參數信息進行假設檢驗。些非參數信息進行假設檢驗。幾種常用非參檢驗方法:幾種常用非參檢驗方法:擬合優度檢驗、獨立樣本非參數檢驗、相關樣本非參數檢驗。擬合優度檢驗、獨立樣本非參數檢驗、相關樣本非參數檢驗。 、卡方擬合優度檢驗、卡方擬合優度檢驗星期星期一一二二三三四四五五六六七七死亡人數死亡人數11191715161619試檢驗一周內各日的死亡危險性是否有差異?試檢驗一周內各日的死亡危險性是否有差異?某市星期一到星期日共某市星期一到

2、星期日共7天中各日居民的死亡平均數如表天中各日居民的死亡平均數如表5-1所示所示 變量基本要求:變量基本要求:一個頻數變量,變量類型為數值型,頻數變量需要加權處理;一個頻數變量,變量類型為數值型,頻數變量需要加權處理;一個分組變量,變量類型為數值型或字符型;一個分組變量,變量類型為數值型或字符型;本例定義兩個變量:本例定義兩個變量:“星期星期”和和“死亡人數死亡人數”,變量類型為數,變量類型為數值型。將死亡人數錄入值型。將死亡人數錄入“死亡人數死亡人數”變量;將星期錄入變量;將星期錄入“星期星期”變量。變量。菜單操作:菜單操作:1)變量加權主菜單)變量加權主菜單“數據數據”“加權個案加權個案”

3、,將頻數變量,將頻數變量“死亡死亡人數人數”選入選入“頻率變量頻率變量”框,點擊框,點擊“確定確定” 按鈕。按鈕。2)卡方擬合優度主菜單)卡方擬合優度主菜單“分析分析”“非參數檢驗非參數檢驗”“卡方卡方”,出,出現卡方擬合優度檢驗界面。現卡方擬合優度檢驗界面。【主要結果與分析主要結果與分析】星期星期觀察數觀察數期望數期望數殘差殘差11116.1-5.121916.12.931716.1.941516.1-1.151616.1-.161616.1-.171916.12.9Total113理論頻數理論頻數 卡方擬合優度檢驗結果卡方擬合優度檢驗結果 檢驗統計量檢驗統計量星期星期卡方卡方2.779ad

4、f6漸進顯著性漸進顯著性.836統計量統計量=2.779,伴隨概率,伴隨概率P值為值為0.836,大于檢驗水準,大于檢驗水準0.05。說明一周內各日的死亡危險性差異沒有統計學意義,因此可以說明一周內各日的死亡危險性差異沒有統計學意義,因此可以認定一周內各日的死亡危險性無差異。認定一周內各日的死亡危險性無差異。 二、兩個獨立樣本的非參數檢驗二、兩個獨立樣本的非參數檢驗兩個獨立樣本非參數檢驗是在對總體分布未知的情況下,通過兩個獨立樣本非參數檢驗是在對總體分布未知的情況下,通過樣本數據檢驗兩獨立樣本的對應總體分布或分布位置差異是否樣本數據檢驗兩獨立樣本的對應總體分布或分布位置差異是否有統計學意義。有

5、統計學意義。兩個獨立樣本非參數檢驗方法最常用兩個獨立樣本非參數檢驗方法最常用Mann-Whitney U 檢驗,檢驗,也稱為威爾科克遜(也稱為威爾科克遜(Wilcoxon W)等級秩和檢驗。)等級秩和檢驗。 秩和檢驗的原假設秩和檢驗的原假設H0:兩組獨立樣本來自的兩總體分布相同。:兩組獨立樣本來自的兩總體分布相同。 SPSS結果,當小樣本時,統計量以結果,當小樣本時,統計量以“Mann-Whitney U”給出,給出,伴隨概率伴隨概率P值以值以“精確顯著性精確顯著性(Exact Sig.)”給出。當大樣本時,給出。當大樣本時,統計量以統計量以“Z”給出,伴隨概率給出,伴隨概率P值以值以“漸近顯

6、著性漸近顯著性(Asymp. Sig.)” 測量鉛作業與非鉛作業工人的血鉛值(單位:測量鉛作業與非鉛作業工人的血鉛值(單位:mol/l) 鉛作業鉛作業0.820.870.971.211.642.082.13非鉛作業非鉛作業0.240.240.290.330.440.580.630.720.871.01試檢驗鉛作業與非鉛作業工人的血鉛值是否有差異?試檢驗鉛作業與非鉛作業工人的血鉛值是否有差異?【實驗目的實驗目的】兩獨立樣本秩和檢驗的基本思路和適用條件。兩獨立樣本秩和檢驗的基本思路和適用條件。【操作步驟操作步驟】一個(或多個)檢驗變量,變量類型為數值型;一個(或多個)檢驗變量,變量類型為數值型;一

7、個分組變量,變量類型為數值型。一個分組變量,變量類型為數值型。兩樣本數據全為檢驗變量取值,組別通過分組變量值(如兩樣本數據全為檢驗變量取值,組別通過分組變量值(如0,1或或1,2等)區分。等)區分。本例定義檢驗變量本例定義檢驗變量“血鉛值血鉛值”,分組變量,分組變量“是否鉛作業者是否鉛作業者”;將兩組血鉛值數據全部錄入檢驗變量,在分組變量中,鉛作業將兩組血鉛值數據全部錄入檢驗變量,在分組變量中,鉛作業者組錄入者組錄入1,非鉛作業者組錄入,非鉛作業者組錄入0。菜單操作:菜單操作:主菜單主菜單“分析分析”“非參數檢驗非參數檢驗” “兩獨立樣本兩獨立樣本”,出現兩獨立,出現兩獨立樣本檢驗界面。樣本檢

8、驗界面。參數設置:選擇變量參數設置:選擇變量“血鉛值血鉛值”進入進入“檢驗變量列表檢驗變量列表”框;選框;選擇變量擇變量“是否鉛作業者是否鉛作業者”進入進入“分組變量分組變量”框,并點擊框,并點擊“定義定義組組”按鈕,在按鈕,在“組組1”和和“組組2”框中分別輸入分組變量的兩個取框中分別輸入分組變量的兩個取值值1和和0。點擊點擊“確定確定”。兩獨立樣本檢驗界面兩獨立樣本檢驗界面 【主要結果與分析主要結果與分析】兩組秩均值結果兩組秩均值結果 秩秩是否鉛作業者是否鉛作業者N秩均值秩均值秩和秩和血鉛值血鉛值否否105.9559.50是是713.3693.50總數總數17秩和檢驗結果秩和檢驗結果 檢驗

9、統計量檢驗統計量b血鉛值血鉛值Mann-Whitney U4.500Wilcoxon W59.500Z-2.980漸近顯著性漸近顯著性(雙側雙側).003精確顯著性精確顯著性2*(單側顯著性)(單側顯著性).001aa. 沒有對結進行修正沒有對結進行修正b. 分組變量分組變量: 是否鉛作業者是否鉛作業者秩和檢驗結果秩和檢驗結果 鉛作業與非鉛作業兩組工人血鉛值的平均秩分別為鉛作業與非鉛作業兩組工人血鉛值的平均秩分別為13.36和和5.95,顯然鉛作業組血鉛值的平均秩較高。顯然鉛作業組血鉛值的平均秩較高。小樣本時的統計量值小樣本時的統計量值Mann-Whitney U為為4.5,伴隨概率,伴隨概率

10、P值為值為0.001,大樣本時統計量值,大樣本時統計量值Z為為-2.98,對應伴隨概率,對應伴隨概率P值為值為0.003。本例為小樣本應取前者,本例為小樣本應取前者,P值為值為0.001,遠小于檢驗水準,遠小于檢驗水準0.05,說明鉛作業工人和非鉛作業工人血鉛值之間的差異有統計學意說明鉛作業工人和非鉛作業工人血鉛值之間的差異有統計學意義,所以可以認為鉛作業與非鉛作業工人血鉛值有差異。義,所以可以認為鉛作業與非鉛作業工人血鉛值有差異。三、兩相關樣本的檢驗三、兩相關樣本的檢驗【統計學知識統計學知識】在總體分布不了解情況下,通過樣本數據檢驗在總體分布不了解情況下,通過樣本數據檢驗兩個相關樣本的總體分

11、布或分布位置差異是否有統計學意義。兩個相關樣本的總體分布或分布位置差異是否有統計學意義。兩個相關樣本最常用兩個相關樣本最常用Wilcoxon檢驗(即符號秩檢驗)。檢驗(即符號秩檢驗)。符號秩檢驗的原假設符號秩檢驗的原假設H0:兩相關樣本來自的兩總體分布相同。:兩相關樣本來自的兩總體分布相同。11名受試者分別服用兩種不同劑型的藥物,測得血藥濃度達峰名受試者分別服用兩種不同劑型的藥物,測得血藥濃度達峰時間(克時間(克/毫升)(經檢驗不服從正態分布毫升)(經檢驗不服從正態分布)劑型劑型A2.53.01.251.753.52.51.752.253.52.52.0劑型劑型B3.54.02.52.03.5

12、4.01.52.53.03.03.5試檢驗兩種劑型血藥濃度的達峰時間是否具有相同的分布?試檢驗兩種劑型血藥濃度的達峰時間是否具有相同的分布?【實驗目的實驗目的】理解兩相關樣本符號秩檢驗的基本思路和適用條件,掌握理解兩相關樣本符號秩檢驗的基本思路和適用條件,掌握SPSS軟件操作實現方法。軟件操作實現方法。【操作步驟操作步驟】一對(或多對)檢驗變量,變量類型為數值型。一對(或多對)檢驗變量,變量類型為數值型。兩樣本數據分別為兩個相關變量的取值。兩樣本數據分別為兩個相關變量的取值。定義兩個相關變量定義兩個相關變量“劑型劑型A達峰時間達峰時間”和和“劑型劑型B達峰時間達峰時間”,兩組數據分別錄入兩個相

13、關變量。兩組數據分別錄入兩個相關變量。菜單操作:菜單操作:主菜單主菜單“分析分析”“非參數檢驗非參數檢驗” “2個相關樣本個相關樣本”,出現兩關聯樣本檢驗界面。出現兩關聯樣本檢驗界面。參數設置:選擇參數設置:選擇“劑型劑型A達峰時間達峰時間”和和“劑型劑型B達峰時間達峰時間”進入進入“檢驗對檢驗對”框的框的“Variable1”和和“Variable2”; 點擊點擊“選項選項”按鈕,在按鈕,在“統計量統計量”區域,選區域,選“描述性描述性”;點擊;點擊“確定確定”。 主要結果與分析主要結果與分析 描述性統計量描述性統計量N均值均值標準差標準差極小值極小值極大值極大值劑型劑型A達峰時間達峰時間1

14、12.4091.718271.253.50劑型劑型B達峰時間達峰時間113.0000.806231.504.00檢驗統計量檢驗統計量b劑型劑型B達峰時間達峰時間 - 劑型劑型A達峰達峰時間時間Z-2.150a漸近顯著性漸近顯著性(雙側雙側).032a. 基于負秩。基于負秩。b. Wilcoxon 帶符號秩檢驗帶符號秩檢驗劑型劑型A達峰時間的均值為達峰時間的均值為2.4091,標準差為,標準差為0.71827,劑型,劑型B達達峰時間的均值為峰時間的均值為3.0,標準差為,標準差為0.80623。兩者差的統計量值兩者差的統計量值Z=-2.150,伴隨概率,伴隨概率P值為值為0.032,小于檢驗,小

15、于檢驗水準水準0.05,說明兩種劑型血藥濃度的達峰時間分布差異有統計,說明兩種劑型血藥濃度的達峰時間分布差異有統計學意義,可以認為兩種劑型血藥濃度的達峰時間不具有相同的學意義,可以認為兩種劑型血藥濃度的達峰時間不具有相同的分布分布四、列聯表資料的檢驗四、列聯表資料的檢驗 列聯表的行、列屬性變量取值都是計數資料,即定類(無序)資列聯表的行、列屬性變量取值都是計數資料,即定類(無序)資料或定序(有序)資料,可以將列聯表分為三種類型:料或定序(有序)資料,可以將列聯表分為三種類型:雙向無序列聯表、單向有序列聯表及雙向有序列聯表。雙向無序列聯表、單向有序列聯表及雙向有序列聯表。雙向無序列聯表的檢驗雙向

16、無序列聯表的檢驗 【統計學知識統計學知識】雙向無序列聯表檢驗主要有列聯表行、列屬性的獨立性檢驗。雙向無序列聯表檢驗主要有列聯表行、列屬性的獨立性檢驗。檢驗方法一般采用列聯表檢驗方法一般采用列聯表K.Pearson卡方檢驗。卡方檢驗。 原假設原假設H0:各樣本對應總體的總體率(構成比)相等:各樣本對應總體的總體率(構成比)相等(12=k)或列聯表的行列屬性獨立。)或列聯表的行列屬性獨立。雙向無序列聯表雙向無序列聯表K.Pearson卡方檢驗的統計量為卡方檢驗的統計量為 22211()(1)(1)ckijijijijoerce其中其中oij、eij分別為列聯表第分別為列聯表第i行第行第j列的實際頻

17、數和理論頻數,列的實際頻數和理論頻數,c、k分別為行列屬性的分類數目,分別為行列屬性的分類數目,r、c分別為列聯表的行、列數。分別為列聯表的行、列數。 研究觀察鼻咽癌患者與健康人的血型構成,試判斷患鼻咽癌是研究觀察鼻咽癌患者與健康人的血型構成,試判斷患鼻咽癌是否與血型有關否與血型有關 血型血型合計合計ABABO鼻咽鼻咽癌癌648613020300健康健康人人12513821026499合計合計18922434046799【實驗目的實驗目的】理解雙向無序列聯表理解雙向無序列聯表K.Pearson卡方檢驗的基本思路和適用條件,卡方檢驗的基本思路和適用條件,掌握其掌握其SPSS軟件操作實現方法。軟件

18、操作實現方法。【操作步驟操作步驟】根據樣本數據的形式不同,有兩種方式:根據樣本數據的形式不同,有兩種方式:一是樣本數據為原始數據,一是樣本數據為原始數據,這時要求行、列兩個待檢驗的屬性這時要求行、列兩個待檢驗的屬性變量,變量類型為數值型或字符型。變量,變量類型為數值型或字符型。兩樣本數據分別為行、列兩屬性變量的取值。兩樣本數據分別為行、列兩屬性變量的取值。二是匯總的列聯表數據,二是匯總的列聯表數據,這時要求三個變量:這時要求三個變量:頻數變量、頻數頻數變量、頻數所在的行變量及頻數所在的列變量所在的行變量及頻數所在的列變量。頻數變量需要加權處理。頻數變量需要加權處理。頻數變量的取值是列聯表的交叉

19、頻數頻數變量的取值是列聯表的交叉頻數行、列兩個屬性變量的取值是各頻數對應行和列。行、列兩個屬性變量的取值是各頻數對應行和列。本例為匯總列聯表數據,定義三個變量:本例為匯總列聯表數據,定義三個變量:頻數變量頻數變量“交叉頻數交叉頻數”錄入列聯表的所有頻數;錄入列聯表的所有頻數;“人群類別人群類別”和和“血型類別血型類別”分別錄入各頻數對應行和列。分別錄入各頻數對應行和列。 菜單操作:菜單操作:1)變量加權主菜單)變量加權主菜單“數據數據”“加權個案加權個案”,將頻數變量,將頻數變量“交叉交叉頻數頻數”選入選入“頻率變量頻率變量”框,點擊框,點擊“確定確定” 按鈕。按鈕。2)雙向無序列聯表的)雙向

20、無序列聯表的K.Pearson卡方檢驗主菜單卡方檢驗主菜單 “分析分析”“描描述統計述統計”“交叉表,出現交叉列聯表界面。交叉表,出現交叉列聯表界面。參數設置:參數設置:選擇行變量選擇行變量“人群類別人群類別”進入進入“行行”框框列變量列變量“血型類別血型類別”進入進入“列列”框;框; 點擊點擊“統計量統計量”按鈕,選按鈕,選“卡方卡方”,“名義名義”區域,選區域,選“相依系相依系數數”,點擊,點擊“確定確定”。 【主要結果與分析主要結果與分析】人群類別人群類別* 血型類別血型類別 交叉制表交叉制表計數計數血型類別血型類別合計合計1234人群人群類別類別1648613020300212513821026499合計合計18922434046799卡方檢驗卡方檢驗值值df漸進漸進 Sig. (雙側雙側)Pearson 卡方卡方1.921a3.589似然比似然比1.9243.588線性和線性組合線性和線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論