非參數統計分析_第1頁
非參數統計分析_第2頁
非參數統計分析_第3頁
非參數統計分析_第4頁
非參數統計分析_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十三章 非參數統計分析統計推斷方法大體上可分為兩大類。第一大類為參數統計方法。常常在已知總體分布的條件下,對相應分布的總體參數進行估計和檢驗。第二大類為非參數統計方法,著眼點不是總體參數,而是總體的分布情況或者樣本所在總體分布的位置/形狀。非參數統計方法大約有8種,可被劃分為兩大類,處理各種不同情形的數據。單樣本情形:檢驗樣本所在總體的位置參數或者分布是否與已知理論值相同。 Chi-Square過程:針對二分類或者多分類資料例題1:見書P243。檢驗樣本分布情況是否與已知理論分布相同。運用卡方檢驗過程。 Binomial過程:針對二分類資料或者可轉變為二分類問題的資料。例題2 :見書P246

2、。檢驗某一比例是否與已知比例相等,運用二項分布過程。練習:質量監督部門對商店里面出售的某廠家的西洋參片進行了抽查。對于25包寫明為凈重100g的西洋參片的稱重結果為(單位:克),數據見非參數。Sav,人們懷疑廠家包裝的西洋參片份量不足,要求進行檢驗。Runs過程:用于檢驗樣本序列是否是隨機出現的。二分類資料和連續性資料均可。游程檢驗:游程的含義:假定下面是由0和1組成的一個這種變量的樣本:0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的0(或相同的1)在一起稱為一個游程(單獨的0或1也算)。這個數據中有4個0組成的游程和3個1組成的游

3、程。一共是R=7個游程。其中0的個數為m=15,而1的個數為n=10。游程檢驗的原理判斷數據序列是否是真隨機序列。該檢驗的原假設為數據是真隨機序列,備擇假設為非隨機序列,在原假設成立的情況下,游程的總數不應太多也不應太少。例題3: 見書P247。檢驗樣本數據是否是隨機出現的。例題4:從某裝瓶機出來的30盒化妝品的重量(單位克),數據見非參數.sav,為了看該裝瓶機是否工作正常。提示:實際需要驗證大于和小于中位數的個數是否是隨機的(零假設為這種個數的出現是隨機的)。1-ample-K S 過程原理:單樣本的Kolmogorov-Smirnov檢驗(K-S檢驗)方法主要針對連續性資料,是用來檢驗一

4、個樣本數據的觀測累積分布是否是已知的理論分布。這些作為零假設的理論分布在SPSS的選項中有正態分布,Poisson分布,均勻分布和指數分布等。應用:可以檢驗下述四種類型的分布:數據服從正態分布 :數據不服從正態分布:數據服從指數分布 :數據不服從指數分布:數據服從均勻分布 :數據不服從均勻分布:數據服從泊松分布 :數據不服從泊松分布例題5:見書249例題6:打開xuelin.sav分析數據是否服從正態分布例題7:檢驗x7是否服從均勻分布。數據見非參數.sav 雙樣本情形:檢驗兩個樣本所在總體的位置參數或者分布是否相同。(1)2 independent samples:針對2個獨立的樣本資料例題

5、8:見書P252檢驗方法:惠曼特尼檢驗(Mann-Whitney)。一種用于檢驗兩總體位置參數是否一致的方法,相當于參數檢驗中的t檢驗。柯爾摩洛哥夫斯密洛夫檢驗(簡稱)檢驗。主要用于檢驗兩總體分布是否一致。檢驗(Wald-Wolfowitz runs) :側重于檢驗兩總體分布是否相同,要求較為嚴格。例題9:下列哪一個企業職工的工資高?數據見非參數.sav (2) 2 related samples :針對配對資料例題:見書P254檢驗方法:Wilcoxon:根據配對資料的差值的秩進行的檢驗Sign:適合于兩分類資料McNemar:只適合于兩分類資料Marginal Homogeneity: 適

6、合于多分類資料例題:檢驗兩個小麥品種的優劣性,數據見非參數.sav 多樣本情形:檢驗多個樣本所在總體的位置參數或者分布是否相同。(1)K independent samples:針對多個獨立的樣本資料檢驗方法:葛斯卡爾瓦里斯Kruskal-Wallis例題:某公司的管理人員來自三所大學。該公司對三所大學的管理人員做了如下評分,評分在0到100,問:來自這三所大學的管理人員的表現有沒有差異。ABC8475587265787580809555627295659069727542練習:下面數據是游泳、打籃球、騎自行車等三種不同的運動在30分鐘內消耗的熱量。這些數據能否說明這三種運動消耗的熱量全部相等

7、。ABC306311289285364188319338221300315302320398201(2)K related samples :針對配對資料檢驗方法:Friedman/例1:為比較A、B、C、D、E五種藥物注射后產生的皮膚皰珍的大小,選取6只家兔并給每只家兔先后分別按隨機排列的次序注射這5種藥物。試驗結果(皰珍面積)如下表,這批數據能否說明這5種藥物注射后產生的皮膚面積大小有差異。12345617375676169792838199828587373607377687445864647177745777573598582練習:研究某項催眠技術與病人所處的環境有沒有關系。挑選8個病

8、人做試驗。共有4種環境:害怕、愉快、抑郁和平靜。讓每位病人在這四種環境下都用催眠技術催眠。一段時間后,測度試驗者的皮膚電壓值,數據如下:12345678123.157.610.523.611.954.62120.3222.753.29.719.613.847.113.623.6322.553.710.821.113.739.213.716.3422.653.18.321.613.33714.814.8KendallW -一致性系數。用于檢驗多個變量之間有沒有一致性。即是否有同時上升或下降的趨勢。原假設:不具備一致性(隨機)備擇假設:具備一致性(即同時上升或下降),非隨機例題:下面是4個獨立的環境研究單位對15個學校排序的結果,請分析這這種排序是否具有一致性。分析:實踐中常需要按照某些特別的性質來多次對一些個體進行評估或排序;比如幾個(m個)評估機構對一些(n個)學校進行排序。人們想要知道,這些機構的不同結果是否一致。如果很不一致,則該評估多少有些隨機,意義不大。換句話說,這里想要檢驗的原假設是:這些對于不同學校的排序

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論