【統計分析】非參數檢驗課件_第1頁
【統計分析】非參數檢驗課件_第2頁
【統計分析】非參數檢驗課件_第3頁
【統計分析】非參數檢驗課件_第4頁
【統計分析】非參數檢驗課件_第5頁
已閱讀5頁,還剩46頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十章 非參數檢驗Nonparametric Test復習參數:描述總體特征的統計指標(、)統計量:描述樣本特征的統計指標( 、s、p) 參數統計:已知樣本來自的總體分布類型(如正態總體),在此基礎上用樣本統計量對總體參數進行推斷或檢驗的統計分析方法。非參數統計:有許多資料不符合參數統計的要求,分布未知,不能用參數統計的方法進行檢驗,而需要一種不依賴于總體分布類型,也不對總體參數進行統計推斷的假設檢驗,而是對總體的分布或分布位置進行檢驗,稱為非參數檢驗。 參數檢驗與非參數檢驗比較參數檢驗 非參檢驗 要求資料服從正態分布 對資料的沒有特殊要求,總體為偏態、總體分布未知的計量資料(尤其在n0.05

2、 當n25時,可用正態近似法計算z值,確定p值。當相同秩次較多時z值需進行校正。基本思想如果H0成立,即兩總體無差異,在理論上的樣本的正負秩和相等,即T值應為總秩和(T總= n(n+1)/2)的一半,即T+= T- =n(n+1)/4。T值在界值范圍內,p0.05,不拒絕H0,當T值在界值上或界值范圍外, p0.05 ,H0成立的概率很小,拒絕它,認為兩總體分布不同。例10-1 不同劑量組小鼠負重游泳時間(分)樣品號中劑量高劑量差值秩次114.0015.20-1.2-4213.005.507.58.5315.0014.001.02.5417.006.5010.5012513.005.507.5

3、08.5618.0013.504.505717.5010.007.508.5810.2010.200.00-910.0010.000.00-1010.509.501.002.5111213.803.036.803.487.00-0.456-11315.205.509.70111416.509.007.508.5步驟建立假設:H0:差值的總體中位數=0, H1:差值的總體中位數0; =0.05計算統計量 計算差值d,由小到大的順序編秩次,并冠以原d的正負號,然后分別求正負秩和,得到T+=73,T-=5,取秩和較小者作為檢驗統計量T=5查表及結論 n=12,查T界值表T0.05(12)=1365,

4、P0.05,拒絕H0。單樣本資料的符號秩和檢驗已知某地正常人尿氟含量的中位數為2.15mmol/L。今在該地某廠隨機抽取12名工人,測得尿氟含量,問該廠工人的尿氟含量是否高于當地正常人?12名工人尿氟含量測定結果尿氟含量差值d秩次尿氟含量差值d秩次2.1502.620.4762.10-0.05-2.52.720.5772.200.052.52.990.8482.12-0.03-13.191.0492.420.2743.371.22102.520.3754.572.4211建立假設 H0:差值總體中位數為0 H1:差值總體中位數不為0; =0.05計算統計量: T+=62.5,T-=3.5查表與

5、結論 查T界值表,T0.05(11)=1056,T=3.5,在界值范圍外,P0.05,拒絕H0。符號檢驗(Sign test)二、兩樣本比較的秩和檢驗 (Wilcoxon法)適用條件:完全隨機設計的兩個樣本比較,若不滿足參數檢驗的應用條件,則用本法;兩個等級資料比較。 基本思想:如果H0成立,兩樣本來自分布相同的總體,兩樣本的平均秩次應相等或很接近,與總的平均秩次(N+1)/2相差較小。含量為n1樣本的秩和T1應在n1(N+1)/2的左右變化。若T值偏離此值太遠,H0發生的可能性就很小。若偏離出給定的值所確定的范圍時,即P ,拒絕H0 例10-3 兩種療法的退熱時間 新療法傳統療法退熱時間秩次

6、退熱時間秩次25136530240932344113544813.53765015397.55616397.5591742106018461264194813.51952024021n1=10T1=66.5n2=11T2=164.5步驟1.建立假設: H0:兩總體分布相同 H1:兩總體分布不同 =0.052.計算統計量 兩組數據從小到大混合編秩。注意:遇不同組相同數據,取平均秩次。求出兩組秩和,T1+T2=N(N+1)/2=66.5+164.5=21(21+1)/2進行核對,計算無誤,以樣本含量較小組的秩和作為檢驗統計量T,T1=66.53.查表及結論 n=n2-n1,查T界值表T0.01(0

7、)=73147, T1 =66.5落在界值范圍外,所以P0.01,拒絕H0.編秩 A組: 、+、+、+、+B組: +、+、+、+、+、+A組:- + + + +B組: + + + + + + 1 2 3 4 5 76 8 9 10 11 12 1 2 4.5 4.5 4.5 8.54.5 8.5 8.5 8.5 11.5 11.5 秩和 A組: 、+、+、+、 + 秩和: 1 2 4.5 4.5 4.5 8.5 TA25 B組: +、+、+、+、+、+ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB53 TA+TB=N(N+1)/2=78例10-4 兩種藥物對腎小球腎病的療效

8、比較步驟1.建立假設:H0:兩總體分布相同, H1:兩總體分布不同; =0.052.計算檢驗統計量:取較小樣本的秩和作為檢驗統計量T,T=7663,3.z0.05=1.96 ,P0.05,拒絕H0,認為總體分布不同。三、多組獨立樣本的秩和檢驗Kruskal-Wallis法適用條件:完全隨機設計的多個樣本比較,若不滿足參數檢驗的應用條件,則用本法;多個等級資料比較。步驟 1.建立假設,確定檢驗水準 H0:多個總體分布相同。 H1:多個總體分布不全相同。2.編秩:多組數據從小到大混合編秩。注意:遇不同組相同數據,取平均秩次。3.求各組秩和:將各組秩次相加,即Ri,i表示組號。步驟 4.計算檢驗統計

9、量:相同秩次太多時,上式需校正。5.確定p值,得出結論: (1)當k=3,每組例數5,查H界值表。 (2)k3,ni5,近似服從 2的分布,查2界值表。 H 的校正與2近似當有相同秩次時,H 需校正: 當 n 較大時, H 近似服從 = k 1 的 2 分布。 故可按 2 分布獲得概率 P,作出統計推斷。例10-5見書P175數據例10-6 3類患者肺切除術針麻效果的比較步驟 1.建立假設,確定檢驗水準 H0:3個總體分布相同。 H1:3個總體分布不全相同。2.編秩:3.求各組秩和:得T1=8815.5 T2=17254.5 T3=227584.計算檢驗統計量:5.確定p值,得出結論:查2界值

10、表,P0.05,拒絕H0。 隨機化區組設計資料的秩和檢驗Friedman法例10-8在某項隨機化區組設計的動物實驗中,不同種系雌性大白鼠注射不同劑量雌激素后子宮重量(g)如表10-9,試比較3個劑量組雌性大白鼠子宮重量的差別有無統計學意義。表10-9 不同種系雌性大白鼠注射不同劑量雌激素后子宮重量(g)種系雌激素注射劑量(g/100g體重)0.20.40.8甲106(1)116(2)145(3)乙68(2) 42(1)115(3)丙70(1)111 (2)133(3)丁42(1) 87(3) 63(2)5811步驟1.建立假設,確定檢驗水準 H0:多個總體分布相同 H1:多個總體分布不全相同2

11、.編秩:先將各區組的數據從小到大編秩,遇相同數據,取平均秩次。再將各處理組的秩次相加,得到各處理組的秩和Rj。3.計算檢驗統計量M :4.確定P值,得出結論:(1)查表法(當b15,k 15),查M界值表。 (2)超出M界值表的范圍時,可采用近似2分布法本例區組數4,處理數4,查附表14得:M0.05(3,4)26,M=180.05,不拒絕H0。完全隨機設計秩和檢驗的多重比較1.SPSS下的兩組比較確切概率值(exact)2.正態近似法檢驗水準的調整/比較的次數兩兩比較實驗與對照比較隨機區組設計秩和檢驗的多重比較(1)精確法:樣本含量較小時,應采用配對設計的秩和檢驗方法,求得統計量的數值后,借

12、助SAS或SPSS軟件的“exact”功能得到相應的P值。(2)正態近似法:樣本含量較大時,計算Z值檢驗水準的調整/比較的次數兩兩比較實驗與對照比較秩和檢驗的正確應用主要對等級資料進行分析;秩和檢驗可用于任意分布(distribution free)的資料;T檢驗與H檢驗的關系 H檢驗 T檢驗 K=2 F檢驗 t檢驗秩和檢驗用于定量資料 計量資料中: 極度偏態資料,或個別數值偏離過大 各組離散度相差懸殊 資料中含有不確定值 大于5年 0.001 1:1024以上 兼有等級和定量性質的資料完全隨機設計兩樣本比較如資料滿足 t 檢驗的條件,應該用 t 檢驗進行分析。此時,如果對這類資料用Wilco

13、xon秩和檢驗,實際上是將觀察單位的具體數值舍棄不用,只保留了秩次的信息,使檢驗功效降低;尤其樣本含量較小時,降低更加明顯。 如資料不滿足 t 檢驗的條件,而用了t 檢驗,同樣降低了檢驗效能。參數統計和非參數統計優缺點參數統計優點: 對資料的分析利用充分, 統計分析的效率高缺點: 對資料的要求高, 適用范圍有限非參數統計優點: 對資料的沒有特殊要求 不受分布的影響(偏態、分布不明的資料) 不受方差齊性的限制 不受變量類型的影響 不受樣本量的影響缺點: 檢驗效率低(易犯型錯誤) 對信息的利用不充分等級資料秩和檢驗與2檢驗的區別等級資料的形式與計數資料的形式非常相似,所不同在于一個有量的成份,一個無量的成份。小結 了解非參數檢驗的概念,熟悉其應用范圍及條件 ,重點掌握配對設計,成組設計兩樣本,成組設計多樣本的秩和檢驗方法。習題1.配對比較的秩和檢驗的基本思想是:如果假設檢驗成立,則對樣本來說:A.正秩和的絕對值大于負秩和的絕對值B.正秩和的絕對值小于負秩和的絕對值C.正秩和的絕對值與負秩和的絕對值不會相差很大D.正秩和的絕對值與負秩和的絕對值相等E.正秩和的絕對值與負秩和的絕對值相差很大2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論