方差分析-多樣本均數_第1頁
方差分析-多樣本均數_第2頁
方差分析-多樣本均數_第3頁
方差分析-多樣本均數_第4頁
方差分析-多樣本均數_第5頁
已閱讀5頁,還剩64頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

方差分析(ANOVA)又稱

F

檢驗,其目的是推斷多組資料的總體均數是否相等。本章主要內容包括單因素方差分析(即完全隨機設計資料的方差分析)、兩因素方差分析(即隨機區組設計資料的方差分析)和三因素方差分析(即拉丁方設計資料的方差分析)及多個樣本均數間的多重比較。第九章多個樣本均數比較的方差分析

第一節方差分析的基本思想和應用條件

一、方差分析的基本思想

方差分析的基本思想借助以下例題予以說明:

例9-1為研究煤礦粉塵作業環境對塵肺的影響,將18只大鼠隨機分到甲、乙、丙3個組,每組6只,分別在地面辦公樓、煤炭倉庫和礦井下染塵,12周后測量大鼠全肺濕重(g),數據見表9—2,問不同環境下大鼠全肺濕重有無差別?

甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666

從以上資料可看出,三個組的數據各不相同,這種差異(總變異)可以分解成兩部分:即

(1)組間變異:甲、乙、丙三個組大鼠全肺濕重各不相等(此變異反映了處理因素的作用,以及隨機誤差的作用)

(2)組內變異:各組內部大鼠的全肺濕重各不相等(此變異主要反映的是隨機誤差的作用)各部分變異的計算:

①總變異(全部試驗數據間大小不等)用總離均差平方和來表示。

其中

甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666

②組間變異(由于所接受的處理因素不同而致各組間大小不等)用組間離均差平方和來表示。

各組均數之間相差越大,它們與總均數的差值就越大,越大;反之,越小。甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666③組內變異(同一處理組內部試驗數據大小不等)用組內離均差平方和來表示。

三個變異之間的關系:

其中:

離均差平方和只能反映變異的絕對大小。變異程度除與離均差平方和的大小有關外,還與其自由度有關,由于各部分自由度不相等,因此各部分離均差平方和不能直接比較,須除以相應的自由度,該比值稱均方差,簡稱均方(MS)。

的大小就反映了各部分變異的平均大小。

方差分析就是通過比較組內均方和組間均方的大小關系來判斷處理因素有無效應。

檢驗統計量:

如果各組的總體均數相等,即無處理因素的作用,則組內變異和組間變異都只反映隨機誤差的大小,此時組間均方和組內均方大小相當,即F值則接近1,各組均數間的差異沒有統計學意義;反之,如果處理有作用,則組間變異不僅包含隨機誤差,還有處理因素引起的變異(組間變異主要反映處理因素的作用),此時組間均方遠大于組內均方,則F值遠大于1,各組均數間的差異有統計學意義。故依據

F值的大小可判斷各組之間有無差別。

可見,方差分析的基本思想就是根據實驗設計的類型,將全部測量值總的變異分解成兩個或多個部分,每個部分的變異可由某個因素的作用(或某幾個因素的作用)加以解釋,通過比較各部分的均方與隨機誤差項均方的大小,借助

F

分布來推斷各研究因素對實驗結果有無影響。二、方差分析的應用條件(1)各觀測值相互獨立,并且服從正態分布;(2)各組總體方差相等,即方差齊性。第二節完全隨機設計資料的方差分析一、完全隨機設計完全隨機設計是采用完全隨機化的分組方法,將全部試驗對象分配到g個處理組,各處理組分別接受不同的處理,試驗結束后比較各組均數之間差別有無統計學意義,以推斷處理因素的效應。二、變異分解

完全隨機設計資料的方差分析表變異來源自由度SSMSF

總變異

組間

組內

例9-1

試根據表9-2的試驗結果,檢驗三組大鼠全肺濕重的總體均數是否相同。解:

(1)建立假設,并確定檢驗水準。

H0:

H1:

不等或不全相等

三、分析步驟(2)計算F值表9-2三組大鼠的全肺濕重(g)

本例

,以上計算結果代入方差分析表,并求出相應的MS

及F

值:表9-3例9-1的方差分析表變異來源SSv

MSF

值P值組

間2.528

21.2644.70<0.05組

內4.03515

0.269總6.56317(3)查F界值表,確定P值并作結論。

由附表

5

查得F0.05(2,15)=3.68,F=4.70>

F0.05(2,15),故P<0.05,按=0.05水準拒絕H0,接受H1,差別有統計學意義,可認為不同粉塵環境影響大鼠的全肺濕重。當g=2時,方差分析的結果與兩樣本均數比較的t

檢驗等價,且有。第三節隨機區組設計資料的方差分析

一、隨機區組設計隨機區組設計(randomizedblockdesign),又稱配伍組設計,是配對設計的擴展。具體做法是:先按影響試驗結果的非處理因素將受試對象配成區組(block),再將各區組內的受試對象隨機分配到不同的處理組,各處理組分別接受不同的處理,試驗結束后比較各組均數之間差別有無統計學意義,以推斷處理因素的效應。該設計的特點:(1)該設計包含兩個因素,一個是區組因素,一個是處理因素;(2)各區組及處理組的受試對象數相等,各處理組的受試對象生物學特性較均衡,可減少試驗誤差,提高假設檢驗的效率。此類資料的方差分析,其應用條件同前:即資料滿足正態性及方差齊性的要求。

因為隨機區組設計可以將區組間變異從完全隨機設計的組內變異中分離出來以反映不同區組對結果的影響,所以隨機區組設計全部測量值總的變異相應地就分成三部分。

各種變異之間的關系是:

其中:

二、

變異分解(1)總變異:反映全部試驗數據間大小不等的狀況,(2)處理組間變異:甲、乙、丙三個組間測量值的均數大小不等,(3)區組間變異:12個區組間測量值的均數大小不等,(4)誤差變異:反映隨機誤差產生的變異,表9-5隨機區組設計的方差分析表

變異來源自由度SSMSF

總變異處理間區組間

誤差二、分析步驟

結合例9-2:

例9-2研究甲、乙、丙三種營養素對小白鼠體重增加的影響,已知窩別為影響因素。擬用6窩小白鼠,每窩3只,隨機地安排喂養甲、乙、丙三種營養素之一種,8周后觀察小白鼠體重增加情況,數據見表9-6。問:(1)不同營養素之間小白鼠的體重增加是否不同?(2)不同窩別之間小白鼠的體重增加是否不同?表9-6三種營養素喂養小白鼠所增體重(g)

窩別號甲營養素乙營養素丙營養素164657325354593716879441463855058656424046(1)建立假設、確定檢驗水準。處理:H0:甲=乙=丙(三種營養素對小白鼠體重增加作用相同)H1:甲,乙,丙不全相等(三種營養素對小白鼠體重增加作用不全相同)區組:H0:1=2=…=6(窩別對小白鼠體重增加無影響)H1:1,2,…,6不全相等(窩別對小白鼠體重增加有影響)

(2)計算檢驗統計量F

值。計算各處理組的小計,各區組的小計,見表9-6。表9-6三種營養素喂養小白鼠所增體重(g)

窩別號甲營養素乙營養素丙營養素區組合計(Bj)1646573

2022535459

1663716879

2184414638

1255505865

1736424046

128處理組合計(Ti)321331360

10121789118845228365957253.555.260.056.22本例,表9-2例9-2方差分析表變異來源

SSV

MS

FP處理組間136.778

268.3894.24<0.05區組間2377.1115475.42229.49<0.01誤差161.2221016.122總變異2675.11117①處理因素:查F界值表,,因,故

P<0.05

。結論:按α=0.05

水準,拒絕H0,接受H1,差別有統計學意義,可認為不同營養素對小白鼠體重增加有影響。②區組因素:查F界值表,

,,F>F

0.01(5,10),故P<0.05。結論:按α=0.05水準,拒絕H0,接受H1,差別有統計學意義,可認為不同窩別對小白鼠體重增加有影響。(3)查F界值表,確定P

值并作結論。隨機區組設計的優點是,從組內變異中分離出區組變異從而減少了誤差均方,使處理組間的F

值更容易出現顯著性,即提高了統計檢驗效率。當g=2時,隨機區組設計方差分析與配對設計資料的t

檢驗等價,有t2=F。第四節拉丁方設計資料的方差分析

一、拉丁方設計完全隨機設計只涉及到一個處理因素;隨機區組設計涉及一個處理因素和一個區組因素。若實驗涉及一個處理因素和兩個控制因素,而且每個因素的水平數相等,此時可采用拉丁方設計來安排實驗,將兩個控制因素分別安排在拉丁方的行和列上。4×4ABCDDABCCDABBCDA拉丁方是由g個拉丁字母排成的g×g方陣,每行或每列中每個字母都只出現一次,這樣的方陣稱為g階拉丁方。拉丁方設計是在隨機區組設計的基礎上發展的,它可多安排一個已知的對實驗結果有影響的非處理因素,提高了效率。應用時,根據水平數g

來選定拉丁方大小。3×34×45×5ABCCABBCAABCDDABCCDABBCDAABCDEEABCDDEABCCDEABBCDEA

例9-3研究A、B、C、D四種食品,以及甲、乙、丙、丁四種加工方法對小白鼠增體重的影響。擬用4窩大鼠,每窩4只,每只小白鼠隨機喂養一種食品、隨機采用一種加工方法;8周后觀察大鼠增體重情況。實驗結果如表9-9所示。問:(1)食品種類是否影響大鼠體重增加?(2)食品加工方法是否影響大鼠增體重?(3)不同窩別的大鼠體重增加是否不同?區組號甲乙丙丁180(D)70(B)51(C)48(A)247(A)75(C)78(D)45(B)348(B)80(D)47(A)52(C)446(C)81(A)49(B)77(D)表9-9四種食品及四種加工方法喂養大鼠所增體重(g)4×4ABCDDABCCDABBCDA二、變異分解表9-8拉丁方設計資料的方差分析表

表中C為校正數,、、分別為不同處理、行區組、列區組的合計。三、分析步驟例9-3問:(1)食品種類是否影響大鼠體重增加?(2)食品加工方法是否影響大鼠增體重?(3)不同窩別的大鼠體重增加是否不同?表9-9四種食品及四種加工方法喂養大鼠所增體重(g)解:

(1)建立檢驗假設,確定檢驗水準H處理0:A=B=C=D

即四種食品對大鼠體重增加相同

H處理1:A,B,C,D不全相等即四種食品對大鼠體重增加不全相同H行0:1=2=3=4

即不同窩別大鼠體重增加相同

H行1:1,2,3,4不全相等即不同窩別大鼠體重增加不全相同H列0:甲=乙=丙=丁

即不同加工方法對大鼠體重增加相同

H列1:甲,乙,丙,丁不全相等即不同加工方法對大鼠體重增加不全相同

=0.05

(2)計算檢驗統計量

=62772-59292.25=3479.75

(2232+2122+2242+3152)-59292.25=1726.25

(2492+2452+2272+2532)-59292.25=98.75(2212+3062+2252+2222)-59292.25=1304.25

=3479.75-1726.25-98.75-1304.25=350.5

表9-10例9-3方差分析表變異來源

SSV

MS

FP處理間1726.25

3575.4179.85<0.01行區組98.75332.9170.56>0.05列區組1304.253434.7507.44<0.05誤差350.50658.417總3479.7515(3)確定P值,作出推斷結論①對處理:以處理=3和誤差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.01,按=0.05水準拒絕H0,接受H1,差別有統計學意義,可認為食品種類能影響大鼠增重。②對行區組:以行=3和誤差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P>0.05,按=0.05水準不拒絕H0,差別無統計學意義,尚不能認為不同窩別可影響大鼠增重。③對列區組:以列=3和誤差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.05,按=0.05水準拒絕H0,接受H1,差別有統計學意義,可認為食品加工方法會影響大鼠增重。拉丁方設計的要求:

①一定是三因素,且三因素水平數相等;②行間、列間、處理間均無交互作用;③各行、列、處理的方差齊。拉丁方設計的優缺點:

優點是可同時研究三個因素,減少實驗次數。從組內變異中不但分離出行區組變異,而且還分離出列區組變異,使誤差變異進一步減小。缺點是要求處理組數與所要控制的兩個因素水平數相等,一般實驗不容易滿足此條件,而且數據缺失會增加統計分析的難度。第五節多個均數間的兩兩比較

經過方差分析,若拒絕了檢驗假設H0,只能說明多個總體均數不等或不全相等。若要得到各組均數間更詳細的信息,應在方差分析的基礎上進行多個樣本均數的兩兩比較。多重比較常用的方法有:SNK-q檢驗、LSD-t

檢驗和Dunnett-t

檢驗。一、SNK-q檢驗

SNK(Student-Newman-Keuls)檢驗,亦稱q

檢驗,適用于多個均數兩兩之間的全面比較。檢驗統計量q

的計算公式為:

例9-4例9-1經

F檢驗結論有統計學意義,試用SNK-q檢驗方法對三組均數進行多重比較。解:

(1)建立假設,確定檢驗水準。

H0

:(對比組總體均數相等);

H1

:(對比組總體均數不等);

(2)計算檢驗統計量q值。

①計算差值的標準誤:本例nA=nB=6,MS誤差=MS組內=0.269

②將三個樣本均數從小到大排序,并賦予秩次:均數3.8174.2334.733

組別甲組乙組丙組秩次(R)

123

③列表計算檢驗統計量q

值:表9-12例9-1的3個樣本均數兩兩比較的q檢驗

(3)確定P值,作出推斷結論 以誤差=15及組數

a

q

界值表,并確定

P

值,填入表9-12。

結論:甲組與丙組(“1與3”)比較P<0.05,按=0.05水準拒絕H0,接受H1,有統計學意義,可認為甲組(辦公樓)全肺濕重小于丙組(礦井);其余對比組之間比較均P>0.05,按=0.05水準不拒絕H0。因此,可認為礦井下環境會造成肺功能損害。

二、Dunnett-t

檢驗

Dunnett–t檢驗適用于多個實驗組與一個對照組均數差別的多重比較。檢驗統計量為:

例9-5例9-2中甲組是對照組,研究目的是比較乙營養素和丙營養素是否比甲營養素多增加體重,經F檢驗結論有統計學意義,試用Dunnett-t檢驗方法對三組均數進行多重比較。解:

(1)建立假設,確定檢驗水準。

H0:

(所比較實驗組與對照組總體均數相等)

H1:(所比較實驗組與對照組總體均數不等)

(2)計算檢驗統計量Dunnett-t值。

①本例

nT=nC=6,MS誤差=16.122,則差值的標準誤為

2.318

②列表計算tD

統計量,如表9-13所示。

(3)確定P值,作出推斷結論。

以及處理數T=2查Dunnett-t

檢驗界值表,并確定P值,填入表9-13。丙組與甲組比較P<0.05,按=0.05水準拒絕H0,接受H1,有統計學意義,可認為丙營養素比對照組體重增加更多。但乙組與甲組比較P>0.05,沒有統計學意義,按=0.05水準不拒絕H0,尚不能認為乙營養素與對照組增加體重不同。

表9-13例9-2的2個處理組與對照組均數比較的tD檢驗三、LSD-t

檢驗

LSD-t

檢驗即最小顯著差異t

檢驗,適用于一對或幾對在專業上有特殊意義的樣本均數間的比較。檢驗統計量

t

的計算公式為:

LSD-

例9-6例9-3中食品種類是否影響大鼠增體重,研究目的只為比較A食品與B食品,C食品與D食品便可;多組間經F檢驗結論有統計學意義,試用LSD-t檢驗方法對這兩對均數進行多重比較。 檢驗步驟為:

(1)建立檢驗假設,確定檢驗水準

H0:A=

B即所研究的兩個對比組的總體均數相等

H1:A≠

B即所研究的兩個對比組的總體均數不等

=0.05

(2)計算檢驗統計量

本例

nA=nB=4,MS誤差=58.417,=誤差=6

②計算統計量LSD-t值,如表9-14所示。

(3)確定P值,作出推斷結論

以誤差=6查t界值表,并確定P值,填入表9-14。由表9-14得A食品與B食品比較P>0.05,按=0.05水準,不拒絕H0,無統計學意義,還不能認為A食品和工食品增體重不同。但C食品與D食品比較P<0.01,按=0.05水準,拒絕H0,有統計學意義,可認為C食品增體重不如D食品。

表9-14例9-3的兩個對子均數比較的LSD-t檢驗

上述三種方法均基于方差分析中估計的誤差均方,這是與t檢驗最大的不同之處。這三種方法是一致的,但并非等價,結果略有差別。由于統計軟件可同時作十幾種多重比較檢驗,應用中應根據統計設計和專業知識考慮來確定采用哪一種方法,不能多種方法一起使用,然后選取“有利”的結果。第五節多組樣本的方差齊性檢驗方差分析的一個應用條件是相互比較的各樣本的總體方差相等,即具有方差齊性,這就需要在作方差分析之前,先對資料的方差齊性進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論