多個樣本均數比較的方差分析詳解演示文稿_第1頁
多個樣本均數比較的方差分析詳解演示文稿_第2頁
多個樣本均數比較的方差分析詳解演示文稿_第3頁
多個樣本均數比較的方差分析詳解演示文稿_第4頁
多個樣本均數比較的方差分析詳解演示文稿_第5頁
已閱讀5頁,還剩111頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多個樣本均數比較的方差分析詳解演示文稿1當前1頁,總共116頁。(優選)多個樣本均數比較的方差分析2當前2頁,總共116頁。

例如,有4個樣本均數,兩兩組合數為,若用t檢驗做6次比較,且每次比較的檢驗水準定為α=0.05,則每次比較不犯Ⅰ類錯誤的概率為(1-0.05),6次均不犯Ⅰ類錯誤的概率為,這時,總的檢驗水準變為,遠比0.05大。因此,樣本均數間的多重比較不能用兩樣本均數比較的t檢驗。當前3頁,總共116頁。

ANOVA由英國統計學家首創,為紀念Fisher,以F命名,故方差分析又稱F檢驗(Ftest)。用于推斷多個總體均數有無差異

當前4頁,總共116頁。

Content1.方差分析的基本思想及應用條件2.完全隨機設計資料的方差分析3.隨機區組設計資料的方差分析4.拉丁方設計資料的方差分析5.兩階段交叉設計資料的方差分析6.多個樣本均數間的多重比較7.多樣本方差比較的Bartlett檢驗和Levene檢驗

當前5頁,總共116頁。

Content1.Basicidealandapplicationconditions2.ANOVAofcompletelyrandomdesigneddata

3.ANOVAofrandomizedblockdesigneddata4.ANOVAoflatinsquaredesigneddata

5.ANOVAofcross-overdesigneddata

6.Multiplecomparisonofsamplemeans7.BartletttestandLevenetest當前6頁,總共116頁。第一節方差分析的基本思想及其應用條件當前7頁,總共116頁。目的:推斷多個總體均數是否有差別。

也可用于兩個

方法:方差分析,即多個樣本均數比較的F檢驗。基本思想:根據資料設計的類型及研究目的,可將總變異分解為兩個或多個部分,每個部分的變異可由某因素的作用來解釋。通過比較可能由某因素所至的變異與隨機誤差,即可了解該因素對測定結果有無影響。當前8頁,總共116頁。應用條件:總體——正態且方差相等

樣本——獨立、隨機設計類型:完全隨機設計資料的方差分析隨機區組設計資料的方差分析拉丁方設計資料的方差分析兩階段交叉設計資料的方差分析當前9頁,總共116頁。完全隨機設計資料的方差分析的基本思想

合計

NS:第i個處理組第j個觀察結果當前10頁,總共116頁。記總均數為,各處理組均數為,總例數為N=nl+n2+…+ng,g為處理組數。

當前11頁,總共116頁。例6.1擬探討枸杞多糖(LBP)對酒精性脂肪肝大鼠GSH(mg/gprot)的影響,將36只大鼠隨機分為甲、乙、丙三組,其中甲(正常對照組)12只,其余24只用乙醇灌胃10周造成大鼠慢性酒精性脂肪肝模型后,再隨機分為2組,乙(LBP治療組)12只,丙(戒酒組)12只,8周后測量三組GSH值。試問三種處理方式大鼠的GSH值是否相同?

§1.One-wayanalysisofvariance(completelyrandomdesignANOVA)單因素方差分析(完全隨機設計方差分析)總變異組內變異組間變異當前12頁,總共116頁。三種“變異”之間的關系離均差平方和分解:當前13頁,總共116頁。1.總變異:全部測量值大小不同,這種變異稱為總變異。總變異的大小可以用離均差平方和(sumofsquaresofdeviationsfrommean,SS)表示,即各測量值Xij與總均數差值的平方和,記為SS總。總變異SS總反映了所有測量值之間總的變異程度。當前14頁,總共116頁。計算公式為其中:當前15頁,總共116頁。2.組間變異:各處理組由于接受處理的水平不同,各組的樣本均數

(i=1,2,…,g)也大小不等,這種變異稱為組間變異。其大小可用各組均數與總均數的離均差平方和表示,記為SS組間。當前16頁,總共116頁。計算公式為當前17頁,總共116頁。3.組內變異:在同一處理組中,雖然每個受試對象接受的處理相同,但測量值仍各不相同,這種變異稱為組內變異(誤差)。組內變異可用組內各測量值Xij與其所在組的均數的差值的平方和表示,記為SS組內,表示隨機誤差的影響。當前18頁,總共116頁。

當前19頁,總共116頁。三種變異的關系:當前20頁,總共116頁。

均方差,均方(meansquare,MS)。當前21頁,總共116頁。檢驗統計量:如果,則都為隨機誤差的估計,F值應接近于1。如果不全相等,F值將明顯大于1。用F界值(單側界值)確定P值。當前22頁,總共116頁。第二節完全隨機設計資料的方差分析當前23頁,總共116頁。

(completelyrandomdesign)是采用完全隨機化的分組方法,將全部試驗對象分配到g個處理組(水平組),各組分別接受不同的處理,試驗結束后比較各組均數之間的差別有無統計學意義,推論處理因素的效應。一、完全隨機設計當前24頁,總共116頁。

例4-1

某醫生為了研究一種降血脂新藥的臨床療效,按統一納入標準選擇120名患者,采用完全隨機設計方法將患者等分為4組進行雙盲試驗。問如何進行分組?當前25頁,總共116頁。(1)完全隨機分組方法:

1.編號:120名高血脂患者從1開始到120,見表4-2第1行(P72);2.取隨機數字:從附表15中的任一行任一列開始,如第5行第7列開始,依次讀取三位數作為一個隨機數錄于編號下,見表4-2第2行;當前26頁,總共116頁。3.編序號:將全部隨機數字從小到大(數據相同則按先后順序)編序號,見表4-2第3行。4.事先規定:序號1-30為甲組,序號31-60為乙組,序號61-90為丙組,序號91-120為丁組,見表4-2第四行。當前27頁,總共116頁。(2)統計分析方法選擇:1.對于正態分布且方差齊同的資料,常采用完全隨機設計的單因素方差分析(one-wayANOVA)或成組資料的t檢驗(g=2);2.對于非正態分布或方差不齊的資料,可進行數據變換或采用Wilcoxon秩和檢驗。當前28頁,總共116頁。二、變異分解

當前29頁,總共116頁。

例4-2

某醫生為了研究一種降血脂新藥的臨床療效,按統一納入標準選擇120名高血脂患者,采用完全隨機設計方法將患者等分為4組(具體分組方法見例4-1),進行雙盲試驗。6周后測得低密度脂蛋白作為試驗結果,見表4-3。問4個處理組患者的低密度脂蛋白含量總體均數有無差別?當前30頁,總共116頁。表4-34個處理組低密度脂蛋白測量值(mmol/L)當前31頁,總共116頁。三、分析步驟

H0:即4個試驗組總體均數相等H1:4個試驗組總體均數不全相等

2.

計算檢驗統計量

:1.建立檢驗假設,確定檢驗水準:當前32頁,總共116頁。當前33頁,總共116頁。表4-5完全隨機設計方差分析表列方差分析表當前34頁,總共116頁。3.確定P值,作出推斷結論:

按水準,拒絕H0,接受H1,認為4個試驗組ldl-c總體均數不相等,即不同劑量藥物對血脂中ldl-c降低影響有差別。當前35頁,總共116頁。F分布曲線當前36頁,總共116頁。=FDIST(3.74,2,14)=FINV(0.05,1,10)附表4當前37頁,總共116頁。F分布曲線下面積與概率當前38頁,總共116頁。當前39頁,總共116頁。當前40頁,總共116頁。⒈

提出檢驗假設,確定檢驗水準。

H0:三個組GSH值的總體均數相同;

H1:三個組GSH值的總體均數不全相同;⒉根據公式計算SS、MS及F值三組大鼠的GSH測得值見后表,問其測得值是否相同?

得F=23.85>F0.05(2,32)=3.30。P<0.05,差別有統計學意義,按照0.05的顯著性水準,拒絕H0,可認為三種處理方式大鼠的GSH值不全相同。當前41頁,總共116頁。Excel計算方法當前42頁,總共116頁。Excel計算結果當前43頁,總共116頁。SPSS計算方法當前44頁,總共116頁。SPSS結果當前45頁,總共116頁。注意:

方差分析的結果拒絕H0,接受H1,不能說明各組總體均數間兩兩都有差別。如果要分析哪些兩組間有差別,可進行多個均數間的多重比較(見本章第六節)。當g=2時,完全隨機設計方差分析與成組設計資料的t

檢驗等價,有。當前46頁,總共116頁。第三節隨機區組設計資料的方差分析當前47頁,總共116頁。一、隨機區組設計——配伍組設計

(randomizedblockdesign)

隨機區組設計(randomizedblockdesign)又稱為配伍組設計,是配對設計的擴展。具體做法是:先按影響試驗結果的非處理因素(如性別、體重、年齡、職業、病情、病程等)將受試對象配成區組(block),再分別將各區組內的受試對象隨機分配到各處理或對照組。

(1)隨機分組方法:當前48頁,總共116頁。(2)隨機區組設計的特點

隨機分配的次數要重復多次,每次隨機分配都對同一個區組內的受試對象進行,且各個處理組受試對象數量相同。區組內均衡。在進行統計分析時,將區組變異離均差平方和從完全隨機設計的組內離均差平和中分離出來,從而得到更接近真實的組內離均差平方和(誤差平方和),提高了統計檢驗效率。當前49頁,總共116頁。

例4-3

如何按隨機區組設計,分配5個區組的15只小白鼠接受甲、乙、丙三種抗癌藥物?

分組方法:先將小白鼠按體重編號,體重相近的3只小白鼠配成一個區組,見表4-6。在隨機數字表中任選一行一列開始的2位數作為1個隨機數,如從第8行第3列開始紀錄,見表4-6;在每個區組內將隨機數按大小排序;各區組中序號為1的接受甲藥、序號為2的接受乙藥、序號為3的接受丙藥,分配結果見表4-6。當前50頁,總共116頁。當前51頁,總共116頁。(3)統計方法選擇:1.正態分布且方差齊同的資料,應采用兩因素(處理、配伍)方差分析(two-wayANOVA)或配對t檢驗(g=2);2.當不滿足方差分析和t檢驗條件時,可對數據進行變換或采用隨機區組設計資料的FriedmanM檢驗。當前52頁,總共116頁。

表4-7隨機區組設計的試驗結果

當前53頁,總共116頁。二、變異分解(1)

總變異:反映所有觀察值之間的變異,記為SS總。(2)處理間變異:由處理因素的不同水平作用和隨機誤差產生的變異,記為SS處理。(3)區組間變異:由不同區組作用和隨機誤差產生的變異,記為SS區組。(4)誤差變異:完全由隨機誤差產生的變異,記為SS誤差。對總離均差平方和及其自由度的分解,有:

當前54頁,總共116頁。

表4-8

隨機區組設計資料的方差分析表

當前55頁,總共116頁。三、分析步驟

例4-4

某研究者采用隨機區組設計進行實驗,比較三種抗癌藥物對小白鼠肉瘤抑瘤效果,先將15只染有肉瘤小白鼠按體重大小配成5個區組,每個區組內3只小白鼠隨機接受三種抗癌藥物(具體分配方法見例4-3),以肉瘤的重量為指標,試驗結果見表4-9。問三種不同的藥物的抑瘤效果有無差別?當前56頁,總共116頁。

表4-9

不同藥物作用后小白鼠肉瘤重量(g)

當前57頁,總共116頁。H0:,即三種不同藥物作用后小白鼠肉瘤重量的總體均數相等

H1:三種不同藥物作用后小白鼠肉瘤重量的總體均數不全相等當前58頁,總共116頁。當前59頁,總共116頁。當前60頁,總共116頁。

據1=2、2=8查附表3的F界值表,得在α=0.05的水準上,拒絕H0,接受H1,認為三種不同藥物作用后小白鼠肉瘤重量的總體均數不全相等,即不同藥物的抑瘤效果有差別。同理可對區組間的差別進行檢驗。當前61頁,總共116頁。注意:

方差分析的結果拒絕H0,接受H1,不能說明各組總體均數間兩兩都有差別。如果要分析哪些兩組間有差別,可進行多個均數間的多重比較(見本章第六節)。當g=2時,隨機區組設計方差分析與配對設計資料的t

檢驗等價,有。當前62頁,總共116頁。

隨機區組設計確定區組因素應是對試驗結果有影響的非處理因素。區組內各試驗對象應均衡,區組之間試驗對象具有較大的差異為好,這樣利用區組控制非處理因素的影響,并在方差分析時將區組間的變異從組內變異中分解出來。因此,當區組間差別有統計學意義時,這種設計的誤差比完全隨機設計小,試驗效率得以提高。當前63頁,總共116頁。第四節拉丁方設計資料的方差分析

在試驗涉及一個處理因素和兩個控制因素,每個因素的類別數或水平數相等時,可將兩個控制因素安排在拉丁方的行和列上,采用拉丁方設計。拉丁方設計必須在從專業上判斷各個因素間的相互作用可以忽略的情況下采用。當前64頁,總共116頁。第五節兩階段交叉設計資料的方差分析

研究中需要對比兩種不同處理效果的時候,隨機將研究對象分組,按不同的先后順序接受兩種處理,這種設計稱為兩階段交叉設計。兩階段交叉設計必須保證一個階段的處理效應不能持續到下一個階段,有必要在兩個階段之間設置一個洗脫期,以消除殘留效應的影響。當前65頁,總共116頁。補充2×2析因設計的方差分析

析因設計(factorialdesign)是將多個因素的各個水平進行排列組合,在每一種可能的水平組合下進行試驗,以探討各因素的效應以及各因素之間的交互效應,而且通過比較各種組合效應,找出最佳組合。當前66頁,總共116頁。2×2析因設計的數據結構當前67頁,總共116頁。2×2析因設計方差分析的目的考察A、B兩因素的“主效應”考察A、B兩因素間的“交互效應”當前68頁,總共116頁。表6-11小鼠BALF中IL-4值(pg/ml)

40只小鼠隨機分配到4組

A1B1、A1B2、A2B1、A2B2當前69頁,總共116頁。當前70頁,總共116頁。當前71頁,總共116頁。單獨效應主效應當前72頁,總共116頁。當前73頁,總共116頁。單獨效應主效應一階交互效應:AB=[(a2b2-a1b2)-(a2b1-a1b1)]/2=2當前74頁,總共116頁。當前75頁,總共116頁。當前76頁,總共116頁。例6.4

計算得到方差分析表當前77頁,總共116頁。當前78頁,總共116頁。當前79頁,總共116頁。當前80頁,總共116頁。隨機區組設計的方差分析和析因設計的方差分析之間有什么區別?當前81頁,總共116頁。正交設計當試驗因素多達三個以上時,采用析因設計的試驗次數劇增,正交設計是多個因素各水平的部分組合,是非全面試驗,或稱析因設計的部分實施。當實驗因素較多時,采用正交設計可以成倍地減少試驗次數,但是是以犧牲分析各因素的部分或大部分交互作用為代價的。正交設計通常作為試驗條件的探索,在確定研究因素的作用時,需要進一步的試驗。當前82頁,總共116頁。嵌套設計裂區設計當前83頁,總共116頁。方差分析的使用條件各處理組樣本來自隨機、獨立的正態總體-------(W法、D法、卡方檢驗推斷)W法:Shapiro-Wilk檢驗D法:Kolmogorov-Smirnov檢驗各處理組樣本的總體方差相等

------Bartlett檢驗法、Levene檢驗法當前84頁,總共116頁。

第六節

多個樣本均數間的多重比較

(multiplecomparison)當前85頁,總共116頁。多重比較不能用兩樣本均數比較的t檢驗!

若用兩樣本均數比較的t檢驗進行多重比較,將會加大犯Ⅰ類錯誤(把本無差別的兩個總體均數判為有差別)的概率。當前86頁,總共116頁。

例如,有4個樣本均數,兩兩組合數為,若用t檢驗做6次比較,且每次比較的檢驗水準定為α=0.05,則每次比較不犯Ⅰ類錯誤的概率為(1-0.05),6次均不犯Ⅰ類錯誤的概率為,這時,總的檢驗水準變為,遠比0.05大。因此,樣本均數間的多重比較不能用兩樣本均數比較的t檢驗。當前87頁,總共116頁。適用條件:

當方差分析的結果為拒絕H0,接受H1時,只說明g個總體均數不全相等。若想進一步了解哪些兩個總體均數不等,需進行多個樣本均數間的兩兩比較或稱多重比較。當前88頁,總共116頁。一、LSD-t檢驗

(leastsignificantdifference)適用范圍:一對或幾對在專業上有特殊意義的樣本均數間的比較。當前89頁,總共116頁。檢驗統計量t的計算公式為式中

當前90頁,總共116頁。注意:

當前91頁,總共116頁。LSD-t檢驗中的誤差項和自由度是考慮了進行差異檢驗的兩個組以外的其它試驗組的影響的!當前92頁,總共116頁。

例4-7

對例4-2資料,問高血脂患者的降血脂新藥2.4g組、4.8g組、7.2g組與安慰劑組的低密度脂蛋白含量總體均數有無差別?當前93頁,總共116頁。

,即降血脂新藥2.4g組與安慰劑組的低密度脂蛋白含量總體均數相等,

即降血脂新藥2.4g組與安慰劑組的低密度脂蛋白含量總體均數不等α=0.05降血脂新藥2.4g組與安慰劑組的比較:當前94頁,總共116頁。當前95頁,總共116頁。

新藥4.8g組VS安慰劑組:LSD-t為-4.297.2g組VS安慰劑組:LSD-t

為-8.59。同理:按水準,降血脂新藥4.8g組、7.2g組與安慰劑組間差別有統計學意義。當前96頁,總共116頁。二、Dunnett-t檢驗

適用條件:g-1個實驗組與一個對照組均數差別的多重比較,檢驗統計量為t

。當前97頁,總共116頁。式中

計算公式為:Dunnett-當前98頁,總共116頁。

例4-8

對例4-2資料,問高血脂患者的三個不同劑量降血脂新藥組與安慰劑組的低密度脂蛋白含量總體均數是否有差別?

H0:μi=μ0,即各實驗組與安慰劑組的低密度脂蛋白含量總體均數相等H1:μi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論