第四章 多個樣本均數比較的方差分_第1頁
第四章 多個樣本均數比較的方差分_第2頁
第四章 多個樣本均數比較的方差分_第3頁
第四章 多個樣本均數比較的方差分_第4頁
第四章 多個樣本均數比較的方差分_第5頁
已閱讀5頁,還剩99頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

送上小月餅,祝您中秋節快樂

祝最親愛的同學們中秋節快樂!review:

1.均數的標準誤與標準差的區別2、t分布概念和性質隨機變量XN(m,s2)標準正態分布N(0,12)u變換標準正態分布N(0,12)Studentt分布自由度:n-1均數正態分布t分布曲線

t分布有如下性質:①單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱②與正態分布相比,曲線最高處較矮,兩尾部翹得高(見綠線)③隨自由度增大,曲線逐漸接近正態分布;分布的極限為標準正態分布。3、參數估計和假設檢驗可信區間的解釋

95%可信區間:從總體中作隨機抽樣,作100次抽樣,每個樣本可算得一個可信區間,得100個可信區間,平均有95個可信區間包括μ(估計正確),只有5個可信區間不包括μ(估計錯誤)。4.兩均數差別檢驗的比較:大樣本也可近似用u檢驗summary:independentt-test檢驗1、目的:用于推斷兩個獨立樣本所來自的兩個總體分布是否有差別;2、獨立樣本:完全隨機分組;3、資料類型:計量3、滿足參數檢驗的條件:正態性和方差齊性4、檢驗的統計量:t

summary:independentt-test檢驗1、目的:用于推斷兩個獨立樣本所來自的兩個總體分布是否有差別;2、獨立樣本:完全隨機分組;3、資料類型:計量3、滿足參數檢驗的條件:正態性和方差齊性4、檢驗的統計量:t

summary:pairedt-test檢驗1、目的:用于推斷兩個相關樣本所來自的兩個總體分布是否有差別;2、相關樣本:配對設計;3、資料類型:計量3、滿足參數檢驗的條件:正態性和方差齊性4、檢驗的統計量:td

多個樣本均數比較的方差分析

前章介紹了兩樣本均數比較的t檢驗。在醫學科學研究中,常常要通過多個樣本均數比較來推斷各處理組間是否存在差別,此時若多次重復使用t-test,會使犯第Ⅰ類錯誤(假陽性錯誤)的概率增大,且脫離了原先的實驗設計,將多個樣本均數的同時比較轉變為兩個樣本均數的多次比較。若采用實驗設計所對應的方差分析同時分析多個樣本均數的差別,則可避免以上問題。第四章多個樣本均數比較

的方差分析

AnalysisofVariance,ANOVA

Ftest

Content1.Basalidealandapplicationconditions2.ANOVAofcompletelyrandomdesigneddata

3.ANOVAofrandomizedblockdesigneddata4.ANOVAoflatinsquaredesigneddata

5.ANOVAofcross-overdesigneddata

6.Multiplecomparisonofsamplemeans7.BartletttestandLevenetest

例4-1某醫生為了研究一種降血脂新藥的臨床療效,按統一納入標準選擇120名高血脂患者,采用完全隨機設計方法將患者等分為4組(進行雙盲試驗。6周后測得低密度脂蛋白作為試驗結果,見表4-3。2、問4個處理組患者的低密度脂蛋白含量總體均數有無差別?1、問如何進行分組?(1)完全隨機分組方法:

1.編號:120名高血脂患者從1開始到120,見表4-2第1行(P72);2.取隨機數字:從附表15中的任一行任一列開始,如第5行第7列開始,依次讀取三位數作為一個隨機數錄于編號下,見表4-2第2行;3.編序號:將全部隨機數字從小到大(數據相同則按先后順序)編序號,見表4-2第3行。4.事先規定:序號1-30為甲組,序號31-60為乙組,序號61-90為丙組,序號91-120為丁組,見表4-2第四行。怎樣實現隨機化分配呢?怎樣實現隨機化分配呢?IFblock<=2THENgroup='A';IF2<block<=4THENgroup='B';IF4<block<=6THENgroup='C';(2)統計分析方法選擇:1.對于正態分布且方差齊同的資料,常采用完全隨機設計的單因素方差分析(one-wayANOVA)或成組資料的t檢驗(g=2);2.對于非正態分布或方差不齊的資料,可進行數據變換或采用Wilcoxon秩和檢驗。

(completelyrandomdesign)是采用完全隨機化的分組方法,將全部試驗對象分配到g個處理組(水平組),各組分別接受不同的處理,試驗結束后比較各組均數之間的差別有無統計學意義,推論處理因素的效應。一、完全隨機設計表4-34個處理組低密度脂蛋白測量值(mmol/L)didj總變異SS總表4-34個處理組低密度脂蛋白測量值(mmol/L)dj組間變異SS組間存在組間變異的原因有:①隨機誤差(包括個體變異和測量誤差);②處理的不同水平可能對試驗結果的影響。表4-34個處理組低密度脂蛋白測量值(mmol/L)組內變異SS組內djdj存在組內變異的原因有:①隨機誤差(包括個體變異和測量誤差);二、變異分解

處理效應+隨機誤差隨機誤差0三、分析步驟

H0:即4個試驗組總體均數相等H1:4個試驗組總體均數不全相等

2.

計算檢驗統計量:1.建立檢驗假設,確定檢驗水準:表4-5完全隨機設計方差分析表列方差分析表3.確定P值,作出推斷結論:

按水準,拒絕H0,接受H1,認為4個試驗組ldl-c總體均數不相等,即不同劑量藥物對血脂中ldl-c降低影響有差別。注意:

方差分析的結果拒絕H0,接受H1,不能說明各組總體均數間兩兩都有差別。如果要分析哪些兩組間有差別,可進行多個均數間的多重比較(見本章第六節)。當g=2時,完全隨機設計方差分析與成組設計資料的t檢驗等價,有。二、變異分解

方差分析的基本思想及其應用條件目的:推斷多個總體均數是否有差別。

也可用于兩個

方法:方差分析,即多個樣本均數比較的F檢驗。基本思想:根據資料設計的類型及研究目的,可將總變異分解為兩個或多個部分,每個部分的變異可由某因素的作用來解釋。通過比較可能由某因素所至的變異與隨機誤差,即可了解該因素對測定結果有無影響。應用條件:總體——正態且方差相等

樣本——獨立、隨機設計類型:完全隨機設計資料的方差分析隨機區組設計資料的方差分析拉丁方設計資料的方差分析兩階段交叉設計資料的方差分析完全隨機設計資料的方差分析的基本思想合計

NS:第i個處理組第j個觀察結果記總均數為,各處理組均數為,總例數為N=nl+n2+…+ng,g為處理組數。

1.總變異:全部測量值大小不同,這種變異稱為總變異。總變異的大小可以用離均差平方和(sumofsquaresofdeviationsfrommean,SS)表示,即各測量值Xij與總均數差值的平方和,記為SS總。總變異SS總反映了所有測量值之間總的變異程度。計算公式為其中:2.組間變異:各處理組由于接受處理的水平不同,各組的樣本均數

(i=1,2,…,g)也大小不等,這種變異稱為組間變異。其大小可用各組均數與總均數的離均差平方和表示,記為SS組間。計算公式為3.組內變異:在同一處理組中,雖然每個受試對象接受的處理相同,但測量值仍各不相同,這種變異稱為組內變異(誤差)。組內變異可用組內各測量值Xij與其所在組的均數的差值的平方和表示,記為SS組內,表示隨機誤差的影響。

三種變異的關系:

均方差,均方(meansquare,MS)。檢驗統計量:如果,則都為隨機誤差的估計,F值應接近于1。如果不全相等,F值將明顯大于1。用F界值(單側界值)確定P值。第二節完全隨機設計資料的方差分析第三節隨機區組設計資料的方差分析一、隨機區組設計——配伍組設計

(randomizedblockdesign)隨機區組設計(randomizedblockdesign)又稱為配伍組設計,是配對設計的擴展。具體做法是:先按影響試驗結果的非處理因素(如性別、體重、年齡、職業、病情、病程等)將受試對象配成區組(block),再分別將各區組內的受試對象隨機分配到各處理或對照組。

(1)隨機分組方法:(2)隨機區組設計的特點

隨機分配的次數要重復多次,每次隨機分配都對同一個區組內的受試對象進行,且各個處理組受試對象數量相同。區組內均衡。在進行統計分析時,將區組變異離均差平方和從完全隨機設計的組內離均差平和中分離出來,從而減小組內離均差平方和(誤差平方和),提高了統計檢驗效率。

例4-3

如何按隨機區組設計,分配5個區組的15只小白鼠接受甲、乙、丙三種抗癌藥物?

分組方法:先將小白鼠按體重編號,體重相近的3只小白鼠配成一個區組,見表4-6。在隨機數字表中任選一行一列開始的2位數作為1個隨機數,如從第8行第3列開始紀錄,見表4-6;在每個區組內將隨機數按大小排序;各區組中內序號為1的接受甲藥、序號為2的接受乙藥、序號為3的接受丙藥,分配結果見表4-6。(3)統計方法選擇:1.正態分布且方差齊同的資料,應采用兩因素(處理、配伍)方差分析(two-wayANOVA)或配對t檢驗(g=2);2.當不滿足方差分析和t檢驗條件時,可對數據進行變換或采用隨機區組設計資料的FriedmanM檢驗。

表4-7隨機區組設計的試驗結果

二、變異分解(1)總變異:反映所有觀察值之間的變異,記為SS總。(2)處理間變異:由處理因素的不同水平作用和隨機誤差產生的變異,記為SS處理。(3)區組間變異:由不同區組作用和隨機誤差產生的變異,記為SS區組.(4)誤差變異:完全由隨機誤差產生的變異,記為SS誤差。對總離均差平方和及其自由度的分解,有:

表4-8隨機區組設計資料的方差分析表

三、分析步驟

例4-4某研究者采用隨機區組設計進行實驗,比較三種抗癌藥物對小白鼠肉瘤抑瘤效果,先將15只染有肉瘤小白鼠按體重大小配成5個區組,每個區組內3只小白鼠隨機接受三種抗癌藥物(具體分配方法見例4-3),以肉瘤的重量為指標,試驗結果見表4-9。問三種不同的藥物的抑瘤效果有無差別?

表4-9不同藥物作用后小白鼠肉瘤重量(g)

H0:,即三種不同藥物作用后小白鼠肉瘤重量的總體均數相等

H1:三種不同藥物作用后小白鼠肉瘤重量的總體均數不全相等

1=2、

2=8查附表3的F界值表,得在α=0.05的水準上,拒絕H0,接受H1,認為三種不同藥物作用后小白鼠肉瘤重量的總體均數不全相等,即不同藥物的抑瘤效果有差別。同理可對區組間的差別進行檢驗。注意:

方差分析的結果拒絕H0,接受H1,不能說明各組總體均數間兩兩都有差別。如果要分析哪些兩組間有差別,可進行多個均數間的多重比較(見本章第六節)。當g=2時,隨機區組設計方差分析與配對設計資料的t檢驗等價,有。隨機區組設計確定區組因素應是對試驗結果有影響的非處理因素。區組內各試驗對象應均衡,區組之間試驗對象具有較大的差異為好,這樣利用區組控制非處理因素的影響,并在方差分析時將區組間的變異從組內變異中分解出來。因此,當區組間差別有統計學意義時,這種設計的誤差比完全隨機設計小,試驗效率得以提高。第五節兩階段交叉設計資料的方差分析(不講)

第六節

多個樣本均數間的多重比較

(multiplecomparison)多重比較不能用兩樣本均數比較的t檢驗!

若用兩樣本均數比較的t檢驗進行多重比較,將會加大犯Ⅰ類錯誤(把本無差別的兩個總體均數判為有差別)的概率。

例如,有4個樣本均數,兩兩組合數為,若用t檢驗做6次比較,且每次比較的檢驗水準定為α=0.05,則每次比較不犯Ⅰ類錯誤的概率為(1-0.05),6次均不犯Ⅰ類錯誤的概率為,這時,總的檢驗水準變為,遠比0.05大。因此,樣本均數間的多重比較不能用兩樣本均數比較的t檢驗。適用條件:

當方差分析的結果為拒絕H0,接受H1時,只說明g個總體均數不全相等。若想進一步了解哪些兩個總體均數不等,需進行多個樣本均數間的兩兩比較或稱多重比較。一、LSD-t檢驗

(leastsignificantdifference)適用范圍:一對或幾對在專業上有特殊意義的樣本均數間的比較。檢驗統計量t的計算公式為式中

注意:

例4-7對例4-2資料,問高血脂患者的降血脂新藥2.4g組、4.8g組、7.2g組與安慰劑組的低密度脂蛋白含量總體均數有無差別?,即降血脂新藥2.4g組與安慰劑組的低密度脂蛋白含量總體均數相等,

即降血脂新藥2.4g組與安慰劑

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論