5第五講方差分析與秩和檢驗_第1頁
5第五講方差分析與秩和檢驗_第2頁
5第五講方差分析與秩和檢驗_第3頁
5第五講方差分析與秩和檢驗_第4頁
5第五講方差分析與秩和檢驗_第5頁
已閱讀5頁,還剩70頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、方差分析與秩和檢驗第五講number of comparsonstype i error rateexperimentwise error rate10.050.05020.050.09830.050.14340.050.18550.050.22660.050.26570.050.30280.050.33790.050.370100.050.401110.050.431120.050.460130.050.487140.050.512150.050.537160.050.560170.050.582180.050.603190.050.623200.050.642ec 1 1 () 兩兩比較次

2、數同類指標數(數量越多)亞組分析與期中分析方差分析(analysis of variance) anova基本思想根據資料的設計類型,即變異的不同來源,將全部觀察值總的離均差平方和以及自由度分解為兩個或多個部分,每個部分的變異與自由度組成均方(ms),均方比值(統計量)服從f分布,由此做出統計推斷,從而了解各因素對觀察指標影響有無統計學意義。第一部分 方差分析analysis of variance(anova)r fisher(1890-1962)在20世紀30年代發表以f分布為基礎的用于多組計量資料均數比較假設檢驗-方差分析,有時又被稱為變異分析或 f檢驗等。r a fisher, the

3、 founder of statistical inference, working on amechanical calculatorwithin group variance is large compared to variability between means.unclear separation of means.xy-4-3-2-101234xy-4-3-2-101234within group variance is small compared to variability between means.clear separation of means.xy-4-3-2-1

4、01234xy-4-3-2-101234xy-4-3-2-101234xy-4-3-2-10123410,10215, 5215, 121f統計量的抽樣分布方差分析的理論基礎:f分布f分布是方差分析的基礎,通過f分布確定p值f分布也是一簇連續性分布,分布類型與第一、二自由度有關。當第一、二自由度固定時,f值越大,其對應的p值越小;反之亦然。方差分析的概述方差分析核心是變異的分解:將所有觀察值之間的變異分解成幾部分,每一部分均反映了特定的內容(如某因素的作用、交互作用)通過變異間的相互比較,并構建統計量f值,基于f分布,計算p值。方差分析的用途很廣,按照設計類型又可細為很多亞型。方差分析的主要設

5、計類型成組設計(完全隨機設計):單因素多組配伍設計:研究因素/配伍因素多組交叉設計:多個因素析因設計:兩因素及其交互作用拉丁方設計:正交試驗設計:多因素,多水平。方差分析主要用途推斷兩個及以上總體均數有無區別;分析兩個或多個因素主效應及其交互作用回歸方程的線性假設檢驗。 一、成組設計資料的方差分析(實例分析) 例1、某醫院對31名石棉礦工中的石棉肺患者、可疑患者、非患者進行了用力肺活量測定,結果見下,問三組石棉礦工的用力肺活量有無差別? 表1 三組石棉礦工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8

6、1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5均數 1.79 2.31 3.4 2.51(合)例數 11 9 111、成組設計方差分析的變異分解總變異 = 組間變異 + 組內變異(1.79-2.51) + (1.8-1.79) (1.8-2.51) = 表1 三組石棉礦工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.

7、4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5均數 1.79 2.31 3.4 2.51(合)例數 11 9 11第一組第一例變異(1.8-1.79)+(1.79-2.51)總變異 31名礦工的用力肺活量的測試值大小不等,這種變異稱為總變異。其大小ss總=(xij -x )2 ,即每個觀察值與總均數x 的離均差平均和。組內變異每個組內的個體測量值也大小不等,這種變異稱為組內變異(ss組內),反映了隨機誤差的大小。 ss組內(xij -xi )2 ,因ss組內與樣本例數有關,為排除其影響,用組內均方代替:組內ss組內(n-k)組間變異 三組間的均數大小不等,稱為組間變異(ss

8、組間),反映了干預效應與隨機誤差ss組間ni(xi -x )2, 為排除組數多少的影響,用組間均方代替: 組間ss組間(k)。變異的分解:ss總ss組間ss組內自由度的分解:總組間組內 組間變異(ms組間) / 組內變異(ms組內)=f組數減1為第一自由度,合并例數減組數為第二自由度.根據f統計量與一、二自由度確定f分布,計算p值.2、方差分析過程 變異原因 變異 統計量干預效應干預效應隨機因素隨機因素組間變異組間變異組內變異組內變異總變異總變異組間均方組間均方組內均方組內均方f f值值1.792.313.4(三組)推斷總體h0三總體均數相等1=2=3三總體均數不等/不全等拒絕h0p值小概率事

9、件不拒絕h012=3, 1=23, 1= 3 2, 1233、假設檢驗的步驟建立假設: h0:三組礦工用力肺活量的總體均數相等, h1:三組礦工用力肺活量的總體均數不等或不全等 12=3, 1=23, 1= 3 2, 123 =0.05構筑統計量:f=組間變異/組內變異 =組間組內 確定 p 值: 假設無效假設成立的情況下,干預無效應,即組間與組內接近,則值接近于,在附近出現的機率多,而出現較大值的機率小,當值大到一定界值時,根據小概率事件原則,就有理由認為無效假設不成立,從而拒絕0,而接受h1。 表2 方差分析結果變異來源 ss 總 10.8 30 組間 9.266 2 4.633 84.5

10、4 0.01組內 1.534 28 0.0548 按照=0.05的水準,拒絕h0,接受h1,可認為三組礦工的用力肺活量不同。an ovameasure9.26624.63384.544.0001.53428.05510.80030between groupswithin groupstotalsum ofsquaresdfmean squarefsig.spss分析結果4、方差分析及兩兩比較方差分析只能表明三組工人的用力肺活量的總體均數有差別,還不能說明任何兩組間是否有差別,還需做兩兩比較檢驗。 ; ; 兩兩比較:任兩個均數比較以及多個實驗組與一個對照組比較兩個類型。計算組間比較的均數差值及9

11、5%可信區間。5、兩兩比較與95%可信區間multiple comparisonsdependent variable: measurebonferroni-.5202*.10522.000-.7881-.2523-1.2909*.09982.000-1.5451-1.0367.5202*.10522.000.2523.7881-.7707*.10522.000-1.0386-.50281.2909*.09982.0001.03671.5451.7707*.10522.000.50281.0386(j) group2.003.001.003.001.002.00(i) group1.002.0

12、03.00meandifference(i-j)std. errorsig.lower boundupper bound95% confidence intervalthe mean difference is significant at the .05 level.*. 效應量及其95%可信區間5、成組設計的方差分析資料特點本例資料為成組設計的單因素計量資料,進行多組均數間比較。總變異組間變異組內變異6、方差分析的應用條件各樣本來自正態總體:中等程度、大樣本方差齊性:最好是例數相等,敏感(變量變換、修剪)各樣本為相互獨立的隨機樣本(獨立性,代表性)基線均衡性與效應可加性二、配伍設計多個樣本

13、均數比較1、資料特點分析 是配對設計的擴展。具體做法是:先按影響試驗結果的非處理因素(如性別、體重、年齡、職業、病情、病程等)將受試對象配成區組(block),再分別將各區組內的受試對象隨機分配到各處理或對照組。1、資料特點分析研究因素有兩個: a:藥物因素-不同藥物組的重量是否 有差別? b:個體變異因素-不同個體間重量有否差 別?方差分析變異的分解: ss總ss組間ss配伍 ss組內 , 總組間配伍 組內2、變異的分解總變異組間變異組內變異配伍變異3、方差分析過程建立假設:假設1:藥物因素0:三種藥物作用后的肉瘤重量總體均數相等, h1:三種藥物作用后肉瘤重量總體均數不等或不全等=0.05

14、 假設2:個體變異因素0:5個區組重量的總體均數相等 h1: 5個區組重量的均數不等或不全等 =0.05 dependent variable: 肉瘤重量.456a6.0767.964.0053.09213.092323.742.000.2284.0575.978.016.2282.11411.937.004.0768.0103.62515.53314sourcecorrected modelinterceptblockdrugerrortotalcorrected totaltype iii sumof squaresdfmean squarefsig.r squared = .857 (a

15、djusted r squared = .749)a. 組內變異藥物變異配伍變異確定p值和做出結論 以1 =2,2 =8,查f界值表, 得p0.05, 按照=0.05的水準,拒絕0,而接受h1,可認為不同藥物的腫瘤重量不同。 以1 =4,2 =8,查f界值表, 得p0.05階段 24 1 24 1.14 0.05個體 1008 11 91.36 4.36 0.05誤差 210 10 21 總變異 1338 23 從結果來看: 只有個體間的差異有統計學意義,不同治療方案,不同階段均無統計學意義。 六、方差分析的誤用 例5 為觀察764-3(丹參的有效成分)對低氧性肺動脈高壓及右心室肥厚等是否有保

16、護作用進行了如下試驗:取180-220g雄性大鼠141只,隨機分成三組:即正常組,單純低氧組,764-3處理低氧組每組再分成2個小組,分別于3天,21天時處死大鼠,測量相關指標的數值。 表9 764-3對低氧所致右心室收縮壓變化的影響組別 收縮壓(xse) 3天 21天對照 3.060.12 3.020.12單純低氧 3.370.12* 3.850.12*764-3+低氧 3.350.15 3.330.09* 注: 原作者采用t檢驗分析資料,得:與對照組比, p0.05,* *p0.01,與單純低氧組比p0.05。 存在的問題?七、方差分析的小結 方差分析的目的是推斷多個總體均數間有無差別:不

17、能檢驗那些有差別、那些無差別;不能說明差別的顯著程度;需通過兩兩比較,計算效應量及其95%可信區間;兩兩比較不同于多個t檢驗比較.兩兩比較的方法優選 事先設置比較: 檢驗水準校正法 bonferroni(或dunns)多重比較過程(次數較少) 界值擴大因子(與比較次數及自由度有關) anova后post hoc兩兩比較 非成對比較(scheff過程) 任意兩對均數比較(tukey hsd, snk) 多組干預與對照組比較(dunnett)建議不要使用: lsd duncan方法特點優勢不足tukey hsd擴大因子sqrt(mse/n)1、power高2、計算可信區間擴大因子需查表scheff

18、e擴大因子界值1、最靈活、最保守方法2、可計算可信區間公式復雜snk(newman-keul)擴大因子sqrt(mse/n)排序、界值不固定,敏感性強不能計算可信區間dunnett法擴大因子sqrt(2mse/n)1、計算方便2、界值最小僅用于多個試驗組與同一對照組比較根據設計類型選擇具體方差分析方法.設計方案決定檢驗效能的大小成組設計; 配伍設計; 交叉設計; 析因設計;拉丁方設計;正交設計方差分析要求:u基本條件:資料的正態性、方差齊性、獨立性其中對方差齊性要求最高,采用levene檢驗若方差不齊,變量變換(四種),否則秩和檢驗u額外條件:均衡性、效應可加性;0.005.0010.0015

19、.0020.0025.0030.0035.00010203040sample meansample varianceiiyz 020406080100120140160180200010203040sample meansample variancezy ln( )yarcsinysinz1zy1考察各組均數與方差的關系變量變換的參考依據變量變換的參考依據第二部分 秩和檢驗 參數統計:總體分布類型已知,對總體參數進行估計或檢驗。非參數統計:總體分布類型未知或已知分布類型與其應用條件不符,并非是參數間的比較,而是用于分布間的比較。 一、“應用條件” 優:非參數檢驗不受總體分布的限定,且對等級資料

20、、不能被準確測量的資料、有不確定值的資料等均可進行。劣:與參數檢驗相比,檢驗效能降低。 根據不同的資料特點與設計類型選用不同秩和檢驗方法。二、秩和檢驗配對設計數值變量資料的秩和檢驗(wilcoxon配對法,1945) 例6 某研究者對病人治療前后的生存質量進行了測量,資料見下,問病人生存質量治療前后有無變化? 表8 病人治療前后的生存質量評分 病人編號 治療前 治療后 評分差值 秩次1 7 10 3 +9 2 7 9 2 +6 3 7 7 0 4 6 7 1 +3 5 7 10 3 +9 6 7 6 -1 - 3 7 8 9 1 +3 8 2 6 4 +11 9 9 8 -1 - 3 10 6

21、 9 3 +9 11 4 6 2 +7 12 6 6 0 13 6 7 1 +3秩和檢驗的基本步驟建立假設: 0:生存質量差值的總體中位數md =0 h1:md 0 =0.05計算差值并編秩:依差值的絕對值從小到大編秩,再根據差值的正負給秩次冠以正負號;差值為0時不編秩;差值相等符號相同仍按順序編秩;差值相等符號不同取平均秩次。求秩和并確定檢驗統計量:分別計算正、負秩次之和,任取其一為t。 確定p值和做出推斷結論:當n50時,超出t界值表范圍,采用正態近似法。 成組設計兩樣本比較的秩和檢驗(wilcoxon兩樣本比較法) 例7 某實驗室觀察局部溫熱治療小鼠移植性腫瘤的療效,以生存日數作為觀察指

22、標,實驗結果見下表,試檢驗兩組小鼠生存日數有無差別? 表9 兩組小鼠發癌后生存天數 實驗組 對照組生存天數 秩次 生存天數 秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9.5 90以上 22 11 11 12 12.5 13 14資料特點與基本步驟兩組比較成組設計資料,存在截尾值。基本步驟: 1:建立假設:0:兩組小鼠生存天數總體分布相同 h1: 兩組小鼠生存天數總體分布不同 =0.05 2:編秩及計算秩和: 將兩組數據由小到大統一編秩。原始數據相同時,若相同數據在同一組按順序編秩;若相同數據在不同組時,取平均秩次。當兩組樣本例數不等時,以樣本例數較小者的秩和為t;當例數相等時,任取其中一個秩和為t。 3:確定p值和做出推斷結論: 當n111,n2-n111時,查t界值表,t分布同上;當樣本量較大超出t界值表范

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論