




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、方差分析和協方差分析第5組 在針對連續變量的統計推斷方法中,最常用的有t 檢驗和方差分析兩種 四種不同的顏色包裝對飲料銷售量的影響(四個水平,分類變量) 兩兩t 檢驗?不能做t 檢驗 如果有K(K3)個平均數,若用兩兩比較的方法來檢驗,則需作K(K-1)/2次檢驗,不但程序繁瑣,而且相當于從t 分布中隨機抽取多個t 值,其落在大于臨界值的范圍內的概率大大增加,犯類錯誤的概率大大增加:如6次檢驗H0的概率是0.95時的誤差為:1-0.956 =0.265。 方差分析概念 第一類因素:可以控制的控制因素 第二類因素:不能控制的隨機因素 受前兩類因素影響的事物為觀察變量 方差分析目的:分析控制變量的
2、不同水平是否對觀察變量產生了顯著影響,檢驗各個水平下觀察變量的均值是否相等 方差分析分類之一 單變量方差分析:一個觀察變量 單因方差分析中的控制變量只有一個 多因素方差分析中的控制變量有多個 多變量方差分析:多個觀察變量 方差分析分類之二 一般方差分析:因變量是定量變量,自變量是定類數據 協方差分析:將很難控制的因素作為協變量,在排除協變量影響的條件下,分析控制變量對觀察變量的影響,從而更加準確地對控制變量進行評價。協變量一定要是連續數值型。 非定量方差分析:因變量為定序變量 統計技術分類圖定量因變量一個自變量多個自變量二分變量多分變量T檢驗單因子方差分析定類定類和定距定距N因子方差分析協方差
3、分析回歸分析一個因變量多個因變量多變量方差分析因變量非定量因變量非定量方差分析 方差分析原理 目的:通過方差的比較來檢驗各個水平下的觀察值的均值是否相等 觀察值差異:觀察值存在差異,差異的產生來自兩個方面。 系統性差異:由控制變量的不同水平造成的,例如飲料的不同顏色帶來不同的銷售量 隨機性差異:由于抽選樣本的隨機性而產生的差異,例如,相同顏色的飲料在不同的商場銷售量也不相同。方差分析的基本思想(單因素)9組間變異總變異組內變異組內只包含隨機誤差組間既包括隨機誤差,也包括系統誤差 X1X2X3X4X5X組間變異組內變異AB X1X2X3X4X5X組間變異組內變異 AB單因素方差分析邏輯與步驟(O
4、ne-Way ANOVA) 前提假設 模型與假設 平方和的分解與F 檢驗 多重比較(事后檢驗) 關聯強度與效應值方差分析的前提條件(1)每個水平下的因變量應當服從正態分布。方差分析對分布假設有穩健性(robust),即正態性不滿足時,統計結果變化不大,因此一般并不要求檢驗總體的正態性。(2)變異可加性。各因素對離差平方和的影響可以分割成幾個可以加在一起的部分。(多因素)(3)獨立性。觀察對象是來自所研究因素的各個水平之下的獨立隨機抽樣(4)方差齊性(homogeneity of variance),也稱變異的同質性,各個水平下的總體具有相同的方差。這是方差分析一個很重要的前提,因此在進行方差分
5、析之前,應當進行方差齊性檢驗。 Bartlett檢驗法 Levene F 檢驗 最大方差與最小方差之比3,初步認為方差齊同。方差不齊若方差齊性的假定不滿足,可考慮如下策略: a.檢查某些表現“特殊”的觀測值,看能否將其剔除,用剩下的數據進行方差分析。 b.使用無方差齊性假設的多重比較方法。 c.數據變換,用變換(平方根變換、對數變換等)后的數據進行方差分析。正態性轉換。 d. 非參數檢驗模型與假設 模型表達式(單因素)Y=+a+e 建立假設,確定檢驗水準 012:kH 0.05;0.01 k組總體均數不全相等。 1:H方差分析表 組間變異體現了因素A的效應,組內變異則被視作誤差。ASS1k A
6、MSEAMSMSESS(1)k nEMSTSS1nk 來源平方和 自由度均方F 值P 值組間組內總和確定P 值,做出統計推斷事后比較(posteriori/post hoc comparison)F 檢驗顯著說明各組均值并不相同(至少兩組不同),但不能回答到底哪幾組不同。 通過對各組均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異。 方法眾多,不下20種。LSD法:最靈敏,會犯假陽性錯誤;Sidak法:比LSD法保守;Bonferroni法:比Sidak法更為保守一些;常用Scheffe法:多用于進行比較的兩組間樣本含量不等時;Dunnet法:常用于多個試驗組與一個對照組的比較;S-N-
7、K法:尋找同質亞組的方法;Turkey法:最遲鈍,要求各組樣本含量相同;Duncan法:與Sidak法類似。均數兩兩比較方法關聯強度 (strength of association)與效應值 (effect size)的度量實驗處理引致的效應的大小或者數據的變異有多少部分是由實驗處理造成的。 Eta平方 凈(偏)Eta平方 Omega平方 Cohens f(具體內容見附錄)雙因素(無交互作用)試驗的方差分析表方差來源因素A總和平方和ASSBSSTSS自由度AdfEdfTdf均方和AAASSMSdfEEESSMSdfF 值AAEMSFMSF 值臨介值(1 ,11 )Faab因素B誤差ESSBd
8、fBBBSSMSdfBBEMSFMS(1 ,11 )Fbab,ETABETABdfdfdffSSSSSSSS注意 各因素離差平方和的自由度為水平數減一,總平方和的自由度為試驗總次數減一。雙因素(有重復)試驗方差分析表方差來源因素A總和平方和ASSBSSTSS自由度AdfEdfTdf均方和AAASSMSdfEEESSMSdfF 值AAEMSFMSF 值臨介值(1 ,1 )Faab n因素B誤差ESSBdfBBBSSMSdfBBEMSFMS(1 ,1 )Fbab nA BA BSSA BdfA BA BA BMSSSdfA BA BEMSFMS(11 ,1 )Fabab nA BABdfdfdf這
9、里方差分析的應用范圍: (一)單因素多個樣本均數的比較:1. 完全隨機設計:只安排一種處理因素,不安排任何配伍因素。2. 隨機化區組設計:只安排一種處理因素,安排一種配伍因素。 3. 拉丁方設計:只安排一種處理因素,安排兩種配伍因素。 (二)多因素樣本均數間的比較:1.析因設計:安排兩種或兩種以上處理因素, 分析處理因素間的交互作用2.裂區設計:安排兩種或兩種以上處理因素, 分析處理因素間的交互作用3.交叉設計:安排兩種或兩種以上處理因素, 分析處理因素間的交互作用(三)多個樣本均數向量間的比較 多元方差分析:結果變量有兩個以上,需要綜合評價。(四)回歸方程的假設檢驗 協方差分析 概念:將方差
10、分析和回歸分析結合起來的一種統計分析方法27 當試驗指標(Y)的變異既受一個或幾個分類變量,也受一個或幾個連續變量的影響,可采用協方差分析方差分析:一個或幾個因子(分類變量)對變量Y(連續變量)的影響回歸分析:一個或幾個變量(連續變量)對變量Y (連續變量)的影響 目的 消除連續變量對Y的影響,使方差分析的檢驗功效更高,結果更可靠 連續變量可能會增大 Y 的組間差異,導致錯誤結論 連續變量可能會增大 Y 的組內變異,降低檢驗功效 消除分類變量的影響,使回歸分析的結果更可靠28 20名男性籃球運動員和20名大學生的肺活量(cm3)比較籃球運動員肺活量Y大學生肺活量Y470034505200410
11、0 48004000協方差分析基本思想協方差分析基本思想籃球運動員大學生身高X肺活量Y身高X肺活量Y1854700168345017552001704100 17448001694000 20名男性籃球運動員和20名大學生的肺活量(cm3)比較協變量協方差分析基本思想 比較肺活量時,要消除身高的影響。方法1:抽樣時,選身高相近的。方法2:從統計分析技巧上平衡數據。 校正了身高的影響后(回歸分析),再比較兩組肺活量的均數有無差異(方差分析)。協方差分析基本思想 在方差分析中,用來校正因變量的數值型變量稱為協變量(covariable)。 含有協變量的方差分析稱為協方差分析。 協方差分析可提高方差
12、分析的準確度。觀察指標(Y)的總變異:SS總SS協變量SS處理SS誤差協方差分析的基本思想 其實質就是從Y的總離均差平方和中扣除協變量X對Y的回歸平方和,對剩余(殘差)平方和作進一步分解后再進行方差分析,以更好的評價處理的效應。 33 SS總總SS回回 SS殘殘 SS總總SS協變量協變量SS處理處理SS誤差誤差 SS修正修正SS組內殘組內殘差差身高肺活量GROUP 2.00 1.001X2XX1Y2YY1大學生籃球運動員Y2圖圖1 協方差分析示意圖協方差分析示意圖調調整整均均數數xbay 11xbay 22協方差分析步驟完全隨機設計的協方差分析 應用條件檢驗 回歸分析 求調整均數 對調整均數作
13、方差分析協方差分析的假設 協方差分析的基本假設與方差分析相同,包括變量的正態性、觀測值獨立、方差齊性等,此外還有三個重要的假設: 因變量與協方差之間線性關系; 所測量的協變量不應有誤差,如果選用的是多項的量表,應有高的內部一致性信度或重測信度,系數最好大于0.80。這一假設若被違反會造成犯一類錯誤的概率上升,降低統計檢驗力。 “組內回歸系數同質性”(homogeneity of with in rgression),各實驗處理組中一舉協變量(X)預測因變量(Y)的回歸線的回歸系數要相等,即斜率相等,各條回歸線平行。如果斜率不等則不宜直接進行協方差分析。協方差分析的模型和假定37回歸分析:*)(
14、ijiijijXXY協方差分析:ijiijiijeXXaY)(l模型協變量協變量Co-variable方差分析:ijiijaYijiiijijeaXXY)(ijiijiijeXXaY)(Thanks!問題:為什么一個比較均數差異的方法竟稱為方差分析? 這種命名是因為在檢驗均數間差異是否具有統計學意義的過程中,我們實際上是通過比較方差而得到的。 與t 檢驗直接比較兩組的平均數的做法不同,方差分析把“平均數之間差異是否顯著”的問題轉化為“平均數組間變異是否顯著”的問題,通過“組間變異”與“組內變異”的對比,進行F 檢驗檢驗,從整體上同時比較多組的平均數之同時比較多組的平均數之間間是否存在顯著差異。
15、 LSD (費舍最小顯著差異法, Fishers least significant difference) 該方法是對檢驗兩總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE代替)而得到的。 ()11()ijijXXtt nkMSEnn特點檢驗敏感性高,即水平間的均值只要存在一定程度的微小差異就可能被檢驗出來。但該方法沒有控制范第一類錯誤的概率。 S-N-K(Student-Newman-Keuls, q檢驗) 首先把各組均值排序,用每一比較的兩個均值在排序序列種相差的等級數來確定不同的q 臨界值。 ( ,)11()2ijijeXijXXXXqq r dfSEMSEnn兩均值的ra
16、nk之差是一種有效劃分相似性子集的方法,該方法是一種有效劃分相似性子集的方法,該方法適用于各水平下觀測值個數相等的情況。適用于各水平下觀測值個數相等的情況。 Tukey法(honesty significant different, HSD) 與SNK法類似,不同之處在于不論各組均值的大小次序,均使用同一臨界值。 ( ,)11()2ijijeXijXXXXqq k dfSEMSEnn組數它采用q統計量,適用于各水平下觀測值個數相等的情況。與LSD方法比較,較好的控制了范第一類錯誤的概率。Bonferroni校正(以t 分布作為檢驗分布,對檢驗水準進行調整)與LSD方法基本相同。不同的是它控制了
17、范第一類錯誤的概率。在每次兩兩組的檢驗中,它將顯著水平除以兩兩檢驗的總次數。 在比較的次數較多時,該方法就不太適合。 DunnettDunnett方法方法 是一種唯一用于多個處理組和一個對照組是一種唯一用于多個處理組和一個對照組比較的方法。比較的方法。SPSSSPSS提供的常用多重比較檢驗方法提供的常用多重比較檢驗方法1 1、TambaneTambanes T2:s T2: 基于基于t t檢驗的保守的多重比較方法。檢驗的保守的多重比較方法。不滿足方差齊性不滿足方差齊性多重多重檢驗方法檢驗方法2 2、DunnettDunnetts T3:s T3: 基于學生化極大模的多重比較方法。基于學生化極大
18、模的多重比較方法。3 3、Games-Howell:Games-Howell: 非參數多重比較方法。非參數多重比較方法。4 4、 DunnettDunnetts C:s C:基于學生化極差的多重比較方基于學生化極差的多重比較方法,是一種可信區間的方法。法,是一種可信區間的方法。 Eta平方(Eta-Squared,2),又稱關聯強度(correlation ratio),因變量的變異被自變量解釋的百分比。 凈Eta平方(partial Eta-Squared,p2),多因素ANOVA中,扣除了其他自變量后某自變量的效應。 判斷標準:0.01,小;0.06,中;0.14,大2effecttota
19、lSSSS2effectpeffecterrorSSSSSS Omega平方(Omega squared,2) 當F顯著時,2將會是正值,若為負,則要解釋為0。當樣本很大而使MSw變得很小,F很容易達到顯著,此時若2很小,即使在統計上有意義,實際應用上仍然沒意義。 判斷標準:0.01,小;0.06,中;0.14,大2(1)effectberrorterrorwbtwSSdf MSSSMSSSkMSSSMS Cohens f f f 0.25,中;f 0.40,高 221f修正均數修正均數 的計算:的計算:jYXXXYcllb組內組內公共回歸系數:XXbYYjcjj修正均數間的多重比較:修正均數
20、間的多重比較:2.011ABY XXXXXYYqSlnal組間組內S S2 2y.xy.x為組內剩余方差為組內剩余方差SS總總 SS回回 SS總殘總殘52YYl2XYxyXXlSSbll回SSSS總回SSSS組內殘差修正2XYYYXXlSSll組內組內殘差組內組內()() ()222ij()ijjijiiXlSSXni組內組內(X -X2N總殘差 1修正k1Nk組內殘差總殘差修正 SSSSSS總殘組內殘差修正常用試驗設計 1.完全隨機設計(Completely random design) 單因素設計. 優點:簡單易行,缺點:只能分析一個因素 2.配伍設計(Randomized block design) 隨機區組或雙因素無重復試驗設計. 交互作用和方差齊性無法考察 (1) 同一受試對象在同一處理不同水平間的比較復 (2) 將幾個受試對象按一定條件劃分成配伍組,再將每一配伍組的各受試者隨機分配 到各處理組中,每個配伍組的例數等于處理組個數. 3.交叉設計(Cross-over design
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥品電子訂單管理制度
- 藥店醫保培訓管理制度
- 藥店開發銷售管理制度
- 藥店設備校準管理制度
- 薪資薪酬績效管理制度
- 設備公司采購管理制度
- 設備工藝變更管理制度
- 設備機房衛視管理制度
- 設備現場安全管理制度
- 設備腐蝕檢測管理制度
- 人教部編版三年級下冊語文【選擇題】專項復習訓練真題100題(附答案解析)
- 免檢車輛標志委托書
- 人教鄂教版科學18《制作日晷》課件-科學四年級下冊人教鄂教版
- 云南開放大學實-用寫作離線作業1-5
- 內科學(腎臟-內分泌-血液)智慧樹知到期末考試答案章節答案2024年溫州醫科大學
- 食品安全與日常飲食智慧樹知到期末考試答案章節答案2024年中國農業大學
- 信息安全、網絡安全和隱私保護-信息安全控制清單(2024A1-雷澤佳編制)
- 100以內進退位加減法口算題每天60道
- 基礎護理學第七版題附有答案
- MOOC 嵌入式軟件設計-大連理工大學 中國大學慕課答案
- RFJ 003-2021 人民防空工程防護設備產品與安裝質量檢測標準(暫行)
評論
0/150
提交評論