




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
方差分析與試驗設計第1頁,共78頁,2023年,2月20日,星期五10.1方差分析引論一.方差分析及其有關術語二.方差分析的基本思想和原理三.方差分析中的基本假定四.問題的一般提法第2頁,共78頁,2023年,2月20日,星期五一.方差分析及其有關術語(1)檢驗多個總體均值是否相等(2)研究定性的自變量(條件)對數值型因變量(結果)的影響(3)有單因素方差分析和雙因素方差分析
?單因素方差分析:涉及一個分類的自變量(條件)
?雙因素方差分析:涉及兩個分類的自變量(條件)第3頁,共78頁,2023年,2月20日,星期五例10.1為了對幾個行業的服務質量進行評價,消費者協會在四個行業分別抽取了23家不同的企業作為樣本.得最近一年中消費者對企業投訴的次數如下表.表10-1消費者對四個行業的投訴次數行業觀測值零售業旅游業航空公司家電制造業12345675766494034534468392945565131492134404451657758第4頁,共78頁,2023年,2月20日,星期五續(1)分析四個行業之間的服務質量是否有顯著差異,也就是要判斷不同“行業”的“投訴次數”是否有顯著差異.可歸結為檢驗這四個行業被投訴次數的均值是否相等.(2)如果它們的均值相等,就意味著它們之間的服務質量沒有顯著差異;如果均值不全相等,則表示它們之間的服務質量有顯著差異.第5頁,共78頁,2023年,2月20日,星期五幾個基本概念1.對投訴次數是否有影響的那些(可以控制的)條件稱為因素.2.為了考察一個因素的影響,一般把他嚴格控制在幾個不同的狀態或等級上,把因素的每一個狀態或等級稱為一個水平.3.只考察一個因素的方差分析,稱為單因素方差分析.4.同時考察兩個或兩個以上因素的方差分析,稱為多因素方差分析.5.假定各水平的數據是來自正態分布總體的隨機樣本,各水平的樣本互相獨立,且方差相等.第6頁,共78頁,2023年,2月20日,星期五二.方差分析的基本思想和原理
1.兩類誤差及兩類方差(1)每個水平為一個總體(2)每個水平的一組觀察值為總體的一個隨機樣本,同一水平下樣本觀察值之間的差異稱為隨機誤差,用組內方差來表示.(3)不同水平下樣本觀察值之間的差異可能是由于不同水平引起的,這種誤差稱為系統誤差,但也包含隨機誤差.不同水平樣本觀察值之間差異用組間方差來表示,即組間方差包括隨機誤差,也包括系統誤差.第7頁,共78頁,2023年,2月20日,星期五2.方差的比較(1)如果不同水平對試驗結果沒有不同影響,那么組間方差中只包括隨機誤差.這時,組間方差與組內方差應該相近,組間方差與組內方差之比接近1.(2)如果不同水平對試驗結果有不同影響,那么組間方差除了隨機誤差之外還包括系統誤差.這時,組間方差就會大于組內方差,組間方差與組內方差之比就會大于1.(3)方差分析就是通過這種方差的比較,作出判斷.第8頁,共78頁,2023年,2月20日,星期五三.方差分析中的基本假定(1)每個總體都應服從正態分布對于因素的每一個水平,其觀察值是來自服從正態分布總體的簡單隨機樣本.(2)各個總體的方差必須相同各組觀察數據是從具有相同方差的總體中抽取的(3)樣本是獨立的即每個行業的樣本是獨立抽取的第9頁,共78頁,2023年,2月20日,星期五四.問題的一般提法(1)
要檢驗k個水平(總體)的均值是否相等,需要提出如下假設:不全相等對例10.1,設為零售業被投訴次數的均值,為旅游業被投訴次數的均值,為航空公司被投訴次數的均值,為家電制造業被投訴次數的均值,則提出的假設為不全相等第10頁,共78頁,2023年,2月20日,星期五10.2單因素方差分析
(one-wayanalysisofvariance)
一.數據結構二.分析步驟三.關系強度的測量四.用Excel進行方差分析第11頁,共78頁,2023年,2月20日,星期五一.數據結構觀察值
xij水平Ai
A1A2
…Ak12::ni
x11x21…xk1x12x22…xk2::::::::x1n1
x2n2
…xknk表10-2單因素方差分析的數據結構第12頁,共78頁,2023年,2月20日,星期五二.分析步驟
(一)提出假設對于k個水平的單因素方差分析,原假設和備擇假設為不全相等第13頁,共78頁,2023年,2月20日,星期五(二)構造檢驗的統計量1.水平的樣本均值:設第i水平有個觀察值,則第i個水平的樣本均值2.樣本的總均值其中(10.1)(10.2)第14頁,共78頁,2023年,2月20日,星期五消費者對四個行業的投訴次數及均值表10-3第15頁,共78頁,2023年,2月20日,星期五3.計算誤差平方和
(1)總誤差平方和(sumofsquaresfortotal)用SST表示總誤差平均和,反映全部數據的離散情況,即(10.3)例10.1的總誤差平方和為第16頁,共78頁,2023年,2月20日,星期五(2)水平項誤差平方和(sumofsquaresforfactorA)用SSA表示水平項誤差平方和,反映各水平樣本數據之間的異差程度,即對于例10.1有(10.4)第17頁,共78頁,2023年,2月20日,星期五(3)誤差項平方和(sumofsquaresforerror)用SSE表示誤差項平方和,反映各水平數據的離散情況,即對例10.1,零售業的誤差項平方和(10.5)第18頁,共78頁,2023年,2月20日,星期五續類似可得從而第19頁,共78頁,2023年,2月20日,星期五三個平方和的關系總誤差平方和SST、誤差項平方和SSE及水平項誤差平方和SSA之間的關系
SST=SSA+SSE即(10.6)第20頁,共78頁,2023年,2月20日,星期五續(三個平方和的關系)由于從而在實際計算時,一般先計算SST和SSA,而
SSE=SST-SSA對于例10.1有4164.6087=1456.6087+2708第21頁,共78頁,2023年,2月20日,星期五4.計算統計量(1)各個誤差平方和的大小與數據的多少有關,各個誤差平方和的平均稱為平均平方,也稱均方或方差,用MS表示.(2)平均平方是離差平方和除以相應的自由度(3)三個平方和的自由度分別為
SST的自由度為n-1
SSA的自由度為k-1
SSE的自由度為第22頁,共78頁,2023年,2月20日,星期五續(計算統計量)(4)SSA的平均平方記為MSA,即(5)SSE的平均平方記為MSE,即(10.7)關于自由度,存在如下的關系式(10.8)對于例10.1第23頁,共78頁,2023年,2月20日,星期五續(計算統計量)如果成立,那么(10.9)對于例10.1,求得第24頁,共78頁,2023年,2月20日,星期五(三)統計決策對于規定的顯著性水平,由于成立時根據小概率原理,若則拒絕.認為各水平均值不全相等.稱所考察因素的各水平間差異顯著,或各水平均值間有顯著差異.而當則不能拒絕.這時稱各水平之間無顯著差異,即認為成立,各水平的均值都相等.第25頁,共78頁,2023年,2月20日,星期五續(統計決策)對于例10.1,若取,則由于從而拒絕.認為四個不同行業的平均投訴次數有顯著差異,即不同行業的平均投訴次數是不同的.第26頁,共78頁,2023年,2月20日,星期五圖10-4統計量F的抽樣分布F(k-1,n-k)0F第27頁,共78頁,2023年,2月20日,星期五(四)方差分析表(analysisofvariancetable)前面這些計算結果可以列成表格的形式,稱為方差分析表.誤差來源平方和自由度均方F值FαSS
dfMS組間SSAk-1MSAMSA/MSE組內SSEn-kMSE-總差異SSTn-1
--表10-4方差分析表第28頁,共78頁,2023年,2月20日,星期五例10.1的方差分析表表10-5第29頁,共78頁,2023年,2月20日,星期五三.關系強度的測量拒絕原假設則表明因素(自變量)與觀測值之間有關系,而組間平方和(SSA)則度量了自變量(行業)對因變量(投訴次數)的影響大小.因此變量間關系的強度用用自變量平方和(SSA)總平方和(SST)的比例大小來反映,其平方根R就可以用來測量兩個變量之間的關系強度.(10.10)對于例10.1,得第30頁,共78頁,2023年,2月20日,星期五四.用Excel進行單因素方差分析第1步:選擇【工具】下拉菜單第2步:選擇【數據分析】選項第3步:在數據分析工具中選擇【單因素方差分析】,然后選擇【確定】第4步:當對話框出現時在【輸入區域】方框內鍵入數據單元格區域在【】方框內鍵入0.05(也可根據需要確定)在【輸出區域】中選擇輸出位置第31頁,共78頁,2023年,2月20日,星期五表10-6用Excel進行方差分析的步驟第32頁,共78頁,2023年,2月20日,星期五表10-7Excel輸出的方差分析結果第33頁,共78頁,2023年,2月20日,星期五10.3方差分析中的多重比較
(multiplecomparisonprocedures)當方差分析拒絕,從而接受時,認為各水平均值不全相等.多重比較是通過對各均值之間的配對比較來進一步檢驗到底那些均值之間有顯著差異.多重比較的方法有多種,這里介紹最小顯著差異法.第34頁,共78頁,2023年,2月20日,星期五最小顯著差異法(LSD)
LSD方法是一種檢驗兩個總體均值是否相等的t檢驗方法,由(8.8)式其中是由兩個樣本的數據求得.當對多個總體進行比較時,由于MSE是把k個水平的全部樣本數據求得,從而用
MSE代替.于是統計量t為第35頁,共78頁,2023年,2月20日,星期五多重比較的步驟(1)提出原假設和備擇假設(3)若則拒絕,稱和有顯著差異,否則不能拒絕.即接受,稱和沒有顯著差異.(2)檢驗統計量第36頁,共78頁,2023年,2月20日,星期五LSD
方法
LSD方法通常并不按t值作檢驗,而是基于作檢驗.(1)提出和(3)若則拒絕,否則接受.(2)計算LSD(10.11)第37頁,共78頁,2023年,2月20日,星期五例10.1的LSD方法已知取,則,從而多重比較的結果可以列成表格形式,稱為多重比較表.第38頁,共78頁,2023年,2月20日,星期五例10.1的多重比較表(LSD法)
24*1110
14*1
13
表中差值右上角標者表示相應的第39頁,共78頁,2023年,2月20日,星期五10.4雙因素方差分析
一、雙因素方差分析及其類型(1)同時分析兩個因素(因素A和因素B)對試驗結果的影響.(2)分別對兩個因素進行檢驗,考察各自的作用.(3)如果因素A和因素B對試驗結果的影響是相互獨立的,則可以分別考察各自的影響,這種雙因素方差分析稱為無交互作用的雙因素方差分析.(4)如果因素A和因素B除了各自對試驗結果的影響外,還產生額外的新影響,這種額外的影響稱為交互作用,這時的雙因素方差分析則稱為有交互作用的雙因素方差分析.(5)無交互作用的雙因素方差分析,相當于對每個因素分別進行單因素方差分析.第40頁,共78頁,2023年,2月20日,星期五例10.3品牌地區地區1地區2地區3地區4地區5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298表10-8不同品牌的彩電在各地區的銷售量數據有四個品牌的彩電在五個地區銷售,為分析彩電的品牌(品牌因素)和銷售地區(地區因素)對銷售量是否有影響,對每個品牌在各地區的銷售量取得以下數據.試分析品牌和銷售地區對彩電的銷售量是否有顯著影響?(=0.05)第41頁,共78頁,2023年,2月20日,星期五二、無交互作用的雙因素方差分析
(一)數據結構雙因素方差分析的基本假定(1)每個水平組合的觀察值,是來自正態總體的簡單隨機樣本.(2)各正態總體的方差都相等.(3)各隨機樣本相互獨立.第42頁,共78頁,2023年,2月20日,星期五表10-9雙因素方差分析數據結構
第43頁,共78頁,2023年,2月20日,星期五各水平樣本均值與樣本總均值(1)A(行)因素第i水平的樣本均值(2)B(列)因素第j水平的樣本均值(3)樣本總平均(10.12)(10.13)(10.14)第44頁,共78頁,2023年,2月20日,星期五(二)分析步驟
1.提出假設(1)對A(行)因素
提出的假設為不全相等(2)對B(列)因素B提出的假設為不全相等第45頁,共78頁,2023年,2月20日,星期五2.構造檢驗統計量
(1)計算誤差平方和總誤差平方和反映全部數據的離散情況(10.15)第46頁,共78頁,2023年,2月20日,星期五續(計算誤差平方和)(10.16)SSR反映A(行)因素誤差平方和(10.17)SSC反映B(列)因素誤差平方和(10.18)SSE反映隨機誤差平方和即
SST=SSR+SSC+SSE(10.19)第47頁,共78頁,2023年,2月20日,星期五續(計算均方)各個誤差平方和的大小與數據的多少有關,各個誤差平方和的平均稱為均方(平均平方).均方是離差平方和除以相應的自由度.各個平方和的自由度分別為
SST的自由度為n-1
SSR的自由度為k-1
SSC的自由度為r-1
SSE的自由度為且第48頁,共78頁,2023年,2月20日,星期五續(計算均方)SSR的均方記為MSR,即SSC的均方記為MSC,即SSE的均方記為MSE,即(10.20)(10.21)(10.22)第49頁,共78頁,2023年,2月20日,星期五構造檢驗統計量檢驗A(行)因素的各水平對試驗結果有無顯著影響,采用統計量檢驗B(列)因素的各水平對試驗結果有無顯著影響,采用統計量(10.23)(10.24)第50頁,共78頁,2023年,2月20日,星期五3.統計決策對規定的顯著性水平
,由于則拒絕,認為A(行)因素的各水平間有顯著差異.對規定的
,由于根據小概率原理,若從而,若則拒絕,認為B(列)因素的各水平間有顯著差異.第51頁,共78頁,2023年,2月20日,星期五方差分析表表10-10雙因素方差分析表誤差來源誤差平方和自由度均方F值A(行)因素SSR
k-1MSR=SSR/(k-1)FR=MSR/MSEB(列)因素SSCr-1MSC=SSC/(r-1)FC=MSC/MSE誤差SSE(k-1)(r-1)MSE=
SSE/(k-1)(r-1)-合計SSTn-1--第52頁,共78頁,2023年,2月20日,星期五例10.4
有四個品牌的彩電在五個地區銷售,為分析彩電的品牌(品牌因素)和銷售地區(地區因素)對銷售量是否有影響,對每個品牌在各地區的銷售量取得以下數據。試分析品牌和銷售地區對彩電的銷售量是否有顯著影響?(=0.05)解:先建立假設.對于A(行)因素(品牌)不全相等對于B(列)因素(地區)不全相等直接利用Excel進行雙因素方差分析結果見表10-11.第53頁,共78頁,2023年,2月20日,星期五用Excel進行雙因素方差分析第1步:選擇【工具】下拉菜單第2步:選擇【數據分析】選項第3步:在數據分析工具中選擇【無重復雙因素方差分析】,然后選擇【確定】第4步:當對話框出現時在【輸入區域】方框內鍵入數據單元格區域在【】方框內鍵入0.05(也可根據需要確定)在【輸出選項】中選擇輸出區域第54頁,共78頁,2023年,2月20日,星期五用Excel進行雙因素方差分析的步驟第55頁,共78頁,2023年,2月20日,星期五表10-11Excel輸出的方差分析結果第56頁,共78頁,2023年,2月20日,星期五統計決策從而拒絕,接受,即不同的品牌對銷售產生了不同的影響.又由于由于所以接受,即不同地區對銷售沒有產生不同的影響.第57頁,共78頁,2023年,2月20日,星期五(三)關系強度的測量
把A(行)因素的平方和SSR和B(列)因素的平方和SSC加在一起,與總平方和的比值定義為R2,即(10-25)對于例10.4,得第58頁,共78頁,2023年,2月20日,星期五三、有交互作用的雙因素方差分析
例10.5城市道路交通管理部門為研究不同的路段和不同的時間段對行車時間的影響,讓一名交通警察分別在兩個路段和高峰期與非高峰期親自駕車進行試驗,通過試驗取得共獲得20個行車時間(分鐘)的數據如下.試分析路段、時段以及路段和時段的交互作用對行車時間的影響.表10-14不同時段和不同路段的行車時間單位:分鐘第59頁,共78頁,2023年,2月20日,星期五各水平樣本均值與樣本總均值(1)A(行)因素第i水平的樣本均值(2)B(列)因素第j水平的樣本均值第60頁,共78頁,2023年,2月20日,星期五續(4)樣本總平均(3)A(行)因素第i水平與B(列)因素第j水平組合的樣本均值第61頁,共78頁,2023年,2月20日,星期五計算誤差平方和SST代表總誤差平方和(10.26)(10.27)SSR代表A(行)因素平方和(10.28)SSC代表B(列)因素平方和第62頁,共78頁,2023年,2月20日,星期五續(10.29)SSE代表誤差平方和即
SST=SSR+SSC+SSRC+SSE(10.30)SSRC代表交互作用平方和第63頁,共78頁,2023年,2月20日,星期五表10-15有交互作用的雙因素方差分析表第64頁,共78頁,2023年,2月20日,星期五用Excel進行有交互作用的雙因素方差分析第1步:選擇【工具】下拉菜單第2步:選擇【數據分析】選項第3步:在數據分析工具中選擇【可重復雙因素方差分析】,然后選擇【確定】第4步:當對話框出現時在【輸入區域】方框內鍵入數據單元格區域在【】方框內鍵入0.05(也可根據需要確定)
在【每一樣本的行數】方框內鍵入5在【輸出區域】中選擇輸出位置第65頁,共78頁,2023年,2月20日,星期五表10-16用Excel進行雙因素方差分析的步驟第66頁,共78頁,2023年,2月20日,星期五表10-17Excel輸出的方差分析結果第67頁,共78頁,2023年,2月20日,星期五10.5試驗設計初步一、完全隨機化設計二、隨機化區組設計三、因子設計第68頁,共78頁,2023年,2月20日,星期五一、完全隨機化設計
(completelyrandomizeddesign)完全隨機化設計是指因素的水平或水平組合采用隨機方法安排到試驗單元的一種試驗設計.“處理”是指因素的各個水平或水平組合“試驗單元(experimentunit)”是安排“處理”的對象或材料
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年體育休閑廣場運動項目引進與推廣研究報告
- 藥品藥店安全管理制度
- 藥品銷售異常管理制度
- 藥店醫保網絡管理制度
- 藥店消毒制度管理制度
- 萊西中學資產管理制度
- 設備臺賬資料管理制度
- 設備客戶報修管理制度
- 設備更新維護管理制度
- 設備申請購買管理制度
- 中國血脂管理指南理論知識考核試題及答案
- 教考結合·必修上冊文言知識梳理- 備考
- 血管活性藥物靜脈輸注護理
- 2024年機關事業單位工人汽車駕駛員高級技師國家題庫練習題答案
- 村級積分制管理
- Nikon尼康D3100中文說明書
- 國家開放大學2024春《1494員工勞動關系管理》期末考試真題及答案-開
- DBJ∕T 13-234-2024 不發火建筑地面應用技術標準
- 2024年新疆中考地理真題卷及答案
- 人教版初三物理總復習電學專題復習教學設計
- 項目風險記錄及跟蹤表
評論
0/150
提交評論