




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
關于概率論與數理統計第九章1第1頁,共155頁,星期日,2025年,2月5日2方差分析(Analysisofvariance,簡稱:ANOVA),是由英國統計學家費歇爾(Fisher)在20世紀20年代提出的,可用于推斷兩個或兩個以上總體均值是否有差異的顯著性檢驗.第2頁,共155頁,星期日,2025年,2月5日3§1單因素方差分析例:為了比較三種不同類型日光燈管的壽命(小時),現將從每種類型日光燈管中抽取8個,總共24個日光燈管進行老化試驗,根據下面經老化試驗后測算得出的各個日光燈管的壽命(小時),試判斷三種不同類型日光燈管的壽命是不是有存在差異.第3頁,共155頁,星期日,2025年,2月5日4日光燈管的壽命(小時)類型壽命(小時)類型I52906210574050005930612060805310類型II58405500598062506470599054705840類型.III71306660634064707580656072906730引起日光燈管壽命不同的原因有二個方面:其一,由于日光燈類型不同,而引起壽命不同.其二,同一種類型日光燈管,由于其它隨機因素的影響,也使其壽命不同.第4頁,共155頁,星期日,2025年,2月5日5在方差分析中,通常把研究對象的特征值,即所考察的試驗結果(例如日光燈管的壽命)稱為試驗指標.對試驗指標產生影響的原因稱為因素,“日光燈管類型”即為因素.因素中各個不同狀態稱為水平,如日光燈管三個不同的類型,即為三個水平.第5頁,共155頁,星期日,2025年,2月5日6單因素方差分析僅考慮有一個因素A對試驗指標的影響.假如因素A有r個水平,分別在第i水平下進行了多次獨立觀測,所得到的試驗指標的數據第6頁,共155頁,星期日,2025年,2月5日7每個總體相互獨立.因此,可寫成如下的數學模型:第7頁,共155頁,星期日,2025年,2月5日8
方差分析的目的就是要比較因素A的r個水平下試驗指標理論均值的差異,問題可歸結為比較這r個總體的均值差異.第8頁,共155頁,星期日,2025年,2月5日9檢驗假設第9頁,共155頁,星期日,2025年,2月5日10假設等價于第10頁,共155頁,星期日,2025年,2月5日11為給出上面的檢驗,主要采用的方法是平方和分解。即假設數據總的差異用總離差平方和分解為二個部分:一部分是由于因素A引起的差異,即效應平方和;另一部分則由隨機誤差所引起的差異,即誤差平方和。第11頁,共155頁,星期日,2025年,2月5日12第12頁,共155頁,星期日,2025年,2月5日13證明:
第13頁,共155頁,星期日,2025年,2月5日14第14頁,共155頁,星期日,2025年,2月5日15第15頁,共155頁,星期日,2025年,2月5日16第16頁,共155頁,星期日,2025年,2月5日17第17頁,共155頁,星期日,2025年,2月5日18定理9.1.1第18頁,共155頁,星期日,2025年,2月5日19方差來源平方和自由度均方F比因素Ar-1誤差n-r總和n-1單因素試驗方差分析表第19頁,共155頁,星期日,2025年,2月5日20第20頁,共155頁,星期日,2025年,2月5日21
例1設有5種治療蕁麻疹的藥,要比較它們的療效。假設將30個病人分成5組,每組6人,令同組病人使用一種藥,并記錄病人從使用藥物開始到痊愈所需時間,得到下面的記錄:(=0.05)第21頁,共155頁,星期日,2025年,2月5日22藥物類型治愈所需天數x15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6第22頁,共155頁,星期日,2025年,2月5日23這里藥物是因子,共有5個水平,這是一個單因素方差分析問題,要檢驗的假設是“所有藥物的效果都沒有差別”。
第23頁,共155頁,星期日,2025年,2月5日24第24頁,共155頁,星期日,2025年,2月5日25方差來源平方和自由度均方F比因素A36.46749.1173.90誤差58.500252.334總和94.96729第25頁,共155頁,星期日,2025年,2月5日26未知參數的估計第26頁,共155頁,星期日,2025年,2月5日27第27頁,共155頁,星期日,2025年,2月5日28第28頁,共155頁,星期日,2025年,2月5日29第29頁,共155頁,星期日,2025年,2月5日30在Excel上實現方差分析先加載''數據分析"這個模塊,方法如下:在excel工作表中點擊主菜單中“工具”點擊下拉式菜單中“加載宏”就會出現一個“加載宏”的框.
在“分析工具庫”前的框內打勾點擊“確定”.這時候再點擊下拉式菜單會新出現“數據分析”.然后就可以進行統計分析了.第30頁,共155頁,星期日,2025年,2月5日31以下面的例子來說明用Excel進行方差分析的方法:保險公司某一險種在四個不同地區一年的索賠額情況記錄如表所示.試判斷在四個不同地區索賠額有無顯著的差異?第31頁,共155頁,星期日,2025年,2月5日32保險索賠記錄地區索賠額(萬元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60第32頁,共155頁,星期日,2025年,2月5日33在Excel工作表中輸入上面的數據點擊主菜單中“工具”點擊下拉式菜單中“數據分析”就會出現一個“數據分析”的框.
點擊菜單中“方差分析:單因素方差分析”點擊“確定”,出現“方差分析:單因素方差分析”框.第33頁,共155頁,星期日,2025年,2月5日34在“輸入區域”中標定你已經輸入的數據的位置根據你輸入數據分組情況(是按行分或按列分)確定分組.選定方差分析中F檢驗的顯著水平選定輸出結果的位置點擊“確定”.
在你指定的區域中出現如下方差分析表:第34頁,共155頁,星期日,2025年,2月5日35方差來源平方和自由度均方F比P-valueFcrit組間0.049230.01642.16590.12083.0491組內0.1666220.0076總計0.215825方差分析表第35頁,共155頁,星期日,2025年,2月5日36根據Excel給出的方差分析表,假設H0的判別有二種方法:第36頁,共155頁,星期日,2025年,2月5日37第37頁,共155頁,星期日,2025年,2月5日38第38頁,共155頁,星期日,2025年,2月5日39方差分析的前提第39頁,共155頁,星期日,2025年,2月5日40方差分析和其它統計推斷一樣,樣本的獨立性對方差分析是非常重要的,在實際應用中會經常遇到非隨機樣本的情況,這時使用方差分析得出的結論不可靠.因此,在安排試驗或采集數據的過程中,一定要注意樣本的獨立性問題.第40頁,共155頁,星期日,2025年,2月5日41在實際中,沒有一個總體真正服從正態分布的,而方差分析卻依賴于正態性的假設.不過由經驗可知,方差分析F檢驗對正態性的假設并不是非常敏感,即,實際所得到的數據,若沒有異常值和偏性,或者說,數據顯示的分布比較對稱的話,即使樣本容量比較小(如每個水平下的樣本容量僅為5左右),方差分析的結果仍是值得依賴的.第41頁,共155頁,星期日,2025年,2月5日42方差齊性對于方差分析是非常重要的,因此在方差分析之前往往要進行方差齊性的診斷,檢驗方差齊性假設通常采用Barlett檢驗.不過,也可采用如下的經驗準則:當最大樣本標準差不超過最小樣本標準差的兩倍時,方差分析F檢驗結果近似正確.第42頁,共155頁,星期日,2025年,2月5日43例
檢驗a,b兩種藥物的抗癌效果,要做動物試驗。作法是:將患有某種癌的白鼠隨機地分成三組。第一組:注射a物質,第二組:注射b物質,第三組:不做處理。經過一段時間觀察后,得到壽命數據。在試驗中,考慮白鼠的性別有可能對其壽命有顯著的影響。將“性別”作為另一個因素——“雙因素試驗”。因素A:藥物,三個水平;因素B:性別,二個水平;兩個因素共有2×3=6種組合。§2雙因素方差分析第43頁,共155頁,星期日,2025年,2月5日44
(一)
無交互作用的雙因素方差分析
因素B因素A第44頁,共155頁,星期日,2025年,2月5日45第45頁,共155頁,星期日,2025年,2月5日46分別檢驗假設第46頁,共155頁,星期日,2025年,2月5日47第47頁,共155頁,星期日,2025年,2月5日48第48頁,共155頁,星期日,2025年,2月5日49第49頁,共155頁,星期日,2025年,2月5日50第50頁,共155頁,星期日,2025年,2月5日51雙因素無重復試驗的方差分析表方差來源平方和自由度均方F比因素A因素B誤差總和第51頁,共155頁,星期日,2025年,2月5日52例
假定對3個小麥品種和3塊試驗地塊進行區組設計試驗,得到如下的數據:
表
小麥品種區組試驗數據
小麥品種(A)試驗地塊(B)總和B1B2B3A1258279242779A2302314336952A3321318327966總和8819119052697第52頁,共155頁,星期日,2025年,2月5日53雙因素無重復試驗的方差分析表方差來源平方和自由度均方F比F值α=0.05因素A7232.666723616.333312.506.94因素B168.0000284.00000.296.94誤差1157.33334289.3333總和8558.00008第53頁,共155頁,星期日,2025年,2月5日54在這個問題中我們所關心的是因素A的效應,由方差分析表知,原假設不成立,即認為小麥品種的產量之間有顯著差異。在這里,品種3的單產最高,而品種1的產量最低,因此可以斷定品種3明顯地優于品種1。
第54頁,共155頁,星期日,2025年,2月5日55
(二)
有交互作用的雙因素方差分析
因素B因素A第55頁,共155頁,星期日,2025年,2月5日56第56頁,共155頁,星期日,2025年,2月5日57第57頁,共155頁,星期日,2025年,2月5日58分別檢驗假設:第58頁,共155頁,星期日,2025年,2月5日59第59頁,共155頁,星期日,2025年,2月5日60第60頁,共155頁,星期日,2025年,2月5日61第61頁,共155頁,星期日,2025年,2月5日62第62頁,共155頁,星期日,2025年,2月5日63第63頁,共155頁,星期日,2025年,2月5日64雙因素試驗的方差分析表方差來源平方和自由度均方F比因素A因素B交互作用誤差總和第64頁,共155頁,星期日,2025年,2月5日65例
為了比較3種松樹在4個不同的地區的生長情況有無差別,在每個地區對每種松樹隨機地選取5株,測量它們的胸徑,得到的數據列表如下。
松樹數據表松樹種類地區1234123,15,26,13,2125,20,21,16,1821,17,16,24,2714,17,19,20,24228,22,25,19,2630,26,26,20,2819,24,19,25,2917,21,18,26,23318,10,12,22,1315,21,22,14,1223,25,19,13,2218,12,23,22,19第65頁,共155頁,星期日,2025年,2月5日66輸出各單元總和及因素水平總和:
松樹數據的總和表單元總和B1B2B3B4水平總和A19810010594397A2120130116105471A3758410294355水平總和2933143232931223第66頁,共155頁,星期日,2025年,2月5日67方差來源平方和自由度均方F比F值α=0.05因素A344.93332172.46679.453.19因素B46.0500315.35000.842.80交互作用113.6000618.93331.042.30誤差875.60004818.2417總和1380.183359雙因素方差分析表第67頁,共155頁,星期日,2025年,2月5日68§3一元線性回歸分析一、確定性關系:當自變量給定一個值時,就確定應變量的值與之對應。如:在自由落體中,物體下落的高度h與下落時間t之間有函數關系:
變量與變量之間的關系
第68頁,共155頁,星期日,2025年,2月5日69二、相關性關系:
變量之間的關系并不確定,而是表現為具有隨機性的一種“趨勢”。即對自變量x的同一值,在不同的觀測中,因變量Y可以取不同的值,而且取值是隨機的,但對應x在一定范圍的不同值,對Y進行觀測時,可以觀察到Y隨x的變化而呈現有一定趨勢的變化。第69頁,共155頁,星期日,2025年,2月5日70如:身高與體重,不存在這樣的函數可以由身高計算出體重,但從統計意義上來說,身高者,體也重。如:父親的身高與兒子的身高之間也有一定聯系,通常父親高,兒子也高。第70頁,共155頁,星期日,2025年,2月5日71我們以一個例子來建立回歸模型某戶人家打算安裝太陽能熱水器.為了了解加熱溫度與燃氣消耗的關系,記錄了16個月燃氣的消耗量,數據見下表.第71頁,共155頁,星期日,2025年,2月5日72
月份平均加熱溫度燃氣用量
月份平均加熱溫度燃氣用量Nov.246.3Jul.01.2Dec.5110.9Aug.11.2Jan.438.9Sep.62.1Feb.337.5Oct.123.1Mar.265.3Nov.306.4Apr.134Dec.327.2May.41.7Jan.5211Jun.01.2Feb.306.9第72頁,共155頁,星期日,2025年,2月5日73在回歸分析時,我們稱“燃氣消耗量”為響應變量記為Y,“加熱溫度”為解釋變量記為X,由所得數據計算相關系數得r=0.995,表明加熱溫度與燃氣消耗之間有非常好的線性相關性.如果以加熱溫度作為橫軸,以消耗燃氣量作為縱軸,得到散點圖的形狀大致呈線性.第73頁,共155頁,星期日,2025年,2月5日74第74頁,共155頁,星期日,2025年,2月5日75第75頁,共155頁,星期日,2025年,2月5日76第76頁,共155頁,星期日,2025年,2月5日77第77頁,共155頁,星期日,2025年,2月5日78第78頁,共155頁,星期日,2025年,2月5日79第79頁,共155頁,星期日,2025年,2月5日80一元線性回歸要解決的問題:第80頁,共155頁,星期日,2025年,2月5日81參數估計第81頁,共155頁,星期日,2025年,2月5日82整理得正規方程系數行列式第82頁,共155頁,星期日,2025年,2月5日83第83頁,共155頁,星期日,2025年,2月5日84第84頁,共155頁,星期日,2025年,2月5日85
在誤差為正態分布假定下,的最小二乘估計等價于極大似然估計。第85頁,共155頁,星期日,2025年,2月5日86采用最大似然估計給出參數的估計與最小二乘法給出的估計完全一致。采用最大似然估計給出誤差的估計如下:此估計不是的無偏估計。第86頁,共155頁,星期日,2025年,2月5日87例1K.Pearson收集了大量父親身高與兒子身高的資料。其中十對如下:父親身高x(吋)60626465666768707274兒子身高y(吋)63.665.26665.566.967.167.468.370.170求Y關于x的線性回歸方程。第87頁,共155頁,星期日,2025年,2月5日88第88頁,共155頁,星期日,2025年,2月5日89參數性質第89頁,共155頁,星期日,2025年,2月5日90即為正態隨機變量的線性組合,所以服從正態分布。證明(1)第90頁,共155頁,星期日,2025年,2月5日91(2)類似可得。第91頁,共155頁,星期日,2025年,2月5日92回歸方程顯著性檢驗
采用最小二乘法估計參數,并不需要事先知道Y與x之間一定具有相關關系。因此μ(x)是否為x的線性函數:一要根據專業知識和實踐來判斷,二要根據實際觀察得到的數據用假設檢驗方法來判斷。第92頁,共155頁,星期日,2025年,2月5日93(1)影響Y取值的,除了x,還有其他不可忽略的因素;(2)E(Y)與x的關系不是線性關系,而是其他關系;(3)Y與x不存在關系。若原假設被拒絕,說明回歸效果是顯著的,否則,若接受原假設,說明Y與x不是線性關系,回歸方程無意義。回歸效果不顯著的原因可能有以下幾種:第93頁,共155頁,星期日,2025年,2月5日94假設的檢驗統計量與方差分析方法類似,仍采用平方和分解。一般地,用來描述之間的總的差異大小,稱SST為總平方和。第94頁,共155頁,星期日,2025年,2月5日95可以證明:第95頁,共155頁,星期日,2025年,2月5日96可以證明,由參數估計的性質可知,當時,
第96頁,共155頁,星期日,2025年,2月5日97第97頁,共155頁,星期日,2025年,2月5日98第98頁,共155頁,星期日,2025年,2月5日99也可采用t檢驗第99頁,共155頁,星期日,2025年,2月5日100例3檢驗例1中回歸效果是否顯著,取α=0.05。第100頁,共155頁,星期日,2025年,2月5日101回歸系數的置信區間由第101頁,共155頁,星期日,2025年,2月5日102第102頁,共155頁,星期日,2025年,2月5日103回歸參數估計和顯著性檢驗的Excel實現
例1(續)前面我們已經分析了加熱溫度與燃氣消耗量之間的關系,認為兩者具有較好的線性關系,下面我們進一步建立燃氣消耗量(響應變量)與加熱溫度(解釋變量)之間的回歸方程.采用Excel中的“數據分析”模塊.在Excel工作表中輸入上面的數據點擊主菜單中“工具”點擊下拉式菜單中“數據分析”就會出現一個“數據分析”的框,點擊菜單中“回歸”,點擊“確定”,出現“回歸”框.第103頁,共155頁,星期日,2025年,2月5日104在“Y值輸入區域”中標定你已經輸入的響應變量數據的位置,在“X值輸入區域”中標定你已經輸入的解釋變量數據的位置(注意:數據按“列”輸入)“置信度”中輸入你已經確定置信度的值選定輸出結果的位置點擊“確定”.在指定位置輸出相應的方差分析表和回歸系數輸出結果,例1的輸出結果如下所示,第104頁,共155頁,星期日,2025年,2月5日105
自由度平方和均方F值P_值
回歸1168.581168.5811467.5511.415E-15誤差141.6080.115總的15170.189方差分析表第105頁,共155頁,星期日,2025年,2月5日106
Coef.標準誤差tStatPvalueLower95%Upper95%Intercept1.0890.1397.8411.729E-060.7911.387X0.1890.00538.3091.415E-150.1780.200方差分析中,給出了假設檢驗的F檢驗.方差分析表中各項也與前一節方差分析表中的意義類似.值得注意的是,方差分析表中“均方”列中,相應于“誤差”行的值即為模型誤差方差的估計,即
=0.115.第106頁,共155頁,星期日,2025年,2月5日107第107頁,共155頁,星期日,2025年,2月5日108第108頁,共155頁,星期日,2025年,2月5日109預測預測一般有兩種意義.第109頁,共155頁,星期日,2025年,2月5日110第110頁,共155頁,星期日,2025年,2月5日111因此,根據觀測結果,點預測為第111頁,共155頁,星期日,2025年,2月5日112第112頁,共155頁,星期日,2025年,2月5日113第113頁,共155頁,星期日,2025年,2月5日114第114頁,共155頁,星期日,2025年,2月5日115第115頁,共155頁,星期日,2025年,2月5日116第116頁,共155頁,星期日,2025年,2月5日117第117頁,共155頁,星期日,2025年,2月5日118例合金鋼的強度y與鋼材中碳的含量x有密切關系。為了冶煉出符合要求強度的鋼常常通過控制鋼水中的碳含量來達到目的,為此需要了解y與x之間的關系。其中x:碳含量(%)y:鋼的強度(kg/mm2)數據見下:x0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0第118頁,共155頁,星期日,2025年,2月5日119(1)畫出散點圖;(2)設μ(x)=α+βx,求α+β的估計;(3)求誤差方差的估計,畫出殘差圖;(4)檢驗回歸系數β是否為零(取α=0.05);(5)求回歸系數β的95%置信區間;(6)求在x=0.06點,回歸函數的點估計和95%置信區間;(7)求在x=0.06點,Y的點預測和95%區間預測。
第119頁,共155頁,星期日,2025年,2月5日1200.030.050.070.090.110.130.150.170.1956545250484644424038(1)合金鋼的強度y與鋼材中碳的含量x的散點圖第120頁,共155頁,星期日,2025年,2月5日121第121頁,共155頁,星期日,2025年,2月5日122第122頁,共155頁,星期日,2025年,2月5日123第123頁,共155頁,星期日,2025年,2月5日1240.030.050.070.090.110.130.150.170.19x0e第124頁,共155頁,星期日,2025年,2月5日1250.030.050.070.090.110.130.150.170.1956545250484644424038合金鋼的強度y與鋼材中碳的含量x的回歸直線圖第125頁,共155頁,星期日,2025年,2月5日126顯著水平為0.05第126頁,共155頁,星期日,2025年,2月5日127第127頁,共155頁,星期日,2025年,2月5日128第128頁,共155頁,星期日,2025年,2月5日129回歸函數線性的診斷誤差方差齊性診斷誤差的獨立性診斷誤差的正態性診斷§4回歸診斷第129頁,共155頁,星期日,2025年,2月5日130一、回歸函數線性的診斷第130頁,共155頁,星期日,2025年,2月5日131第131頁,共155頁,星期日,2025年,2月5日132第
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 景觀設計總結匯報
- 大米包裝設計調研報告
- 2025遼寧裝備制造職業技術學院輔導員考試試題及答案
- 2025貴州醫科大學輔導員考試試題及答案
- 2025貴陽幼兒師范高等專科學校輔導員考試試題及答案
- 2025萍鄉衛生職業學院輔導員考試試題及答案
- 2025甘肅建筑職業技術學院輔導員考試試題及答案
- 2025白銀礦冶職業技術學院輔導員考試試題及答案
- 著名設計師及其設計理念
- 中控大屏方案設計
- 輪式拖拉機的設計計算書
- 2025年中國辦公椅數據監測研究報告
- 機械手培訓圖片與課件
- 自動駕駛車輛的遠程監控與維護系統-全面剖析
- 排他協議合同協議
- 物聯網工程技術考研真題卷100道及答案
- 2024北京通州區三年級(下)期末語文試題及答案
- 2025-2030生鮮商超行業市場發展現狀及競爭形勢與投資前景研究報告
- 2025年四川省建筑安全員-B證考試題庫及答案
- GB/T 5453-2025紡織品織物透氣性的測定
- 臨床教學醫院發展規劃塑造未來醫療教育的新格局
評論
0/150
提交評論