第五章第一節單因素方差分析_第1頁
第五章第一節單因素方差分析_第2頁
第五章第一節單因素方差分析_第3頁
第五章第一節單因素方差分析_第4頁
第五章第一節單因素方差分析_第5頁
已閱讀5頁,還剩101頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、l 5.1 單因素方差分析單因素方差分析l 5.1.1 5.1.1 單因素方差分析的問題單因素方差分析的問題l 單因素方差分析用來檢驗根據某一個分類變量得到單因素方差分析用來檢驗根據某一個分類變量得到的多個分類總體的均值是否相等下面以一簡例說明方的多個分類總體的均值是否相等下面以一簡例說明方差分析的原理差分析的原理 第五章第五章 方方 差差 分分 析析l【例例1】某化肥生產商要檢驗三種新產品的效果,在同某化肥生產商要檢驗三種新產品的效果,在同一地區選取一地區選取18塊大小相同,土質相近的農田中播種同塊大小相同,土質相近的農田中播種同樣的種子,用等量的甲乙丙化肥各施于六塊農田,試驗樣的種子,用等

2、量的甲乙丙化肥各施于六塊農田,試驗結果每塊農田的糧食產量如下所示結果每塊農田的糧食產量如下所示l l 試根據試驗數據推斷甲乙丙三種化肥的肥效是否存試根據試驗數據推斷甲乙丙三種化肥的肥效是否存在差異在差異產量產量甲化肥甲化肥504649524848乙化肥乙化肥495047474649丙化肥丙化肥5150494650505.1.1 單因素方差分析的問題單因素方差分析的問題l 本例中,只考慮化肥這一個因素本例中,只考慮化肥這一個因素(記為記為A)對糧食產量對糧食產量的影響,三種不同的化肥稱為該因素的三個不同水平的影響,三種不同的化肥稱為該因素的三個不同水平(分別記為(分別記為A1,A2,A3)l從表

3、中數據看出,即使是施同一種化肥,由于隨機因素從表中數據看出,即使是施同一種化肥,由于隨機因素(溫度,濕度等)的影響,產量也不同(溫度,濕度等)的影響,產量也不同l因而有:因而有:l (1) 糧食產量是隨機變量,是數值型的變量;糧食產量是隨機變量,是數值型的變量;l (2) 把同一化肥把同一化肥(A的同一水平的同一水平)得到的糧食產量看作同得到的糧食產量看作同一總體抽得的樣本,施用不同化肥得到的糧食產量視為一總體抽得的樣本,施用不同化肥得到的糧食產量視為不同總體下抽得的樣本,表中數據應看成從三個總體不同總體下抽得的樣本,表中數據應看成從三個總體X1,X2,X3中分別抽了容量為中分別抽了容量為6的

4、樣本的觀測值的樣本的觀測值.l 推斷甲乙丙三種化肥的肥效是否存在差異的問題,推斷甲乙丙三種化肥的肥效是否存在差異的問題,就是要辨別糧食產量之間的差異主要是由隨機誤差造成就是要辨別糧食產量之間的差異主要是由隨機誤差造成的,還是由不同化肥造成的,這一問題可歸結為三個總的,還是由不同化肥造成的,這一問題可歸結為三個總體是否有相同分布的討論體是否有相同分布的討論l 由于在實際中有充分的理由認為糧食產量服從正態由于在實際中有充分的理由認為糧食產量服從正態分布分布, 且在安排試驗時且在安排試驗時, 除所關心的因素除所關心的因素(這里是化肥這里是化肥)外外, 其它試驗條件總是盡可能做到一致其它試驗條件總是盡

5、可能做到一致. l 這使我們可以認為每個總體的方差相同這使我們可以認為每個總體的方差相同l即即 XiN( i,2) i = 1, 2, 3l 因此,推斷三個總體是否具有相同分布的問題就簡因此,推斷三個總體是否具有相同分布的問題就簡化為:檢驗幾個具有相同方差的正態總體均值是否相等化為:檢驗幾個具有相同方差的正態總體均值是否相等的問題,即只需檢驗的問題,即只需檢驗lH0: 1 = 2 = 3l 因此,推斷三個總體是否具有相同分布的問題就簡因此,推斷三個總體是否具有相同分布的問題就簡化為:檢驗幾個具有相同方差的正態總體均值是否相等化為:檢驗幾個具有相同方差的正態總體均值是否相等的問題,即只需檢驗的問

6、題,即只需檢驗H0: 1 = 2 = 3l 象這類檢驗若干同方差的正態總體均值是否相等的象這類檢驗若干同方差的正態總體均值是否相等的一種統計分析方法稱為一種統計分析方法稱為方差分析方差分析l 當只有兩個正態總體時,這類問題也可以用第八章當只有兩個正態總體時,這類問題也可以用第八章講過的兩正態總體均值比較的方法來解決講過的兩正態總體均值比較的方法來解決l5.1.2 5.1.2 單因素方差分析的數學模型單因素方差分析的數學模型l 進行單因素方差分析時,需要得到如表進行單因素方差分析時,需要得到如表1所示所示的數據結構的數據結構 l表中用表中用A表示因素,表示因素,A的的m個取值稱為個取值稱為m個水

7、平分別用個水平分別用A1,A2,Am表示,每個水平對應一個總體表示,每個水平對應一個總體l 從不同水平(總體)中抽出的樣本容量可以相同,也從不同水平(總體)中抽出的樣本容量可以相同,也可以不同若不同水平抽出的樣本容量相同則稱為可以不同若不同水平抽出的樣本容量相同則稱為均衡均衡數據數據,否則稱,否則稱非均衡數據非均衡數據觀測值(觀測值(j)A因素(因素(i)A1A2Am1x11x21xm12x12x22xm2ni平均值平均值11nx22nxmmnx. 1x. 2x.mx表表1 單因素方差分析中數據結構單因素方差分析中數據結構l設設xij表示第表示第i個總體的第個總體的第j個觀測值個觀測值(j =

8、 1, 2, ,ni, i = 1,2,m), 由于由于 ,i = 1, 2, , ml單因素方差分析模型??杀硎緸椋簡我蛩胤讲罘治瞿P统?杀硎緸椋簒ij = i + ij ,相互獨立,相互獨立,1im,1jni.l其中其中 i表示第表示第i個總體的均值,個總體的均值, ij為隨機誤差為隨機誤差 ),(2 iijNxl5.1.3 5.1.3 方差分析的方法方差分析的方法l為了方便起見,可將為了方便起見,可將 i記為:記為: i = + il其中其中 稱為總均值稱為總均值, i = i (i = 1, 2, , m)l稱為因素稱為因素A的第的第i個水平的附加效應個水平的附加效應.l對不同水平下均

9、值是否相同的檢驗對不同水平下均值是否相同的檢驗l H0: 1 = 2 = = m,l H1: 1, 2, m不全相等不全相等;l就可以表示為就可以表示為:l H0: 1 = 2 = = m = 0,l H1: 1, 2, m不全為零不全為零 miim11 l下面簡單介紹檢驗統計量及檢驗方法下面簡單介紹檢驗統計量及檢驗方法l 以以 表示所有表示所有xij的總平值,的總平值, 表示第表示第i組數據的組內平組數據的組內平均值,即均值,即l其中其中n = n1 + n2 + + nm統計量:統計量:l稱為稱為總離差平方和總離差平方和,或簡稱,或簡稱總平方和總平方和. 它反映了全部試它反映了全部試驗數據

10、之間的差異驗數據之間的差異x. ix minjijixnx111 injijiixnx1.1 minjijixxSST112)(l另外另外l反映了每組數據均值和總平均值的誤差,稱為反映了每組數據均值和總平均值的誤差,稱為組間離差組間離差平方和平方和,簡稱,簡稱組間平方和組間平方和,或,或稱因素稱因素A平方和平方和l反映了組內數據和組內平均的隨機誤差,稱為反映了組內數據和組內平均的隨機誤差,稱為組內離差組內離差平方和平方和,或稱為,或稱為誤差平方和誤差平方和 miiiminjiAxxnxxSSMi12.112.)()( minjiijixxSSE112.)(l可以證明可以證明SST = SSMA

11、 + SSEl構造檢驗統計量構造檢驗統計量l可以證明,在可以證明,在H0成立下成立下)()1(mnSSEmSSMFA ), 1()()1(mnmFmnSSEmSSMFA l當原假設成立時,各總體均值相等,各樣本均值間的差當原假設成立時,各總體均值相等,各樣本均值間的差異應該較小,模型平方和也應較小,異應該較小,模型平方和也應較小,F統計量取很大值統計量取很大值應該是稀有的情形應該是稀有的情形l所以對給定顯著性水平所以對給定顯著性水平 (0, 1),H0的拒絕域為:的拒絕域為:l 若由觀測數據若由觀測數據xij(j = 1, 2, , ni,i = 1, 2, , m)計算得計算得到到F的觀測值

12、為的觀測值為F0, 當當F0落入拒絕域時拒絕原假設落入拒絕域時拒絕原假設H0, 可可以認為因素以認為因素A對響應變量有顯著影響;否則不能拒絕對響應變量有顯著影響;否則不能拒絕H0,認為因素認為因素A對響應變量無顯著影響對響應變量無顯著影響 ), 1()()1(mnmFmnSSEmSSMFA l另外,另外,F統計量的統計量的P值為值為P=PF F0,在顯著水平,在顯著水平 下,若下,若P=PF F0 F組間組間SSMAm 1SSMA / (m 1)MSA / MSEP組內組內SSEn mSSE / (n m)全部全部SSMA+SSEn 1l【實驗實驗1】利用利用Excel的數據分析工具對例的數據

13、分析工具對例1作方差分作方差分析析l Excel的數據分析工具作方差分析的步驟如下:的數據分析工具作方差分析的步驟如下:l (1) 將例將例1中數據輸入中數據輸入Excel中,如圖中,如圖1所示所示l (2) 在在Excel主菜單中選擇主菜單中選擇“工具工具”“數據分析數據分析”,打開打開“數據分析數據分析”對話框,在對話框,在“分析工具分析工具”列表中選列表中選擇擇“方差分析:單因素方差分析方差分析:單因素方差分析”選項,單擊選項,單擊“確定確定”按鈕按鈕 l(3) 在打開的在打開的“方差分析:單因素方差分析方差分析:單因素方差分析”對話框中,對話框中,輸入輸入“輸入區域輸入區域”:B2:D

14、8,“分組方式分組方式”取默認的取默認的“列列”方式,選中方式,選中“標志位于第一行標志位于第一行”復選框,如圖復選框,如圖2所示,單擊所示,單擊“確定確定”按鈕按鈕l 得到單因素方差分析的結果如圖得到單因素方差分析的結果如圖3所示所示 l (4) 結果分析結果分析l 第一部分第一部分“SUMMARY”提供擬合模型的一般信息,提供擬合模型的一般信息,包括各分組的名稱、觀測數、和、均值和方差,如圖包括各分組的名稱、觀測數、和、均值和方差,如圖3所示所示l 第二部分為方差分析表,其中各項含義可參見表的第二部分為方差分析表,其中各項含義可參見表的說明最右邊多了一列:在說明最右邊多了一列:在 = 0.

15、05的顯著水平下,單的顯著水平下,單因素方差分析因素方差分析F檢驗的臨界值(即檢驗的臨界值(即F統計量的上統計量的上 分位點:分位點:F ) l 從方差分析表可以看出,從方差分析表可以看出,P值大于值大于0.05(顯著水平),(顯著水平),所以不能拒絕原假設,沒有足夠的證據證明三種化肥的所以不能拒絕原假設,沒有足夠的證據證明三種化肥的肥效有顯著差異肥效有顯著差異 l【例例2】為了對幾個行業的服務質量進行評價,消費者為了對幾個行業的服務質量進行評價,消費者協會在零售業、旅游業、航空公司、家電制造業分別抽協會在零售業、旅游業、航空公司、家電制造業分別抽取了不同的企業作為樣本取了不同的企業作為樣本l

16、每個行業各抽取每個行業各抽取5家企業家企業, 所抽取的這些企業在服務對所抽取的這些企業在服務對象、服務內容、企業規模等方面基本上是相同的象、服務內容、企業規模等方面基本上是相同的l然后統計出最近一年中消費者對總共然后統計出最近一年中消費者對總共20家企業投訴的家企業投訴的次數次數l結果如下:結果如下:行業行業投訴次數投訴次數零售業零售業5766494044旅游業旅游業6839294556航空公司航空公司3149213440家電制造業家電制造業4451657758l通常,受到投訴的次數越多,說明服務的質量越差消通常,受到投訴的次數越多,說明服務的質量越差消費者協會想知道這幾個行業之間的服務質量是

17、否有顯著費者協會想知道這幾個行業之間的服務質量是否有顯著差異,試進行方差分析差異,試進行方差分析.l 本例采用單因素方差分析法,只考慮行業這一個因本例采用單因素方差分析法,只考慮行業這一個因素對投訴次數的影響,四個不同的行業稱為該因素的四素對投訴次數的影響,四個不同的行業稱為該因素的四個不同水平原假設是:不同行業對服務質量的投訴次個不同水平原假設是:不同行業對服務質量的投訴次數沒有顯著差異數沒有顯著差異 行業行業投訴次數投訴次數零售業零售業5766494044旅游業旅游業6839294556航空公司航空公司3149213440家電制造業家電制造業4451657758l【實驗實驗2】利用利用Ex

18、cel的數據分析工具對例的數據分析工具對例2作方差分作方差分析析l (1) 將數據輸入將數據輸入Excel中,中,l如圖所示如圖所示l (2) 在在Excel主菜單中選擇主菜單中選擇“工具工具”“數據分析數據分析”,打開打開“數據分析數據分析”對話框,在對話框,在“分析工具分析工具”列表中選擇列表中選擇“方差分析:單因素方差分析方差分析:單因素方差分析”選項,單擊選項,單擊“確定確定”按按鈕鈕 l(3) 在打開的在打開的“方差分析:單因素方差分析方差分析:單因素方差分析”對話框中,對話框中,輸入輸入“輸入區域輸入區域”:A2:D7,“分組方式分組方式”取默認的取默認的“列列”方式,選中方式,選

19、中“標志位標志位l于第一行于第一行”復選框,如圖復選框,如圖l所示,單擊所示,單擊“確定確定”按鈕按鈕 l (4) 結果分析:結果分析:l從方差分析表可以看出,從方差分析表可以看出,P值值 = 0.047647 0.05(顯著(顯著水平),所以拒絕原假設,即水平),所以拒絕原假設,即4個行業之間的服務質量個行業之間的服務質量有顯著差異從平均投訴的次數來看,家電制造業最高有顯著差異從平均投訴的次數來看,家電制造業最高(59),航空公司最低(),航空公司最低(35),從各分組的方差來看,),從各分組的方差來看,航空公司的服務最穩定(方差最?。┖娇展镜姆兆罘€定(方差最?。?X例 設總體的分布律為

20、X123P2q2 (1)qq-2(1)q-01q= ,0.c q未知參數設有設有n個產品投入定數截尾試驗個產品投入定數截尾試驗, 截尾數為截尾數為m,得定數截尾樣本得定數截尾樣本12 c, mtttL (), c q利用這一樣本估計未知參數產品的平均壽命 , , mc tm在時間區間有個產品失效 . mtmn個產品的壽命超過個產品的壽命超過有有 , 估計估計利用最大似然估計法來利用最大似然估計法來為了確定似然函數為了確定似然函數, 觀察上述結果出現的概率觀察上述結果出現的概率.( ,d 1 ( )ded ,1,2, .iiiitciiit ttf tttimqq-+=L產品在失效的概率近似地為

21、 的概率為的概率為個產品壽命超過個產品壽命超過其余其余mtmn 1edmnmt cttqq-驏桫(e),mtcnmq-=上述觀察結果出現的概率近似地為上述觀察結果出現的概率近似地為 1212111ededed(e)mmtctctctcnmmntttmqqqqqqq-驏驏驏驏鼢? 瓏?鼢?瓏?鼢?瓏?鼢?瓏? 鼢?瓏?桫 桫桫桫L121()121ed dd,mmtttnm tncmmnt ttmqq-+-驏= 桫LL . d , ,d ,d 21為常數為常數其中其中mttt取似然函數為取似然函數為121()1( , )e.mmtttnm tncmLcqqq-+-=L對數似然函數為對數似然函數為1

22、21l n ( , )l n() ,mmLcmtttnm tncqqq= -+-L1 l n ( , )0nLcctcqq=?則1221 ()0,mmmtttnm tncqq-+-=L則 l n ( , )0Lcqq=令 的最大似然估計值為的最大似然估計值為得到得到 121()mmtttnm tntmmq+-=-L2. 定時截尾樣本的最大似然估計定時截尾樣本的最大似然估計設定時截尾樣本設定時截尾樣本120 c, mttttL0( ) t其中是截尾時間有類似的結論三、小結三、小結兩種常見的截尾壽命試驗兩種常見的截尾壽命試驗定時截尾壽命試驗定時截尾壽命試驗 定數截尾壽命試驗定數截尾壽命試驗定時截尾樣本的最大似然估計定時截尾樣本的最大似然估計:,)(0mts 定數截尾樣本的最大似然估計定數截尾樣本的最大似然估計:.)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論