連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析課件_第1頁(yè)
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析課件_第2頁(yè)
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析課件_第3頁(yè)
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析課件_第4頁(yè)
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析課件_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SPSS統(tǒng)計(jì)分析

基礎(chǔ)教程北京理工大學(xué)珠海學(xué)院1什么是方差分析?2什么是方差分析?

(概念要點(diǎn))1.檢驗(yàn)多個(gè)總體均值是否相等通過(guò)對(duì)各觀察數(shù)據(jù)誤差來(lái)源的分析來(lái)判斷多個(gè)總體均值是否相等2.變量一個(gè)定類尺度的自變量2個(gè)或多個(gè)(k個(gè))處理水平或分類一個(gè)定距或定比尺度的因變量2023/7/173什么是方差分析?

(一個(gè)例子)表8-1該飲料在五家超市的銷售情況超市無(wú)色粉色橘黃色綠色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無(wú)色透明。這四種飲料的營(yíng)養(yǎng)含量、味道、價(jià)格、包裝等可能影響銷售量的因素全部相同。現(xiàn)從地理位置相似、經(jīng)營(yíng)規(guī)模相仿的五家超級(jí)市場(chǎng)上收集了前一時(shí)期該飲料的銷售情況,見(jiàn)表8-1。試分析飲料的顏色是否對(duì)銷售量產(chǎn)生影響。2023/7/174什么是方差分析?

(例子的進(jìn)一步分析)檢驗(yàn)飲料的顏色對(duì)銷售量是否有影響,也就是檢驗(yàn)四種顏色飲料的平均銷售量是否相同設(shè)1為無(wú)色飲料的平均銷售量,2粉色飲料的平均銷售量,3為橘黃色飲料的平均銷售量,4為綠色飲料的平均銷售量,也就是檢驗(yàn)下面的假設(shè)H0:1234

H1:1,2,3,4不全相等檢驗(yàn)上述假設(shè)所采用的方法就是方差分析2023/7/175方差分析的基本思想和原理6方差分析的基本思想和原理

(幾個(gè)基本概念)因素或因子所要檢驗(yàn)的對(duì)象稱為因子要分析飲料的顏色對(duì)銷售量是否有影響,顏色是要檢驗(yàn)的因素或因子水平因素的具體表現(xiàn)稱為水平A1、A2、A3、A4四種顏色就是因素的水平觀察值在每個(gè)因素水平下得到的樣本值每種顏色飲料的銷售量就是觀察值2023/7/177方差分析的基本思想和原理

(幾個(gè)基本概念)試驗(yàn)這里只涉及一個(gè)因素,因此稱為單因素四水平的試驗(yàn)總體因素的每一個(gè)水平可以看作是一個(gè)總體比如A1、A2、A3、A4四種顏色可以看作是四個(gè)總體樣本數(shù)據(jù)上面的數(shù)據(jù)可以看作是從這四個(gè)總體中抽取的樣本數(shù)據(jù)2023/7/1781. 比較兩類誤差,以檢驗(yàn)均值是否相等2. 比較的基礎(chǔ)是方差比3. 如果系統(tǒng)(處理)誤差顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來(lái)測(cè)度的方差分析的基本思想和原理2023/7/179方差分析的基本思想和原理

(兩類誤差)隨機(jī)誤差在因素的同一水平(同一個(gè)總體)下,樣本的各觀察值之間的差異比如,同一種顏色的飲料在不同超市上的銷售量是不同的不同超市銷售量的差異可以看成是隨機(jī)因素的影響,或者說(shuō)是由于抽樣的隨機(jī)性所造成的,稱為隨機(jī)誤差

系統(tǒng)誤差在因素的不同水平(不同總體)下,各觀察值之間的差異比如,同一家超市,不同顏色飲料的銷售量也是不同的這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差2023/7/1710方差分析的基本思想和原理

(兩類方差)組內(nèi)方差因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差比如,無(wú)色飲料A1在5家超市銷售數(shù)量的方差組內(nèi)方差只包含隨機(jī)誤差組間方差因素的不同水平(不同總體)下各樣本之間的方差比如,A1、A2、A3、A4四種顏色飲料銷售量之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差2023/7/1711方差分析的基本思想和原理

(方差的比較)如果不同顏色(水平)對(duì)銷售量(結(jié)果)沒(méi)有影響,那么在組間方差中只包含有隨機(jī)誤差,而沒(méi)有系統(tǒng)誤差。這時(shí),組間方差與組內(nèi)方差就應(yīng)該很接近,兩個(gè)方差的比值就會(huì)接近1如果不同的水平對(duì)結(jié)果有影響,在組間方差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間方差就會(huì)大于組內(nèi)方差,組間方差與組內(nèi)方差的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在著顯著差異2023/7/1712方差分析中的基本假定13方差分析中的基本假定每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本比如,每種顏色飲料的銷售量必需服從正態(tài)分布各個(gè)總體的方差必須相同對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷售量的方差都相同觀察值是獨(dú)立的比如,每個(gè)超市的銷售量都與其他超市的銷售量獨(dú)立2023/7/1714方差分析中的基本假定在上述假定條件下,判斷顏色對(duì)銷售量是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等的問(wèn)題如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近四個(gè)樣本的均值越接近,我們推斷四個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,我們推斷總體均值不同的證據(jù)就越充分2023/7/1715方差分析中基本假定如果原假設(shè)成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒(méi)有系統(tǒng)誤差

這意味著每個(gè)樣本都來(lái)自均值為、差為2的同一正態(tài)總體

Xf(X)1

2

3

4

2023/7/1716方差分析中基本假定如果備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的有系統(tǒng)誤差這意味著四個(gè)樣本分別來(lái)自均值不同的四個(gè)正態(tài)總體

Xf(X)3

1

2

4

2023/7/1717單因素方差分析的數(shù)據(jù)結(jié)構(gòu)觀察值(j)因素(A)i

水平A1水平A2

…水平Ak12::n

x11x12…x1kx21x22…x2k::::::::xn1

xn2…xnk2023/7/1718單因素方差分析的步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策19提出假設(shè)一般提法H0:m1=m2=…=mk(因素有k個(gè)水平)H1:m1

,m2

,…,mk不全相等對(duì)前面的例子H0:m1=m2=m3=m4顏色對(duì)銷售量沒(méi)有影響H0:m1

,m2

,m3,m4不全相等顏色對(duì)銷售量有影響2023/7/1720構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值離差平方和均方(MS)2023/7/1721構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平的均值)假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡(jiǎn)單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù)計(jì)算公式為式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù)

xij為第i個(gè)總體的第j個(gè)觀察值2023/7/1722

皮肌炎是一種引起皮膚、肌肉、心、肺、腎等多臟器嚴(yán)重?fù)p害的,全身性疾病,而且不少患者同時(shí)伴有惡性腫瘤。它的1癥狀表現(xiàn)如下:1、早期皮肌炎患者,還往往伴有全身不適癥狀,如-全身肌肉酸痛,軟弱無(wú)力,上樓梯時(shí)感覺(jué)兩腿費(fèi)力;舉手梳理頭發(fā)時(shí),舉高手臂很吃力;抬頭轉(zhuǎn)頭緩慢而費(fèi)力。皮肌炎圖片——皮肌炎的癥狀表現(xiàn)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個(gè)數(shù)計(jì)算公式為2023/7/1724構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(前例計(jì)算結(jié)果)表8-2四種顏色飲料的銷售量及均值超市(j)水平A(i)無(wú)色(A1)粉色(A2)橘黃色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計(jì)136.6147.8132.2157.3573.9水平均值觀察值個(gè)數(shù)x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總均值x=28.6952023/7/1725構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算總離差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況總離差平方和(總變異)其計(jì)算公式為前例的計(jì)算結(jié)果:

SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.92952023/7/1726構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算誤差項(xiàng)平方和SSW)每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個(gè)樣本各觀察值的離散狀況,又稱組內(nèi)離差平方和該平方和反映的是隨機(jī)誤差的大小誤差項(xiàng)平方和(組內(nèi)變異或是組內(nèi)平方和)計(jì)算公式為

前例的計(jì)算結(jié)果:SSW=39.0842023/7/1727構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平項(xiàng)平方和SSB)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計(jì)算公式為前例的計(jì)算結(jié)果:SSB=76.84552023/7/1728構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個(gè)平方和的關(guān)系)總離差平方和(SST)、誤差項(xiàng)離差平方和(SSW)、水平項(xiàng)離差平方和(SSB)之間的關(guān)系SST=SSW+SSB2023/7/1729構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個(gè)平方和的作用)

SST反映了全部數(shù)據(jù)總的誤差程度;SSW反映了隨機(jī)誤差的大小;SSB反映了隨機(jī)誤差和系統(tǒng)誤差的大小.如果原假設(shè)成立,即H1=H2

=…=Hk為真,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSB除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小為檢驗(yàn)這種差異,需要構(gòu)造一個(gè)用于檢驗(yàn)的統(tǒng)計(jì)量2023/7/1730構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對(duì)離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)SSB的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)SSW的自由度為n-k2023/7/1731構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)

SSB的均方也稱組間方差,記為MSB,計(jì)算公式為

SSW的均方也稱組內(nèi)方差,記為MSW,計(jì)算公式為2023/7/1732構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算檢驗(yàn)的統(tǒng)計(jì)量F)將MSB和MSW進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即2023/7/1733統(tǒng)計(jì)決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出接受或拒絕原假設(shè)H0的決策根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F

若F>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,所檢驗(yàn)的因素(A)對(duì)觀察值有顯著影響若FF

,則不能拒絕原假設(shè)H0

,表明所檢驗(yàn)的因素(A)對(duì)觀察值沒(méi)有顯著影響【根據(jù)P值直接進(jìn)行決策】2023/7/1734單因素方差分析表

(基本結(jié)構(gòu))方差來(lái)源平方和SS自由度df均方MSF值組間(因素影響)

組內(nèi)(誤差)

總和SSBSSWSSTk-1n-kn-1MSBMSWMSBMSW2023/7/1735單因素方差分析實(shí)質(zhì)上采用了統(tǒng)計(jì)推斷的方法,由于方差分析有一個(gè)比較嚴(yán)格的前提條件,即不同水平下,各

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論