stata教程集錦統計分析與應用chap_第1頁
stata教程集錦統計分析與應用chap_第2頁
stata教程集錦統計分析與應用chap_第3頁
stata教程集錦統計分析與應用chap_第4頁
stata教程集錦統計分析與應用chap_第5頁
已閱讀5頁,還剩17頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

主要內容:1、單因素方差分析2、雙因素或多因素方差分析3、協方差分析實驗4.1單因素方差分析一、實驗基本原理方差分析的目的是檢驗各個水平的均值是否相等,實現這個目的的手段是通過方差的比較。觀察值之間的差異來自于兩個方面,一個是由不同水

平造成的系統性差異,一個是由抽選樣本的隨機性而

產生的差異。兩個方面產生的差異可以用兩個方差來

衡量:一個稱為水平之間的方差,是由系統性因素和

隨機性因素共同造成的;一個稱為水平內部的方差,

僅由隨機性因素造成。如果不同的水平對結果沒有影

響,則在水平之間的方差中,僅僅有隨機因素的差異,而沒有系統性的差異,所以兩個方差的比值應接近于1;反之,則兩個方差應差異較大。一般情況下,單因素方差分析的數據如表4.1所示排列。二、實驗內容和實驗數據實驗數據來源于對某種飲料的銷售調查,該種飲料有4種顏色,在5家超市進行銷售,其中變量sales代表銷售量,color變量代表顏色。完整的數據在本書附帶光盤的data文件夾的“sales.dta”工作文件中。利用數據分析,顏色是否對銷售量有顯著影響,即分析不同顏色的銷售量總體均值是否相等。三、實驗操作指導單因素方差分析的基本命令語句如下:oneway

response_var

factor_var

[if]

[in][weight]

[,

options]在這個命令語句中,oneway是進行單因素方差分析的命令語句,response_var代表將要測量的變量名稱,factor_var代表分類變量名稱,也即水平名稱,if是條件語句,in是范圍語句,weight是權重語句。在單因素方差分析中的options選項較多,內容如表4.2所示。例如,利用sales.dta數據做方差分析的練習,在這個數據中,反映了一種飲料的銷售情況,這種飲料有4種顏色,在5家超市進行銷售,除顏色之外其他條件全部相同,分析一下飲料的顏色是否對銷售量有影響。對此問題進行方差分析的命令語句為:oneway

sales

color,

tabulate這個命令語句中,oneway是進行單因素方差分析的命令語句,sales是將要分析的變量,color是分類變量,也就是水平變量,tabulate選項的作用是產生有關數據的匯總表。顯示結果如圖4.1所示。實驗4.2雙因素或多因素方差分析一、實驗基本原理在現實研究中,一個事件不可能僅受一個因素的影響,恰恰相反,一個事件是受多個因素綜合作用的結果,

所以多因素方差分析相比單因素方差分析有更廣泛的

應用空間。下面以雙因素方差分析中無交互作用的情

況為例,介紹一下多因素方差分析的基本原理。一般情況下,雙因素方差分析的數據如表4.3所示排列,影響因素有A和B兩個。二、實驗數據和實驗內容實驗數據來源于對某國女性工作情況的調查,其中變量married是代表是否結婚的分類變量,children是代表是否擁有子女的分類變量,wage代表工資水平。完整的數據在本書附帶光盤的data文件夾的“wwork.dta”工作文件中。利用數據分析,女性的工資會不會因是否結婚、是否有子女以及二者的互動而差異。三、實驗操作指導多因素方差分析的命令語句如下:anova

varname

[term

[/]

[term

[/]

...]]

[if

]

[in][weight]

[,

options]在這個命令語句中,anova是進行多因素方差分析的命令語句,varname是將要進行分析的變量名稱,term的形式是

varname[{*||}varname[...]],主要是進行影響因素的設定,*表示交叉積,第一個|表示或者的功能,第二個|表示條件運算,*的運算級高于|運算,if是條件語句,in是范圍語句,

weight是權重語句,多因素方差分析的options選項內容如表4.4所示。例如,利用wwork.dta數據做雙因素方差分析的練習,在這個數據中,反映了某國女性工資、婚姻狀況、擁有子女狀況的情況,利用這些數據分析一下婚姻、子女以及二者的交互項是否對工資有影響。對此問題進行雙因素方差分析的命令語句為:anova

wage

children

married

children

*

married在這個命令語句中,anova是進行多因素方差分析的命令語句,wage是因變量,children、married和children

*married是影響因素,執行的結果如圖4.2所示實驗4.3協方差分析一、實驗基本原理方差分析存在明顯的弊端,無法控制分析中存在的某些隨機因素,使之影響了分析結果的準確度。協方差分析控制了這些干擾或調節因素,提高了試驗的精確性和準確性,對處理以外的一切條件都采取了有效措施嚴加控制,使它們在各個處理過程中盡量保持一致。協方差分析主要是在排除了協變量的影響后再對修正后的主效應進行方差分析,是將線性回歸與方差分析結合起來的一種分析方法。例如研究幾種飼料對牛的增重的影響,由于初始重量將會對增重造成影響,所以在這個試驗中希望初始重量相同(排除初始重量對增重的影響),但是這個要求難以達到,所以必須通過增重與初始重量的線性關系進行調整,使之相同,然后進行試驗研究飼料對增重的影響。協方差分析是對多因素方差分析的推進和拓展,使之不僅可以涵蓋分類變量的情形,還可以將連續變量的情況包括在內。一般情況下,協方差分析將那些難以控制的因素作為協變量,從而在排除協變量影響的情況下,分析自變量因變量的作用。當模型中只存在一個協變量時,叫做一元協方差分析,當有兩個及其以上的協變量時,叫做多元協方差分析。二、實驗數據和實驗內容實驗數據來源于對某國女性工作情況的調查,其中變量married是代表是否結婚的分類變量,children是代表是否擁有子女的分類變量,wage代表工資水平,education代表受教育年限。完整的數據在本書附帶光盤的data文件夾的“wwork.dta”工作文件中。利用數據進行協方差分析,女性的工資會不會因是否結婚、是否有子女以及二者的互動和受教育年限的不同而差異。三、實驗操作指導協方差分析的基本命令語句與多因素方差分析的命令語句基本一致,如下:anova

varname

[term

[/]

[term

[/]

...]]

[if

]

[in][weight],

continuous(varlist)

[options]這個命令語句與多因素方差分析命令語句的唯一不同是“continuous(varlist)”,即必須指明連續變量,若不指明,Stata默認除因變量之外的所有變量均為分類變量。例如,在實驗4.2利用wwork.dta數據做多因素方差分析的

練習中,如果用戶認為除婚姻、子女以及二者的交互項對

工資有影響之外,還認為受教育年限對工資水平存在影響,想進一步驗證。這時就需要進行協方差分析了,因為受教

育年限是連續變量而不是分類變量。進行這個研究需要輸入的命令語句為:anova

wage

children

married

children

*

married

education,continuous(education)這個命令語句較之實驗4.2的命令語句,多了變量

education,并且指明education是連續變量,這時協方差分析的結果如圖4.3所示。通過實驗原理,我們知道協方差分析是借助回歸分析完成的,所以我們可以通過添加regress選項的形式使回歸的結果得到展示,使變量間的關系得到更清晰的展現,這時的命令語句如下:anova

wage

children

married

children

*

married

education,continuous(education)

regress習題1.利用usaauto.dta數據進行單因素方差分析,分析內容為美國汽車的價格price是否受進口還是國產的影響,即以price為因變量,以foreign為分類變量進行單因素分析,并且進行結果的解讀。2.利用womenwork.dta數據進行多因素方差分析,分

析內容為婦女受教育水平education是否受結婚

married和是否有子女children以及二者交互項的影響,即以education為因變量,以married、children和married

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論