解釋變量包含虛擬變量課件_第1頁
解釋變量包含虛擬變量課件_第2頁
解釋變量包含虛擬變量課件_第3頁
解釋變量包含虛擬變量課件_第4頁
解釋變量包含虛擬變量課件_第5頁
已閱讀5頁,還剩63頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章解釋變量包含虛擬變量的回歸模型

一、虛擬變量的基本含義二、虛擬變量的引入三、虛擬變量的設置原則第五章解釋變量包含虛擬變量的回歸模型一1一、虛擬變量的基本含義許多經濟變量是可以定量度量的,如:商品需求量、價格、收入、產量等。但也有一些影響經濟變量的因素無法定量度量,如:職業、性別對收入的影響,戰爭、自然災害對GDP的影響,季節對某些產品(如冷飲)銷售的影響等等。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。一、虛擬變量的基本含義許多經濟變量是可以定量度量的,如:商品2這種“量化”通常是通過引入“虛擬變量”來完成的。根據這些因素的屬性類型,構造只取“0”或“1”的人工變量,通常稱為虛擬變量(dummyvariables),記為D。例如,反映文化程度的虛擬變量可取為:1,本科學歷D=0,非本科學歷這種“量化”通常是通過引入“虛擬變量”來完3

一般地,在虛擬變量的設置中:基礎類型、肯定類型取值為1;比較類型,否定類型取值為0。一般地,在虛擬變量的設置中:4概念:同時含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一個以性別為虛擬變量考察企業職工薪金的模型:其中:Yi為企業職工的薪金,Xi為工齡,Di=1,若是男性,Di=0,若是女性。概念:同時含有一般解釋變量與虛擬變量的模型5二、虛擬變量的引入虛擬變量做為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則

企業女職工的平均薪金為:1.加法方式二、虛擬變量的引入虛擬變量做為解釋變量引入模6

企業男職工的平均薪金為:幾何意義:假定2>0,則兩個函數有相同的斜率,但有不同的截距。意即,男女職工平均薪金對工齡的變化率是一樣的,但兩者的平均薪金水平相差2。企業男職工的平均薪金為:幾何意義:假7可以通過傳統的回歸檢驗,對2的統計顯著性進行檢驗,以判斷企業男女職工的平均薪金水平是否有顯著差異。02028

又例:在橫截面數據基礎上,考慮個人保健支出對個人收入和教育水平的回歸。教育水平考慮三個層次:高中以下,高中,大學及其以上。這時需要引入兩個虛擬變量:又例:在橫截面數據基礎上,考慮個人保健支出對9模型可設定如下:

在E(i)=0的初始假定下,高中以下、高中、大學及其以上教育水平下個人保健支出的函數:高中以下:模型可設定如下:在E(i)=0的初始假定下,10高中:大學及其以上:假定3>2,其幾何意義:高中:大學及其以上:假定3>2,其幾何意義11還可將多個虛擬變量引入模型中以考察多種“定性”因素的影響。

如在上述職工薪金的例中,再引入代表學歷的虛擬變量D2:本科及以上學歷本科以下學歷職工薪金的回歸模型可設計為:還可將多個虛擬變量引入模型中以考察多種“定性”因素的12女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:于是,不同性別、不同學歷職工的平均薪金分別為:男職工本科以下學歷的平均薪金:男職工本科以上學歷的平均薪金:女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:132.乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下:往往是斜率就有變化,或斜率、截距同時發生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。2.乘法方式加法方式引入虛擬變量,考察:截距的不同。14例:根據消費理論,消費水平C主要取決于收入水平Y,但在一個較長的時期,人們的消費傾向會發生變化,尤其是在自然災害、戰爭等反常年份,消費傾向往往出現變化。這種消費傾向的變化可通過在收入的系數中引入虛擬變量來考察。如,設消費模型可建立如下:例:根據消費理論,消費水平C主要取決于收入水平Y,但15這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來考察消費傾向的變化。假定E(i)=0,上述模型所表示的函數可化為:

正常年份:

反常年份:這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來考察16

當截距與斜率發生變化時,則需要同時引入加法與乘法形式的虛擬變量。例,考察1990年前后的中國居民的總儲蓄-收入關系是否已發生變化。表中給出了中國1979~2001年以城鄉儲蓄存款余額代表的居民儲蓄以及以GNP代表的居民收入的數據。當截距與斜率發生變化時,則需要同時引入加法與乘法形式17解釋變量包含虛擬變量課件18以Y為儲蓄,X為收入,可令:1990年前:Yi=1+2Xi+1ii=1,2…,n1

1990年后:Yi=1+2Xi+2ii=1,2…,n2

則有可能出現下述四種情況中的一種:(1)1=1,且2=2,即兩個回歸相同,稱為重合回歸(CoincidentRegressions);以Y為儲蓄,X為收入,可令:1990年前:Yi=1+19(2)11,但2=2,即兩個回歸的差異僅在其截距,稱為平行回歸(ParallelRegressions);(3)1=1,但22,即兩個回歸的差異僅在其斜率,稱為匯合回歸(ConcurrentRegressions);(4)11,且22,即兩個回歸完全不同,稱為相異回歸(DissimilarRegressions)。(2)11,但2=2,即兩個回歸的差異僅在其20平行回歸平行回歸21匯合回歸匯合回歸22相異回歸相異回歸23可以運用鄒氏結構變化的檢驗。這一問題也可通過引入乘法形式的虛擬變量來解決。將n1與n2次觀察值合并,并用以估計以下回歸:Di為引入的虛擬變量:可以運用鄒氏結構變化的檢驗。這一問題也可通過24于是有:可分別表示1990年后期與前期的儲蓄函數。

在統計檢驗中,如果3=0的假設被拒絕,則說明兩個時期中儲蓄函數的截距不同,如果4=0的假設被拒絕,則說明兩個時期中儲蓄函數的斜率不同。于是有:可分別表示1990年后期與前期的儲蓄函數。25具體的回歸結果為:(-6.11)(22.89)(4.33)(-2.55)由3與4的t檢驗可知:參數顯著地不等于0,強烈示出兩個時期的回歸是相異的,儲蓄函數分別為:1990年前:1990年后:=0.9836具體的回歸結果為:(-6.11)26鄒氏結構變化的檢驗和虛擬變量法的比較鄒檢驗只是告訴我們結構是否已經變化,而不能告訴我們當有變化時候是因為只是斜率相異或只是截距相異,或兩者均相異。但是虛擬變量法不僅告訴我們兩個回歸是否有差異,而且落實到差異的起因——由于截距或由于斜率或由于兩者。我們只要做一個回歸,因為其他的回歸可以方便地由它導出。這個單一的回歸可以用來做各種假設檢驗。由于合并而增加了自由度,參數估計的相對精度也有所改進。鄒氏結構變化的檢驗和虛擬變量法的比較鄒檢驗只是告訴我們結構是273.臨界指標的虛擬變量的引入(分段回歸)

在經濟發生轉折時期,可通過建立臨界指標的虛擬變量模型來反映。例如,進口消費品數量Y主要取決于國民收入X的多少,中國在改革開放前后,Y對X的回歸關系明顯不同。

3.臨界指標的虛擬變量的引入(分段回歸)在28則進口消費品的回歸模型可建立如下:這時,可以t*=1979年為轉折期,以1979年的國民收入Xt*為臨界值,設如下虛擬變量:則進口消費品的回歸模型可建立如下:29OLS法得到該模型的回歸方程為:則兩時期進口消費品函數分別為:當t<t*=1979年,當tt*=1979年,OLS法得到該模型的回歸方程為:則兩時期進口消費品函30三、虛擬變量的設置原則虛擬變量的個數須按以下原則確定:

每一定性變量所需的虛擬變量個數要比該定性變量的類別數少1,即如果有m個定性變量,只在模型中引入m-1個虛擬變量。

例已知冷飲的銷售量Y除受k種定量變量Xk的影響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響,只需引入三個虛擬變量即可:三、虛擬變量的設置原則虛擬變量的個數須按以下31則冷飲銷售量的模型為:在上述模型中,若再引入第四個虛擬變量:則冷飲銷售量的模型為:在上述模型中,若再引入第四個虛擬變量:32則冷飲銷售模型變量為:其矩陣形式為:

如果只取六個觀測值,其中春季與夏季取了兩次,秋、冬各取到一次觀測值,則式中的:則冷飲銷售模型變量為:其矩陣形式為:如果只取六個觀33顯然,(X,D)中的第1列可表示成后4列的線性組合,從而(X,D)不滿秩,參數無法唯一求出。

這就是所謂的“虛擬變量陷阱”,應避免。顯然,(X,D)中的第1列可表示成后4列的線34第五章解釋變量包含虛擬變量的回歸模型

一、虛擬變量的基本含義二、虛擬變量的引入三、虛擬變量的設置原則第五章解釋變量包含虛擬變量的回歸模型一35一、虛擬變量的基本含義許多經濟變量是可以定量度量的,如:商品需求量、價格、收入、產量等。但也有一些影響經濟變量的因素無法定量度量,如:職業、性別對收入的影響,戰爭、自然災害對GDP的影響,季節對某些產品(如冷飲)銷售的影響等等。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。一、虛擬變量的基本含義許多經濟變量是可以定量度量的,如:商品36這種“量化”通常是通過引入“虛擬變量”來完成的。根據這些因素的屬性類型,構造只取“0”或“1”的人工變量,通常稱為虛擬變量(dummyvariables),記為D。例如,反映文化程度的虛擬變量可取為:1,本科學歷D=0,非本科學歷這種“量化”通常是通過引入“虛擬變量”來完37

一般地,在虛擬變量的設置中:基礎類型、肯定類型取值為1;比較類型,否定類型取值為0。一般地,在虛擬變量的設置中:38概念:同時含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一個以性別為虛擬變量考察企業職工薪金的模型:其中:Yi為企業職工的薪金,Xi為工齡,Di=1,若是男性,Di=0,若是女性。概念:同時含有一般解釋變量與虛擬變量的模型39二、虛擬變量的引入虛擬變量做為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則

企業女職工的平均薪金為:1.加法方式二、虛擬變量的引入虛擬變量做為解釋變量引入模40

企業男職工的平均薪金為:幾何意義:假定2>0,則兩個函數有相同的斜率,但有不同的截距。意即,男女職工平均薪金對工齡的變化率是一樣的,但兩者的平均薪金水平相差2。企業男職工的平均薪金為:幾何意義:假41可以通過傳統的回歸檢驗,對2的統計顯著性進行檢驗,以判斷企業男女職工的平均薪金水平是否有顯著差異。020242

又例:在橫截面數據基礎上,考慮個人保健支出對個人收入和教育水平的回歸。教育水平考慮三個層次:高中以下,高中,大學及其以上。這時需要引入兩個虛擬變量:又例:在橫截面數據基礎上,考慮個人保健支出對43模型可設定如下:

在E(i)=0的初始假定下,高中以下、高中、大學及其以上教育水平下個人保健支出的函數:高中以下:模型可設定如下:在E(i)=0的初始假定下,44高中:大學及其以上:假定3>2,其幾何意義:高中:大學及其以上:假定3>2,其幾何意義45還可將多個虛擬變量引入模型中以考察多種“定性”因素的影響。

如在上述職工薪金的例中,再引入代表學歷的虛擬變量D2:本科及以上學歷本科以下學歷職工薪金的回歸模型可設計為:還可將多個虛擬變量引入模型中以考察多種“定性”因素的46女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:于是,不同性別、不同學歷職工的平均薪金分別為:男職工本科以下學歷的平均薪金:男職工本科以上學歷的平均薪金:女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:472.乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下:往往是斜率就有變化,或斜率、截距同時發生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。2.乘法方式加法方式引入虛擬變量,考察:截距的不同。48例:根據消費理論,消費水平C主要取決于收入水平Y,但在一個較長的時期,人們的消費傾向會發生變化,尤其是在自然災害、戰爭等反常年份,消費傾向往往出現變化。這種消費傾向的變化可通過在收入的系數中引入虛擬變量來考察。如,設消費模型可建立如下:例:根據消費理論,消費水平C主要取決于收入水平Y,但49這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來考察消費傾向的變化。假定E(i)=0,上述模型所表示的函數可化為:

正常年份:

反常年份:這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來考察50

當截距與斜率發生變化時,則需要同時引入加法與乘法形式的虛擬變量。例,考察1990年前后的中國居民的總儲蓄-收入關系是否已發生變化。表中給出了中國1979~2001年以城鄉儲蓄存款余額代表的居民儲蓄以及以GNP代表的居民收入的數據。當截距與斜率發生變化時,則需要同時引入加法與乘法形式51解釋變量包含虛擬變量課件52以Y為儲蓄,X為收入,可令:1990年前:Yi=1+2Xi+1ii=1,2…,n1

1990年后:Yi=1+2Xi+2ii=1,2…,n2

則有可能出現下述四種情況中的一種:(1)1=1,且2=2,即兩個回歸相同,稱為重合回歸(CoincidentRegressions);以Y為儲蓄,X為收入,可令:1990年前:Yi=1+53(2)11,但2=2,即兩個回歸的差異僅在其截距,稱為平行回歸(ParallelRegressions);(3)1=1,但22,即兩個回歸的差異僅在其斜率,稱為匯合回歸(ConcurrentRegressions);(4)11,且22,即兩個回歸完全不同,稱為相異回歸(DissimilarRegressions)。(2)11,但2=2,即兩個回歸的差異僅在其54平行回歸平行回歸55匯合回歸匯合回歸56相異回歸相異回歸57可以運用鄒氏結構變化的檢驗。這一問題也可通過引入乘法形式的虛擬變量來解決。將n1與n2次觀察值合并,并用以估計以下回歸:Di為引入的虛擬變量:可以運用鄒氏結構變化的檢驗。這一問題也可通過58于是有:可分別表示1990年后期與前期的儲蓄函數。

在統計檢驗中,如果3=0的假設被拒絕,則說明兩個時期中儲蓄函數的截距不同,如果4=0的假設被拒絕,則說明兩個時期中儲蓄函數的斜率不同。于是有:可分別表示1990年后期與前期的儲蓄函數。59具體的回歸結果為:(-6.11)(22.89)(4.33)(-2.55)由3與4的t檢驗可知:參數顯著地不等于0,強烈示出兩個時期的回歸是相異的,儲蓄函數分別為:1990年前:1990年后:=0.9836具體的回歸結果為:(-6.11)60鄒氏結構變化的檢驗和虛擬變量法的比較鄒檢驗只是告訴我們結構是否已經變化,而不能告訴我們當有變化時候是因為只是斜率相異或只是截距相異,或兩者均相異。但是虛擬變量法不僅告訴我們兩個回歸是否有差異,而且落實到差異的起因——由于截距或由于斜率或由于兩者。我們只要做一個回歸,因為其他的回歸可以方便地由它導出。這個單一的回歸可以用來做各種假設檢驗。由于合并而增加了自由度,參數估計的相對精度也有所改進。鄒氏結構變化的檢驗和虛擬變量法的比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論