




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
§3.6含有虛擬變量的多元線性回歸模型
一、含有虛擬變量的模型一、虛擬變量的引入二、虛擬變量的設置原則
§3.6含有虛擬變量的多元線性回歸模型一、含有虛擬變量1一、含有虛擬變量的模型一、含有虛擬變量的模型21、虛擬變量(dummyvariables)許多經濟變量是可以定量度量。一些影響經濟變量的因素是無法定量度量。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過引入“虛擬變量”來完成的。根據這些因素的屬性類型,構造只取“0”或“1”的人工變量,通常稱為虛擬變量,記為D。虛擬變量只作為解釋變量。1、虛擬變量(dummyvariables)許多經濟變量是3一般地,在虛擬變量的設置中:
基礎類型、肯定類型取值為1;比較類型,否定類型取值為0。例如,反映文程度的虛擬變量可取為:D=1,本科學歷D=0,非本科學歷虛擬變量能否取1、0以外的數值?一般地,在虛擬變量的設置中:42、虛擬變量模型同時含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。例如,一個以性別為虛擬變量考察企業職工薪金的模型:其中:Yi為企業職工的薪金;Xi為工齡;Di=1,若是男性,Di=0,若是女性。2、虛擬變量模型同時含有一般解釋變量與虛擬變量的模型稱為虛擬5二、虛擬變量的引入二、虛擬變量的引入61、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則企業男、女職工的平均薪金為:1、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法7假定2>0,則兩個函數有相同的斜率,但有不同的截距。意即,男女職工平均薪金對工齡的變化率是一樣的,但兩者的平均薪金水平相差2。可以通過對2的統計顯著性進行檢驗,以判斷企業男女職工的平均薪金水平是否有顯著差異。02假定2>0,則兩個函數有相同的斜率,但有不同的截距。意即,8將上例中的性別換成教育水平,教育水平考慮三個層次:高中以下、高中、大學及其以上。高中以下高中大學及以上將上例中的性別換成教育水平,教育水平考慮三個層次:高中以下、9在上例中同時引入性別和教育水平:在上例中同時引入性別和教育水平:10女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:男職工本科以下學歷的平均薪金:男職工本科以上學歷的平均薪金:女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:112、乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下,斜率發生變化,或斜率、截距同時發生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。2、乘法方式加法方式引入虛擬變量,考察:截距的不同。12例如,根據消費理論,收入決定消費。但是,農村居民和城鎮居民的邊際消費傾向往往是不同的。這種消費傾向的不同可通過在消費函數中引入虛擬變量來考察。農村居民:城鎮居民:例如,根據消費理論,收入決定消費。但是,農村居民和城鎮居民的133、同時引入加法與乘法形式的虛擬變量當截距與斜率發生變化時,則需要同時引入加法與乘法形式的虛擬變量。對于一元模型,有兩組樣本,則有可能出現下述四種情況中的一種:
1=1,且2=2,即兩個回歸相同,稱為重合回歸(CoincidentRegressions);11,但2=2,即兩個回歸的差異僅在其截距,稱為平行回歸(ParallelRegressions);1=1,但22,即兩個回歸的差異僅在其斜率,稱為匯合回歸(ConcurrentRegressions);11,且22,即兩個回歸完全不同,稱為相異回歸(DissimilarRegressions)。3、同時引入加法與乘法形式的虛擬變量當截距與斜率發生變化時,144、例題判斷中國農村居民與城鎮居民的消費行為是否有顯著差異。被解釋變量:居民家庭人均生活消費支出Y解釋變量:居民家庭人均工資收入X1、其他收入X2樣本:2013年31個地區農村居民與城鎮居民人均數據虛擬變量Di:農村居民取值1,城鎮居民取值0
4、例題判斷中國農村居民與城鎮居民的消費行為是否有顯著差異。15由變量顯著性檢驗得到:在10%的顯著性水平下,Di和DiXi1是顯著的,而DiXi2不顯著。因此:2013年農村居民的平均消費支出要比城鎮居民少1573.9元;在其他條件不變的情況下,農村居民與城鎮居民的工資收入都增加100元時,農村居民要比城鎮居民多支出19元用于生活消費;農村居民與城鎮居民在其他收入方面有相同的增加量時,兩者增加的消費支出沒有顯著差異。總體回歸模型樣本回歸函數由變量顯著性檢驗得到:在10%的顯著性水平下,Di和DiXi16三、虛擬變量的設置原則三、虛擬變量的設置原則17每一定性變量(qualitativevariable)所需的虛擬變量個數要比該定性變量的狀態類別數(categories)少1。即如果有m種狀態,只在模型中引入m-1個虛擬變量。例如,季節定性變量有春、夏、秋、冬4種狀態,只需要設置3個虛變量:
如果設置第4個虛變量,則出現“虛擬變量陷井”(DummyVariableTrap)。為什么?每一定性變量(qualitativevariable)所需18例如:包含季節變量的正確模型:解釋變量完全共線性錯誤模型例如:包含季節變量的正確模型:解釋變量完全共線性錯誤模型19如果在服裝需求函數模型中必須包含3個定性變量:季節(4種狀態)、性別(2種狀態)、職業(5種狀態),應該設置多少虛變量?模型含常數項模型不含常數項如果在服裝需求函數模型中必須包含3個定性變量:季節(4種狀態20討論:定序定性變量可否按照狀態賦值?例如:表示居民對某種服務的滿意程度,分5種狀態:非常不滿意、一般不滿意、無所謂、一般滿意、非常滿意。在模型中按照狀態分別賦值0、1、2、3、4或者-2、-1、0、1、2。被經常采用,尤其在管理學、社會學研究領域。正確的方法:設置多個虛擬變量,理論上正確,帶來自由度損失。以定性變量為研究對象,構造多元排序離散選擇模型,然后以模型結果對定性變量的各種狀態賦值。但需要更多的信息支持。賦值的方法等于是對虛變量方法中的各個虛變量的參數施加了約束,而這種約束經常被檢驗為錯誤的。討論:定序定性變量可否按照狀態賦值?例如:表示居民對某種服務21§3.6含有虛擬變量的多元線性回歸模型
一、含有虛擬變量的模型一、虛擬變量的引入二、虛擬變量的設置原則
§3.6含有虛擬變量的多元線性回歸模型一、含有虛擬變量22一、含有虛擬變量的模型一、含有虛擬變量的模型231、虛擬變量(dummyvariables)許多經濟變量是可以定量度量。一些影響經濟變量的因素是無法定量度量。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過引入“虛擬變量”來完成的。根據這些因素的屬性類型,構造只取“0”或“1”的人工變量,通常稱為虛擬變量,記為D。虛擬變量只作為解釋變量。1、虛擬變量(dummyvariables)許多經濟變量是24一般地,在虛擬變量的設置中:
基礎類型、肯定類型取值為1;比較類型,否定類型取值為0。例如,反映文程度的虛擬變量可取為:D=1,本科學歷D=0,非本科學歷虛擬變量能否取1、0以外的數值?一般地,在虛擬變量的設置中:252、虛擬變量模型同時含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。例如,一個以性別為虛擬變量考察企業職工薪金的模型:其中:Yi為企業職工的薪金;Xi為工齡;Di=1,若是男性,Di=0,若是女性。2、虛擬變量模型同時含有一般解釋變量與虛擬變量的模型稱為虛擬26二、虛擬變量的引入二、虛擬變量的引入271、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則企業男、女職工的平均薪金為:1、加法方式虛擬變量作為解釋變量引入模型有兩種基本方式:加法28假定2>0,則兩個函數有相同的斜率,但有不同的截距。意即,男女職工平均薪金對工齡的變化率是一樣的,但兩者的平均薪金水平相差2。可以通過對2的統計顯著性進行檢驗,以判斷企業男女職工的平均薪金水平是否有顯著差異。02假定2>0,則兩個函數有相同的斜率,但有不同的截距。意即,29將上例中的性別換成教育水平,教育水平考慮三個層次:高中以下、高中、大學及其以上。高中以下高中大學及以上將上例中的性別換成教育水平,教育水平考慮三個層次:高中以下、30在上例中同時引入性別和教育水平:在上例中同時引入性別和教育水平:31女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:男職工本科以下學歷的平均薪金:男職工本科以上學歷的平均薪金:女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:322、乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下,斜率發生變化,或斜率、截距同時發生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。2、乘法方式加法方式引入虛擬變量,考察:截距的不同。33例如,根據消費理論,收入決定消費。但是,農村居民和城鎮居民的邊際消費傾向往往是不同的。這種消費傾向的不同可通過在消費函數中引入虛擬變量來考察。農村居民:城鎮居民:例如,根據消費理論,收入決定消費。但是,農村居民和城鎮居民的343、同時引入加法與乘法形式的虛擬變量當截距與斜率發生變化時,則需要同時引入加法與乘法形式的虛擬變量。對于一元模型,有兩組樣本,則有可能出現下述四種情況中的一種:
1=1,且2=2,即兩個回歸相同,稱為重合回歸(CoincidentRegressions);11,但2=2,即兩個回歸的差異僅在其截距,稱為平行回歸(ParallelRegressions);1=1,但22,即兩個回歸的差異僅在其斜率,稱為匯合回歸(ConcurrentRegressions);11,且22,即兩個回歸完全不同,稱為相異回歸(DissimilarRegressions)。3、同時引入加法與乘法形式的虛擬變量當截距與斜率發生變化時,354、例題判斷中國農村居民與城鎮居民的消費行為是否有顯著差異。被解釋變量:居民家庭人均生活消費支出Y解釋變量:居民家庭人均工資收入X1、其他收入X2樣本:2013年31個地區農村居民與城鎮居民人均數據虛擬變量Di:農村居民取值1,城鎮居民取值0
4、例題判斷中國農村居民與城鎮居民的消費行為是否有顯著差異。36由變量顯著性檢驗得到:在10%的顯著性水平下,Di和DiXi1是顯著的,而DiXi2不顯著。因此:2013年農村居民的平均消費支出要比城鎮居民少1573.9元;在其他條件不變的情況下,農村居民與城鎮居民的工資收入都增加100元時,農村居民要比城鎮居民多支出19元用于生活消費;農村居民與城鎮居民在其他收入方面有相同的增加量時,兩者增加的消費支出沒有顯著差異。總體回歸模型樣本回歸函數由變量顯著性檢驗得到:在10%的顯著性水平下,Di和DiXi37三、虛擬變量的設置原則三、虛擬變量的設置原則38每一定性變量(qualitativevariable)所需的虛擬變量個數要比該定性變量的狀態類別數(categories)少1。即如果有m種狀態,只在模型中引入m-1個虛擬變量。例如,季節定性變量有春、夏、秋、冬4種狀態,只需要設置3個虛變量:
如果設置第4個虛變量,則出現“虛擬變量陷井”(DummyVariableTrap)。為什么?每一定性變量(qualitativevariable)所需39例如:包含季節變量的正確模型:解釋變量完全共線性錯誤模型例如:包含季節變量的正確模型:解釋變量完全共線性錯誤模型40如果在服裝需求函數模型中必須包含3個定性變量:季節(4種狀態)、性別(2種狀態)、職業(5種狀態),應該設置多少虛變量?模型含常數項模型不含常數項如果在服裝需求函數模型中必須包含3個定性變量:季節(4種狀態41
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 量子信用評分算法-洞察及研究
- 2025屆江西名校高二化學第二學期期末監測試題含解析
- 產業競爭壁壘研究-洞察及研究
- 2025屆廣東省中山一中等七校高二化學第二學期期末聯考模擬試題含解析
- 市場需求定價模型-洞察及研究
- 跨境電商營銷策略優化-第1篇-洞察闡釋
- 分子進化和保護-洞察及研究
- 環境規劃與政策創新-洞察闡釋
- 虛擬現實影院發展-洞察闡釋
- 新媒體傳播中的傳播效果分析框架-洞察及研究
- GMP附錄-細胞治療產品
- 2025年中國烘焙食品行業發展深度分析及行業發展趨勢報告
- 專業燒烤店管理制度
- 節能降耗與循環利用相結合的金屬冶煉工業優化策略-洞察闡釋
- 中國保險行業發展分析及發展前景與投資研究報告2025-2028版
- 2025年衛生系統招聘考試(護理學專業知識)新版真題卷(附詳細解析)
- 少兒編程運營方案
- 2008-2024年江蘇省連云港贛榆區事業單位考試《綜合知識與能力素質》真題試卷及答案
- 貴州省貴陽市觀山湖區2023-2024學年四年級下學期數學期末試卷(含答案)
- 中醫護理技術創新思維
- 2025年6月8日內蒙古呼倫貝爾市事業單位面試真題及答案解析
評論
0/150
提交評論