第六章計量經濟學_第1頁
第六章計量經濟學_第2頁
第六章計量經濟學_第3頁
第六章計量經濟學_第4頁
第六章計量經濟學_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章 虛擬變量的回歸模型第一部分 學習目標和要求 本章主要介紹虛擬變量的基本概念及其應用。需要掌握并理解以下內容:(1) 虛擬變量的基本概念、虛擬變量分別作為解釋變量和被解釋變量的情形、虛擬變量回歸模型的類型和解釋變量個數選取規則;(2) 定量變量與不同數量定性變量(一對一、一對多和多對多)虛擬變量模型;(3) 應用虛擬變量改變回歸直線的截距或斜率;(4) 分段線性回歸;(5) 應用虛擬變量檢驗回歸模型的結構穩定性、傳統判別結構穩定性的方法及存在的缺陷、虛擬變量法比較兩個回歸方程的結構方法。第二部分 練習題一、解釋下列概念:1虛擬變量2方差分析模型(ANOVA)3協方差模型(ANOCVA)4

2、基底5級差截距系數6虛擬變量陷阱二、簡要回答下列問題:1虛擬變量在線性回歸模型中的作用是什么?舉例說明。2回歸模型中虛擬變量個數的選取原則是什么?為什么?3如果現在有月度數據,在對下面的假設進行檢驗時,你將引入幾個虛擬變量? A) 一年中的每月均呈現季節性波動趨勢; B) 只有雙數月份呈現季節性波動趨勢。4如果現在讓你著手檢驗上海和深圳兩個股票市場在過去5年內的收益率是否有顯著差異,如何使用虛擬變量進行?三、考慮如下模型: 其中,對前20個觀察值取0,對后30個觀察值取1。已知。(1) 如何解釋和?(2) 這兩組的均值分別是多少?(3) 已知。如何計算的方差?四、考慮如下模型: 其中代表一位大

3、學教授的年薪;為從教年限;為性別虛擬變量。 考慮定義虛擬變量的三種方式: (1)對男性取值1,對女性取值0; (2)對女性取值1,對男性取值2; (3)對女性取值1,對男性取值1; 對每種虛擬變量定義解釋上述回歸模型。是否有某個方法比另外的更好?說明你的理由。五、下表給出了1983年至1986年期間服裝季度銷售額的原始數據(單位:百萬元):年度季度123419834190492768436912198445215522535072041985490259125972798719865458635965018607考慮如下兩個模型: (A) (B) 其中,:第一季度:第二季度:第三季度:第四季度

4、 回答以下問題:(1) 估計模型(A);(2) 解釋,;(3) 如何消除模型(A)中的季節性?(4) 模型(B)與模型(A)有什么區別?(5) 估計模型(B);(6) 比較兩個模型的結果。六、考慮如下關于期望工作時間的對1543對夫婦調查后的回歸結果(比率放在括號內): 其中為妻子希望每年花在工作上的小時數,以每年工作的小時數加上花在找工作上的時間之和計算;:妻子稅后真實時薪;:丈夫在上一年度稅后真實收入;:妻子的年齡;:妻子的受教育年數;:態度變量。若被調查者愿意工作而且其丈夫也同意其工作則取值1,否則為0;:態度變量。若被調查者的丈夫支持其工作則取值1,否則為0;:年齡低于6歲的子女數;:

5、年齡在613歲的子女數;回答以下問題:(1) 各非虛擬回歸元系數的符號有經濟含義嗎?說明你的觀點。(2) 如何解釋虛擬變量和?這些虛擬變量統計顯著嗎?(3) 在這項研究中,一位婦女的年齡和受教育程度不是影響其勞動力參與決策的顯著因素,你認為這是為什么?七、設有個高中畢業生和個大學畢業生構成總數為的總樣本。考慮如下回歸模型: 其中,表示以美元度量的小時工資;為虛擬變量,對大學畢業生取值為1,對高中畢業生取值為0。試利用公式,證明和。其中下標具有如下含義:表示高中畢業生,表示大學畢業生。八、在51個學生(其中男生36人,女生15人)的體重(W)對身高(H)的回歸分析中,得到下面的結果: 1 2 3

6、其中體重的單位為磅,身高的單位為英寸,為乘積或差別斜率虛擬變量,為性別虛擬變量:參考下面的相關矩陣,回答問題(1)(6)。解釋:例如,身高和性別的相關系數是,性別和交互虛擬變量的相關系數是(1) 你將選擇哪個回歸?1還是2,為什么?在模型2與3中呢?(2) 如果實際較為理想的回歸是2,那么選擇1說明犯了什么錯誤?(3) 回歸2中的性別虛擬變量說明了什么?(4) 回歸模型2中差別截距是統計顯著的,但在模型3中差別斜率卻是統計不顯著的。如何解釋這種變化?(5) 在模型2與3中,變量身高的系數幾乎相等,但性別虛擬變量的系數相差很大。對此你有什么想法?九、Paul W. Bauer 和Thomas J

7、. Zlatoper在研究決定開往Cleveland的直接機票的因素中得到下面的回歸結果(表的形式)用以解釋單程頭等艙、二等艙和經濟艙機票(因變量是單程機票)的價格。解釋變量頭等艙二等艙經濟艙Carriers19.5023.0017.50=(0.878)(1.99)(3.67)Carriers2.794.002.19(0.632)(1.83)(2.42)Miles0.2230.2770.0791(5.13)(12.00)(8.24)Miles0.00000970.0000520.000014(0.495)(4.98)(3.23)POP0.005980.001140.000868(1.67)(4

8、.98)(1.05)INC0.001950.001870.00411(0.686)(1.06)(6.05)Corp3.621.221.06(3.45)(2.51)(5.22)Pass0.0008180.0002750.853(0.771)(0.527)(3.93)Stop12.507.643.58(1.36)(2.13)(2.60)Slot7.130.74617.70(0.299)(0.067)(3.82)Hub11.304.183.500.90(1.81)(1.62)Meal11.200.9451.80(1.07)(0.177)(0.813)EA18.305.8010.60(1.60)(0.

9、775)(3.49)CO66.4056.504.17(5.72)(7.61)(1.35)常數項212.00126.00113.00(5.21)(5.75)(12.40)0.8630.8710.799觀察值個數163323323數據來源:Paul W. Bauer 和Thomas J. Zlatoper經濟評論(Economic Review), Cleveland聯邦儲備銀行,第25卷,第一期,1989年,表2、3、4,第67頁。解釋變量定義如下:Carriers 飛機數量 Pass 總乘客人數 Miles 從出發地到Cleveland的距離 Pop 出發地人口INC 出發地人均收入 Corp

10、 潛在商業交通代理 Slot Stop 中轉站數 Meal Hub EA CO (1) 在這個模型中,引入變量載客人數和載客人數的平方為解釋變量的理論依據是什么?載客人數符號為負和載客人數平方符號為正表明了什么?(2) 引入距離和距離的平方為解釋變量的理論依據是什么?觀察到的這些變量的符號有經濟意義嗎?(3) 觀察到的人口變量符號為負,這有什么含義?(4) 為什么在所有的回歸結果中人均收入變量符號都是負的?(5) 為什么“Stop”變量在“頭等艙”和“二等艙”回歸方程中的符號為正?而在“經濟艙”回歸方程中符號為負?(6) 虛擬變量“洲際航線”的符號始終為負。這表明了什么?(7) 估計每個回歸系

11、數的顯著性,分別用單邊和雙邊檢驗。(8) 為什么虛擬變量“Slot”僅僅在“經濟艙”回歸方程中是統計顯著的?(9) 由于“頭等艙”和“經濟艙”的觀察值的個數相同,能否將他們加總起來(646個)作一個回歸方程?如果可以,如何區別“二等艙”和“經濟艙”的觀察值?(10) 對上表中的回歸結果進行評價。十、1966年的第四季度,當時的英國勞工黨政府放松了國民保險法案的原則,以統一收費率和救濟金與先前收入相關相結合的混合體系取代原來短期失業救濟金的統一收費率體系,從而提高了失業救濟金水平。根據以下數據:年份和季度失業率,崗位空缺率,年份和季度失業率,崗位空缺率,19581.1950.5100019651

12、.2010.9970019591.8760.541001.1921.035001.8420.541001.2591.040001.7500.690001.1921.086001.6480.7710019661.0891.1010019601.4500.836001.1011.058001.3930.908001.2430.987001.3220.968001.6230.81900.8191.2600.9980019671.8210.74010.74019611.1710.968001.9900.66110.6611.1820.964002.1140.66010.6601.2210.952002

13、.1150.69810.6981.3400.8490019682.1500.69510.69519621.4110.748002.1410.73210.7321.6000.658002.1670.74910.7491.7800.562002.1070.80010.8001.9410.5100019692.1040.78310.78319632.1780.510002.0560.80010.8002.0670.544002.1700.79410.7941.9420.568002.1610.79010.7901.7640.6770019702.2250.75710.75719641.5320.79

14、4002.2410.74610.7461.4550.838002.3660.73910.7391.4090.885002.3240.70710.7071.2960.9780019712.5160.58310.5832.9090.52410.524說明:上表中1971年數據為初步估計值。資料來源:Damodar Gujarati, “The Behavior of Unemployment and Unfilled Vacancies: Great Britain, 1958-1971,” The Economic Journal, vol. 82, March 1972, p. 202.考慮如

15、下的回歸結果: 其中失業率,崗位空缺率,時間,以季度度量(1) 失業率和崗位空缺率的關系有何先驗預期?(2) 保持崗位空缺率不變,在從1966年第4季度開始的期間內,平均失業率為多少?它與1966年第4季度之前的期間有顯著差異嗎?(3) 1966年第4季度之前和之后的斜率在統計上不同嗎?(4) 根據這項研究,能斷定慷慨的失業救濟金導致更高的失業率嗎?經濟上是否講得通?(5) 根據表中得數據,檢驗1958至1966和1966至1971兩個子區間誤差方差相同的假設。十一、下表是美國1985年第1季度至1991年第4季度給出的稅后公司利潤和凈利潤(億美元)的季度數據。年份和季度紅利稅后利潤年份和季度

16、紅利稅后利潤198587.2125.31988117.5213.4198590.8124.81988121.0226.0198594.1129.81989124.6221.3198597.4134.21989127.1206.21986105.1109.21989129.1195.71986110.7106.01989130.7203.01986112.3110.01990132.3199.11986111.0119.21990132.5193.71987108.0140.21990133.8196.31987105.5157.91990136.2199.01987105.1169.11991

17、137.8189.71987106.3176.01991136.7182.71988109.6195.51991138.1189.61988113.3207.21991138.5190.3資料來源:U.S. Department of Commerce, Bureau of Economic Analysis, Business Statistics, 1963-1991, dividend and after-tax profits are in billions of dollars and are obtained from p.A-110.(1) 做紅利對稅后利潤的回歸。二者之間是否相

18、關?(2) 如果紅利支付呈現出季節變動的趨勢,引入一個適當的虛擬變量并對其進行估計。在建立的模型當中,如何考慮截距和斜率會隨季節的不同而變化?(3) 在不考慮季節因素時,何時作對的回歸?第三部分 參考答案一、解釋概念:1虛擬變量:虛擬變量、定性變量、指標變量、名義變量和二分變量都指的是一種取值為0或1的變量。在現實經濟生活中,有一類變量如季節、民族、性別等都可能成為影響某個因變量的重要因素,但這些變量反映的并不是數量,而是某種性質或屬性,要納入定量性質的回歸模型,必須先定量化。因此我們可以構造一種特殊變量,只有1和0兩種取值,并且規定當變量值取1是,表明具有某種性質或屬性,取0時則表明不存在。

19、由于這種變量是人為虛構出來的,所以稱為虛擬變量。2方差分析模型(ANOVA):一個只含有虛擬變量或定性解釋變量的回歸模型稱為方差分析模型(Analysis-of-Variance,簡記為ANOVA)。例如,在研究性別與收入關系時,可以定義虛擬變量,線性回歸模型 ()就是一個方差分析模型。3協方差模型(ANOCVA):同時包含定量和定性解釋變量的回歸模型叫做協方差分析模型(Analysis-of-co-Variance,簡記為ANCOVA)。例如,將上例更改為如下形式:其中表示工齡,其他含義不變。該協方差模型含有一個定量變量和一個定性變量。4基底:虛擬變量被富裕0值的那個類別通常被稱為基底,主要

20、是因為它是用以和其他類別做比較的基礎。例如,上述模型中,女性就是被用來做基底的,截距項就是基底類的截距。這是因為對進行回歸時,截距是。需要注意的是,不管用哪一類作為基底,都不過是一種選擇的結果,這種選擇有時是根據某種事先考慮而做出的。5級差截距系數:附著于虛擬變量的系數,稱為級差截距系數,表示取值為1的類別的截距值和基底類的截距值相比有多少差別。6虛擬變量陷阱:引入的虛擬變量個數應該比研究的類別少一個,否則就會造成完全多重共線,就是通常說的虛擬變量陷阱。二、簡答題:1考慮到回歸分析中定性變量的作用,引入虛擬變量后可以讓線性回歸模型成為一種極其靈活的工具。例如,在研究性別與收入關系時,可以定義虛

21、擬變量,對于線性回歸模型 ()若假設成立,則說明收入與性別關系不大,否則說明收入與性別相關。虛擬變量不僅可以作為解釋變量,也可以作為被解釋變量。例如,銀行在研究是否給企業貸款時,結果只有貸或者不貸。這種情況就可以用一個虛擬變量作為被解釋變量來表示。2虛擬變量個數的選取的一般原則是:如果一個定性變量有個類別,則只需引入個變量。例如:為了區分兩個類別(如男和女),我們只需要引入一個虛擬變量。這是由于性別只有兩種可能,如果指男性,則我們可以知道指女性。如果不遵從這個原則,就將掉進虛擬變量陷阱,并陷入完全多重共線性的境地。3在一年中每月均呈現季節性波動趨勢的情況下,引入11個虛擬變量;在只有雙數月份呈

22、現季節性波動趨勢的情況下,引入5個虛擬變量。 4分別建立如下回歸方程:上海:;深圳:。問題轉化為檢驗是否顯著不為0。建立如下含有虛擬變量的回歸方程:。其中是一個解釋變量,也是虛擬變量。對復合方程進行回歸,直接對解釋變量實施t檢驗即可。三、(1)和(2)給出了前20次觀測中的期望值,給出了后30次觀測中的期望值的變化量,而后30次觀測中的實際期望值為。 (3)根據隨機變量之和的方差計算公式,我們有 首先計算得,然后利用有關雙變量模型的公式,可以得到: 這兩個變量之間得協方差為15,綜上可得四、(1)男教授: 女教授: 保持不變,男性平均薪水高出(2)男教授: 女教授: 保持不變,男性平均薪水高出

23、(3)男教授: 女教授: 保持不變,男性平均薪水高出由于虛擬變量的度量是任意的,所以沒有哪一種方法會比其他方法更好。對于給定的數據,答案不會隨著虛擬變量尺度的變化而變化。五、(1) (2):第一季度的平均銷售額為4767.8萬元;:第二季度比第一季度的銷售額平均高出912.25萬元;:第三季度比第一季度的銷售額平均高出1398.8萬元;:第二季度比第一季度的銷售額平均高出2909.8萬元; (3)為了消除數據的季節性,只需將每季度的原始數據減去相應季度虛擬變量的系數估計值即可。 (4)模型(B)對每一季度都使用了虛擬變量,但為了避免虛擬變量陷阱問題而抑制了常數項。 (5)(6)對各季度的平均銷

24、售額的估計值一樣。六、(1)根據經濟理論,預期和的系數為正;、和的系數為負;的系數可正可負,取決于妻子的年齡和子女數量。可能年齡與6歲以下子女數或613歲子女數之間的交互項更有助于闡明年齡與意愿工作小時數之間的關系。(2)保持所有其他因素不變,預計意愿工作小時數會高于(共同的)截距1286小時。但這個系數的符號為負,不過由于它在統計上不顯著,所以我們就對(平均)的影響也無話可說。至于,其符號預期為正,結果也的確如此。不僅如此,它還是統計顯著的,因為值相當高。(3)可能是由于年齡和受教育程度之間以及它們與子女數之間的共線性所致。還要注意的是這個模型并不包括丈夫完成的受教育年限。七、根據公式,我們

25、知道: 現在很容易驗證;若,則,若,則。方程中的分母可以寫成: 方程中的分子可以寫成: 所以有,代入截距公式即可得到。八、(1) 在1和2中選擇2。因為根據實際經驗,不同性別的體重會有較明顯的差異,因而需要把性別考慮進來;(2) 在2和3中選擇2,因為模型3中、都不是顯著的;(3) 模型設定偏差;(4) 說明了性別因素對體重的影響;(5) 說明性別因素會影響體重,但不一定會對斜率產生影響;(6) 模型2認為身高系數不受性別不同的影響,但不同性別的截距是不同的;模型3則認為性別不同不但影響截距,對身高系數也有影響。九、(1) 理論依據:飛機數量的增多,會使總體機票價格下降,但下降的幅度并不是線性

26、的,而是曲線的。飛機數量系數為負表明其與機票價格負相關,平方的系數為負表明其與價格之間的關系不是線性的。(2) 理論依據:機票價格隨距離加長而上升,但并不是線性上升,上升趨勢是逐漸變緩的。(3) 機票價格隨乘客人數增多而下降。(4) 人均收入高,乘坐飛機人數會更多,有助于攤低成本,從而機票價格會下降。(5) 中轉站數多表明短途旅客多。由于路程短,經濟艙機票就賣的較多,而頭等艙和二等艙則相反。(6) 表明洲際航線價格較低。(7) 提示:由于觀察值的個數足夠大,因此在5的顯著水平下,可以用正態分布近似t分布。(8) 說明此項服務只對經濟艙有影響。(9) 可以。設即可。(10) 從表中的回歸結果可以發現:對于頭等艙機票的價格,只有從出發地到Cleveland的距離(Miles)、潛在商業交通代理(Corp)、是否為洲際航線(CO)3個因素對其有明顯的影響,而其他因素我們均不能拒絕其偏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論