




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第六章 虛擬變量的回歸模型第一部分 學(xué)習(xí)目標(biāo)和要求 本章主要介紹虛擬變量的基本概念及其應(yīng)用。需要掌握并理解以下內(nèi)容:(1) 虛擬變量的基本概念、虛擬變量分別作為解釋變量和被解釋變量的情形、虛擬變量回歸模型的類型和解釋變量個數(shù)選取規(guī)則;(2) 定量變量與不同數(shù)量定性變量(一對一、一對多和多對多)虛擬變量模型;(3) 應(yīng)用虛擬變量改變回歸直線的截距或斜率;(4) 分段線性回歸;(5) 應(yīng)用虛擬變量檢驗回歸模型的結(jié)構(gòu)穩(wěn)定性、傳統(tǒng)判別結(jié)構(gòu)穩(wěn)定性的方法及存在的缺陷、虛擬變量法比較兩個回歸方程的結(jié)構(gòu)方法。第二部分 練習(xí)題一、解釋下列概念:1虛擬變量2方差分析模型(ANOVA)3協(xié)方差模型(ANOCVA)4
2、基底5級差截距系數(shù)6虛擬變量陷阱二、簡要回答下列問題:1虛擬變量在線性回歸模型中的作用是什么?舉例說明。2回歸模型中虛擬變量個數(shù)的選取原則是什么?為什么?3如果現(xiàn)在有月度數(shù)據(jù),在對下面的假設(shè)進行檢驗時,你將引入幾個虛擬變量? A) 一年中的每月均呈現(xiàn)季節(jié)性波動趨勢; B) 只有雙數(shù)月份呈現(xiàn)季節(jié)性波動趨勢。4如果現(xiàn)在讓你著手檢驗上海和深圳兩個股票市場在過去5年內(nèi)的收益率是否有顯著差異,如何使用虛擬變量進行?三、考慮如下模型: 其中,對前20個觀察值取0,對后30個觀察值取1。已知。(1) 如何解釋和?(2) 這兩組的均值分別是多少?(3) 已知。如何計算的方差?四、考慮如下模型: 其中代表一位大
3、學(xué)教授的年薪;為從教年限;為性別虛擬變量。 考慮定義虛擬變量的三種方式: (1)對男性取值1,對女性取值0; (2)對女性取值1,對男性取值2; (3)對女性取值1,對男性取值1; 對每種虛擬變量定義解釋上述回歸模型。是否有某個方法比另外的更好?說明你的理由。五、下表給出了1983年至1986年期間服裝季度銷售額的原始數(shù)據(jù)(單位:百萬元):年度季度123419834190492768436912198445215522535072041985490259125972798719865458635965018607考慮如下兩個模型: (A) (B) 其中,:第一季度:第二季度:第三季度:第四季度
4、 回答以下問題:(1) 估計模型(A);(2) 解釋,;(3) 如何消除模型(A)中的季節(jié)性?(4) 模型(B)與模型(A)有什么區(qū)別?(5) 估計模型(B);(6) 比較兩個模型的結(jié)果。六、考慮如下關(guān)于期望工作時間的對1543對夫婦調(diào)查后的回歸結(jié)果(比率放在括號內(nèi)): 其中為妻子希望每年花在工作上的小時數(shù),以每年工作的小時數(shù)加上花在找工作上的時間之和計算;:妻子稅后真實時薪;:丈夫在上一年度稅后真實收入;:妻子的年齡;:妻子的受教育年數(shù);:態(tài)度變量。若被調(diào)查者愿意工作而且其丈夫也同意其工作則取值1,否則為0;:態(tài)度變量。若被調(diào)查者的丈夫支持其工作則取值1,否則為0;:年齡低于6歲的子女?dāng)?shù);:
5、年齡在613歲的子女?dāng)?shù);回答以下問題:(1) 各非虛擬回歸元系數(shù)的符號有經(jīng)濟含義嗎?說明你的觀點。(2) 如何解釋虛擬變量和?這些虛擬變量統(tǒng)計顯著嗎?(3) 在這項研究中,一位婦女的年齡和受教育程度不是影響其勞動力參與決策的顯著因素,你認為這是為什么?七、設(shè)有個高中畢業(yè)生和個大學(xué)畢業(yè)生構(gòu)成總數(shù)為的總樣本。考慮如下回歸模型: 其中,表示以美元度量的小時工資;為虛擬變量,對大學(xué)畢業(yè)生取值為1,對高中畢業(yè)生取值為0。試?yán)霉剑C明和。其中下標(biāo)具有如下含義:表示高中畢業(yè)生,表示大學(xué)畢業(yè)生。八、在51個學(xué)生(其中男生36人,女生15人)的體重(W)對身高(H)的回歸分析中,得到下面的結(jié)果: 1 2 3
6、其中體重的單位為磅,身高的單位為英寸,為乘積或差別斜率虛擬變量,為性別虛擬變量:參考下面的相關(guān)矩陣,回答問題(1)(6)。解釋:例如,身高和性別的相關(guān)系數(shù)是,性別和交互虛擬變量的相關(guān)系數(shù)是(1) 你將選擇哪個回歸?1還是2,為什么?在模型2與3中呢?(2) 如果實際較為理想的回歸是2,那么選擇1說明犯了什么錯誤?(3) 回歸2中的性別虛擬變量說明了什么?(4) 回歸模型2中差別截距是統(tǒng)計顯著的,但在模型3中差別斜率卻是統(tǒng)計不顯著的。如何解釋這種變化?(5) 在模型2與3中,變量身高的系數(shù)幾乎相等,但性別虛擬變量的系數(shù)相差很大。對此你有什么想法?九、Paul W. Bauer 和Thomas J
7、. Zlatoper在研究決定開往Cleveland的直接機票的因素中得到下面的回歸結(jié)果(表的形式)用以解釋單程頭等艙、二等艙和經(jīng)濟艙機票(因變量是單程機票)的價格。解釋變量頭等艙二等艙經(jīng)濟艙Carriers19.5023.0017.50=(0.878)(1.99)(3.67)Carriers2.794.002.19(0.632)(1.83)(2.42)Miles0.2230.2770.0791(5.13)(12.00)(8.24)Miles0.00000970.0000520.000014(0.495)(4.98)(3.23)POP0.005980.001140.000868(1.67)(4
8、.98)(1.05)INC0.001950.001870.00411(0.686)(1.06)(6.05)Corp3.621.221.06(3.45)(2.51)(5.22)Pass0.0008180.0002750.853(0.771)(0.527)(3.93)Stop12.507.643.58(1.36)(2.13)(2.60)Slot7.130.74617.70(0.299)(0.067)(3.82)Hub11.304.183.500.90(1.81)(1.62)Meal11.200.9451.80(1.07)(0.177)(0.813)EA18.305.8010.60(1.60)(0.
9、775)(3.49)CO66.4056.504.17(5.72)(7.61)(1.35)常數(shù)項212.00126.00113.00(5.21)(5.75)(12.40)0.8630.8710.799觀察值個數(shù)163323323數(shù)據(jù)來源:Paul W. Bauer 和Thomas J. Zlatoper經(jīng)濟評論(Economic Review), Cleveland聯(lián)邦儲備銀行,第25卷,第一期,1989年,表2、3、4,第67頁。解釋變量定義如下:Carriers 飛機數(shù)量 Pass 總乘客人數(shù) Miles 從出發(fā)地到Cleveland的距離 Pop 出發(fā)地人口INC 出發(fā)地人均收入 Corp
10、 潛在商業(yè)交通代理 Slot Stop 中轉(zhuǎn)站數(shù) Meal Hub EA CO (1) 在這個模型中,引入變量載客人數(shù)和載客人數(shù)的平方為解釋變量的理論依據(jù)是什么?載客人數(shù)符號為負和載客人數(shù)平方符號為正表明了什么?(2) 引入距離和距離的平方為解釋變量的理論依據(jù)是什么?觀察到的這些變量的符號有經(jīng)濟意義嗎?(3) 觀察到的人口變量符號為負,這有什么含義?(4) 為什么在所有的回歸結(jié)果中人均收入變量符號都是負的?(5) 為什么“Stop”變量在“頭等艙”和“二等艙”回歸方程中的符號為正?而在“經(jīng)濟艙”回歸方程中符號為負?(6) 虛擬變量“洲際航線”的符號始終為負。這表明了什么?(7) 估計每個回歸系
11、數(shù)的顯著性,分別用單邊和雙邊檢驗。(8) 為什么虛擬變量“Slot”僅僅在“經(jīng)濟艙”回歸方程中是統(tǒng)計顯著的?(9) 由于“頭等艙”和“經(jīng)濟艙”的觀察值的個數(shù)相同,能否將他們加總起來(646個)作一個回歸方程?如果可以,如何區(qū)別“二等艙”和“經(jīng)濟艙”的觀察值?(10) 對上表中的回歸結(jié)果進行評價。十、1966年的第四季度,當(dāng)時的英國勞工黨政府放松了國民保險法案的原則,以統(tǒng)一收費率和救濟金與先前收入相關(guān)相結(jié)合的混合體系取代原來短期失業(yè)救濟金的統(tǒng)一收費率體系,從而提高了失業(yè)救濟金水平。根據(jù)以下數(shù)據(jù):年份和季度失業(yè)率,崗位空缺率,年份和季度失業(yè)率,崗位空缺率,19581.1950.5100019651
12、.2010.9970019591.8760.541001.1921.035001.8420.541001.2591.040001.7500.690001.1921.086001.6480.7710019661.0891.1010019601.4500.836001.1011.058001.3930.908001.2430.987001.3220.968001.6230.81900.8191.2600.9980019671.8210.74010.74019611.1710.968001.9900.66110.6611.1820.964002.1140.66010.6601.2210.952002
13、.1150.69810.6981.3400.8490019682.1500.69510.69519621.4110.748002.1410.73210.7321.6000.658002.1670.74910.7491.7800.562002.1070.80010.8001.9410.5100019692.1040.78310.78319632.1780.510002.0560.80010.8002.0670.544002.1700.79410.7941.9420.568002.1610.79010.7901.7640.6770019702.2250.75710.75719641.5320.79
14、4002.2410.74610.7461.4550.838002.3660.73910.7391.4090.885002.3240.70710.7071.2960.9780019712.5160.58310.5832.9090.52410.524說明:上表中1971年數(shù)據(jù)為初步估計值。資料來源:Damodar Gujarati, “The Behavior of Unemployment and Unfilled Vacancies: Great Britain, 1958-1971,” The Economic Journal, vol. 82, March 1972, p. 202.考慮如
15、下的回歸結(jié)果: 其中失業(yè)率,崗位空缺率,時間,以季度度量(1) 失業(yè)率和崗位空缺率的關(guān)系有何先驗預(yù)期?(2) 保持崗位空缺率不變,在從1966年第4季度開始的期間內(nèi),平均失業(yè)率為多少?它與1966年第4季度之前的期間有顯著差異嗎?(3) 1966年第4季度之前和之后的斜率在統(tǒng)計上不同嗎?(4) 根據(jù)這項研究,能斷定慷慨的失業(yè)救濟金導(dǎo)致更高的失業(yè)率嗎?經(jīng)濟上是否講得通?(5) 根據(jù)表中得數(shù)據(jù),檢驗1958至1966和1966至1971兩個子區(qū)間誤差方差相同的假設(shè)。十一、下表是美國1985年第1季度至1991年第4季度給出的稅后公司利潤和凈利潤(億美元)的季度數(shù)據(jù)。年份和季度紅利稅后利潤年份和季度
16、紅利稅后利潤198587.2125.31988117.5213.4198590.8124.81988121.0226.0198594.1129.81989124.6221.3198597.4134.21989127.1206.21986105.1109.21989129.1195.71986110.7106.01989130.7203.01986112.3110.01990132.3199.11986111.0119.21990132.5193.71987108.0140.21990133.8196.31987105.5157.91990136.2199.01987105.1169.11991
17、137.8189.71987106.3176.01991136.7182.71988109.6195.51991138.1189.61988113.3207.21991138.5190.3資料來源:U.S. Department of Commerce, Bureau of Economic Analysis, Business Statistics, 1963-1991, dividend and after-tax profits are in billions of dollars and are obtained from p.A-110.(1) 做紅利對稅后利潤的回歸。二者之間是否相
18、關(guān)?(2) 如果紅利支付呈現(xiàn)出季節(jié)變動的趨勢,引入一個適當(dāng)?shù)奶摂M變量并對其進行估計。在建立的模型當(dāng)中,如何考慮截距和斜率會隨季節(jié)的不同而變化?(3) 在不考慮季節(jié)因素時,何時作對的回歸?第三部分 參考答案一、解釋概念:1虛擬變量:虛擬變量、定性變量、指標(biāo)變量、名義變量和二分變量都指的是一種取值為0或1的變量。在現(xiàn)實經(jīng)濟生活中,有一類變量如季節(jié)、民族、性別等都可能成為影響某個因變量的重要因素,但這些變量反映的并不是數(shù)量,而是某種性質(zhì)或?qū)傩裕{入定量性質(zhì)的回歸模型,必須先定量化。因此我們可以構(gòu)造一種特殊變量,只有1和0兩種取值,并且規(guī)定當(dāng)變量值取1是,表明具有某種性質(zhì)或?qū)傩裕?時則表明不存在。
19、由于這種變量是人為虛構(gòu)出來的,所以稱為虛擬變量。2方差分析模型(ANOVA):一個只含有虛擬變量或定性解釋變量的回歸模型稱為方差分析模型(Analysis-of-Variance,簡記為ANOVA)。例如,在研究性別與收入關(guān)系時,可以定義虛擬變量,線性回歸模型 ()就是一個方差分析模型。3協(xié)方差模型(ANOCVA):同時包含定量和定性解釋變量的回歸模型叫做協(xié)方差分析模型(Analysis-of-co-Variance,簡記為ANCOVA)。例如,將上例更改為如下形式:其中表示工齡,其他含義不變。該協(xié)方差模型含有一個定量變量和一個定性變量。4基底:虛擬變量被富裕0值的那個類別通常被稱為基底,主要
20、是因為它是用以和其他類別做比較的基礎(chǔ)。例如,上述模型中,女性就是被用來做基底的,截距項就是基底類的截距。這是因為對進行回歸時,截距是。需要注意的是,不管用哪一類作為基底,都不過是一種選擇的結(jié)果,這種選擇有時是根據(jù)某種事先考慮而做出的。5級差截距系數(shù):附著于虛擬變量的系數(shù),稱為級差截距系數(shù),表示取值為1的類別的截距值和基底類的截距值相比有多少差別。6虛擬變量陷阱:引入的虛擬變量個數(shù)應(yīng)該比研究的類別少一個,否則就會造成完全多重共線,就是通常說的虛擬變量陷阱。二、簡答題:1考慮到回歸分析中定性變量的作用,引入虛擬變量后可以讓線性回歸模型成為一種極其靈活的工具。例如,在研究性別與收入關(guān)系時,可以定義虛
21、擬變量,對于線性回歸模型 ()若假設(shè)成立,則說明收入與性別關(guān)系不大,否則說明收入與性別相關(guān)。虛擬變量不僅可以作為解釋變量,也可以作為被解釋變量。例如,銀行在研究是否給企業(yè)貸款時,結(jié)果只有貸或者不貸。這種情況就可以用一個虛擬變量作為被解釋變量來表示。2虛擬變量個數(shù)的選取的一般原則是:如果一個定性變量有個類別,則只需引入個變量。例如:為了區(qū)分兩個類別(如男和女),我們只需要引入一個虛擬變量。這是由于性別只有兩種可能,如果指男性,則我們可以知道指女性。如果不遵從這個原則,就將掉進虛擬變量陷阱,并陷入完全多重共線性的境地。3在一年中每月均呈現(xiàn)季節(jié)性波動趨勢的情況下,引入11個虛擬變量;在只有雙數(shù)月份呈
22、現(xiàn)季節(jié)性波動趨勢的情況下,引入5個虛擬變量。 4分別建立如下回歸方程:上海:;深圳:。問題轉(zhuǎn)化為檢驗是否顯著不為0。建立如下含有虛擬變量的回歸方程:。其中是一個解釋變量,也是虛擬變量。對復(fù)合方程進行回歸,直接對解釋變量實施t檢驗即可。三、(1)和(2)給出了前20次觀測中的期望值,給出了后30次觀測中的期望值的變化量,而后30次觀測中的實際期望值為。 (3)根據(jù)隨機變量之和的方差計算公式,我們有 首先計算得,然后利用有關(guān)雙變量模型的公式,可以得到: 這兩個變量之間得協(xié)方差為15,綜上可得四、(1)男教授: 女教授: 保持不變,男性平均薪水高出(2)男教授: 女教授: 保持不變,男性平均薪水高出
23、(3)男教授: 女教授: 保持不變,男性平均薪水高出由于虛擬變量的度量是任意的,所以沒有哪一種方法會比其他方法更好。對于給定的數(shù)據(jù),答案不會隨著虛擬變量尺度的變化而變化。五、(1) (2):第一季度的平均銷售額為4767.8萬元;:第二季度比第一季度的銷售額平均高出912.25萬元;:第三季度比第一季度的銷售額平均高出1398.8萬元;:第二季度比第一季度的銷售額平均高出2909.8萬元; (3)為了消除數(shù)據(jù)的季節(jié)性,只需將每季度的原始數(shù)據(jù)減去相應(yīng)季度虛擬變量的系數(shù)估計值即可。 (4)模型(B)對每一季度都使用了虛擬變量,但為了避免虛擬變量陷阱問題而抑制了常數(shù)項。 (5)(6)對各季度的平均銷
24、售額的估計值一樣。六、(1)根據(jù)經(jīng)濟理論,預(yù)期和的系數(shù)為正;、和的系數(shù)為負;的系數(shù)可正可負,取決于妻子的年齡和子女?dāng)?shù)量。可能年齡與6歲以下子女?dāng)?shù)或613歲子女?dāng)?shù)之間的交互項更有助于闡明年齡與意愿工作小時數(shù)之間的關(guān)系。(2)保持所有其他因素不變,預(yù)計意愿工作小時數(shù)會高于(共同的)截距1286小時。但這個系數(shù)的符號為負,不過由于它在統(tǒng)計上不顯著,所以我們就對(平均)的影響也無話可說。至于,其符號預(yù)期為正,結(jié)果也的確如此。不僅如此,它還是統(tǒng)計顯著的,因為值相當(dāng)高。(3)可能是由于年齡和受教育程度之間以及它們與子女?dāng)?shù)之間的共線性所致。還要注意的是這個模型并不包括丈夫完成的受教育年限。七、根據(jù)公式,我們
25、知道: 現(xiàn)在很容易驗證;若,則,若,則。方程中的分母可以寫成: 方程中的分子可以寫成: 所以有,代入截距公式即可得到。八、(1) 在1和2中選擇2。因為根據(jù)實際經(jīng)驗,不同性別的體重會有較明顯的差異,因而需要把性別考慮進來;(2) 在2和3中選擇2,因為模型3中、都不是顯著的;(3) 模型設(shè)定偏差;(4) 說明了性別因素對體重的影響;(5) 說明性別因素會影響體重,但不一定會對斜率產(chǎn)生影響;(6) 模型2認為身高系數(shù)不受性別不同的影響,但不同性別的截距是不同的;模型3則認為性別不同不但影響截距,對身高系數(shù)也有影響。九、(1) 理論依據(jù):飛機數(shù)量的增多,會使總體機票價格下降,但下降的幅度并不是線性
26、的,而是曲線的。飛機數(shù)量系數(shù)為負表明其與機票價格負相關(guān),平方的系數(shù)為負表明其與價格之間的關(guān)系不是線性的。(2) 理論依據(jù):機票價格隨距離加長而上升,但并不是線性上升,上升趨勢是逐漸變緩的。(3) 機票價格隨乘客人數(shù)增多而下降。(4) 人均收入高,乘坐飛機人數(shù)會更多,有助于攤低成本,從而機票價格會下降。(5) 中轉(zhuǎn)站數(shù)多表明短途旅客多。由于路程短,經(jīng)濟艙機票就賣的較多,而頭等艙和二等艙則相反。(6) 表明洲際航線價格較低。(7) 提示:由于觀察值的個數(shù)足夠大,因此在5的顯著水平下,可以用正態(tài)分布近似t分布。(8) 說明此項服務(wù)只對經(jīng)濟艙有影響。(9) 可以。設(shè)即可。(10) 從表中的回歸結(jié)果可以發(fā)現(xiàn):對于頭等艙機票的價格,只有從出發(fā)地到Cleveland的距離(Miles)、潛在商業(yè)交通代理(Corp)、是否為洲際航線(CO)3個因素對其有明顯的影響,而其他因素我們均不能拒絕其偏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大型影視項目專用發(fā)電機組與拍攝場地租賃協(xié)議
- 鐵塔作業(yè)安全協(xié)議書
- 壓路機租賃合同協(xié)議書
- 項目人員服務(wù)協(xié)議書
- 中關(guān)村履約監(jiān)管協(xié)議書
- 質(zhì)量問題協(xié)議協(xié)議書
- 退場合同終止協(xié)議書
- 合伙向他人購買協(xié)議書
- 酒醉責(zé)任自負協(xié)議書
- 便利店供貨合同協(xié)議書
- 校園ip地址規(guī)劃方案表格
- 威圖電柜空調(diào)SK3304500使用說書
- 中國近現(xiàn)代外交史智慧樹知到期末考試答案章節(jié)答案2024年外交學(xué)院
- 河南省2022漢字大賽題庫
- 2023年湖北宜昌高新區(qū)社區(qū)專職工作人員(網(wǎng)格員)招聘考試真題及答案
- 2024年江蘇省知識產(chǎn)權(quán)競賽參考試題庫(含答案)
- 《導(dǎo)數(shù)及其概念》課件
- 小學(xué)英語面試試講(六大課型)
- 國培教師個人成長案例3000字
- 電工技能競賽實操試題庫完整
- 水土保持工程監(jiān)理工作總結(jié)報告(格式)
評論
0/150
提交評論