

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第一章2.4以下是某城市10個市場蘋果需求(Y)和價格(X)的數據:Y999170796055701018167"X2224232627242523_2226(1)計算工y2,工x2,工xy。/X/X(2)假設Y=卩+卩2X+u,計算系數的OLS估計量卩,卩2。(3)做出散點圖和樣本回歸線(利用統計軟件)。AYAX_AYX(4)估計蘋果在本均值點(X,Y)的需求彈性(亍一=點乂Y)答:(1)X=(22+24+23+26+27+24+25+23+22+26)/10=24.2Y=(99+91+70+79+60+55+70+101+81+67)/10=77.3工y2=工(Y-Y)2=470
2、.89+187.69+53.29+2.89+299.29+497.29+53.29+561.69+13.69+106.09=2246.1工x2=工(X-X)2=4.84+0.04+1.44+3.24+7.84+0.04+0.64+1.44+4.84+3.24=27.6工xy=工(X-X)(Y-Y)=-47.74-2.74+8.76+3.06-48.44+4.464-28.44-8.14-18.54=143.602-143.6=-5.20327.60=Y-0X=77.3-6.3824.2=203.212612(3)散點圖和樣本回歸線如下圖所示:i110100-90-80-70-60-501l21
3、22232425262728(4)AYAXAY.Y.育_AXX=0Yx£=5.203x竺_1.632Y77.32.5DATA1-1給出了中國2011年各省市GDP(Y)和投資(X)的數據。利用統計軟件(Eviews或Stata)回答以下問題:(1)做散點圖,觀察投資對GDP的影響。(2)估計回歸方程Y_P1+P2X+u。i12ii(3)你如何解釋斜率系數的含義?答:(1)散點圖如下:60,00010,000-50,000-40,000-30,000-20,000-010,00020,00030,000X(2)以下是用eviews6.0輸出的結果,可知:Y二1.832478X-490.
4、2798,即為所要求的估計回歸方程。ii(3)斜率系數是指當投資變動1單位時,GDP將變動1.832478單位。第三章3.5以下陳述正確嗎?不論正確與否,請說明理由。(1) X值越接近樣本均值,斜率的OLS估計值就越精確。答:錯誤。因為se(®=X2X2U2亡,當X值越接近樣本均值時n一2X=X-X將會變小,則2X2也將變小,這將會導致se()變大。標準差的變大致使1 ii2i=1OLS估計值波動更大,OLS估計值也變得更不精確了。(2) 如果誤差項u與自變量X相關,則估計量仍然是無偏的。答:錯誤。在證明估計量是無偏性的時候,我們假定自變量是給定的,否則E(0)=卩kE(u)=P的第
5、一個等式不成立。22ii2(3) 僅當誤差項服從正態分布時,估計量才具有BLUE性質。答:錯誤,在證明高斯-馬爾科夫定理時,無需假設誤差項服從正態分布。(4) 如果誤差項不服從正態分布,則不能進行t檢驗和F檢驗。答:正確。在證明相關統計量服從學生分布和F分布時,需要假設誤差項服從正態分布。(5) 如果誤差項的方差較大,則置信區間較寬。答:正確。因為當誤差項變大時,置信區間的表達式:0-se(0)-15卩50+se(0)-1中,估計量方差更大,從而可知置信區間將會變寬。2 2a/2222a/2(6) 如果自變量方差較大,則系數的置信區間較窄。答:正確。因為自變量的方差較大,則系數估計量的方差較小
6、。以一元回歸方程為例:系數估計量的方差隨自變量方差的增加而增加。(7) p值較大意味著系數為零的可能性小。答:錯誤。P值就是當原假設為真時樣本觀察結果對應的統計值出現的概率,p值較大意味著拒絕原假設犯錯的可能性較小,也就是說系數為0的可能性也就越大。(8)如果選擇的顯著性水平較高(p值較小),則回歸系數為顯著的可能性較大。答:正確。當選擇的顯著性水平較高時,容許犯第I類錯誤的概率上限將會下降,這使得我們斷言“回歸系數顯著”的可能性也越大。(9)如果誤差項序列相關或為異方差,則估計系數不再是無偏或BLUE。答:錯誤。當誤差項序列相關或為異方差時,估計系數依然是無偏的,但是不再具有有效性,同時線性
7、性也是滿足的。(10)P值是零假設為真的概率。答:錯誤。P值是當原假設為真時我們拒絕原假設的概率。3.8假設某人利用容量為19的樣本估計了消費函數C二a+卩Y+u,并獲得下列結果:iiiC=15+0.Y1iit=(3.1)(18.72=R0.98(1)計算參數估計量的標準差。(2)構造P的95%的置信區間,據此檢驗P的統計顯著性。B八081答:(1)沁18.7可得:se(0)=0.0433se(卩)18.7&15沁3.1可得:se(a)=4.8387se(d)3.1(2)由置信區間公式:P-se(0)-150<P+se(0)-1,可得:a/2a/20.7186<0<0
8、.9014,原點沒有包含在置信區間內,故P是統計顯著性的。第四章4.7利用Y=某電纜制造商對其主要客戶的年銷售量(百萬英尺),X2=GNP(10億美元),X°=新房動工數(千套),X=失業率(),X=滯后6個月的最惠利率,X<=用戶用3456線增量()得到如下回歸方程(16年的數據)Y=5962+4.88X+2.36X-819X+12X-851X23456se=(2.51)(0.84)(187)(147)(292)R2=0.82(1)此模型中各系數的預期符號是什么?(2)系數符號是否與預期一致?(3)系數在5%的顯著性水平上是統計顯著的嗎?(4)如果先做Y對X2,XX4的回歸,
9、擬合優度為R2二0.6021。然后決定是否加進234變量XX你如何知道是否應該把XX加進模型?你用何種檢驗?進行必要的5656計算。答:(1)Xc的預期符號是正的;XQ的預期符號是正;X的預期符號是負;Xv的預期2345符號是負;X«的預期系數是正。6(2)由(1)知,X5、X«的系數符號和預期是不一致的。6(3)丄二1.94se(B)'2方法一:Prob-(t10二L94)=°.°8方法二:1.94<t(10)=2.230.05這說明,02是不顯著的。同理可以得到,03、卩4、卩6都是顯著的。2346但對于05'0二se(0)51
10、2=0.082147prob.qt。、0.082)二0.94可知,卩厶是不顯著的。(4) 可以使用瓦爾德檢驗。由公式:廠(R2-R2)/(k-m)(0.82-0.6021)/2F=ur=6.053c(1-R2)/(n-k)(1-0.82)/(16-6)U可知:F工F*=410,則說明05,06是聯合顯著的。c56則應該把他們兩個加進模型(嚴格地說,應該是不能同時從模型中去掉)。4.8利用15個觀察數據估計三變量(兩個解釋變量X2,X3)回歸模型得到如下結果:TSS=6600ESS=2200,O(1) 求殘差平方和RSS。(2) TSS,RSS和ESS的自由度各為多少?(3) 檢驗假設:X2,X
11、3對被解釋變量沒有影響。使用什么檢驗?(4) 如果沒有殘差數據,但知道三變量回歸方程的擬合優度,能否完成3)中的檢驗?用什么計算公式?答:(1)RSS二TSS-ESS二6600-2200二4400(2)tss的自由度是N1=15-1=14,rss的自由度是NK=15-3=12,ess的自由度是2。(3)可以使用聯合顯著性檢驗:廠ESS/(k-1)2200/2F二u二一cRSSJ(n-k)4400/(15-3)二3.00(3)F<F*(0-05)=3-89,因此接受原假設。c2,12(4)能。我們可以使用瓦爾德檢驗。零假設:卩=卩=°,23非受限模型為:Y=卩+卩X+卩X+u12
12、233受限模型為:Y“1+u則我們可以用公式Fc=R;空-1)(1-R2)/(n-k)4.11根據1978年至2012年中國城鎮居民的收入和消費的數據(DATA4-8),得到如下回歸方程(year是時間趨勢變量)Consumption=-267.30+0.74Income+85.54yeart=(-1.85)(37.30)(6.58)(1)收入增加一個單位時引起的消費增量稱為邊際消費傾向MPC,MPC顯著不為1嗎?給出檢驗過程。(2)Year的系數顯著嗎?其經濟含義是什么?(3)計算每個系數估計量的標準誤差。答:(1)零假設為:02=1,則t=d=-130.02查表(2)t32(0.05)=2
13、.037,因此拒絕原假設,系數顯著。零假設為:03=0,658>2307,拒絕零假設,故系數顯著異于0。-267.30由t=-185=,可得se(0)=144.49,se(01)1074t=37.30=I,可得,se(B)=0.02se(卩)22t=6.58=,可得,se(卩)=13。se(卩)33第五章0p(3p6-3p0i005(-0.6X4)R2=0.93F=38.95.4在一個關于某城市用水量的分析中,估計出了如下的方程(n=15):watc=-326.-90.3h0USe+t=-(1.7)(0.9)-17.87prwat-1.123rain(-1.2)(-0.8)其中,watc
14、=總用水量,house=總的房屋套數,pop=總人口,pci=人均年收入,prwat=水價,rain=年降雨量,括號內的數值是:統計量。(1)根據經濟理論或直覺,你認為每個回歸系數的符號應該是什么,為什么?估計出來的系數的符號與你的推測一致嗎?(2)每個系數的t統計值都不顯著,但是F統計值是顯著的,導致這種矛盾的原因是什么?(3)這些估計量是有偏的、無效的或者不一致的嗎?答:(1)house的系數應該是正的,因為房屋越多,住戶也就越多,用戶量也會增加。模型中和推測的一致;pop的系數也應該是正的,因為人越多,用水量肯定也越多,模型中和推測一致。Pci的系數應該是正的,因為當人的收入多時,也就不
15、會珍惜使用每一滴水來減少花費,模型中和推測不一致;prwat的系數應該是負的,因為當水價上升時,對于那些在意水價格的人們將會降低對水的使用,從而水的用量降低,模型中和推測一致;ain的系數應該是正的,因為當降水量增加時,用水量必然要增加了,這是由于水量相比較于以前增加了,模型中和推測不一致。(2)導致這種矛盾的原因是多重共線性的存在。(3)如果保持自變量取值不變且有足夠多的樣本,利用這些樣本計算得到OLS估計值的平均值將“接近于”真實的參數值,所以說這些估計量是無偏的。而且多重共線性沒有破壞OLS估計量的最小方差性,但最小的方差也可能比較大。較大的方差容易導致本該顯著的系數不能通過顯著性檢驗。
16、所以這些估計量是有效的,只是最小方差變大了。但是這些估計量將是不一致的,因為多重共線性將會帶來的后果致使模型估計不準確,也就不能依概率收斂于總體的真值。5.6判斷以下陳述的正誤,并給出理由。(1)盡管存在多重共線性,OLS估計量仍然是具有BLUE性質的。(2)在高度多重共線性的情形下,要評價一個或多個偏回歸系數的個別顯著性是不可能的。(3)如果有某一輔助回歸顯示出高的R2值,則模型中肯定存在較嚴重的多重共線性問題。(4)變量的兩兩高度相關并不表示高度的多重共線性。(5)如果分析的目的僅僅是預測,則多重共線性是無害的。(6)其它條件不變,VIF越高,相應的OLS估計量的方差越大。(7)在多元回歸
17、中,如果根據t檢驗,全部的偏回歸系數個別來說都是不顯著的,那么就不可能得到一個較高的R2。答:(1)正確。無偏性是一個重復抽樣的性質,如果保持自變量取值不變且有足夠多的樣本,利用這些樣本計算得到OLS估計值的平均值將“接近于”真實的參數值。所以無偏性并沒有改變。多重共線性也沒有破壞OLS估計量的最小方差性,但最小的方差也可能比較大。較大的方差容易導致本該顯著的系數不能通過顯著性檢驗。(2)正確。在嚴重多重共線性情況下,由于估計的標準誤急劇增加,使得假設檢驗中的t值變小,從而導致接受零假設,從而無法評估偏回歸系數的個別顯著性。(3)錯誤。我們可以通過輔助回歸檢驗是否存在多重共線性,如果某個輔助回
18、歸方程的擬合優度顯著不為零(即整體顯著:F檢驗),則模型中可能存在多重共線性,但是并不表示必然存在。輔助回歸不是檢驗多重共線性的充分條件。(4)正確。變量高度相關并不一定是線性相關,如果是高度非線性相關就不一定會導致嚴重的多重共線性;即使在兩個變量高度線性相關的前提下,也并不意味著嚴重的多重共線性。(5)不一定。如果所觀察到的共線性關系能夠在新的未來的數據中保持下去,則此論斷正確,如果不是,則錯誤。(6)正確。從公式可以看出var(儀)=_-VIF,如果其他條件不變的情況下,VIF越2工x22i高,相應的OLS估計量的方差越大。(7)錯誤。這是多重共線性的“典型”特征就是:R2較高但t值顯著的
19、系數不多。如果R2較高,比如在0.8以上,F檢驗通常會拒絕零假設,即解釋變量聯合起來對被解釋變量有影響,但單個系數能通過顯著性檢驗(t檢驗)的不多。這說明即使根據t檢驗,全部的偏回歸系數個別來說都是不顯著的,那么也有可能得到一個較高的R2。第八早6.3在研究生產函數時,我們得到如下結果In9=8.57+0.4601nK+1.2851nL+0.272tse=(4.2)(0.025)(0.347)(0.041)n=36R2=0.889其中9為產量,K為資本,L為勞動時數,'為時間變量。(1) 解釋系數0.460、1.285、0.272的含義。(2) 對資本、勞動時數的回歸系數做顯著性檢驗(
20、寫出原假設、備擇假設、計算檢驗統計量)。答:(1)0.460表示的是產量對資本的彈性。同理,1.285表示的是產量對勞動時數的彈性,0.272表示的是當時間變動一單位所引起的產量的變化27.2%。(2)對于資本的系數B:原假設:H:0=0,備擇假設:H:卩H020212=18.4卩0.460t=2=se(0)0.0252由Excel計算可得:prob(|>18.4)=1.40E18,可知0是顯著的。2對于勞動時數的系數0:原假設:H:0=0,備擇假設:H:0H030313t=爲5=0347=3.703由Excel計算可得:prob(|t>3.70)=0.000807I32由此可以看
21、出,0也是顯著的。36.4一個勞動經濟學家想分析教育程度和工作經驗對收入的影響。使用橫截面數據,她獲得如下關系式:log(income)=7.71+0.094educ+0.023exper-0.000325exper2se=(0.113)(0.005)(0.009)(0.000187)R2=0.337n=60式中,加come為收入;educ為受教育程度;exper為工作經驗。括號內為標準誤。請寫出以下檢驗的原假設和備擇假設。(1) 檢驗“受教育程度對收入沒有影響”;(2) 檢驗:“受教育程度和工作經驗對收入都沒有影響”;(3) 檢驗“工作經驗對收入沒有影響”,如果有必要你還會進行什么回歸?寫出
22、檢驗統計量的表達式,說明其分布和自由度。(4) 寫出收入對a.受教育程度;b.工作經驗的邊際效應的表達式。如果有需要的話,計算這些邊際效應你還需要什么其他信息?(5) 寫出收入對a.受教育程度;b.工作經驗的彈性的表達式。如果有需要的話,計算這些彈性你還需要什么其他信息?答:設educ的系數為P,exper的系數為0,exper2的系數為p。234(1)原假設:H:p=0,備擇假設:p主0。022(3) 原假設:H:0=0=0=0,備擇假設:H:p,p,p不全為0。02341234(4) 原假設:H:p=p=0,備擇假設:H:p,p不全為0。034134如果有必要還要進行輔助回歸。檢驗統計量:
23、f=(Ri-RR2'(1-R:):56其分布服從自由度為(2,56)的F分布。(4) =pxY(X表示受教育程度,Y表示收入,X)dx2111空=(p+2pX)xY,如果有需要的話,還要知道各變量的均值。dx3422(5) E=-yx£=pxXeducdxY211E=空x5=(p+2|3XXX,exerdxY34222如果有需要的話,計算這些彈性還需要有這些變量的均值。第七章7.9DATA7-6給出了46個中產階級個人收入及其他相關信息的數據,自變量包括:Experience工作年限;Management1,經理;0,非經理;Education1,高中;2,大學;3,研究生。
24、(1)直接利用表中受教育程度的數據進行回歸分析合適嗎?會導致什么樣的問題?(2)利用Experience、Management以及重新設定后的受教育程度變量進行線性回歸。所有變量是統計顯著的嗎?(3)建立一個新的模型,考慮經理人和非經理人因工作經歷差異可能導致的收入增量差異。寫出回歸結果。(4)建立一個新的模型,考慮經理人和非經理人由于教育水平的差異可能導致的收入增量差異。寫出回歸結果。答:(1)不合適。因為這樣會使得回歸結果中各種學歷者之間的工資差異相同,即本科學歷工作者與高中學歷工作者之間的工資差異同研究生學歷工作者與本科學歷工作者之間的工資差異相同,會導致回歸結果不準確,致使不能正確估計
25、模型。(2)引入虛擬變量:1,大學1,研究生D=<,D=<10,其他20,其他設定模型:salary=B+BExperience+Pmanagerment+PD+PD+u1234152估計方程得:salary=11031.81+546.18Experience+6883.53managerment-2996.21D】+147.82D?p=(0)(0)(0)(0)(0.7)R2=0.957由此可以看出,除了D不顯著外,其他都是顯著的。2(3) 建立模型:salary=a+aexperience+amanagementxexperience+aD12341+aD+amanagement
26、+u526估計模型得:salary=8576.13+514.13experience+6251.99management+75.12managementxexperiencet=(17.63)(12.25)(10.15)(1.04)+2728.68D+2471.07D2t=(7.08)(5.50)R2=0.950(4) 建立模型:salary=X+Xexperience+入D+入D+入management1231425+XDmanagement+XDmanagement+u6172估計模型得:salary=11203-43+496.99experience1730.748D349.08D+70
27、47.41management12一3066.04management+1836-49managementr2=0.9997.10DATA7-7是美國1995年3月當期人口調查的數據,抽取了1865歲年齡段的1289名工人,具體信息如下:Wage小時工資(美元)Age年齡;Female1,女工;Nonwhite1,非白人;Union1,工會會員Education受教育年限;Experience工作年限。(1) 根據這些數據,估計下面的模型,寫出回歸結果:lnWage=B+BAge+BFemale+BNonwhite+BUnion+BEducation+BExperience+ui1234567
28、i其中,InWage表示Wage的自然對數。(2) 如何解釋每個回歸系數?(3) a=0.05的水平下,哪些系數是顯著的?(4) 平均而言,工會會員的工資相對較高嗎?為什么?(5) 平均而言男工比女工的工資高嗎?為什么?(6) 女工會員的工資比女非工會會員的工資高嗎?為什么?答:(1)用eviews做相關分析可以發現age和Wage相關系數達到0.97,說明這兩個變量具有多重共線性。刪掉變量age有:log(Wage)=0.906+0.18Union-0.134Nonwhite-0.249Femalet=(12.21)(4.88)(-3.59)(-9.357)+0.013Exper+0.100Educationt=(10.89)(20.75)R2=0.346(2) B表示wage以90.6%開始變化。1B表示年齡每增加1歲,每小時工資會無變化。2B表示女工的工資比男工的工資少24.9%
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 財產處理協議書
- 表5安全教育與培訓
- 2024-2025學年七年級數學北師大版上冊期末檢測卷(含答案)
- 幼兒園《雨天的活動》科學教案
- 大班幼兒全面發展指南策略分析
- 2024-2025學年下學期高二生物人教版期末必刷常考題之生態系統的信息傳遞
- 森林之旅心理題目及答案
- 2025屆河南省九師聯盟高三下學期2月教學質量檢測語文試題(解析版)
- 年底員工評價的評語
- 渣土車輛超速檢討書
- 醫療廢物收集人員個人防護要求
- 山東產權交易集團有限公司招聘(校招、社招)筆試真題2023
- (正式版)HGT 6263-2024 電石渣脫硫劑
- GB/T 6346.1-2024電子設備用固定電容器第1部分:總規范
- 廣州市廣大附中2024屆八年級數學第二學期期末學業質量監測試題含解析
- 建筑美學智慧樹知到期末考試答案2024年
- (高清版)DZT 0280-2015 可控源音頻大地電磁法技術規程
- 教師論文寫作培訓課件
- 礦井探放水圖牌板管理標準
- 學校安全:如何應對學生賭博行為
- 廉潔應征承諾書
評論
0/150
提交評論