應用回歸分析(第三版)何曉群_劉文卿_課后習題答案_完整版_第1頁
應用回歸分析(第三版)何曉群_劉文卿_課后習題答案_完整版_第2頁
應用回歸分析(第三版)何曉群_劉文卿_課后習題答案_完整版_第3頁
應用回歸分析(第三版)何曉群_劉文卿_課后習題答案_完整版_第4頁
應用回歸分析(第三版)何曉群_劉文卿_課后習題答案_完整版_第5頁
已閱讀5頁,還剩133頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二章一元線性回歸分析思考與練習參考答案2.1 一元線性回歸有哪些基本假定?答:假設1、解釋變量X是確定性變量,Y是隨機變量;假設2、隨機誤差項e具有零均值、同方差和不序列相關性:E(i )=0i=1,2,,nVar ( i)=e02i=1,2,,nCov( i,eq)=0i 豐 j i,j= 1,2, ,n假設3、隨機誤差項e與解釋變量X之間不相關:Cov(Xi, i)=0i=1,2,,n假設4、e服從零均值、同方差、零協方差的正態分布曠N(0,仃2 )i=1,2,,n2.2 考慮過原點的線性回歸模型Yi= 'Xi+ &i=1,2,,n誤差百(i=1,2,仍滿足基本假定。求B

2、i的最小二乘估計解:Qe =£ (Yi -Y?)2(Yi 區iXi)2i 1i 1Qe =2n (Yi /XM =0:?1 i d0 (XiYJi 1 n x (Xi2) i 12.3 證明(2.27 式),lei =0 ,工eiXi=0。nnQ=Z (Y -Y?)2 =S (Y (>+舀Xj)2證明:11其中:Y?=用十邑Xie=Y-Y?*I E(A+律%-用=0| =(4+/?K-i;)二 o即:工e =0 , -eiXi=02.4 回歸方程E (Y) = 8+ B1X的參數8, B1的最小二乘估計與最大似然估計在 什么條件下等價?給出證明。答:由于?N(0,。2 )i=1

3、,2,,n所以Yi=®+ &X + N (也+向X ,仃2 )最大似然函數:學習參考2 n2 n/ 21 n- -2L( 0, i,)=iJ(Yi) =(2二二廣 exp-2X Yi -( o i o,Xi) 一2- ycc)n91 nccc9LnL( 0, i,二 2) 二 一 ln(2二二 2) 一2” Yi -(。 i o,X i )222 二 y使彳3Ln (L)最大的田,禺就是風 由的最大似然估計值。同時發現使得Ln (L)最大就是使得下式最小,nnQ = £ (Y -Y?)2 -Z (Y-(E +叱XJ)2ii上式恰好就是最小二乘估計的目標函數相同。值得

4、注意的是:最大似然估計是在&N (0,。2 )的假設下求得,最小二乘估計則不要求分布假設。所以在N(0,仃2)的條件下,參數例,1的最小二乘估計與最大似然估計等價o2.5證明凡是的的無偏估計。_ i n _ n證明:E(P0)=E(Y -P1X)=E-S Yi -XSi =1Xi - X 、Yi)xx= En (1XX)Yi = E n (1-X)( o 1Xi i) i=1 nLxxi=1 nLxx= E00十W (。一女與工居=七十£ ( iT nLxxy n-XAf1A)E( .)= oLxx2.6證明Var( ?0) =AX)c2n 、 Xi X 2i =1,(工:)

5、n Lxx證明:n 1 Xi Xn 1 Xi - X 2Var(?o) =Var(-X; )YJ=(-X)2Var( 0 iXi i) i=1 nLxxi=1 nLxxn 1 2- Xi - X - Xi -X 22nLxx-(_)2_2X (X-i-)2:2i 1 nnLxxLxx2.7證明平方和分解公式:SST=SSE+SSR證明:nnsst =£ M -Y 2 = £ 收-Y?) + (Y? -Y 2 i 4i 1n2八Y? Yi 1nn22 Yi Y?)(Y? Y 八 Yi Y?)i 1i=1n=£i=1(Y?i - Y 2 +£ (Yi -R)

6、 2i=1= SSR SSE2.8驗證三種檢驗的關系,即驗證:“、, (n -2)r iSSR/1 Lxx ?122(1) t = / - ; (2) F=-21 =t21_r2SSE/(n -2)?2證明:(1)PLxx?r JLyy: Lxxr JLyyJn 2rJn - 2rt ='='=彳;?2 Lxx, SSE(Lxx(n-2),SSE(n-2), SSE SST .1-r2(2)ssrc(?y)2 一遇 Nx -y)2 =、 (y ?(Xi -x)-y)2=E (附為-X)2 = f?2Lxxi 1i 4_ SSR/1 _ ?2LLxx2FttSSE/(n -2);

7、?212.9 驗證(2.63)式:Var(ei)=(1 n(XiX )2LHXX證明:var(e ) = var(*y?) = var( X) + var( y?) 2cov( y» y?) = var(yi) +var(00 +用為)-2cov(小川 +X)(Xi -又)二1rnLXXL2-XX2 CT22 1 (Xi -X)2一一251Cov(yi,y ?1(Xi - x) =Cov(yi,y) Cov(yi, Z(Xi X)甘1 J/ (Xi - X)其中:=Cov(yi, £ yi) +(Xi -X)Cov(yi,Z (yjn i 1iLxx212 (Xi - X)

8、 2a + crnLxx(11 n2(Xi - X)、 2 )7LXX2.10用第9題證明證明:E(;?2)1n 21n 2;?2 :二2的無偏估計量1 n2n;E(y?)2n; var(e)i3(n -2)二2n 2二21n 2E(e2)(為一%一2Lxx2.11驗證決定系數與F值之間的關系式F n -2證明:2 SSR SSR1r =SST SSR SSE 1 SSE/SSR1="n2i SSR/(SSE/(n -2)1F1 , n -2 F n -2 F2.14為了調查某廣告對銷售收入的影響,某商店記錄了 5個月的銷售收入y(萬元)和廣告費用x (萬元),數據見表2.6,要求用

9、手工計算:表2.6月份12345X12345Y1010202040(1)畫散點圖(略)(2) X與Y是否大致呈線性關系?答:從散點圖看,X與Y大致呈線性關系(3)用最小二乘法估計求出回歸方程計算表XY(Xi -X)2-2(Yi Y )(Xi -X)(Yi -Y)Y?(Y?-Y)2(Y?-Yi)21104100206(-14) 2(-4) 221011001013(-7) 2(3) 2320000200042010027727254044004034142(-6) 2和15100和 Lxx=10Lyy=600和 Lxy=70和100SSR=490SSE=110均3均20均20N xy = 70

10、=7, ?0 =Y - ?X = 20-3 7 = -1.Lxx 10回歸方程為:Y?=K + X = -1十7X(4)求回歸標準誤差先求SSR (Qe)見計算表。所以Qe 110=22 =3=6.055.(5)給用饋的置信度為95%的區間估計;由于(1-a)的置信度下 黑 的置信區間是(f?t2 s?)查表可得 t:/2(n-2)=to.025(3) =3.182S4 ;1.915所以耳的 95% 的區間估計為:(73.182*1.915, 7+3.182*1.915 ),即(0.906,13.094)。12536.667() =6.3515 10所以?o 的 95% 的區間估計為:(-1-

11、3.182*6.351 , -1+3.182*6.351 ),即(-21.211, 19.211 ) 。 Po的置信區間包含0,表示Po不顯著(6)計算x和y的決定系數2 SSR SSR 490R20.817SST Lyy 600說明回歸方程的擬合優度高。(7)對回歸方程作方差分析方差分析表方差來源平方和自由度F值SSR490149013.364SSE110336.667SST6004F值=13.364>F 0.05(1,3)=10.13(當n1=1,n 2=8 時,%=0.05 查表得對應 的值為10.13),所以拒絕原假設,說明回歸方程顯著。(8)做回歸系數01的顯著性檢驗H0: 3

12、1=0t = M/S? =7/1.915 = 3.656t值=3.656>t 0.05/2 (3)=3.182,所以拒絕原假設,說明x對Y有顯著的影響。(8)做相關系數R的顯著性檢驗2 SSRR = R20.817 = 0.904SSTR值=0.904>R 0.05(3)=0.878,所以接受原假設,說明x和Y有顯著的 線性關系。(9)對回歸方程作殘差圖并作相應的分析殘差圖(略).從殘差圖上看出,殘差是圍繞e=0在一個固定的帶子里隨機波動,基本滿足模型的假設eiN(0,。2),但由于樣本量太少,所以誤 差較大.(10)求廣告費用為4.2萬元時,銷售收入將達到多少?并給出置信度為95

13、%的置信區間.解:當X0=4.2時,Y? - ?0ZX0=T 7 4.2 = 28.4所以廣告費用為4.2萬元時,銷售收入將達到28.4萬元.由于置信度為1-a時,丫。估計值的置信區間為:?2(121 (X0 X) "I'In Lxx= 36.667(1510所以求得Yo的95%的置信區間為:6.05932 ,50.74068預測誤差較大.2.15 一家保險公司十分關心其總公司營業部加班的制度 ,決定認真調查一下現 狀。經過十周時間,收集了每周加班工作時間的數據和簽發的新保單數目 ,x 為每周新簽發的保單數目,y為每周加班工作時間(小時)。見表2.7。表 2.7周序號1234

14、5678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.01、畫散點圖2、散點圖4.03.02.0100012001400每周簽發的新保單數目小 時 )每 周 加 班 工 作 時 間由散點圖可以看出x與y之間大致呈線性關系。3、用最小二乘法求出回歸系數回歸系數顯著性檢驗表a模型未標準化系數標準化系數tP直95%回歸系數的置信區間B標準誤下限上限1(Constant).118.355.333.748-.701.937每周簽發的新保單數目.004.000.9498.509.000.003.005a. Depend

15、ent Variable:周加班工作時間(小時)由表可知:?0 =0.118 ?1= 0.00359回歸方程為:y = 0.118 +0.00359x4、求回歸標準誤差?方差分析表b模型平方和自由度均方FP值1回歸16.682116.68272.396.000 a殘差1.8438.230總和18.5259a. Predictors: (Constant), 每周簽發 的新保單 數目b. Dependent Var iable:每周加班 工作時間(小時)由方差分析表可以得到:SSE=1.843故回歸標準誤差。、鬻。=。.48。5、給出回歸系數的置信度為95%的區間估計回歸系數顯著性檢驗表a模型未

16、標準化系數標準化系數_t_P195%回歸系數的置信區間B標準誤下限上限1(Constant).118.355.333.748-.701.937每周簽發的新保單數目.004.000.9498.509.000.003.005a. Dependent Variables周加班工作時間(小時)由回歸系數顯著性檢驗表可以看出,當置信度為95%時:0。的預測區間為-0.701,0.937, 味的預測區間為0.003,0.005.瓦的置信區間包含0,表示瓦不拒絕為零的假設模型概要b模型R決定系 數調整后的 決定系數估計值的標 準誤差Durbin-Wats on1.949 a.900.888.4800.753

17、a. Predictor s: (Constant), 每周簽發的新保單數目b. Dependent Vari able:每 周加 班 工作時 間(小 時)6、決定系數由模型概要表得到決定系數為0.9接近于1 ,說明模型的擬合優度高方差分析表b模型平方和自由度均方FP值1回歸16.682116.68272.396.000 a殘差1.8438.230總和18.5259a. Predictors: (Constant), 每 周 簽發 的 新保單 數目b. Dependent Var iable:每周加班 工作 時間(小時)7.對回歸方程作方差分析由方差分析表可知:F值=72.396>5.3

18、2(當5=1門2=8時,查表得對應的值為5.32)P值=0,所以拒絕原假設,說明回歸方程顯著。8、對W的顯著性檢驗從上面回歸系數顯著性檢驗表可以得到Pi的t統計量為t=8.509 ,所對應的p值近似為0,通過t檢驗。說明每周簽發的新保單數目x對 每周加班工作時間y有顯著的影響。9.做相關系數顯著性檢驗相關分析表每周簽發的 新保單數目每周加班 工作時間 (小時)母周簽發日勺新保單數目 Pearson Correlation1.949*Sig. (2-tailed).000N1010每周 加班 工 作時間(小 Pearson Correlation.949*1時)Sig. (2-tailed).0

19、00N1010* Correlation is significant at the 0.01 level (2-tailed).相關系數達到0.949,說明x與y顯著線性相關化殘-0.30000殘差圖0.600000.300000.00000-0.60000-0.90000每周簽發的新保單數目10、對回歸方程作殘 差圖并作相應分析從殘差圖上看出,殘 差是圍繞e=0隨即波 動,滿足模型的基本 假設。11、該公司預計下一周簽發新保單X0=1000張,需要的加班時間是多少?當X0=1000 張時,y = 0.118 + 0.00359* 1000 = 3.7032 小時12、給出Y。的置信水平為9

20、5%的預測區間通過SPS游算彳#到Y。的置信水平為95%的預測區間為:(2.5195, 4.8870)。13給出E (Y。)的置信水平為95%的預測區間通過SPS前算彳#到Y。的置信水平為95%的預測區間為:(3.284, 4.123)。2.16表是1985年美國50個州和哥倫比亞特區公立學校中教師的人均年工資 y(美元)和學生的人均經費投入x(美元).1 丁 Pyx1 丁 pyxJ 丁 pyx11958333461820816305935195382642220263311419180952967362046031243203253554202093932853721419275242680

21、045422122644391438251603429529470466922246244517392248239476266104888232718643494020969250973067857102433990502041272245440827170553625233823594422589240429258534168262062728214322644340210245003547272279533664424640282911242743159282157029204522341229712271703621292208029804625610293213301683782302

22、2250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349172197431553418443230551258453766解答:(1)繪制y對x的散點圖,可以用直線回歸描述兩者之間的關系嗎?yx由上圖可以看出y與x的散點分布大致呈直線趨勢(2)建立y對x的線性回歸利用SPSS進行y和x的線性回歸,輸出結果如下:表1模型概要RR2調整后的R2隨機誤差項的標準差佶計值0.8350.6970.6912323.25589表2

23、方差分析表模型平方和自由度和平均F值P值1回歸平方和殘差平方和6.089E82.645E81496.089E85397517.938112.811.000a總平方和8.734E850表3系數表模型非標準化系數標準化系數t值P值B標準差回歸系數1常數12112.6291197.76810.113.000對學生的人均經費投入3.314.312.83510.621.0001)由表1可知,x與y決定系數為r2 = 0.697 ,說明模型的擬合效果一般x與y線性相關系數R=0.835 ,說明x與y有較顯著的線性關系。2)由表2 (方差分析表中)看到,F=112.811 ,顯著性Sig.p % 0.000

24、,說明 回歸方程顯著。3)由表3可見對P1的顯著性t檢驗P值近似為零,故久顯著不為0,說明 x對y有顯著的線性影響。4)綜上,模型通過檢驗,可以用于預測和控制。x與y的線性回歸方程為:?= 12112.629 3.314* x(3)繪制標準殘差的直方圖和正態概率圖D«paneltnt V9rvbl«: fit湎人的年 I:然SIU7需町圖1標準殘差的直方圖圖2標準殘差的正態概率P-P現測值概率由圖1可見標準化后殘差近似服從正態分布,由圖2可見正態概率圖中的各個散點都分布在45。線附近,所以沒有證據證明誤差項服從同方差的正態分 布的假定是不真實的,即殘差通過正態性檢驗,滿足模

25、型基本假設。第3章多元線性回歸思考與練習參考答案3.2討論樣本容量n與自變量個數p的關系,它們對模型的參數估 計有何影響? 答:在多元線性回歸模型中,樣本容量n與自變量個數p的關系是: n>>p 。如果n<=p對模型的參數估計會帶來很嚴重的影響。因為:1 .在多元線性回歸模型中,有p+1個待估參數B,所以樣本容量的 個數應該大于解釋變量的個數,否則參數無法估計。2 .解釋變量X是確定性變量,要求rank(X尸p+l<n,表明設計矩陣 X中的自變量列之間不相關,即矩陣X是一個滿秩矩陣。若rank(X) < p十1 ,則解釋變量之間線性相關,(XX)是奇異陣,則 P的

26、估計不穩定。3 .3證明a2 = SSE/(n -曜枇孽差項由勺方差。2的無偏估計。證明:':92 :一1sse=1(ee)=1工 e2, n - p 1n - p -1n - p -1 i 1nnnnn.Ee2)八D(q)- ' ;:2(1-)-;-八(1-) - ;:2(n-%hii)- -2(n- p -1)i=1i 1i 1i =1i=1c1n ccE(;?2) =-eq e2)=:2n -p-1 i 14 .4 一個回歸方程的復相關系數 R=0.99 ,樣本決定系數R2=0.9801 , 我們能判斷這個回歸方程就很理想嗎? 答:不能斷定這個回歸方程理想。因為:1 .在

27、樣本容量較少,變量個數較大時,決定系數的值容易接近1,而此時可能F檢驗或者關于回歸系數的t檢驗,所建立的回歸方 程都沒能通過。2 .樣本決定系數和復相關系數接近于1只能說明 Y與自變量X1,X2,Xp整體上的線性關系成立,而不能判斷回歸方程和每個自變量是顯著的,還需進行F檢驗和t檢驗。3 .在應用過程中發現,在樣本容量一定的情況下,如果在模型中增 加解釋變量必定使得自由度減少,使得R2往往增大,因此增加 解釋變量(尤其是不顯著的解釋變量)個數引起的R2的增大與 擬合好壞無關。3.7驗證n證明:多?!繃i回歸方程jliXil2一般形式為i 1y = BO , :1xi2X2 - HI - : p

28、Xp,;其經驗回歸方程式為?=用十限i十陽泡 +川十%xp,又用=y -禺x -?>X2 -ni-pXp,故?=y + E(x 1)+ /X2 -x2)+ih + f?p(Xp Xp),中心化后,則有 -y = f?(x -X1)+阿0-X2)十用十%(Xp -Xp),左右同時除以又=J£ (y -y)2 ,n令 Ljj 工(Xj -Xj )2,i =1,2,|,n , j =1,2,|, p i 1樣本數據標準化的公式為III - ?pXij -XjXij,yiLjjyy,i =1,2,lll,n , j=1,2,|,p ,Lyy則上式可以記為y二 l?薦、精+用4£

29、;"力| 十用常乂$.Lyy- Lyy. Lyy二號 Xi ?2 X2|h?p Xip 則有j =j= ?j,j =1,2,111P Lyy3.10驗證決定系數R2與F值之間的關系式R2F (n - p-1)/ p證明: “SSR/ p. F -',SSE/(n - p -1)F SSESSR = pn-p-1R2SSR SSRF SSE nrTi pSST SSR SSE F SSEF p n-p-1 F (n-p-1)/p p SSE n-p-13.11研究貨運總量y (萬噸)與工業總產值x1 (億元)、農業總產值x2 (億元)、居民非商品支出x3 (億元)的關系。數據見

30、表3.9 (略)。(1)計算出y, x1 , x2 , x3的相關系數矩陣。SPSS輸出如下:相關系數表yx1x2x3yPearson Correlation1.556.731*.724*Sig. (2-tailed).095.016.018N10101010x1Pearson Correlation.5561.113.398Sig. (2-tailed).095.756.254N10101010x2Pearson Correlation.731*.1131.547Sig. (2-tailed).016.756.101N10101010x3Pearson Correlation.724*.39

31、8.5471Sig. (2-tailed).018.254.101N10101010* Correlation is significant at the 0.05 level (2-tailed).1.000 0.556 0.731 0.7240.556 1.000 0.113 0.398則相關系數矩陣為:)0.731 0.113 1.000 0.547II0.724 0.398 0.547 1.000(2)求出y與x1 , x2 , x3的三元回歸方程Coe fficients aModelUnstandardized CoefficientsStandardized Coefficien

32、tstSig.BStd. ErrorBeta1(Constant)-348.280176.459-1.974.096x13.7541.933.3851.942.100x27.1012.880.5352.465.049x312.44710.569.2771.178.284a. Dependent Variable: y對數據利用SPSS做線性回歸,得到回歸方程為? =-348.38 3.754x1 7.101x2 12.447x3(3)對所求的方程作擬合優度檢驗。Model Summ aryModelRR SquareAdjustedR SquareStd. E rror of the Esti

33、mate1.898 a.806.70823.44188a. Predictors: (Constant), x3, x1, x2由上表可知,調整后的決定系數為0.708,說明回歸方程對樣本觀 測值的擬合程度較好。(4)對回歸方程作顯著性檢驗;方差分析表bModel平方和自由度均方FSig.1回歸13655.37034551.7908.283.015a殘差3297.1306549.522總和16952.5009a. Predictors: (Constant), x3, x1, x2 b. Dependent Variable: y原假設:孔:01=02=瓦=°F統計量服從自由度為(3

34、, 6)的F分布,給定顯著性水平a =0.05, 查表得%。5(3.6)=4.76,由方查分析表得,日直=8.283>4.76 , p值 =0.015,拒絕原假設H0,由方差分析表可以得到F =8.283,P =0.015 <0.05 ,說明在置信水平為95%下,回歸方程顯著。(5)對每一個回歸系數作顯著性檢驗;回歸系數表aModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)-348.280176.459-1.974.096x13.7541.933.3851.

35、942.100x27.1012.880.5352.465.049x312.44710.569.2771.178.284a. Dependent Variable: y做t檢驗:設原假設為九普二0,t統計量服從自由度為n-p-1 =6的t分布,給定顯著性水平0.05,查 得單側檢驗臨界值為1.943, X1的t值=1.942<1.943 ,處在否定域邊 緣。X2的t值=2.465>1.943 。拒絕原假設由上表可得,在顯著性水平口=0.05時,只有x2的P值<0.05,通過檢驗, 即只有X2的回歸系數較為顯著;其余自變量的P值均大于0.05,即 x1, x2的系數均不顯著。(6

36、)如果有的回歸系數沒有通過顯著性檢驗,將其剔除,重新建立 回歸方程,并作回歸方程的顯著性檢驗和回歸系數的顯著性檢驗。解:用后退法對數據重新做回歸分析,結果如下:Coe fficientsModelUnstandardizedCoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)-348.280176.459-1.974.096x13.7541.933.3851.942.100x27.1012.880.5352.465.049x312.44710.569.2771.178.2842(Constant)-459.62

37、4153.058-3.003.020x14.6761.816.4792.575.037x28.9712.468.6763.634.008a. Dependent Variable: y選擇模型二,重新建立的回歸方程為:? =-459.624 4.676x1 8.971x2方差分析表b模型平方和自由度:均方FSig.1回歸12893.19926446.60011.117.007 a殘差4059.3017579.900Total16952.5009a. Predictors: (Constant), 農業總產 值X2 (億元),工業 總產 值X1 (億元) b. Dependent Var iab

38、le:貨運總量 Y (萬噸)模型摘要模型RR Square調整后的R SquareStd. Error of the Estimate改變統計量R Square ChangeF Changedf1df2Sig. F Change1.872a.761.69224.081.76111.11727.007a. Predictors: (Constant),農業總產值X2 (億元),工業總產值X1 (億元)對新的回歸方程做顯著性檢驗:原彳段設:H0:羯=0F服從自由度為(2, 7)的F分布,給定顯著性水平二二0.05,查表 得 F0.05(2.7) =474,由方差分析表得,f 值= ii.ii7&g

39、t;4.74 , p 值=0.007 , 拒絕原假設H0.認為在顯著性水平« =0.05下,x1, x2整體上對y有顯著的線性影 響,即回歸方程是顯著的。對每一個回歸系數做顯著性檢驗:做t檢驗:設原假設為H0邛1 =0 , L統計量服從自由度為n-p-1 = 7 的t分布,給定顯著性水平0.05,查得單側檢驗臨界值為1.895, X1的t值=2.575>1.895 ,拒絕原假設。故內顯著不為零,自變量 X1對因變量y的線性效果顯著;同理位也通過檢驗。同時從回歸系數顯著性檢驗表可知:X1,X2的 p值都小于0.05,可認為對x1, x2分別對y都有顯著的影響。(7)求出每一個回歸

40、系數的置信水平為955D置信區間由回歸系數表可以看到,(31置信水平為95%的置信區間 0.381,8.970,位置信水平為95%的置信區間3.134,14.808Coe fficients aModelUnstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. E rrorBetaLow er BoundUpper Bound1(Constant)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.1

41、00-.9778.485x27.1012.880.5352.465.049.05314.149x312.44710.569.2771.178.284-13.41538.3102(Constant)-459.624153.058-3.003.020-821.547-97.700x14.6761.816.4792.575.037.3818.970x28.9712.468.6763.634.0083.13414.808a. Dependent Variable: y(8)求標準化回歸方程由回歸系數表(上表)可得,標準化后的回歸方程為:_* * *? = 0.479x10.676x2(9)求當X01=

42、75 , X02 =42 , x03=3.1時的y的預測值?。,給定置 信水平95% ,用SPSS軟件計算精確置信區間,用手工計算近似預 測區間;編號工業總產 值值居民非商 品支出PRE_11160.0070 0035 001 00191.654122260.0075.0040 002.40249.887083210.0065 0040.002.00203.130774265.0074.0042 003.00263 1533751240.0072.00二 3G 001.20217 918266220.0063.0046 001.50262.012471275.0073 0042 004.002

43、81.855898160.0066.0036 002.00171.922569275.0070.0044 003.20262.3927710250.0065.0042.003.00221.07270國75 0042 003.10267.82900由 SPSS輸出結果可知,當 x°1 =75,如=42,%3=3.1 時,?。=267.829 (見 上表),y0的置信度為95%的精確預測區間為(204.4,331.2)(見 下表),y0的置信度為95%的近似預測區間為(?°±2H),手工計算得: (219.6,316.0)。UCI_1UICI_1114 1803624

44、9 12788186.71910313.05505139.27006266.99149200 92084325 38591155.95559279.88094195.34073328.68422213 46314350 24865101380123B 707W199 02041325.76514156 11131296.03403204 43551331.22249(10)結合回歸方程對問題做一些簡單分析答:由回歸方程y? - -459.624 4.676x 8.971x2可知農業總產值固定的時候,工業總產值每增加1億元,貨運總量 增加4.676萬噸;工業總產值固定的時候,農業總產值每增加1億

45、 元,貨運總量增加8.971萬噸。而居民非商品支出對貨運總量沒有*顯著的線性影響。由標準化回歸方程? =0.479X1 +0.676X2可知: 工業總產值、農業總產值與Y都是正相關關系,比較回歸系數的大 小可知農業總產值X2對貨運總量Y的影響程度大一些。第4章違背基本假設的情況思考與練習參考答案4.1試舉例說明產生異方差的原因。答:例4.1:截面資料下研究居民家庭的儲蓄行為Yi=%*Xi+ 彳其中:Yi表示第i個家庭的儲蓄額,Xi表示第i個家庭的可支配收入。由于高收入家庭儲蓄額的差異較大,低收入家庭的儲蓄額則更有規律性,差異 較小,所以出的方差呈現單調遞增型變化。例4.2:以某一行業的企業為樣

46、本建立企業生產函數模型Yi=AiP1 kJ2 l/3e d被解釋變量:產出量Y,解釋變量:資本K、勞動L、技術A,那么每個企業所 處的外部環境對產出量的影響被包含在隨機誤差項中。由于每個企業所處的外部環境對產出量的影響程度不同,造成了隨機誤差項的異方差性。這時,隨機 誤差項的勺方差并不隨某一個解釋變量觀測值的變化而呈規律性變化,呈現復雜 型。4.2異方差帶來的后果有哪些?答:回歸模型一旦出現異方差性,如果仍采用OLS估計模型參數,會產生下列 不良后果:1、參數估計量非有效2、變量的顯著性檢驗失去意義3、回歸方程的應用效果極不理想總的來說,當模型出現異方差性時,參數OLS估計值的變異程度增大,從

47、而造成對Y的預測誤差變大,降低預測精度,預測功能失效。4.3 簡述用加權最小二乘法消除一元線性回歸中異方差性的思想與 方法。答:普通最小二乘估計就是尋找參數的估計值使離差平方和達極小。其中每個平方項的權數相同,是普通最小二乘回歸參數估計方法。在誤差項等方差不相 關的條件下,普通最小二乘估計是回歸參數的最小方差線性無偏估計。然而在異方差的條件下,平方和中的每一項的地位是不相同的,誤差項的方差大的項,在殘差平方和中的取值就偏大,作用就大,因而普通最小二乘估計的回歸線就 被拉向方差大的項,方差大的項的擬合程度就好,而方差小的項的擬合程度就 差。由OLS求出的仍然是的無偏估計,但不再是最小方差線性無偏

48、估計。所以 就是:對較大的殘差平方賦予較小的權數,對較小的殘差平方賦予較大的權數 。這樣對殘差所提供信息的重要程度作一番校正,以提高參數估計的精度。加權最小二乘法的方法QwWi(yi - ?J2 :、Wi(y-ixi)2'、Wi(Xi 一 xw)(y 一 yw)iT?1wi= 10w(Xiyw- p?wxwXw)2表示 iwi二 j2kxi2xi2或二一mkXi ,Wim xi4.4 簡述用加權最小二乘法消除多元線性回歸中異方差性的思想與方 法。答:運用加權最小二乘法消除多元線性回歸中異方差性的思想與一元線性 回歸的類似。多元線性回歸加權最小二乘法是在平方和中加入一個適當的權數 Wi

49、,以調整各項在平方和中的作用,加權最小二乘的離差平方和為:nQw(%Pi,,Pp)=£ Wi(yi -久一3。一Lip)2(2)i 1加權最小二乘估計就是尋找參數降,也,,丸的估計值f?Lf?LFpw使式(2)的離差平方和Qw達極小。所得加權最小二乘經驗回歸方程記做?w = 20w + EwX1 + %wxp( 3)多元回歸模型加權最小二乘法的方法:首先找到權數wi,理論上最優的權數wi為誤差項方差仃2的倒數,即wi =?(4)二 i誤差項方差大的項接受小的權數,以降低其在式(2)平方和中的作用;誤 差項方差小的項接受大的權數,以提高其在平方和中的作用。由(2)式求出的 加權最小二乘估計%w,(?w,,w就是參數上,日1,,Pp的最小方差線性無偏估 計。一個需要解決的問題是誤差項的方差仃:是未知的,因此無法真正按照式(4)選取權數。在實際問題中誤差項方差52通常與自變量的水平有關(如誤差項方差。2隨著自變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論