應用回歸分析第章課后習題參考答案_第1頁
應用回歸分析第章課后習題參考答案_第2頁
應用回歸分析第章課后習題參考答案_第3頁
應用回歸分析第章課后習題參考答案_第4頁
應用回歸分析第章課后習題參考答案_第5頁
已閱讀5頁,還剩39頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二章 一元線性回歸分析思考與練習參考答案 2.1 一元線性回歸有哪些基本假定?答: 假設1、解釋變量X是確定性變量,Y是隨機變量; 假設2、隨機誤差項具有零均值、同方差和不序列相關性: E(i)=0 i=1,2, ,n Var (i)=s2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n 假設3、隨機誤差項與解釋變量X之間不相關: Cov(Xi, i)=0 i=1,2, ,n 假設4、服從零均值、同方差、零協方差的正態分布 iN(0, s2 ) i=1,2, ,n2.2 考慮過原點的線性回歸模型 Yi=1Xi+i i=1,2, ,n誤差i(i=1,2, ,n)仍滿

2、足基本假定。求1的最小二乘估計解:得:2.3 證明(2.27式),Sei =0 ,SeiXi=0 。證明:其中:即: Sei =0 ,SeiXi=02.4回歸方程E(Y)=0+1X的參數0,1的最小二乘估計與最大似然估計在什么條件下等價?給出證明。答:由于iN(0, s2 ) i=1,2, ,n所以Yi=0 + 1Xi + iN(0+1Xi , s2 )最大似然函數:使得Ln(L)最大的,就是0,1的最大似然估計值。同時發現使得Ln(L)最大就是使得下式最小,上式恰好就是最小二乘估計的目標函數相同。值得注意的是:最大似然估計是在iN(0, s2 )的假設下求得,最小二乘估計則不要求分布假設。

3、所以在iN(0, s2 ) 的條件下, 參數0,1的最小二乘估計與最大似然估計等價。2.5 證明是0的無偏估計。證明:2.6 證明證明:2.7 證明平方和分解公式:SST=SSE+SSR證明:2.8 驗證三種檢驗的關系,即驗證:(1);(2)證明:(1)(2)2.9 驗證(2.63)式:證明:其中:2.10 用第9題證明是s2的無偏估計量證明:2.11 驗證決定系數與F值之間的關系式證明:2.14 為了調查某廣告對銷售收入的影響,某商店記錄了5個月的銷售收入y(萬元)和廣告費用x(萬元),數據見表2.6,要求用手工計算:表2.6月份12345X12345Y1010202040(1) 畫散點圖(

4、略)(2) X與Y是否大致呈線性關系?答:從散點圖看,X與Y大致呈線性關系。(3) 用最小二乘法估計求出回歸方程。計算表XY1104100206(-14)2(-4)221011001013(-7)2(3)2320000200042010027727254044004034142(-6)2和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20回歸方程為:(4) 求回歸標準誤差先求SSR(Qe)見計算表。所以(5) 給出 的置信度為95%的區間估計;由于(1-a)的置信度下, 的置信區間是 查表可得所以 的95%的區間估計為:(73.182*1.

5、915,7+3.182*1.915),即(0.906,13.094)。所以 的95%的區間估計為:(-1-3.182*6.351,-1+3.182*6.351),即(-21.211, 19.211)。的置信區間包含0,表示不顯著。(6) 計算x和y的決定系數 說明回歸方程的擬合優度高。(7) 對回歸方程作方差分析方差分析表方差來源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004F值=13.364F0.05(1,3)=10.13(當n=1,n=8時,=0.05查表得對應的值為10.13),所以拒絕原假設,說明回歸方程顯著。(8)做回歸系數1的顯著性檢驗

6、H0: 1=0t值=3.656t0.05/2(3)=3.182,所以拒絕原假設,說明x對Y有顯著的影響。(8) 做相關系數R的顯著性檢驗R值=0.904R0.05(3)=0.878,所以接受原假設,說明x和Y有顯著的線性關系。(9) 對回歸方程作殘差圖并作相應的分析殘差圖(略) .從殘差圖上看出,殘差是圍繞e=0在一個固定的帶子里隨機波動,基本滿足模型的假設eiN(0, s2 ), 但由于樣本量太少, 所以誤差較大.(10) 求廣告費用為4.2萬元時,銷售收入將達到多少?并給出置信度為95%的置信區間.解: 當X0=4.2時, 所以廣告費用為4.2萬元時, 銷售收入將達到28.4萬元.由于置信

7、度為1-時,Y0估計值的置信區間為:所以求得Y0的95%的置信區間為: 6.05932 ,50.74068預測誤差較大.2.15 一家保險公司十分關心其總公司營業部加班的制度,決定認真調查一下現狀。經過十周時間,收集了每周加班工作時間的數據和簽發的新保單數目,x為每周新簽發的保單數目,y為每周加班工作時間(小時)。見表2.7。表2.7周序號12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.01、畫散點圖2、由散點圖可以看出, x與y之間大致呈線性關系。3、用最小二乘法求出回歸系數由表可知: 回歸

8、方程為: 4、求回歸標準誤差由方差分析表可以得到:SSE=1.843 故回歸標準誤差,=0.48。5、給出回歸系數的置信度為95%的區間估計由回歸系數顯著性檢驗表可以看出,當置信度為95%時:的預測區間為-0.701,0.937, 的預測區間為0.003,0.005.的置信區間包含0,表示不拒絕為零的假設。6、決定系數 由模型概要表得到決定系數為0.9接近于1,說明模型的擬合優度高。 7. 對回歸方程作方差分析由方差分析表可知:F值=72.3965.32(當n=1,n=8時,查表得對應的值為5.32)P值0,所以拒絕原假設,說明回歸方程顯著。8、對的顯著性檢驗從上面回歸系數顯著性檢驗表可以得到

9、的t統計量為t=8.509,所對應的p值近似為0,通過t檢驗。說明每周簽發的新保單數目x對每周加班工作時間y有顯著的影響。9.做相關系數顯著性檢驗相關系數達到0.949,說明x與y顯著線性相關。10、對回歸方程作殘差圖并作相應分析從殘差圖上看出,殘差是圍繞e=0隨即波動,滿足模型的基本假設。11、該公司預計下一周簽發新保單X0=1000張,需要的加班時間是多少?當x=1000張時,小時12、給出Y0的置信水平為95%的預測區間 通過SPSS運算得到Y0的置信水平為95%的預測區間為:(2.5195,4.8870)。13 給出E(Y0)的置信水平為95%的預測區間通過SPSS運算得到Y0的置信水

10、平為95%的預測區間為:(3.284,4.123)。2.16 表是1985年美國50個州和哥倫比亞特區公立學校中教師的人均年工資y(美元)和學生的人均經費投入x(美元).序號yx序號yx序號yx11958333461820816305935195382642220263311419180952967362046031243203253554202093932853721419275242680045422122644391438251603429529470466922246244517392248239476266104888232718643494020969250973067857102

11、433990502041272245440827170553625233823594422589240429258534168262062728214322644340210245003547272279533664424640282911242743159282157029204522341229712271703621292208029804625610293213301683782302225037314726015370514265254247312094028534825788412315273603982322180025334929132360816216903568332293

12、4272950414808349172197431553418443230551258453766解答:(1)繪制y對x的散點圖,可以用直線回歸描述兩者之間的關系嗎?由上圖可以看出y與x的散點分布大致呈直線趨勢。(2)建立y對x的線性回歸。利用SPSS進行y和x的線性回歸,輸出結果如下:表1 模型概要RR2調整后的R2隨機誤差項的標準差估計值0.8350.6970.6912323.25589表2 方差分析表模型平方和自由度和平均F值P值1回歸平方和6.089E816.089E8112.811.000a殘差平方和2.645E8495397517.938總平方和8.734E850表3 系數表模型非

13、標準化系數標準化系數t值P值B標準差回歸系數1常數12112.6291197.76810.113.000對學生的人均經費投入3.314.312.83510.621.0001) 由表1可知,x與y決定系數為,說明模型的擬合效果一般。x與y線性相關系數R=0.835,說明x與y有較顯著的線性關系。2) 由表2(方差分析表中)看到,F=112.811,顯著性Sig.p,說明回歸方程顯著。3) 由表3 可見對的顯著性t檢驗P值近似為零,故顯著不為0,說明x對y有顯著的線性影響。4) 綜上,模型通過檢驗,可以用于預測和控制。x與y的線性回歸方程為:(3)繪制標準殘差的直方圖和正態概率圖圖1 標準殘差的直

14、方圖理論正態概率觀測值概率 圖2 標準殘差的正態概率P-P圖由圖1可見標準化后殘差近似服從正態分布,由圖2可見正態概率圖中的各個散點都分布在45線附近,所以沒有證據證明誤差項服從同方差的正態分布的假定是不真實的,即殘差通過正態性檢驗,滿足模型基本假設。第3章 多元線性回歸思考與練習參考答案3.2 討論樣本容量n與自變量個數p的關系,它們對模型的參數估計有何影響?答:在多元線性回歸模型中,樣本容量n與自變量個數p的關系是:np。如果n4.76,p值=0.015,拒絕原假設,由方差分析表可以得到,說明在置信水平為95%下,回歸方程顯著。(5)對每一個回歸系數作顯著性檢驗;做t檢驗:設原假設為,統計

15、量服從自由度為n-p-1的t分布,給定顯著性水平0.05,查得單側檢驗臨界值為1.943,X1的t值=1.9421.943。拒絕原假設。由上表可得,在顯著性水平時,只有的P值4.74,p值=0.007,拒絕原假設.認為在顯著性水平=0.05下,x1,x2整體上對y有顯著的線性影響,即回歸方程是顯著的。對每一個回歸系數做顯著性檢驗:做t檢驗:設原假設為,統計量服從自由度為n-p-1的t分布,給定顯著性水平0.05,查得單側檢驗臨界值為1.895,X1的t值=2.5751.895,拒絕原假設。故顯著不為零,自變量X1對因變量y的線性效果顯著;同理2也通過檢驗。同時從回歸系數顯著性檢驗表可知:X1,

16、X2的p值 都小于0.05,可認為對x1,x2分別對y都有顯著的影響。(7)求出每一個回歸系數的置信水平為955D 置信區間由回歸系數表可以看到,1置信水平為95%的置信區間0.381,8.970,2置信水平為95%的置信區間3.134,14.808(8)求標準化回歸方程由回歸系數表(上表)可得,標準化后的回歸方程為:(9)求當x01=75,x02=42,x03=3.1時的y的預測值,給定置信水平95%,用SPSS軟件計算精確置信區間,用手工計算近似預測區間;由SPSS輸出結果可知,當時,(見上表),的置信度為95%的精確預測區間為(204.4,331.2)(見下表),的置信度為95%的近似預

17、測區間為,手工計算得:(219.6,316.0)。(10)結合回歸方程對問題做一些簡單分析。答:由回歸方程可知農業總產值固定的時候,工業總產值每增加1億元,貨運總量增加4.676萬噸;工業總產值固定的時候,農業總產值每增加1億元,貨運總量增加8.971萬噸。而居民非商品支出對貨運總量沒有顯著的線性影響。由標準化回歸方程可知:工業總產值、農業總產值與Y都是正相關關系,比較回歸系數的大小可知農業總產值X2對貨運總量Y的影響程度大一些。第4章 違背基本假設的情況思考與練習參考答案4.1 試舉例說明產生異方差的原因。答:例4.1:截面資料下研究居民家庭的儲蓄行為 Yi=b0+b1Xi+i其中:Yi表示

18、第i個家庭的儲蓄額,Xi表示第i個家庭的可支配收入。由于高收入家庭儲蓄額的差異較大,低收入家庭的儲蓄額則更有規律性,差異較小,所以i的方差呈現單調遞增型變化。 例4.2:以某一行業的企業為樣本建立企業生產函數模型 Yi=Aib1 Kib2 Lib3ei被解釋變量:產出量Y,解釋變量:資本K、勞動L、技術A,那么每個企業所處的外部環境對產出量的影響被包含在隨機誤差項中。由于每個企業所處的外部環境對產出量的影響程度不同,造成了隨機誤差項的異方差性。這時,隨機誤差項的方差并不隨某一個解釋變量觀測值的變化而呈規律性變化,呈現復雜型。4.2 異方差帶來的后果有哪些?答:回歸模型一旦出現異方差性,如果仍采

19、用OLS估計模型參數,會產生下列不良后果:1、參數估計量非有效2、變量的顯著性檢驗失去意義3、回歸方程的應用效果極不理想總的來說,當模型出現異方差性時,參數OLS估計值的變異程度增大,從而造成對Y的預測誤差變大,降低預測精度,預測功能失效。4.3 簡述用加權最小二乘法消除一元線性回歸中異方差性的思想與方法。答:普通最小二乘估計就是尋找參數的估計值使離差平方和達極小。其中每個平方項的權數相同,是普通最小二乘回歸參數估計方法。在誤差項等方差不相關的條件下,普通最小二乘估計是回歸參數的最小方差線性無偏估計。然而在異方差的條件下,平方和中的每一項的地位是不相同的,誤差項的方差大的項,在殘差平方和中的取

20、值就偏大,作用就大,因而普通最小二乘估計的回歸線就被拉向方差大的項,方差大的項的擬合程度就好,而方差小的項的擬合程度就差。由OLS求出的仍然是的無偏估計,但不再是最小方差線性無偏估計。所以就是:對較大的殘差平方賦予較小的權數,對較小的殘差平方賦予較大的權數。這樣對殘差所提供信息的重要程度作一番校正,以提高參數估計的精度。加權最小二乘法的方法:4.4簡述用加權最小二乘法消除多元線性回歸中異方差性的思想與方法。答:運用加權最小二乘法消除多元線性回歸中異方差性的思想與一元線性回歸的類似。多元線性回歸加權最小二乘法是在平方和中加入一個適當的權數 ,以調整各項在平方和中的作用,加權最小二乘的離差平方和為

21、: (2)加權最小二乘估計就是尋找參數的估計值使式(2)的離差平方和達極小。所得加權最小二乘經驗回歸方程記做 (3) 多元回歸模型加權最小二乘法的方法:首先找到權數,理論上最優的權數為誤差項方差的倒數,即 (4)誤差項方差大的項接受小的權數,以降低其在式(2)平方和中的作用; 誤差項方差小的項接受大的權數,以提高其在平方和中的作用。由(2)式求出的加權最小二乘估計就是參數的最小方差線性無偏估計。一個需要解決的問題是誤差項的方差是未知的,因此無法真正按照式(4)選取權數。在實際問題中誤差項方差通常與自變量的水平有關(如誤差項方差隨著自變量的增大而增大),可以利用這種關系確定權數。例如與第j個自變

22、量取值的平方成比例時, 即=k時,這時取權數為 (5)更一般的情況是誤差項方差與某個自變量(與|ei|的等級相關系數最大的自變量)取值的冪函數成比例,即=k,其中m是待定的未知參數。此時權數為 (6)這時確定權數 的問題轉化為確定冪參數m的問題,可以借助SPSS軟件解決。4.5(4.5)式一元加權最小二乘回歸系數估計公式。證明:由得:4.6驗證(4.8)式多元加權最小二乘回歸系數估計公式。證明:對于多元線性回歸模型 (1) ,即存在異方差。設,用左乘(1)式兩邊,得到一個新的的模型:,即。因為,故新的模型具有同方差性,故可以用廣義最小二乘法估計該模型,得原式得證。4.7 有同學認為當數據存在異

23、方差時,加權最小二乘回歸方程與普通最小二乘回歸方程之間必然有很大的差異,異方差越嚴重,兩者之間的差異就越大。你是否同意這位同學的觀點?說明原因。答:不同意。當回歸模型存在異方差時,加權最小二乘估計(WLS)只是普通最小二乘估計(OLS)的改進,這種改進可能是細微的,不能理解為WLS一定會得到與OLS截然不同的方程來,或者大幅度的改進。實際上可以構造這樣的數據,回歸模型存在很強的異方差,但WLS 與OLS的結果一樣。加權最小二乘法不會消除異方差,只是消除異方差的不良影響,從而對模型進行一點改進。4.8 對例4.3的數據,用公式計算出加權變換殘差,繪制加權變換殘差圖,根據繪制出的圖形說明加權最小二

24、乘估計的效果。解:用公式計算出加權變換殘差,分別繪制加權最小二乘估計后的殘差圖和加權變換殘差圖(見下圖)。根據繪制出的兩個圖形可以發現加權最小二乘估計沒有消除異方差,只是對原OLS的殘差有所改善,而經過加權變換后的殘差不存在異方差。4.9 參見參考文獻2,表4.12(P138)是用電高峰每小時用電量y與每月總用電量x的數據。(1)用普通最小二乘法建立y與x的回歸方程,并畫出殘差散點圖。解:SPSS輸出結果如下:由上表可得回歸方程為:殘差圖為:(2)診斷該問題是否存在異方差;解:a由殘差散點圖可以明顯看出存在異方差,誤差的方差隨著的增加而增大。b用SPSS做等級相關系數的檢驗,結果如下表所示:得

25、到等級相關系數,P值=0.021,認為殘差絕對值與自變量顯著相關,存在異方差。(3)如果存在異方差,用冪指數型的權函數建立加權最小二乘回歸方程;解:SPSS輸出結果如圖:Coefficientsa,b-.683.298-2.296.026.004.000.8129.930.000(Constant)xModel1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: ya. Weighted Least Squares Regression - Weighted by W

26、eight for y from WLS, MOD_2x* -1.500b. 由上述表可得,在時對數似然函數達到最大,則冪指數的最優取值為。加權后的回歸方程為:。計算加權后的殘差,并對殘差絕對值和自變量做等級相關系數分析,結果如下表所示:,P值為0.0190.05,說明異方差已經消除。4.10 試舉一可能產生隨機誤差項序列相關的經濟例子。答:例如,居民總消費函數模型: Ct=b0+b1Yt+ t t=1,2,n由于居民收入對消費影響有滯后性,而且今年消費水平受上年消費水平影響,則可能出現序列相關性。另外由于消費習慣的影響被包含在隨機誤差項中,則可能出現序列相關性(往往是正相關 )。4.11 序

27、列相關性帶來的嚴重后果是什么?答:直接用普通最小二乘法估計隨機誤差項存在序列相關性的線性回歸模型未知參數時,會產生下列一些問題:1. 參數估計量仍然是無偏的,但不具有有效性,因為有自相關性時參數估計值的方差大于無自相關性時的方差。2. 均方誤差MSE可能嚴重低估誤差項的方差3. 變量的顯著性檢驗失去意義:在變量的顯著性檢驗中,統計量是建立在參數方差正確估計基礎之上的,當參數方差嚴重低估時,容易導致t值和F值偏大,即可能導致得出回歸參數統計檢驗和回歸方程檢驗顯著,但實際并不顯著的嚴重錯誤結論。4. 當存在序列相關時, 仍然是的無偏估計,但在任一特定的樣本中, 可能嚴重歪曲b的真實情況,即最小二乘

28、法對抽樣波動變得非常敏感5. 模型的預測和結構分析失效。4.12 總結DW檢驗的優缺點。答:優點:1.應用廣泛,一般的計算機軟件都可以計算出DW值; 2.適用于小樣本; 3.可用于檢驗隨機擾動項具有一階自回歸形式的序列相關問題。缺點:1. DW檢驗有兩個不能確定的區域,一旦DW值落入該區域,就無法判斷。此時,只有增大樣本容量或選取其他方法; 2.DW統計量的上、下界表要求n15,這是由于樣本如果再小,利用殘差就很難對自相關性的存在做出比較正確的診斷; 3.DW檢驗不適應隨機項具有高階序列相關性的檢驗。4.13 表4.13中是某軟件公司月銷售額數據,其中,x為總公司的月銷售額(萬元);y為某分公

29、司的月銷售額(萬元)。(1)用普通最小二乘法建立y與x的回歸方程;由上表可知:用普通二乘法建立的回歸方程為(2)用殘差圖及DW檢驗診斷序列的相關性; 1.以自變量x為橫軸,普通殘差為縱軸畫殘差圖如下:從圖中可以看到,殘差有規律的變化,呈現大致反W形狀,說明隨機誤差項存在自相關性。2.以(殘差1)為橫坐標,(殘差)為縱坐標,繪制散點圖如下:由殘差圖可見大部分的點落在第一、三象限內,表明隨機擾動項存在著正的序列相關;3.從下表可知DW值為0.663,查DW表,n=20,k=2,顯著性水平=0.05,得=1.20,=1.41,由于0.6631.20,知DW值落入正相關區域,即殘差序列存在正的自相關。

30、(3)用迭代法處理序列相關,并建立回歸方程。自相關系數令,然后用對作普通最小二乘回歸可得輸出結果如下:可看到新的回歸方程的DW=1.360.且1.181.3601.40=,即DW落入不相關區域,可知殘差序列不存在自相關,一階差分法成功地消除了序列自相關。同時得到回歸方程為=0.169,將=-,=-,代人,還原原始變量的方程=+0.169(-)(5)比較普通最小二乘法所得的回歸方程和迭代法、一階差分法所建立回歸方程的優良性。答:本題中自相關系數0.6685,不接近于1,不適宜用差分法,另外由迭代法的F值及都大于差分法的值,故差分法的效果低于迭代法的效果;而普通最小二乘法的隨機誤差項標準差為0.0

31、9744,大于迭代的隨機誤差項標準差0.07296,所以迭代的效果要優于普通最小二乘法,所以本題中一次迭代法最好。4.14 某樂隊經理研究其樂隊CD盤的銷售額(y),兩個有關的影響變量是每周出場次x1和樂隊網站的周點擊率x2,數據見表4.14。(1)用普通最小二乘法建立y與x1、x2的回歸方程,用殘差圖及DW檢驗診斷序列的自相關性;解:將數據輸入SPSS,經過線性回歸得到結果如下:Model Summary(b)ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.541(a).293.264329.69

32、302.745a Predictors: (Constant), x2, x1b Dependent Variable: yANOVA(b)Model Sum of SquaresdfMean SquareFSig.1Regression2205551.67821102775.83910.145.000(a) Residual5326177.03649108697.491 Total7531728.71451 a Predictors: (Constant), x2, x1b Dependent Variable: y由以上3個表可知普通最小二乘法建立y與x1、x2的回歸方程,通過了r、F、t

33、檢驗,說明回歸方程顯著。y與x1、x2的回歸方程為:y=-574.062+191.098x1+2.045x2殘差圖ei(et)ei1(et-1)為:從殘差圖可以看出殘差集中在1、3象限,說明隨機誤差項存在一階正自相關。DW=0.745查表得dl=1.46 du=1.63, 0DWdu 所以誤差項間無自相關性。=257.86回歸方程為:yt=-178.775+211.11x1t+1.436x2t還原為:yt-0.627y(t-1)= -178.775+211.11*(x1t-0.627x1(t-1) +1.436*( x2t-0.627x2(t-1)(3)用一階差分法處理序列相關,建立回歸方程。

34、Model Summary(c,d)ModelRR Square(a)Adjusted R SquareStd. Error of the EstimateDurbin-Watson1.715(b).511.491280.989952.040a For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regressio

35、n. This CANNOT be compared to R Square for models which include an intercept.b Predictors: DIFF(x2,1), DIFF(x1,1)c Dependent Variable: DIFF(y,1)d Linear Regression through the OriginDW=2.040du,所以消除了自相關性,=280.99差分法回歸方程為: ytyt-1=210.117(x1t-x1(t-1)1.397(x2t-x2(t-1).(4)用最大似然法處理序列相關,建立回歸方程。用SPSS軟件的自回歸功能

36、,analyzetime seriesautoregression: =0.631, =258.068, (5)用科克倫-奧克特迭代法處理序列相關,建立回歸方程 =0.632, =260.560 , DW1.748。(6)用普萊斯-溫斯登迭代法處理序列相關,建立回歸方程。 =0.632, =258.066 , DW1.746。(7)比較以上各方法所建回歸方程的優良性。綜合以上各方法的模型擬合結果如下表所示:自回歸方法DW迭代法0.6275-179.0211.11.4371.716257.86差分法0210.11.3972.040280.99精確最大似然0.631-481.7211.01.436

37、258.07科克倫-奧克特0.632-479.3211.11.4351.748260.560普萊斯-溫斯登0.631-487.1211.01.4351.746258.066由上表可看出:DW值都落在了隨機誤差項無自相關性的區間上,一階差分法消除自相關最徹底,但因為=0.627,并不接近于1,故得到的方差較大,擬合效果不理想。將幾種方法所得到的值進行比較,就可知迭代法的擬合效果最好,以普萊斯-溫斯登法次之,差分法最差。4.15 說明引起異常值的原因和消除異常值的方法。答:通常引起異常值的原因和消除異常值的方法有以下幾條,見表4.10:4.16 對第3章習題11做異常值檢驗。研究貨運總量y(萬噸)與工業總產值x1(億元)、農業總產值x2(億元)、居民非商品支出x3(億元)的關系。(1)利用SPSS建立y與x1,x2,x3的三元回歸方程,分別計算普通殘差,學生化殘差,刪除殘差,刪除學生化殘差,中心化杠桿值,庫克距離,見下表:從表中看到絕對值最大的學生化殘差為SRE=2.11556,小于3,但有超過3的個別值,因而根據學生化殘差診斷認為存在異常值。絕對值最大的刪除學生化殘差為3.832,對應為第6個數據,因此判斷它為為異常值。第6個數據的中心化杠桿值為0.64,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論