基于逐步回歸分析法的國家財政收入模型分析_第1頁
基于逐步回歸分析法的國家財政收入模型分析_第2頁
基于逐步回歸分析法的國家財政收入模型分析_第3頁
基于逐步回歸分析法的國家財政收入模型分析_第4頁
基于逐步回歸分析法的國家財政收入模型分析_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 應用數(shù)理統(tǒng)計 中期第一次作業(yè) 基于逐步回歸分析法的國家財政收入模型分析SY1107409 胡亮(北京航空航天大學機械工程及自動化學院工業(yè)與制造系統(tǒng)工程系,北京,100191)【摘要】中國國家財政收入與農業(yè)總產值、工業(yè)總產值、建筑業(yè)總產值、服務業(yè)總產值、全國人口總量、成災面積六個變量有關。本文利用SPSS Statistics對數(shù)據(jù)對國家財政收入y 與其相關因素進行回歸分析。發(fā)現(xiàn)六個變量之間存在較強的多重共線性,繼而利用逐步回歸法對模型進行修改。結果表明,國家財政收入受服務業(yè)總產值和全國總人口影響最大。【關鍵詞】財政收入;多重線性;逐步回歸法。一 引言逐步回歸理論簡介在經濟模型的建立中,由于經

2、濟指標較之一般指標更為綜合,包含信息交性強,指標間多重共線性現(xiàn)象在經濟模型建立過程中不可避免。多重共線性的存在,一方面使得入選的經濟指標作為其他指標的綜合反映,無法獨立反映與經濟總量之間的結構因果關系;另一方面,多重共線性使得統(tǒng)計檢驗失效,回歸模型缺乏穩(wěn)定性,可靠程度低。因而在進行經濟模型建立時,必須充分考慮經濟指標變量間的多重共線性問題,保證變量間的相互獨立。最常用于克服模型變量的多重共線性問題有三類方法:排除引起共線性的變量;差分法;減小參數(shù)估計量的方差。后兩類方法都只能減輕多重共線性對模型的影響,而第一類方法,從根本上尋找引起多重共線性的解釋變量,將其排除出原模型,因而更為有效。本文將該

3、原理的應用逐步回歸方法引入財政收入模型的建立問題中。在應用回歸分析去處理實際問題時一個關鍵問題就是如何選擇回歸自變量。一般情況下,人們羅列出來可能與因變量有關的自變量往往很多,其中有一些變量對因變量可能沒有影響或影響很小。如果在建立回歸模型時將這樣一些變量都包含進來,不但計算量大,而且估計和預測的精度也會下降。而且某些情況下,許多自變量的觀測數(shù)據(jù)的獲得代價較大,如果這些自變量被錯誤地選進模型,也會引起經濟成本的升高。另外,自變量太多,往往存在共線性。正是由于這些原因,在應用回歸分析中對進入模型的自變量作精心選擇是十分必要的。目前利用逐步回歸分析方法即利用自變量和因變量的一系列同步觀測數(shù)據(jù),通過

4、對相關矩陣的變換和數(shù)理統(tǒng)計的假設檢驗,逐步將顯著性的自變量選入回歸方程中,同時每引入一個新變量后又要對老變量逐個檢查,將變得不顯著性的自變量從回歸方程中剔除,重復步驟,直到所有模型外的變量都不能引入,模型內的變量都不能被剔除為止,最終建立一個最優(yōu)回歸方程。二 問題的提出在回歸分析中,對自變量的選擇很重要。逐步回歸法能使回歸式保留幾個最為顯著的自變量。我們以財政收入(億元)為因變量,選擇的自變量如下:為農業(yè)總產值(億元);為工業(yè)總產值(億元);為建筑業(yè)總產值(億元);為服務業(yè)總產值(億元);為全國人口總量(萬人);為成災面積(萬公頃)(據(jù)2011年中國統(tǒng)計年鑒獲得各年份的統(tǒng)計數(shù)據(jù))。如表1所示,

5、選取1978年、1980年、1985年、1990年至2009年13年的相關統(tǒng)計數(shù)據(jù)建立回歸模型。表2.1 數(shù)據(jù)統(tǒng)計年份農業(yè)總產值工業(yè)總產值建筑業(yè)總產值服務業(yè)總產值全國人口總量(萬人)成災面積(千公頃)財政收入19781117.51607.0138.2872.596259244571132.2619801454.11996.5195.5982.098705297771159.9319852506.43448.7417.92585.0105851227052004.8219904954.36858.0859.45888.4114333178192937.1019915146.48087.11015

6、.17337.1115823278143149.4819925588.010284.51415.09357.4117171258933483.3719936605.114188.02266.511915.7118517231344348.9519949169.219480.72964.716179.8119850313825218.10199511884.624950.63728.819978.5121121222686242.20199613539.829447.64387.423326.2122389212347407.99199713852.532921.44621.626988.112

7、3626303078651934018.44985.830580.5124761251819875.95199914106.235861.55172.133873.41257862673411444.08200013873.640033.65522.338714.01267433437413395.23200114462.843580.65931.744361.61276273179316386.04200214931.547431.36465.549898.91284532716018903.64200314870.154945.57490.856004.71292

8、273251621715.25200418138.465210.08694.364561.31299881629726396.47200519613.477230.810367.374919.31307561996631649.29200621522.391310.912408.688554.91314482463238760.20200724658.1110534.915296.5111351.91321292506451321.78200828044.2130260.218743.2131340.01328022228361330.35200930611.1135239.922398.81

9、47642.11334742123468518.30表2.2 描述統(tǒng)計量N極小值極大值均值標準差農業(yè)總產值231117.530611.113256.1448119.4032工業(yè)總產值231607.0135239.944301.21140167.4884建筑業(yè)總產值23138.222398.86325.5155997.7578服務業(yè)總產值23872.5147642.143357.10342249.2402全國人口總量(萬人)2396259133474122036.4810351.229成災面積(千公頃)2316297.31650000000034374.00000000000025392.414

10、630434780004767.928352014070000財 政 收 入231132.2668518.3018062.257419707.80863在解釋變量與被解釋變量之間一一建立散點圖:由散點圖可以看出因變量Y(財政收入)與自變量X1(農業(yè)總產值),X2(工業(yè)總產值),X3(建筑業(yè)總產值),X4(服務業(yè)總產值)、X5(成災面積)之間基本存在著線性關系,初步估計建立的是線性模型。三 模型的建立根據(jù)題目要求,建立的線性回歸分析模型如下:其中, 為因變量的預測值或估計值。,,為自變量。和,為回歸系數(shù)。為了使以上線性回歸分析方法達到最優(yōu),就要要求自變量,,首先滿足以下兩個條件:(1)在線性回歸

11、分析模型中, 要包含所有對影響顯著的自變量, 消除對影響不顯著的自變量;(2)模型包含的各自變量之間不存在多重共線性即各自變量之間不存在線性關系或近似線性關系。表3.1 描述統(tǒng)計量N極小值極大值均值標準差農業(yè)總產值231117.530611.113256.1448119.4032工業(yè)總產值231607.0135239.944301.21140167.4884建筑業(yè)總產值23138.222398.86325.5155997.7578服務業(yè)總產值23872.5147642.143357.10342249.2402全國人口總量(萬人)2396259133474122036.4810351.229成災

12、面積(千公頃)2316297.31650000000034374.00000000000025392.414630434780004767.928352014070000財 政 收 入231132.2668518.3018062.257419707.80863首先本文利用社會統(tǒng)計學軟件SPSSl3.0,對所有因素進行相關分析,采用Pearson相關系數(shù),輸出結果如下:表3.2 相關性財 政 收 入農業(yè)總產值工業(yè)總產值建筑業(yè)總產值Pearson 相關性財 政 收 入1.000.929.989.991農業(yè)總產值.9291.000.968.962工業(yè)總產值.989.9681.000.993建筑業(yè)總產

13、值.991.962.9931.000服務業(yè)總產值.995.958.997.996全國人口總量(萬人).702.882.779.756成災面積(千公頃)-.246-.181-.217-.225Sig. (單側)財 政 收 入.000.000.000農業(yè)總產值.000.000.000工業(yè)總產值.000.000.000建筑業(yè)總產值.000.000.000.服務業(yè)總產值.000.000.000.000全國人口總量(萬人).000.000.000.000成災面積(千公頃).129.205.160.152N財 政 收 入23232323農業(yè)總產值23232323工業(yè)總產值23232323建筑業(yè)總產值232

14、32323服務業(yè)總產值23232323全國人口總量(萬人)23232323成災面積(千公頃)23232323服務業(yè)總產值全國人口總量(萬人)成災面積(千公頃)Pearson 相關性財 政 收 入.995.702-.246農業(yè)總產值.958.882-.181工業(yè)總產值.997.779-.217建筑業(yè)總產值.996.756-.225服務業(yè)總產值1.000.761-.213全國人口總量(萬人).7611.000-.051成災面積(千公頃)-.213-.0511.000Sig. (單側)財 政 收 入.000.000.129農業(yè)總產值.000.000.205工業(yè)總產值.000.000.160建筑業(yè)總產

15、值.000.000.152服務業(yè)總產值.000.164全國人口總量(萬人).000.408成災面積(千公頃).164.408.N財 政 收 入232323農業(yè)總產值232323工業(yè)總產值232323建筑業(yè)總產值232323服務業(yè)總產值232323全國人口總量(萬人)232323成災面積(千公頃)232323表3.2中每一組數(shù)字由上到下分別表示:Pearson相關系數(shù)、單邊檢驗的顯著性概率和樣本的個數(shù)。本文主要考察農業(yè)總產值、工業(yè)總產值、建筑業(yè)總產值、服務業(yè)總產值、全國人口總量和成災面積與財政收入的關系,因此主要分析財政收入所在行即可。分析發(fā)現(xiàn)前四個因素相關性很大,最后一個因素相關性較大。為了更

16、全面的考察問題,避免遺漏重要因素的影響,本文初步假設不剔除變量。簡單對數(shù)據(jù)進行回歸分析,所得輸出結果入下: 表3.3給出了全模型檢驗的值、值的單邊檢測的顯著性水平。表3.3 Anovah模型平方和df均方FSig.1回歸8.457E918.457E92029.418.000a殘差87513730.085214167320.480總計8.545E9222回歸8.519E924.259E93288.446.000b殘差25905377.541201295268.877總計8.545E9223回歸8.524E932.841E92661.020.000c殘差20288558.689191067818.

17、878總計8.545E9224回歸8.529E942.132E92475.536.000d殘差15504363.24518861353.514總計8.545E9225回歸8.529E932.843E93325.699.000e殘差16241363.20619854808.590總計8.545E9226回歸8.533E942.133E93387.547.000f殘差11335743.75918629763.542總計8.545E9227回歸8.536E951.707E93319.359.000g殘差8743382.27317514316.604總計8.545E922a. 預測變量: (常量),

18、服務業(yè)總產值。b. 預測變量: (常量), 服務業(yè)總產值, 全國人口總量(萬人)。c. 預測變量: (常量), 服務業(yè)總產值, 全國人口總量(萬人), 農業(yè)總產值。d. 預測變量: (常量), 服務業(yè)總產值, 全國人口總量(萬人), 農業(yè)總產值, 建筑業(yè)總產值。e. 預測變量: (常量), 服務業(yè)總產值, 農業(yè)總產值, 建筑業(yè)總產值。f. 預測變量: (常量), 服務業(yè)總產值, 農業(yè)總產值, 建筑業(yè)總產值, 工業(yè)總產值。g. 預測變量: (常量), 服務業(yè)總產值, 農業(yè)總產值, 建筑業(yè)總產值, 工業(yè)總產值, 成災面積(千公頃)。h. 因變量: 財 政 收 入表3.4給出了全模型的回歸系數(shù)。根據(jù)

19、表3,所得回歸模型的結果為:表3.4 系數(shù)a模型非標準化系數(shù)B標準 誤差1(常量)-2058.496616.989服務業(yè)總產值.464.0102(常量)26337.3004131.660服務業(yè)總產值.511.009全國人口總量(萬人)-.249.0363(常量)15964.7155875.980服務業(yè)總產值.560.023全國人口總量(萬人)-.141.058農業(yè)總產值-.380.1664(常量)7798.0586313.396服務業(yè)總產值.443.054全國人口總量(萬人)-.058.063農業(yè)總產值-.659.190建筑業(yè)總產值1.087.4615(常量)1979.063531.794服務

20、業(yè)總產值.426.051農業(yè)總產值-.815.089建筑業(yè)總產值1.327.3806(常量)2206.134463.649服務業(yè)總產值.227.084農業(yè)總產值-.994.100建筑業(yè)總產值1.550.336工業(yè)總產值.211.0767(常量)4104.637943.741服務業(yè)總產值.267.078農業(yè)總產值-.946.093建筑業(yè)總產值1.398.311工業(yè)總產值.181.070成災面積(千公頃)-.077.034表3.5模型匯總h模型RR 方調整 R 方標準估計誤差1.995a.990.9892041.401602.998b.997.9971138.098803.999c.998.997

21、1033.353224.999d.998.998928.091335.999e.998.998924.558596.999f.999.998793.576427.999g.999.999717.15870a. 預測變量: (常量), 服務業(yè)總產值。b. 預測變量: (常量), 服務業(yè)總產值, 全國人口總量(萬人)。c. 預測變量: (常量), 服務業(yè)總產值, 全國人口總量(萬人), 農業(yè)總產值。d. 預測變量: (常量), 服務業(yè)總產值, 全國人口總量(萬人), 農業(yè)總產值, 建筑業(yè)總產值。e. 預測變量: (常量), 服務業(yè)總產值, 農業(yè)總產值, 建筑業(yè)總產值。f. 預測變量: (常量),

22、服務業(yè)總產值, 農業(yè)總產值, 建筑業(yè)總產值, 工業(yè)總產值。g. 預測變量: (常量), 服務業(yè)總產值, 農業(yè)總產值, 建筑業(yè)總產值, 工業(yè)總產值, 成災面積(千公頃)。h. 因變量: 財 政 收 入表3.5為模型小結。列出了回歸方程常用統(tǒng)計量,回歸方程復相關系數(shù)、系數(shù)、修正的系數(shù),估計的標準誤差等。可以看出隨著模型中自變量個數(shù)的增加,系數(shù)的值也在不斷增加,估計的標準誤差不斷降低。一般地,修正的值能較確切地反映擬合度。修正的值越大擬合程度越高。四 模型的解釋圖 4.1圖4.1為帶有正態(tài)曲線的標準化殘差直方圖。從中可以看到絕大部分觀測量隨機的落在正態(tài)曲線內,我們可以認為回歸方程擬合的效果較好。另一

23、方面從所給的六個自變量中我們經過逐步回歸得到兩個對國家財政收人影響較顯著的自變量即服務業(yè)總產值和建筑業(yè)總產值對財政收人影響顯著。服務業(yè)總產值方面,在國家擴大內需、刺激消費的各項政策措施積極作用下,國內消費市場活躍,調動了人們的購買消費熱情,拉動了國民經濟的增長。建筑業(yè)方面,近年來房地產行業(yè)已經成為我國經濟收入的主要來源,房價的升高構成了我國國民經濟收入很大的一部分,同時住房問題是人們都亟待解決的問題,人們購買熱情的提高也極大的促進了經濟的增長。五 逐步回歸法分析為了解決以上兩個問題, 最有效的方法是采用逐步回歸分析方法。其基本思想是在所考慮的全部因素中, 按其對作用顯著程度的大小, 由大到小地

24、逐個引入到回歸方程中,而那些對作用不顯著的變量可能自始至終都未被引入到回歸方程中。另一方面, 已被引入到回歸方程的變量在引入新的變量后也可能因為轉變成對作用不顯著因素而被剔除。六 結論從統(tǒng)計數(shù)據(jù)可以看出,服務業(yè)作為第三產業(yè)對我國財政收入的影響很大,我們知道傳統(tǒng)的產業(yè)部門已經趨于飽和,想要有所突破已經越來越困難,發(fā)展空間有限,而第三產業(yè)是三大產業(yè)中最具有發(fā)展?jié)摿Φ漠a業(yè),這說明我們的發(fā)展還不夠充分,需要加快第三產業(yè)的發(fā)展。加快第三產業(yè)是我國率先實現(xiàn)現(xiàn)代化的客觀要求。第三產業(yè)發(fā)展水平是衡量現(xiàn)代經濟社會發(fā)達程度的重要標志,許多發(fā)達國家和地區(qū)的發(fā)展經驗表明,當經濟發(fā)展到一定階段時,第三產業(yè)的發(fā)展速度普遍

25、高于第一產業(yè)和第二產業(yè)。我國的經濟發(fā)展在總體上處于工業(yè)化的中后期階段,不失時機地加快第三產業(yè)發(fā)展具有深遠的戰(zhàn)略意義。加快發(fā)展第三產業(yè)是促進就業(yè)和提高人民生活水平的重要手段。第三產業(yè)行業(yè)多、門類廣,是吸納勞動力就業(yè)的重要載體。隨著經濟發(fā)展和生活水平的提高,消費需求不斷創(chuàng)新和升級,第三產業(yè)將成為我國新的經濟增長點,其加快發(fā)展將充分滿足人民群眾日益增長的物質和文化生活的需要。政策建議:1.重點發(fā)展交通、郵電等“瓶頸”產業(yè)。隨著市場經濟的發(fā)展,交通、郵電業(yè)等流通領域已成為溝通城鄉(xiāng),連接國民經濟各部門、各地區(qū)的紐帶。我國的交通郵電基礎設施相對薄弱,運輸工具陳舊落后,遠不能適應大流通的需要,今后應加強交通、郵電等基礎行業(yè)的投入、引進先進設備對現(xiàn)有設備進行技術改造,吸納多種經濟成分參與發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論