北航15級數理統計大作業回歸分析_第1頁
北航15級數理統計大作業回歸分析_第2頁
北航15級數理統計大作業回歸分析_第3頁
北航15級數理統計大作業回歸分析_第4頁
北航15級數理統計大作業回歸分析_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在此處鍵入數理統計大作業(一)公共財政的逐步回歸模型11數理統計大作業(一)公共財政收入的逐步回歸模型指導教師院系名稱材料科學與工程院學號SY1501201學生姓名2015 年 12 月 21 日目錄1 引言11.1 研究背景11.2 回歸分析11.2.1 回歸分析11.2.2 回歸分析方法21.2.3 基本假設的檢驗31.3 研究內容和研究目的32.逐步回歸分析42.1 數據采集42.2數據分析42.2.1 自變量的引入52.2.2 模型可決系數及剔除的變量52.2.3 模型顯著性檢驗62.2.4 模型回歸系數顯著性檢驗及回歸系數確定72.2.5 共線性診斷82.2.6 回歸方程殘

2、差分析9結論:10參考文獻111 引言1.1 研究背景財政收入,是指政府為履行其職能、實施公共政策和提供公共物品與服務需要而籌集的一切資金的總和。財政收入表現為政府部門在一定時期內(一般為一個財政收入)所取得的貨幣收入。財政收入是衡量一國政府財力的重要指標,政府在社會經濟活動中提供公共物品和服務的范圍和數量,在很大程度上決定于財政收入的充裕狀況。依據不同的標準,可以對財政收入進行不同的分類。國際上對財政收入的分類,通常按政府取得財政收入的形式進行分類。這種分類方法下,將財政收入分為稅收收入、國有資產收益、國債收入和收費收入以及其他收入等。本文選取的相關影響因素包括國民生產總值、固定資產總投資、

3、貨物進出口總額、城鎮人均可支配收入、教育經費總投入、人口數。1.2 回歸分析1.2.1 回歸分析回歸分析(regression analysis)是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析.多元線性回歸模型是指含有多個自變量的線性回歸模型,用于解釋因變量與其他多個自變量之間的線性關系。其中,因變量的變化可由兩個部分解釋:一是自變量變化引起的;二是由其他隨機因素引起的。建立模型時,有多種引入變量的方法。 1.2.2 回歸分析方法

4、 向前選擇法 與被解釋變量有最大相關的變量首先進入方程,如果該解釋變量沒有通過F檢驗,則變量篩選過程結束,方程中沒有引入任何變量;如果通過F檢驗,則在剩余的變量中尋找具有最大偏相關系數的變量,將其引入方程,并再次進行F檢驗,如果通過檢驗,則保留該變量在模型中,并繼續尋找下一個候選變量,否則變量篩選過程結束,方程中僅有一個解釋變量;以此類推,直至所有滿足判據的變量都被引入模型位置為止。向后選擇法 與向前選擇法的順序相反,向后選擇法首先將所有變量都引入模型,然后剔除最不顯著的變量。如果剩余變量都通過顯著性檢驗,則變量篩選過程結束;否則按同樣的標準繼續剔除不顯著的變量,直至剩余的解釋變量都滿足顯著性

5、檢驗為止。 逐步回歸法逐步回歸法的基本思想是將變量逐個引入模型,每引入一個解釋變量后都要進行F檢驗,并對已經選入的解釋變量逐個進行t檢驗,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除,以確保每次引入新的變量之前回歸方程中只包含顯著性變量。這是一個反復的過程,直到既沒有顯著的解釋變量選入回歸方程,也沒有不顯著的解釋變量從回歸方程中剔除為止,以保證最后所得到的解釋變量集是最優的。1.2.3 基本假設的檢驗異方差檢驗在回歸模型的基本假設中,固定隨機誤差具有相同的方差,但在建立實際經濟問題的回歸模型時,經常存在與此相違背的情況。如果仍用最小二乘法將會引起嚴重的后果。常用的檢驗方

6、法有殘差圖分析法,等級相關系數法,殘差的獨立性檢驗殘差的獨立性檢驗稱為序列相關檢驗。如果隨機誤差不獨立,那么對回歸模型的任何估計與假設所做出的結論都是不可靠的。殘差獨立性檢驗師通過Durbin-watson檢驗完成的。多重共線性檢驗多元回歸模型基本假設要求設計矩陣X中列向量之間不存在密切線性關系。當自變量存在多重共線性時,利用最小二乘法得到的參數估計不穩定,回歸系數的方差隨著共線性強度的增加而加速增長,會造成回歸方程高度顯著的情況下,所有回歸系數都通不過顯著性檢驗,甚至會造成回歸系數正負號無法得到合理解釋。但是有時候這樣建立的模型對歷史數據擬合的很好,從預測角度看不失為較好的模型。常用檢驗方法

7、有方差擴大因子法(VIF)。1.3 研究內容和研究目的本文選取的相關影響因素包括國民生產總值(X1)、固定資產總投資(X2)、貨物進出口總額(X3)、城鎮人均可支配收入(X4)、教育經費總投入(X5)、人口數(X6)。通過逐步回歸的方法,建立公共財政財政收入與各因素之間的最優多元線性回歸模型。通過建立的回歸模型,分析影響公共財政收入的因素,并以此模型對公共財政未來財政收入做出分析和預計。2.逐步回歸分析2.1 數據采集本文數據來自國家統計局統計年鑒2014 。其中教育經費總投入2013年數據缺失。數據是自1997年至2013年。因為我國自1997年開始的財稅體制改革,導致97年前后的財政收入方

8、式有較大差異,因此并未選擇之前的數據。2.2數據分析在進行多元線性回歸分析時,將變量引入模型的方法有向前選擇法、向后選擇法以及逐步選擇法。本文用逐步選擇法引入變量,對變量進行逐步回歸分析。2.2.1 自變量的引入在SPSS軟件中,選擇線性回歸分析,將財政收入加入因變量,其余因素加入自變量,方法選擇逐步,步進方法標準是使用F的概率,F0.05時引入,F0.1時剔除,得到結果如表2.1所示。表2.1 輸入移去的變量a模型輸入的變量移去的變量方法1教育經費總投入億元.步進(準則: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。2國民生產總

9、值億元.步進(準則: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。3城鎮人均可支配收入元.步進(準則: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。a. 因變量: 公共財政收入億元從表2.1中可以看出,通過逐步選擇法引入模型的自變量有教育經費總投入、國民生產總值、城鎮人均可支配收入。2.2.2 模型可決系數及剔除的變量通過逐步回歸分析得到了三個模型,分別是一元、二元和三元模型。由表2.2可以看出,這三個模型的修正復相關系數均0.999,其中第三個模型達到了1,可見此模

10、型的擬合效果極佳。表2.2 模型匯總d模型RR 方調整 R 方標準 估計的誤差更改統計量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.999a.999.9991330.96059.99910257.633114.00021.000b.999.9991102.10443.0007.418113.01731.000c1.0001.000562.96285.00137.823112.0001.792a. 預測變量: (常量), 教育經費總投入億元。b. 預測變量: (常量), 教育經費總投入億元, 國民生產總值億元。c. 預測變量: (常量), 教育經費總投入億元,

11、國民生產總值億元, 城鎮人均可支配收入元。d. 因變量: 公共財政收入億元其中第三個模型的Durbin-Watson檢驗值為1.792接近2,說明殘差與自變量相互獨立。經過t檢驗,剔除不顯著變量,每個模型中剔除的變量如表2.3所示表2.3 已排除的變量a模型Beta IntSig.偏相關共線性統計量容差VIF最小容差1國民生產總值億元.345b2.724.017.603.004240.478.004固定資產總投資億元.113b.876.397.236.006168.196.006貨物進出口總額億元.013b.360.725.099.07613.072.076城鎮人均可支配收入元-.029b-.

12、220.830-.061.006164.514.006人口數萬人-.039b-1.706.112-.428.1616.205.1612固定資產總投資億元.139c1.347.203.362.006169.464.002貨物進出口總額億元-.066c-1.865.087-.474.04522.357.002城鎮人均可支配收入元-.468c-6.150.000-.871.003332.352.002人口數萬人-.063c-4.908.000-.817.1456.896.0043固定資產總投資億元-.023d-.358.727-.107.005217.345.002貨物進出口總額億元.004d.17

13、4.865.052.03033.020.002人口數萬人-.019d-.873.401-.255.03627.565.001a. 因變量: 公共財政收入億元b. 模型中的預測變量: (常量), 教育經費總投入億元。c. 模型中的預測變量: (常量), 教育經費總投入億元, 國民生產總值億元。d. 模型中的預測變量: (常量), 教育經費總投入億元, 國民生產總值億元, 城鎮人均可支配收入元。2.2.3 模型顯著性檢驗 表2.4給出了三個模型的F檢驗的結果,可以看出,方程擬合度很好,回歸方程是顯著的。表2.4 Anovaa模型平方和df均方FSig.1回73111817

14、0946741.73110257.633.000b殘差24800385.298141771456.093總029152回85829089978441.4297483.717.000c殘差15790244.171131214634.167總029153回02736063981333.67619133.675.000d殘差3803126.00212316927.167總02915a. 因變量: 公共財政收入億元b. 預測變量: (常量), 教育經費總投入億元。c. 預測

15、變量: (常量), 教育經費總投入億元, 國民生產總值億元。d. 預測變量: (常量), 教育經費總投入億元, 國民生產總值億元, 城鎮人均可支配收入元。2.2.4 模型回歸系數顯著性檢驗及回歸系數確定通過軟件分析,得到三個模型的回歸系數及其顯著性檢驗如表2.5所示,三個模型回歸系數都是顯著的。表2.5 系數a模型非標準化系數標準系數tSig.共線性統計量B標準 誤差試用版容差VIF1(常量)-4200.257569.911-7.370.000教育經費總投入億元4.443.044.999101.280.0001.0001.0002(常量)-6658.1241018.377-6.538.000教

16、育經費總投入億元2.912.563.6555.169.000.004240.478國民生產總值億元.083.030.3452.724.017.004240.4783(常量)-206.7901170.891-.177.863教育經費總投入億元3.202.292.72010.982.000.004246.952國民生產總值億元.179.022.7478.122.000.002485.817城鎮人均可支配收入元-2.631.428-.468-6.150.000.003332.352a. 因變量: 公共財政收入億元模型一回歸方程是:Y=-4200.257+4.443X5模型二回歸方程是:Y=-6658

17、.124+0.083X1+2.912X5 模型三回歸方程是:Y=-206.790+0.179X1-2.631X4+3.202X5由上分析:模型二和模型三的VIF都大于10,共線性顯著。但其系數都通過了顯著性檢驗。其中模型三種人均可支配收入的系數為負。含義是城鎮人均可支配收入和公共財政收入是負相關的,這與經濟實際不符。其常量未通過顯著性檢驗。造成這么情況的原因是共線性問題。2.2.5 共線性診斷表2.6為各個模型的共線性診斷。表2.6 共線性診斷a模型維數特征值條件索引方差比例(常量)教育經費總投入億元國民生產總值億元城鎮人均可支配收入元111.8121.000.09.092.1883.103.

18、91.91212.7741.000.01.00.002.2263.507.22.00.003.00165.983.771.001.00313.7701.000.00.00.00.002.2284.064.05.00.00.003.00167.034.58.90.09.214.000105.570.38.10.91.79a. 因變量: 公共財政收入億元由表2.6可以看出,第二個模型中第三個維度解釋了100%的教育經費總投入和100%國民生產總值。第三個模型第四個維度解釋了91%的國民生產總值和79%的城鎮人均可支配收入。當方差比例大于50%時,即可認為存在明顯共線性。因此,模型二和模型三都存在嚴重共線性。2.2.6 回歸方程殘差分析 對模型進行殘差分析,分別做成表2.7和圖2.1 。表2.7 殘差統計量a極小值極大值均值標準 偏差N預測值8484.0625117000.179742661.073834825.2245816標準 預測值-.9812.135.0001.00016預測值的標準誤差203.345489.034271.60876.32116調整的預測值8424.4346116221.140

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論