北航數理統計大作業(逐步回歸)_第1頁
北航數理統計大作業(逐步回歸)_第2頁
北航數理統計大作業(逐步回歸)_第3頁
北航數理統計大作業(逐步回歸)_第4頁
北航數理統計大作業(逐步回歸)_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、北京航空航天大事BEIHANG UNIVERSITY應用數理統計第一次大作業學號:姓名:班級:20 15年12月民航客運量得多元線性回歸分析摘要:本文為建立以民航客運量為因變量得多元線性回歸模型,選取了 199 6年 至 2013年得統計數據,包含國民生產總值,民航航線里程,過夜入境旅游人數,城鎮居 民可支配收入等因素,利用統計軟件SPSS對各因素進行了篩選分析,采用逐步回 歸法得到最優多元線性回歸模型,并對模型得回歸顯著性、擬合度以及隨機誤差得 正態性進行了檢驗,并采用201 4年得數據進行檢驗,得到得結果達到預期,證明該 模型建立就是較為成功得.關鍵詞:多元線性回歸,逐步回歸法,民航客運量

2、0、符號說明變量符號民用航空客運量Y國民生產總值X,鐵路客運量X2民航航線里程X3入境過夜旅游人數X4城鎮居民人均可支配收入X51、引言隨著社會得進步,人民生活水平得提高,如何獲得更快捷方便得交通成為人們日 益關注得問題因為航空得安全性,快速且價格水平越來越傾向大眾,越來越 多得人 們選擇航空這種交通方式。近年來,我國得航空客運量已經進入世界前列,為掌握航 空客運得動態,合理安排班機數量科學地對我國民航客運量得影響因素得分析,并 得出其回歸方程,進而能夠估計航空客運量就是非常有必要得。本文收集整理了與我 國航空客運量相關得歷年數據,運用SPSS軟件對數據進行分析,研究199 6年起至20 13

3、年我國民航客運量y(萬人)與國民生產總值Xi(億元)、鐵路客運量X2(萬人)、民航航線里程X3 (萬公里)、入境過夜旅游人數X4 (萬人)、城鎮居民人均可支配收入X5 (元)得關系。采用逐步回歸法建立線 性模型,選出較優得線性回歸模型。2、數據得統計與分析本文在進行統計時,查閱中國統計摘要,中國統計年鑒2 0 14以及中國 知網數據查詢中得數據,收集了 19 96年至201 3年各個自變量因素得數據,分析它們 之間得聯系。整理如表1所示。表1:年份民航客運量(萬人)國內生產 總值(億 元)鐵路客運量(萬人)民航航線 里程(萬 公里)入境過夜旅游人數。人城鎮居民可支配收入(元)1 9985755

4、8 967 7 .95085150.5811 692. 4554 2 5、11 9 996 0 94228 847 9 .24、655.21001641 0 50 7 3105155152、22150、2915 5、36176 5.255 8 54、11 7 50、966280、11880、36 6859、632、71 05606163、7720 1 2 457702、822、89 7 2601 74、 9520 3 3. 58878、3111764204、 942519、89942 1、6200 520 0 62244810、3045、41 1 5 583199、852 9 25、63 10

5、493、11 2 56562 11、353486、45 11 759、51 35670234、333 9 8、5813785、81 46 1 9324 6、1 83 6 9 6、1 5 7 80. 81 9 9655557 8 9739 479 71 16. 651356、264838、9199756 3 0844 0 2、393308142.5157 8、5351 6 0.3506、91524 5 1234、 51983、5714025、9 617174、168145276、54 753、8419109、449 2 4、3 22 1809、24564、7、0547 0 .11893 3 74

6、5. 22 1 059741 0、65 5 62. 3926955. 12 1模型得建立以民航客運量y為因變量,以上5種影響因素為自變量Xj,構建回歸方程:其中“0為常數項,為誤差項。先觀察自變量與因變量得關系,用SPSS得到各個自變量與因變量得散點圖:4CC0D.0-民用航空客運覽3CC0D0-20CODO-1CCOOO.OO10(X100.0 2DOOCO.O 300CODO 40CODD.0 500300.0 6CODOO.O國內生產總值40003.0-O30003.0-OOO20003.0-10003D-.0.80000.01000030120000.0140000.01600030

7、1 EOOOO.O 20CQ00.0 220COO.O鐵路客運雖民航客運量與鐵路客運量散點圖40000 0COOOO.O-民用航空客運魚20000.0-10000.0-0o0-1OD .00200.00300.00400.00500.00民航航線里程4000D.0-*3。八。OO:COODO-Ao oo01000D0-0-10D10D2000 003: CO0 400D.0DSC00 0()9:CC.C0過夜游客圖4民航客運量與入境過夜人數散點圖400300民用肌空客運鳳33030.0-23030.0-010030.0-osP0.0-.05COO.O 10C0C.015000.02O3OD.0

8、25000.020COO.O城鎮居民人均可支配牧人圖5民航客運量與人均可支配收入散點圖從以上五張散點圖,我們可以瞧出因變量民航客運量與國內生產總值,入境過夜旅游人數與城鎮居民人均可支配收入均有較好得線性關系,這說明建立線性模型就是有意義得。繼續下一步逐步回歸分析,逐步回歸得基本思想就是將變量逐個引入模型,每引入一個變量后 都要進行F檢驗,并對已經選入得變量逐個進行t檢驗,當原來引 入得變量111于后面變量得引入變 得不再顯著時,則將其刪除。以確保每次引入新得變量之詢回歸方程中只包含先主動變量。這就是一 個反復得過程,直到既沒有顯著得變量選入回歸方程,也沒用不顯著得變量從回歸方程中剔除為止。 在

9、SPSS軟件中可直接進行逐步回歸分析,得出以下結果:山表2知,逐步回歸后得出兩個模型,模型1只包含城鎮居民可支配收入,其她自變量都沒有進 入模型,模型2在1得基礎上再納入了過夜入境旅游人數,其她得自變量也都被排除了。表2輸入/移去得變量輸入部變冢侈去得變敬方法12城鎖居民人均對支配收入甦夜游客步進C住則:F-to-enter 得概率=050.F-to-remove 得低率 x、100) 步進C隹則:F-to-enter 得概率=050.F-to-remove 得做率r*100)a-因變!R:民用航空客運事表3模型Beta In1Si 幅相關r性統計量容差國內生產忌值 19t 517612 13

10、2 003跣路客運量1.OOP,014989004 0581民航航線里程. 388 704 100 044過夜游客421,3432OOS663018國內生產總值、3061 -059、308272 0032鐵路客運量 020,一餐9 777、O77 058民新航地里程,oir 138892037 043a,因變量:民用航空客近履b 饃型中得預測變址:(常筮).城錨居民人均J支配收入。C 模型中得預測變量:(常址).城錨居民人均盯支配收入.過夜游客,表4模教匯總型RR方HgR標準估計得泯筐更改統計累R方更改F更改df 1df2Sig -F更改19961993992876 *74 009932183

11、*8 41116 0002998996995677 -69 1 3*00311 *779115*004欲 預測變屢:(常筮八城居民人均可支配收人b 預測變承:(常Si )-城居冕人均可支配收入.過夜迎客-C 因變累:民用航空客運量2、2擬合度檢驗山表4模型1得決定系數R2 = 0、9 9 2模型2得決定系數R2=0. 995,可以瞧出回歸方程都高度顯著, 且模型2比模型1更優。2.3回歸方程得顯著性檢驗:山表5,方差分析表Sig值都0、0 5,說明每個模型都拒絕回歸系數均為0得假設,每個方程都就是 顯著得。表5Ano vaa懊型平方與dfFSig*回歸硅M1678659397* 1841229

12、87 67 26 1I16167865939 7*184768 6 72 95 42183 84000、2總計回歸1 6 90 9 581 64 44416 84069181 376888983 17 685 5381833 4 37 0 00總計1690958164 *444因變堪:民用航空客運址,預測變址:(常址城鉗居民人均可支配收入C-預測變址:(常址)城輟居民人均可支配收入過夜游客。由表6可以得到兩個模型得回歸方程分別:以城鎮居民可支配收入為自變量得擬合函數:y=J 6 98、669 + I、40 6X5、以城鎮居民可支配收入與過夜入境旅游人數為自變量得擬合函數:y= 3267 728

13、+0 817X5+2、8 71X,且所有系數得顯著性水平都小于0、05,每個回歸方程都就是有意義得。表6模型非標準化系數標;隹系數tSi B標準誤差試用版 ()1698 669423 955 4 0 07 001城輟居民人均可支配收入1 70603099646 732 000(常童3267 *728562 79 25 8090002城鎮居m何支配收入817 173、5794-721000過夜游客2 - 8718 37423-432-0043因變星:民用航空客運娥表7就是殘差統計結果。主要顯示預測值、標準化預測值、殘差與標準化殘差等統計量得最大 值、最小值、均值與標準差。殘差平方與Q描述得就是隨

14、機誤差引起因變量丫得分散程度,Q越大分 散性也越大,則線性關系越不明顯。山表7可見標準化殘差得最大絕對值為1、758。而且標準殘差得均 值為。,說明隨機誤差對丫值得影響很小。表7殘差統計圾小值;mi標準脩差N測值1581 80435 3 39 1 8 3 615600 4449 953 * 0344)8殘差1191 *5225973、1963,0000636、580218標準-1 * 1071 9830001 -00018標準殘差1-75843 6,ooo 939182、4多重共線性得診斷表8共線性診新.摸型維教待征伯條件索引方羞比疵(B)城鎮居民人均可支配收入垃夜游咨111 8731 *0007606121273*843949412.8521 *000、01000022147414103701003A00239 6R3*62,991 *003因變量:限用航空客運崇表8就是SPSS軟件得多重共線性診斷表,它包括3項診斷值:特征值、條 件數與方差比率。特征 值表明在自變量中存在多少截然不同得維數,當兒個特征值都接近。就是,變量就是高度相關得.條 件數就是最大特征值對每一個連續特征值得比率得平方根,若條件數大于15則表明可能存在多重共 線問題,若大于30則表明存在嚴重得多重共線性問題。顯然表8中變量X4過夜入境旅游人數得條件 數大于3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論