北航數(shù)理統(tǒng)計大作業(yè)逐步回歸_第1頁
北航數(shù)理統(tǒng)計大作業(yè)逐步回歸_第2頁
北航數(shù)理統(tǒng)計大作業(yè)逐步回歸_第3頁
北航數(shù)理統(tǒng)計大作業(yè)逐步回歸_第4頁
北航數(shù)理統(tǒng)計大作業(yè)逐步回歸_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、BEIHANG UNIVERSITY應(yīng)用數(shù)理統(tǒng)計第一次大作業(yè)學(xué)號: 姓名:一班級:B11班2015年12月民航客運(yùn)量的多元線性回歸分析摘要: 本文為建立以民航客運(yùn)量為因變量的多元線性回歸模型,選取了1996年至 2013 年的統(tǒng)計數(shù)據(jù),包含國民生產(chǎn)總值,民航航線里程,過夜入境旅游人數(shù),城鎮(zhèn)居民可支配收入等因素,利用統(tǒng)計軟件SPSSt各因素進(jìn)行了篩選分析,采用逐步回歸法得到最優(yōu)多元線性回歸模型,并對模型的回歸顯著性、擬合度以及隨機(jī)誤差的正態(tài)性進(jìn)行了檢驗(yàn),并采用2014 年的數(shù)據(jù)進(jìn)行檢驗(yàn),得到的結(jié)果達(dá)到預(yù)期,證明該模型建立是較為成功的。關(guān)鍵詞 :多元線性回歸,逐步回歸法,民航客運(yùn)量0.符號說明變M

2、符號民用航空客運(yùn)MY國民生產(chǎn)總值X鐵路客運(yùn)MX2民航航線里程X3入境過夜旅游人數(shù)X4城鎮(zhèn)居民人均可支配收入X51 .弓I言隨著社會的進(jìn)步,人民生活水平的提高,如何獲得更快捷方便的交通成為人們?nèi)找骊P(guān)注的問題。因?yàn)楹娇盏陌踩?,快速且價格水平越來越傾向大眾,越來 越多的人們選擇航空這種交通方式。近年來,我國的航空客運(yùn)M已經(jīng)進(jìn)入世界前歹U ,為掌握航空客運(yùn)的動態(tài),合理安排班機(jī)數(shù)科學(xué)地對我國民航客運(yùn)M的影響因素的分析,并得出其回歸方程,進(jìn)而能夠估計航空客運(yùn)M是非常有必要的。本文收集整理了與我國航空客運(yùn)M相關(guān)的歷年數(shù)據(jù),運(yùn)用SPS敞件對數(shù)據(jù)進(jìn)行分析,研究1996年起至2013年我國民航客運(yùn)M y (萬人

3、)與國民生產(chǎn)總值 X (億元)、 鐵路客運(yùn)M X2 (萬人)、民航航線里程 X3 (萬公里)、入境過夜旅游 人數(shù)X4 (萬人)、 城鎮(zhèn)居民人均可支配收入 X5 (元)的關(guān)系。采用逐步回歸法 建立線性模型,選出較優(yōu)的線 性回歸模型。2 .數(shù)據(jù)的統(tǒng)計與分析本文在進(jìn)行統(tǒng)計時,查閱中國統(tǒng)計摘要,中國統(tǒng)計年鑒 2014»以及中 國知網(wǎng) 數(shù)據(jù)查詢中的數(shù)據(jù),收集了 1996年至2013年各個自變M因素的數(shù)據(jù),分 析它們之間的聯(lián) 系。整理如表1所示。表1:年份民航客運(yùn)# (萬人)國內(nèi)生產(chǎn)總值(億元)鐵路客運(yùn)i (萬人)民航航線 里程(萬 公里)入境過夜旅游人數(shù)(萬人)城鎮(zhèn)居民可支配收入(元)1996

4、55557897394797116.651356.264838.91997563084402.393308142.51578.535160.31998575589677.195085150.581692.455425.11999609488479.2100164152.221765.255854.12000672299214.6105073150.291750.966280.120017524109655.2105155155.361880.366859.620028594120332.7105606163.772012.457702.820038759135822.897260174.952

5、033.588472.2200412123159878.3111764204.942519.899421.6200513827184937.4115583199.852925.6310493.1200615968216314.4125656211.353486.4511759.5200718576265810.3135670234.33398.5813785.8200819251314045.4146193246.183696.7115780.8200923052340506.9152451234.514025.9617174.7201026769397983.5168145276.54753

6、.8419109.4201129316473104146192349.054924.3221809.8201231896519470.1189337328.015668.6324564.7201335397568845.2210597410.65562.3926955.12.1 模型的建立X,構(gòu)建回歸方程以民航客運(yùn)M y為因變以上5種影響因素為自變My = ? + ? ?+ e其中? ?為常數(shù)項(xiàng),為誤差項(xiàng)。先觀察自變M與因變M的關(guān)系,用 SPSS到各個自變M與因變M的散點(diǎn)圖4CO30J-3CO lIOa-2COOO' 3-1COOO 0"0 Oo°JQ=圖2民航客運(yùn)

7、量與鐵路客運(yùn)量散點(diǎn)圖looooaa 200000 jo sooooo.o 4DOCOOO SOOOQDJ6OXJQ0.0圜內(nèi)生產(chǎn)總值圖1民航客運(yùn)量與國內(nèi)生產(chǎn)總值散點(diǎn)圖4aOJD.Ds3Q00D.D-20OODJ-10CDD D s2W0Q.0日勺 Q&QD 1300)0.0 120CCDD 14MGOO 160300.0 19COQO.Q 200000,0圖4民航客運(yùn)量與入境過夜人數(shù)散點(diǎn)圖4i IDOt20000 C-*10000R1IDO Q320C .00300 00社航航線里相500.00圖3民航客運(yùn)量與航線里程散點(diǎn)圖K用肌、VTJA鳳:COOT.icoaja-10ID.0D20

8、00 003000 01AOOJJDSCOCflC!A00 00過被諭客4300D.O-3300c 0-xoao.c -13000 0-.a5CTC-0100W.Q150OQX)ZQW04: 5W0JQ3QCQC-D 械額屈艮人崗可支配枚入 圖5民航客運(yùn)量與人均可支配收入散點(diǎn)圖從以上五張散點(diǎn)圖,我們可以看出因變M民航客運(yùn)M與國內(nèi)生產(chǎn)總值,入境 過夜旅游人數(shù)和城鎮(zhèn)居民人均可支配收入均有較好的線性關(guān)系,這說明建立線性 模型是有意義的。繼續(xù)下一步逐步回歸分析,逐步回歸的基本思想是將變M逐個引入模型,每引入一個變M后都要進(jìn)行檢驗(yàn),并對已經(jīng)選入的變M逐個進(jìn)行t檢驗(yàn),當(dāng)原來引 入的變M由于后面變M的引入變

9、得不再顯著時,則將其刪除。以確保每次引入新的變M之前回歸方程中只包含先主動變這是一個反復(fù)的過程,宜到既沒有顯 著的變M選入回歸方程,也沒用不顯著的變M從回歸方程中剔除為止。在SPSS軟件中可宜接進(jìn)行逐步回歸分析,得出以下結(jié)果:由表2知,逐步回歸后得出兩個模型,模型 1只包含城鎮(zhèn)居民可支配收入,其他自變M都沒有進(jìn)入模型,模型2在1的基礎(chǔ)上再納入了過夜入境旅游人數(shù),其他 的自變M也都被排除了。輸入/移去的變量莫型輸入的變量移去的變量方法城鎮(zhèn)居民人均可支配步進(jìn)(準(zhǔn)則:1收入F-to-e nter的概率二.050 , F-to-remove的概率=.100 ) O過夜游客步進(jìn)(準(zhǔn)則:F-to-e nt

10、er的概率2二.050 , F-to-remove的概率=.100 )。a.因變量:民用航空客運(yùn)量已排除的變量a模型Beta IntSig.偏相關(guān)共線性統(tǒng)計量容差國內(nèi)生產(chǎn)總值.197 b.517.612.132.003鐵路客運(yùn)量-.001 b-.014.989-.004.0581民航航線里程-.040 b-.388.704-.100.044過夜游客.421 b3.432.004.663.018國內(nèi)生產(chǎn)總值.306 c1.059.308.272.0032鐵路客運(yùn)量-.020 c-.289.777-.077.058民航航線里程.011 c.138.892.037.043a.因變量:民用航空客運(yùn)量b

11、.模型中的預(yù)測變量:(常量),城鎮(zhèn)居民人均可支配收入。c.模型中的預(yù)測變量:(常量),城鎮(zhèn)居民人均可支配收入,過夜游客表4模型匯總c莫亶R一調(diào)整R方標(biāo)準(zhǔn)估計的誤差更改統(tǒng)計量R方更改F更改df1df2Sig. F更改1.996 a.993.992876.7400.9932183.841116.0002.998 b.996.995677.6913.00311.779115.004a.預(yù)測變量:(常量),城鎮(zhèn)居民人均可支配收入。b.預(yù)測變量:(常量),城鎮(zhèn)居民人均可支配收入,過夜游客 c.因變量:民用航空客運(yùn)量2.2 擬合度檢驗(yàn)由表4,模型1的決定系數(shù)R2=0.992,模型2的決定系數(shù)R2=0.99

12、5,可以看出回歸方程都高度顯著,且模型 2比模型1更優(yōu)。2.3 回歸方程的顯著性檢驗(yàn):每個方程都是顯著由表5,方差分析表Sig值都0.05,說明每個模型都拒絕回歸系數(shù)均為0的 假設(shè),的。Anova a莫型平方和df均方FSig.回歸1678659397.18411678659397.1842183.841.000 b1殘差12298767.26116768672.954總計1690958164.44417回歸1684069181.3702842034590.6851833.437.000 c2殘差6888983.07515459265.538總計1690958164.44417a. 因變量:民

13、用航空客運(yùn)量b.預(yù)測變量:(常量),城鎮(zhèn)居民人均可支配收入。c.預(yù)測變量:(常量),城鎮(zhèn)居民人均可支配收入,過夜游客由表6可以得到兩個模型的回歸方程分別:1 .以城鎮(zhèn)居民可支配收入為自變M的擬合函數(shù):y=-1698.669+1.406X 52?以城鎮(zhèn)居民可支配收入和過夜入境旅游人數(shù)為自變M的擬合函數(shù):y=-3267.728+0.817X 5+2.871X4且所有系數(shù)的顯著性水平都小于0.05 ,每個回歸方程都是有意義的表6a系數(shù)莫型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn)誤差試用版1(常量)-1698.669423.955-4.007.001城鎮(zhèn)居民人均可支配收入1.406.030.99646.7

14、32.000(常量)-3267.728562.492-5.809.0002城鎮(zhèn)居民人均可支配收入.817.173.5794.721.000過夜游客2.871.837.4213.432.004a.因變量:民用航空客運(yùn)量表7是殘差統(tǒng)計結(jié)果。主要顯示預(yù)測值、標(biāo)準(zhǔn)化預(yù)測值、殘差和標(biāo)準(zhǔn)化殘差等統(tǒng)計M的最大值、最小值、均值和標(biāo)準(zhǔn)差。殘差平方和Q描述的是隨機(jī)誤差引起因變M 丫的分散程度,Q越大分散性也越大,則線性關(guān)系越不明顯。由表 7可見標(biāo)準(zhǔn)化殘差的最大絕對 值為1.758。而且標(biāo)準(zhǔn)殘差的均值為 0,說明隨機(jī)誤 差對丫值的影響很小。表7殘差統(tǒng)計量極小值極大值均值標(biāo)準(zhǔn)偏差N,頁測值4581.80435339.

15、83615600.4449953.034418X差-1191.5225973.1963.0000636.580218M準(zhǔn)預(yù)測值-1.1071.983.0001.00018M準(zhǔn)殘差-1.7581.436.000.93918a.因變量:民用航空客運(yùn)量2.4 多重共線性的診斷表8共線性診斷模型維數(shù)特征值條件索引方差比例(常量)城鎮(zhèn)居民人均可支配收入過夜游客11.8731.000.06.0612.1273.843.94.9412.8521.000.01.00.0022.1474.410.37.01.003.00239.683.62.991.00a.因變量:民用航空客運(yùn)量表8是SPSSB件的多重共線性診

16、斷表,它包括 3項(xiàng)診斷值:特征值、條件 數(shù)和方差比率。特征值表明 在自變M中存在多少截然不同的維數(shù),當(dāng)幾個特征值都接近0是,變M是高度相關(guān)的。條件數(shù)是最大特征值對每一個連續(xù)特征值的比 率的平方根,若條件數(shù)大于 15則表明可能存在多重共線問題,若大于 30則表明 存在嚴(yán)重的多重共線性問題。顯然表8中變M X4過夜入境旅游人數(shù)的條件數(shù)大 于30,說明回歸方程存在多重共線性。2.5 殘差檢驗(yàn)個圖就是根據(jù)樣本數(shù)據(jù)的如圖6是殘差分布宜方圖。在回歸分析中,總是假定殘差服從正態(tài)分布,這計算結(jié)果顯示殘差分析的實(shí)際情況。從圖來看標(biāo)準(zhǔn)化殘差還是近似服從正態(tài)分布的。百方圖57B-15 '. -n(正態(tài)分布)周圍,說明殘差 建立模型。分布基本符合正態(tài)分布,相關(guān)十分顯著,這是符合如圖7殘差的積累概率圖基本圍繞在假設(shè)宜線說明民航客運(yùn)M這個因變M基本上可以用線性回歸方法3 .結(jié)論為了解決多重共線性的問題,排除模型2,考慮到模型1的擬合度也是很好的,綜合來看認(rèn)為模型1為更優(yōu)。最終得到的回歸方程為:y=-1698.669+1.406X 5并以2014年的數(shù)據(jù)檢驗(yàn)該回歸方程,2014年航空客運(yùn)M為39195萬人,城鎮(zhèn)居民人均可支配收入為 28843.9,將自變M X5帶入回歸方程得到y(tǒng)=38855

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論