




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、遂廈工商大尊畢業論文題目多元回歸分析中的變量選取SPSS的應用院(系)數學與統計學院專業年級2010級統計學學生姓名殷婷學號2010101217指導教師職稱副教授日期2014-4-22 多元回歸分析中的變量選取SPSS的應用殷婷摘要本文不僅對于復雜的統計計算通過常用的計算機應用軟件SPSS來實現,同時通過對兩組數據的實證分析,來研究統計學中多元回歸分析中的變量選取,讓大家對統計中的多元回歸數據的選取和操作方法有更深層次的了解。一組數據是對于淘寶交易額的未來發展趨勢的研究,一組數據時對于我國財政收入的研究。本文通過兩個實證從不同程度上對數據選取的研究運用通俗的語言和淺顯的描述將SPSS在多元回歸
2、分析中的統計分析方法呈現在大家面前,讓大家對多元回歸分析以及SPSS軟件都可以有更深一步的了解。通過SPSS軟件對數據進行分析,對數據進行處理的方法進行總結,找出SPSS對于數據處理和分析的優缺點,最后得在對變量的選取和軟件的操作提出建議。關鍵詞:統計學SPSS變量的選取多元回歸分析AbstractInthispaper,notonlyforcomplexstatisticalcalculationsdonebythecommonlyusedcomputerapplicationsoftwareofSPSS,throughtheempiricalanalysisofthetwogroupsof
3、dataatthesametime,tostudythestatisticsofthevariablesinthemultivariateregressionanalysis,leteverybodytoselectmultipleregressioninstatisticaldataandoperationmethodshaveadeeperunderstanding.Isasetofdataforthefuturedevelopmenttrendoftaobaotransactionsofresearch,asetofdatafortheresearchofourcountrysfinan
4、cialincome.Inthispaper,throughtwoempiricaltoselectdatafromdifferentextentresearchusingacommonlanguageandplaintheSPSSstatisticalanalysismethodinmultipleregressionanalysisofpresentinfrontofeveryone,leteveryonetomultipleregressionanalysisandSPSSsoftwarecanhaveadeeperunderstanding.ThroughtheSPSSsoftware
5、toanalyzedata,andsummarizesmethodofdataprocessing,findouttheadvantagesanddisadvantagesofSPSSfordataprocessingandanalysis,finallyhadtoputforwardtheproposaltotheoperationoftheselectionofvariablesandsoftware.Keywords:StatisticalSPSSTheselectionofvariablesmultipleregressionanalysis目錄TOC o 1-5 h z摘要1英文摘要
6、1 HYPERLINK l bookmark4 引言3第一章回歸分析31.1自變量的選擇41.2國內外研究現狀5 HYPERLINK l bookmark16 第二章案例分析一:淘寶交易額的研究62.1數據的來源及變量的選取62.2相關分析72.2.1散點圖72.2.2計算相關系數82.3回歸分析112.4小結13 HYPERLINK l bookmark28 第三章案例分析二:財政收入的研究143.1數據的來源及變量的選取143.2相關分析153.2.1散點圖153.2.2計算相關系數173.3回歸分析193.4逐步回歸213.5小結24 HYPERLINK l bookmark40 第四章
7、總結及建議25 HYPERLINK l bookmark42 參考文獻26引言統計學是一門提供數據信息的收集、處理、歸納和分析的理論與方法的科學。然而隨著社會的發展,統計的運用范圍越來越廣泛,統計學作為高等院校經濟類專業和工商管理類專業的核心課程,不管是在經濟管理領域,或是在軍事、醫學等領域的研究中對于數量分析與統計分析都需要更高的要求,需要用到的數學知識較多,應用方面的靈活性也較強,計算量大且復雜。隨著我國社會主義市場經濟的日趨完善,不管是在宏觀經濟的經濟調控領域還是在微觀的企業管理領域中,人們必須準確及時的獲得經濟運行中的各類信息才能得到高效的監控和科學的管理。然而科學研究的深入,研究的對
8、象也日益變得復雜,復雜系統的研究問題更是成為當今研究的熱點。為了更好的描述一個復雜的現象,就需要大量的數據和信息,如何高效、準確地利用已知的信息便成為當今社會研究的一項重要課題。基于以上背景,本文通過總結和吸取其他國內外學者對統計學研究的,并結合我國的實際情況,本文采用了案例一對于網絡購物這塊的的研究,通過對2005年到2012年的居民消費水平,以及我國網絡普及度,我國人人均純收入以及我國的居民消費水平對淘寶網的未來發展趨勢進行定量數據的研究以及案例二對于我國財政收入的研究,通過對2000年到2012年的人均國內生產總值,經濟活動人口,全社會固定投資,進出口總額,居民消費價格水平對我國財政收入
9、的影響進行定量數據的研究。通過對數據的選取,以及軟件的操作方法來告知讀者如何在SPSS的操作中變量選取的原則、要求和方法。第一章自變量的選擇1.1自變量的選擇在多元線性回歸模型中,自變量的選擇實質上就是模型的選擇。現設一切可供選擇的變量是t個,它們組成的回歸模型稱為全模型(記:m=t+1),在獲得n組觀測數據后,我們有模型Y=XP+N(0Q21)nn其中:Y是nx1的觀測值,P是mx1未知參數向量,X是nxm結構矩陣,并假定X的秩為m。現從x,x,,x這t個變量中選t變量,不妨設x,x,,x,那么對全模型中的參12t12tf數p和結構矩陣X可作如下的分塊(記:p二t+1):卩=(p,卩),X:
10、X)pqpq我們稱下面的回歸模型為選模型:Y=XB+pp卜N(Oq21)n其中:Y是nx1的觀測值,卩是px1未知參數向量,X是nxp結構矩陣,并假定Xppp的秩為p。自變量的選擇可以看成是這樣的兩個問題,一是究竟是用全模型還是用選模型,二是若用選模型,則究竟應包含多少變量最適合。如果全模型為真,而我們用了選模型,這就表示在方程中丟掉了部分有用變量,相反,如果選模型為真,而我們選用了全模型,這就表示在方程中引入了一些無用變量,下面從參數估計和預測兩個角度來看一看由于模型選擇不當帶來的后果。為了討論方便起見,先引入幾個記號:全模型中參數卩Q2的估計:P二(XX)-1XY八C)2其中:R(X)為矩
11、陣X的秩。在點x二(xx)點上的預測值為y=x卩1tppp在選模型中參數卩Q2的估計:卜=(XX)-1XYpppp1,a2=YIX(XX)-1XYpnR(X)ppppp在x=(xx)=(x,x)(x,x)J上的預測值為=x卩pq1pp+1tppp1.2國內外研究現狀在科學技術飛速發展的今天,統計學廣泛吸收和融合相關學科的新理論,不斷開發應用新技術和新方法,深化和豐富了統計學傳統領域的理論與方法,并拓展了新的領域。今天的統計學已展現出強有力的生命力。在我國,社會主義市場經濟體制的逐步建立,實踐發展的需要對統計學提出了新的更多、更高的要求。隨著我國社會主義市場經濟的成長和不斷完善,統計學的潛在功能
12、將得到更充分更完滿的開掘。在應用回歸分析去處理實際問題時,回歸自變量選擇是首先要解決的重要問題。通常,在做回歸分析時,人們根據所研究問題的目的,結合經濟理論羅列出對因變量可能有影響的的一些因素作為自變量引進回歸模型,其結果是把一些對因變量影響很小的,有些甚至沒有影響的自變量也選入了回歸模型中,這樣一來,不但計算量變大,而且估計和預測的精度也會下降。此外,如果遺漏了某些重要變量,回歸方程的效果肯定不好。在一些情況下,某些自變量的觀測數據的獲得代價昂貴,如果這些自變量本身對因變量的影響很小或根本沒有影響,我們不加選擇的引進回歸模型,勢必造成觀測數據收集和模型應用的費用不必要的加大。因此,在應用回歸
13、分析中,對進入模型的自變量作精心的選擇是十分必要的。SPSS軟件作為當今國際上運用廣泛的統計分析軟件,因其具有自動統計繪圖、數據的深入分析、易學易用、功能齊全等特點,在各個領域得到了迅速普及,并成為各行業管理組織提高管理水平、形成科學決策的重要手段。然而,我國對該軟件的理解和運用還處于早期應用階段,對其功能的研究開發與實際生活當中的運用與西方發達國家相差甚遠。特別是在管理決策方面,管理者對客觀現實的準確把握對于決策起著至關重要的作用,他們花費大量人力、物力、財力收集統計數據,但是由于沒有進行深度分析而浪費,或者僅僅利用SPSS軟件進行簡單分析而未進行深度開發,致使所得信息有限、各信息間的關系不
14、明確,最終導致管理者的判斷出現偏差。第二章案例分析一:淘寶交易額的研究數據的來源及變量的解釋為研究淘寶網未來發展趨勢,從新浪官方微博淘寶數據魔方中獲得淘寶2009年聚劃算中購物群眾的年齡比例作為定性數據,進行研究年齡對淘寶購物的影響。并在新浪財經網上獲得淘寶網自2005年到2012年的淘寶交易額以及淘寶注冊人數的數據。在中商情報局里獲得我國近網絡普及度等數據并從國家統計年鑒中選取統計指標居民消費水平。淘寶注冊人數(x)在一定程度上反應了網絡購物的群眾的人數,反應了當今社會1網絡購物的普遍性。同時淘寶的注冊人數也展現了人們對網絡購物的認可度,換言之也就是說接受了網絡購物并會在網上進行消費,是對網
15、絡購物很大程度上的支持。我國網絡普及度(x)是指我國近幾年網絡在我國普及的范圍,這一塊更好的反映2了網絡對居民網絡消費的影響,因為網絡是網絡消費的必要條件。我國網絡普及度反映的是在我國日趨發展的經濟下,網絡也得到了普遍的廣泛,人們對網絡的接受程度,信任程度也是直接影響到淘寶的網絡購物。居民消費水平(x3)是指居民在物質產品和勞務的消費過程中,對滿足人們生存、發展和享受需要方面所達到的程度。通過消費的物質產品和勞務的數量和質量反映出來。居民消費水平是指居民在物質產品和勞務的消費過程中,對滿足人們生存、發展和享受需要方面所達到的程度。它主要通過消費的物質產品和勞務的數量和質量來反映。居民消費水平的
16、提高也能很好的展現在網絡消費上作出的貢獻。通過對以上這三個定量數據的研究來其與淘寶交易額的關系,從而研究淘寶未來的發展趨勢以及優劣態。原始數據如下:年份淘寶網年交易總額億)y淘寶注冊人數(萬人)xl我國網絡普及度1%)x2居民消費水平盤20058925008.555962006169350010.562992007433.1530016731020089996980022.68430200920001700028.99283201040003700034.310522201178006500038.3125702012100007000042.114098由于數據之間單位的不同,為了消除量綱的
17、影響,把數據標準化進行處理,得到如下標準化的數據(所有取值保留了兩位小數):年份淘寶網年交易總額億)y淘寶注冊入數(萬A)xi我國網絡普及度(%)x2居民消費水平工3200511112006L90140I1.241.13200T4.872.121.88LSI200811.233.922661.51200922.476,803.401.662010449414.8014.04L88201187.6426.004.512.252012112.3628.004.952.522.2相關分析2.2.1散點圖對y與各個變量作出散點圖 120.00-3)我國居民消費水平與淘寶交易的相關性檢驗:y=-91.8
18、87+77.036x3100.00-80.00-牛60.00-40.00-Scale2015105020.00-由以上二個散點圖可知,其所有的點均落在了左上至右下的一條直線上,表明了數據之間存在顯著相關關系。所-以我們還需要對數據進行進一步的分析,得到確切的答案。1.001.502.002.503.00222計算相關系數(1)復相關系數r是用來衡量回歸直線對于觀察值配合的密切程度,即用來衡量因變量y與自變量x,x,X之間相關的密切程度。以下是用SPSS對數據進行相關性分123析,得到如下的相關系數圖CrirreEationsx3_.965.0000_966.0000_.970-.000.901
19、.0028.917.00181.992.00081yPearson.CorrelationSigZ0;應的概率Sil.000P值為0.000,小于顯著性水平0800.917.001.01的顯著性水平定的線性關系,相關顯著相關,衣示呈一.0005,說明淘寶交易額與淘寶注.000系數檢驗對冊人數之間相關性顯著。y諸的相關系數為089010,表示呈一定的線性關系,相關系數檢驗對應2的概率P值為0.002,小于顯著性水平0.05,說明淘寶交易額與我國網絡普及度之間相關性顯著。y與X3的相關系數為0.9650,表示呈一定的線性關系,相關系數檢驗對應的概率P值為0.000,小于顯著性水平0.05,說明淘寶
20、交易額與居民消費水平之間相關性顯著。綜上所述通過SPSS得出的相關系數的矩陣得到為:r0.992ryx=0.901ryx=0.965yx123由以上數據可以看出,各列之間存在正相關關系。即淘寶網注冊人數X、我國網絡普及1度X、我國居民消費水平X3與淘寶交易總額y存在正相關關系。(2)計算偏相關系數:在多變量的情況下,變量之間的相關系數是相當復雜的。任意兩個變量之間都有可能存在著相關關系,因此,只知道被解釋變量與解釋變量的總的相關程度是不夠的。如果需要了解某兩個變量間的相關程度,就應在消除其他變量影響的情況下來計算他們的相關系數,這就是偏相關系數。下面是用SPSS作出的偏相關系數:消除我國網絡普
21、及度和居民消費水平的影響后,計算淘寶注冊人數與淘寶交易額的偏相關系數為:CorrelationsControlVariablesyx1x2&x3yCorrelation1.000.894Significance(2-tailed).016df04x1Correlation.8941.000Significance(2-tailed).016df40解析:由上可知,淘寶注冊人數與淘寶交易額的偏相關系數為0.894。消除淘寶交易額和居民消費水平的影響后,我國網絡普及度和淘寶交易額的偏相關系數為:CorrelationsControlVariablesyx2x3&x1yCorrelation1.00
22、0-.806Significance(2-tailed).053df04x2Correlation-.8061.000Significance(2-tailed).053df40解析:由上可知我國網絡普及度與淘寶交易額的偏相關系數為-0.806。消除淘寶注冊人數和我國網絡普及度的影響后,我國居民消費水平和淘寶交易額的偏相關系數:CorrelationsControlVariablesyx3x1&x2yCorrelation1.000.810Significance(2-tailed).051df04x3Correlation.8101.000Significance(2-tailed).051
23、df40解析:由上可知,我國居民消費水平和淘寶交易額的偏相關系數為0.810。消除我國居民消費水平和淘寶交易額的影響后,淘寶注冊人數和我國網絡普及度的偏相關系數:CorrelationsControlVariablesx1x2x3&yx1Correlation1.000.584Significance(2-tailed).224df04x2Correlation.5841.000Significance(2-tailed).224df40解析:由上可知,淘寶注冊人數和我國網絡普及度的偏相關系數為0.584。消除淘寶注冊人數和淘寶交易額的影響后,我國居民消費水平和我國網絡普及度的偏相關系數:Co
24、rrelationsControlVariablesx2x3y&x1x2Correlation1.000.863Significance(2-tailed).002df04x3Correlation.8631.000Significance(2-tailed).002df40解析:由上可知,我國居民消費水平和我國網絡普及度的偏相關系數為0.963。消除我國網絡普及度和淘寶交易額的影響后,我國居民消費水平和淘寶注冊人數的偏相關系數:CorrelationsControlVariablesx3x1y&x2x3Correlation1.000-.505Significance(2-tailed).3
25、06df04x1Correlation-.5051.000Significance(2-tailed).306df40解析:由上可知,我國居民消費水平和淘寶注冊人數的偏相關系數為-0.505。綜上:從以上的偏相關系數來看,如果我國網絡普及度和居民消費水平保持不變,淘寶注冊人數與淘寶交易額之間存在顯著相關,當淘寶交易額和居民消費水平的保持不變時,我國網絡普及度和淘寶交易額之間存在顯著負相關,當淘寶注冊人數和我國網絡普及度的保持不變時,我國居民消費水平和淘寶交易額的也存在顯著相關,當我國居民消費水平和淘寶交易額保持不變時,淘寶注冊人數和我國網絡普及度之間存在顯著相關,當我國網絡普及度和淘寶交易額保
26、持不變時,我國居民消費水平和淘寶注冊人數存在顯著負相關。但是其關系強度較前者略低,所以經過以上系數得到的偏相關系數可以看出,其相關程度較原關系的強度低,應采用原數據的自變量和因變量。即所采用的自變量和因變量保持不變。2.3回歸分析對數據進行回歸分析,得到如下結果:ModelSummary1*ModeRRSquareAdjustedRSquareStd.ErroroftheEstimateChangeStatisticsDurbinWatsonRSquareChangeFCh日nQEdf1df2Sig.FChange1.997a.995.9904.15702.995244.23134.0002.
27、0323.Predictors:(Constant),x3,x1,x2b.DependentVariable:y解析:復相關系數為0.997,判定系數為0.995,調整系數為0.990,估計值的標準誤差為4.157。ANOVAbModelSumofSquaresdfMeanSquareSig.RegressionResidual12661.52469.1234220.508244.231.000a17.281Total12730.6477|a.Predictors:(Constant),x3,x1,x2b.DependentVariable:y解析:由上面結果的看其顯著性檢驗結果為,回歸平方和
28、為12661.224,殘差平方和69.123,總平方和12730.647,F統計量的值為244.231,對應的概率P值為0.000,小于顯著性水平0.05,,即:淘寶交易總額y與淘寶網注冊人數x、我國網絡普及度x12和我國居民消費水平x之間存在線性關系,所以可認為所建立的回歸方程有效。3CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-59.70921.531-2.773.050 x12.529.636.6593.980.016x2-15.9855
29、.870-.563-2.723.043x370.13925.378.8792.764.031a.DependentVariable:y解析:由上圖可知,因變量y與常數項和自變量x,x,x的回歸的標準化回歸系數分123別為-59.709,2.529,-15.985,70.139。3個回歸系數B的顯著性水平x小于0.05,這1里可以認為自變量x,x,x對因變量y有顯著性影響。于是得到回歸方程為:123y=59.709+2.529x-15.985x+70.139x123由上圖可知對數據進行t值檢驗,在給定的a=0.05,自由度n=8-2=6的臨界值時,查表得t6=2.4470.025因為x,x,x的
30、參數對應的t統計量的絕對值均大于2.447,這說明5%的顯著性水平123下,斜率系數均顯著不為0,表明淘寶網注冊人數x,我國網絡普及度x,我國居民消12費水平x等變量聯合起來對該商品的消費支出有顯著的影響。3P檢驗:由上表可以看出各自變量以及常數項的P值分別為:0.05,0.016,0.043及0.031,可以看出其P值均小于0.05,均通過檢驗綜上所述,三個自變量對因變量都有顯著性影響,并都通過了檢驗可以得到最優方程式為:y=59.709+2.529x-15.985x+70.139x1232.4小結通過SPSS操作最后得到的淘寶交易額的預測方程式:y=59.709+2.529x15.985x
31、+70.139x123再加上最后對數據的檢驗可以得出淘寶網注冊人數x,我國網絡普及度x,我國居12民消費水平x3等變量聯合起來對淘寶交易總額y有顯著的影響。影響公式可以近似為:y=59.709+2.529x15.985x+70.139x123即:淘寶注冊人數增加就可使得淘寶網的交易額增加。眾所周知我國網絡普及度是在逐年增加的,這里表現出的網絡普及度為負指標,并不代表網絡普及度要遞減才可以使得淘寶交易額增加,隨著社會的發展,中國的發展更是越來越迅速,網絡普及度的增加使得更多的地方有網絡,更多的人了解網絡才能使得我國淘寶注冊人數的增加。這兩個自變量之間存在著相對嚴密的關系。人均收入的增加固使得人們
32、的消費指數上升,那么人們在網絡購物和日常消費的比例也會發生變化,這里我們可以看出這個比例是在增加的,那么淘寶交易額增加也是必不可少的。第三章案例分析二:我國財政收入的研究數據的來源及變量的解釋為研究我國財政收入情況,為研究人均國內生產總值,經濟活動人口,全社會固定資產投資,進出口總額,居民消費價格指數對財政收入的影響,通過中國國家統計局下載2000年到2012年的數據進行研究。人均國內生產總值x是指國內生產總值的絕對值與該年平均人口的比值,是衡量一個國家或地區每個居民對該國家或地區的經濟貢獻或創造價值的指標。經濟活動人口x是指在16周歲及以上,有勞動能力,參加或要求參加社會經濟活動的2人口。包
33、括就業人員和失業人員。全社會固定資產投資x3是指以貨幣形式表現的在一定時期內全社會建造和購置固定資產的工作量以及與此有關的費用的總稱。其反映固定資產投資規模、結構和發展速度的綜合性指標的同時,也是觀察工程進度和考核投資效果的重要依據。我國的進出口總額X是指實際進出我國國境的貨物總金額。其用以觀察一個國家在4對外貿易方面的總規模。財政收入y指國家財政參與社會產品分配所取得的收入,是實現國家職能的財力保證。財政收入按現行分稅制財政體制劃分為中央本級收入和地方本級收入。原數據如下:年份財政收入(億元)y人均國內生產總值(元)x1經濟活動人口(萬人)x2全社會固定資產投資(億元)x3進出口總額(人民幣
34、億元)x41992年3483.372311.09667828080.19119.61993年4348.952998.366746813072.3112711994年5218.140446813517042.120381.91995年6242.25045.736885520019.323499.91996年7407.995845.896976522913.524133.81997年8651.146420.187080024941.126967.21998年9875.956796.037208728406.126849.71999年11444.087158.57279129854.729896.2
35、2000年13395.237857.687399232917.739273.22001年16386.048621.717388437213.542183.62002年18903.649398.057449243499.951378.22003年21715.25105427491155566.6170483.52004年26396.4712335.67529070477.4395539.12005年31649.2914185.47612088773.611169222006年38760.216499.776315109998.21409742007年51321.7820169.576531137
36、323.91668642008年61330.3523707.777046172828.41799212009年68518.325607.577510224598.81506482010年83101.5130015.178388251683.82017222011年103874.435197.878579311485.12364022012年117253.538459.578894374694.7244160由于數據單位不同,為了消除量綱的影響,用SPSS對數據進行標準化處理,得到如下標準化的數據(所有取值保留了兩位小數):year血x.31992年-0.88-1.08-1.82-0.84-1.
37、041993年-0.86-1.01-1.64-0.80-1.011994年-0.83-0.92-1.47-0.76-0.901995年-0.80-0.82-1.28-0.73-0.861996年-0.77-075-1.04-0.71-0.8519盯年-0.73-0.70-0.77-0.69-0.811998年-0.70-0.66-0.43-0.66-0.821999年-0.65-0.63-0.25-0.64-0.782000-0.59-0.560.06-0.61-0.662001-0.51-0.49G.04-0.57-0.622DCI2年-0.43-0.420.20-0.51-0.502003
38、-0.35-0.320.31-0.40-0.262伽年-0.22-0.150.40-0.260.062D戲年-0.060.020.62-0.090.3320070.100.64年0.510.570.730.360.972血年0.800.900.860.691.1320091.011.080.981.1707620101.441.481.211.421.4120112.041.961.261.981.852D12年2.432.261.352.571.953.2相關分析散點圖(1)人均國內生產總值與我國財政收入的線性趨勢關系3.1.2相關系數(1)本案例中計算的是因變量y與
39、自變量x,x,x,x之間相關的密切程度。以下1234是用SPSS對數據進行相關性分析,得到如下的相關系數圖CorrelationsVx1x2x3x4SpearmansrhoyCorrelationCoefficient1.0001.000.988.999.950Sig.(2-tailed).000.000.000N1616161616X1CorrelationCoefficient1.0001.000.988.999.950Sig.(2-tailed).000.000.000N1616161616x2CorrelationCoefficient.900.9001.000.987.935Sig.
40、(2-tailed).000.000.000.000N1616161616x3CorrelationCoefficient.999.999.9071.000.959Sig.(2-tailed).000.000.000.000N1616161616x4CorrelationCoefficient.950.950.935.9591.000Sig.(2-tailed).000.000.000.000N1616161616*.Correlationissignificantatthe0.01level(2-tailed)解析:圖中有帶“*”號的結果表明有關的兩變量在0.01的顯著性水平下顯著相關,由上
41、圖可知,y與x的相關系數為l0,表示呈一定的線性關系,相關系數檢驗對應的1概率P值為0.000,小于顯著性水平0.05,說明人均國內生產總值與我國財政收入之間相關性顯著。y與x的相關系數為0.9980,表示呈一定的線性關系,相關系數檢驗對2應的概率P值為0.000,小于顯著性水平0.05,說明經濟活動人口與我國財政收入之間相關性顯著。y與x3的相關系數為0.9990,表示呈一定的線性關系,相關系數檢驗對應的概率P值為0.000,小于顯著性水平0.05,說明全社會固定資產投資與我國財政收入之間相關性顯著。y與x的相關系數為0.9500,表示呈一定的線性關系,相關系數4檢驗對應的概率P值為0.00
42、0,小于顯著性水平0.05,說明我國的進出口總額與財政收入之間相關性顯著。綜上所述通過SPSS得出的相關系數的矩陣得到為:r=1r=0.998r=0.999r=0.950yx1yx2yx3yx4由以上數據可以看出,各列之間存在正相關關系。即人均國內生產總值x、經濟活動人1口x、全社會固定資產投資x、我國的進出口總額x與財政收入y存在顯著性相關關234系。(2)計算偏相關系數:下面是用SPSS作出人均國內生產總值x、經濟活動人口x、全12社會固定資產投資x、我國的進出口總額x與財政收入y的偏相關系數:34表一:Coefficients3ModelUnstandardizedCoefficient
43、sStandardizedCoefficientstSig.95%ConfidenceIntervalforBCorrelationsBStd.ErrorBetaLowerBciurdUpperBoundZero-orderPartialPart1(Constant)13.2054.5592.397.0153.17123.239X11.385.333.7184.160.002.6522.117.993.732.037-13.8444.536-.131-3.019.012-23.939-3.750.965-.673-.027.300.100.3972.997.012.080.521.993.67
44、0.026x4.013.076.013.233.820-.150.186.957.070.002a.Dependentvariable:y表二:CorreiationsControlVariablesyx1x2&x3&x4yCorrelation1.000.782Significance(2-tailed).002df011x1Correlation.7821.000Significance(2-tailed).002df110解析:表一為回歸分析圖中的人均國內生產總值X、經濟活動人口X、全社會固定資產12投資XJ我國的進出口總額X分別與財政收入y的偏相關系數,表二為SPSS偏相關系數34操作
45、中得出的我國人均國內生產總值與我國財政收入的偏相關系數。由人均國內生產總值x為例可以看出我國人均國內生產總值與我國財政收入的偏相關系數為0.782。P值檢驗的概率為0.0020.05,可以說明我國人均國內生產總值與我國財政收入之間顯著性相關。同理,從以上的偏相關系數來看,如果人均國內生產總值、全社會固定資產投資、我國的進出口總額保持不變,經濟活動人口與財政收入的偏相關系數為-0.673,其對應的P值檢驗為0.0120.05,經濟活動人口與財政收入之間存在顯著相關,當人均國內生產總值、經濟活動人口、我國的進出口總額保持不變,全社會固定資產投資與財政收入的偏相關系數為0.670,其P值檢驗為0.0
46、120.05,我國的進出口總額與財政收入的相關性不顯著。3.3回歸分析對數據進行回歸分析,得到如下結果:ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate11.000a.999.999.08605a.Predictors:(Constant),x4,x3,x2,x1解析:復相關系數為1,判定系數為0.999,調整系數為0.999,估計值的標準誤差為0.08605。ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression95.071423.7683.210E3.000aResi
47、dual.08111.007Total95.15315Predictors:(Constant),x4,x3,x2,x1DependentVariable:y解析:由上面結果的看其顯著性檢驗結果為,回歸平方和為95.071,殘差平方和0.081,總平方和95.153,F統計量的值為3.210E3,對應的概率P值為0.000,小于顯著性水平0.05,,即:人均國內生產總值x、經濟活動人口x、全社會固定資產投資x、我國123的進出口總額x與財政收入y之間存在線性關系,所以可認為所建立的回歸方程有效。4CoefficientsaModelUnstandardizedCoefficientsStand
48、ardizedCoefficientstSig.BStd.ErrorBeta1(Constant)13.2054.5592.897.015x11.385.333.7184.160.002x2-13.8444.586-.131-3.019.012x3.300.100.3972.997.012x4.018.076.013.233.820a.DependentVariable:y解析:由上圖可知,因變量y與常數項和自變量x,x,x,x的回歸的標準化回歸1234系數分別為13.205,1.385-13.844,0.300,0.018。4個回歸系數中可以看出x的顯著性4水平大于0.05,即自變量x對因變
49、量y的顯著性不明顯。而自變量x,x,x的P值4123檢驗均小于0.05,說明自變量x,x,x對因變量y有顯著性影響。123t檢驗:在給定的a=0.05,自由度n=13-2=11的臨界值時,查表得t11二2.2010.025可以看出常數項及自變量x,x,x的參數對應的t統計量的絕對值均大于2.201,這123說明5%的顯著性水平下,斜率系數均顯著不為0,表明人均國內生產總值x、經濟活動1人口x、全社會固定資產投資x等變量聯合起來對我國的財政收入y有顯著的影響。而23我國的進出口總額x的t值為0.233小于2.201,說明我國的進出口總額x對我國的財44政收入y的影響不顯著。所以需要對數據進行逐步
50、回歸,剔除影響不顯著的變量。未剔除不顯著變量時的回歸方程為:y二13.205+1.385x13.844x+0.3x+0.018x12343.4逐步回歸由上可知自變量進出口總額未通過檢驗,因此對數據進行逐步回歸的處理。逐步回歸模型是以已知地理數據序列為基礎,根據多元回歸分析法和求解求逆緊湊變換法及雙檢驗法而建立的能夠反映地理要素之間變化關系的最優回歸模型。逐步回歸分析是指在多元線性回歸分析中,利用求解求逆緊奏變換法和雙檢驗法,來研究和建立最優回歸方程的并用于地理分析和地理決策的多元線性回歸分析。它實質上就是多元線性回歸分析的基礎上派生出一種研究和建立最優多元線性回歸方程的算法技巧。主要含義如下:
51、1)逐步回歸分析的理論基礎是多元線性回歸分析法;2)逐步回歸分析的算法技巧是求解求逆緊奏變換法;3)逐步回歸分析的方法技巧是雙檢驗法,即引進和剔除檢驗法;4)逐步回歸分析的核心任務是建立最優回歸方程;5)逐步回歸分析的主要作用是降維。其主要用途:主要用于因果關系分析、聚類分析、區域規劃、綜合評價等等。對人均國內生產總值x、經濟活動人口x、全社會固定資產投資x、我國的進出口總額123x與財政收入y進行逐步回歸分析得:4VariablesEntered/RemovedaVariablesVariablesModelEnteredRemovedMethod1x1Stepwise(Criteria:P
52、robability-of-F-to-enter=.100).2Stepwise(Criteria:Probability-of-F-to-ent3x3er=.100).Stepwise(Criteria:Probability-of-F-to-entx2er=.100).a.DependentVariable:y解析:以上為逐步回歸每一步進入或剔除回歸模型中的變量情況。由上可以看出我國的進出口總額x4被剔除。其逐步回歸的順序為x,x.32ModelSummarydModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.998a.996.996.
53、155912.999b.998.998.1095431.000c.999.999.08259Predictors:(Constant),x1Predictors:(Constant),x1,x3Predictors:(Constant),x1,x3,x2DependentVariable:y解析:上表為逐步回歸每一步的回歸模型的統計量:R為相關系數,RSquare相關系的平方,又叫判定系數,判定線性回歸的擬合程度:這里可以看到自變量X,x2,x3的判丄厶O定系數分別為0.996,0.998,0.999,這說明自變量與因變量之間的擬合程度很好。AdjustedRSquare是調整后的判定系數,其
54、值與判定系數相同,最后一列是估計標準誤差,分別為0.156,0.109,0.083其值均很小,說明所選值之間的標準誤差很小。ANOVAdModelSumofSquaresdfMeanSquareFSig.1Regression94.813194.8133.900E3.000aResidual.34014.024Total95.153152Regression94.997247.4983.958E3.000bResidual.15613.012Total95.153153Regression95.071331.6904.646E3.000cResidual.08212.007Total95.15
55、315Predictors:(Constant),x1Predictors:(Constant),x1,x3Predictors:(Constant),x1,x3,x2DependentVariable:y解析:上表為方差分析表,及逐步回歸每一步的回歸模型的方差分析,可以看出其顯著性水平的概率均為0.000,表明此回歸模型極顯著。Coenicierrts-MnriftlUnstandardizedCoefficientsStandardizedCoefficientstSig.95%ConfidenceInternalforBBStd.ErrorBetaLowerBoundUpperBound
56、1(Constant)-.996.079-12.659.000-1.164-.3271.925.031.99862.454.0001.8591.9912(Constant)-.404.161-2.512.026-.751-.057x11.006.215.5635.047.000.6211.551.330.084.4373.919.002.148.5123(Constant)12.7753.9993.194.0084.06121.4091.446.196.7507.394.0001.0201.072x3.203.065.3754.346.001.141.425-13.4424.077-.128-
57、3.297.006-22.326-4.558解析:上表為回歸方程系數表,根據多元回歸模型:yp+Bx+Bx+Bx+Bx011223344通過SPSS作出的逐步回歸得到以上的結果,在統計顯著水平a0.05,則T檢驗值為t=2.201下,三個變量及常數項的t檢驗的絕對值分別為7.394,4.346,-3.297,3.194其絕對值均大于t=2.201,說明三個因子自變量的顯著性水平高。可得到的最優回歸方程為:y12.775+1.446x+0.283x-13.442x132Trend值為該區域中2000年到2012年的模擬值。該值可以通過最優方程式得出,比如2012年的值為y12.775+1.446
58、x4.89+0.283x11.38-13.442x1.078.68由上結果可以看出誤差較小,其誤差百分比在土20%以內的占比比較大,說明模擬效果還可以。求得的逐步回歸模型效果比較顯著。3.5小結通過SPSS操作最后得到的我國財政收入的預測方程式:y12.775+1.446x+0.283x-13.442x132再加上最后對數據的檢驗可以得出人均國內生產總值x、經濟活動人口x、全社會12固定資產投資x3對財政收入y有顯著的影響。從上面的操作可以看出變量通過初步的選取是不夠的,需要對所選自變量進行檢驗,然后剔除未通過檢驗的變量,所以在案例二較案例一的區別在于多了一個逐步回歸分析。即:眾所周知人均國內
59、生產總值,經濟活動人口,全社會固定投資都是逐年變化的,這里表現出的經濟活動人口為負指標,隨著社會的發展,中國的發展更是越來越迅速,這三個自變量之間存在著相對嚴密的關系。第四章總結及建議SPSS是世界上最早采用圖形菜單驅動界面的統計軟件,其最突出的特點就是操作界面極為友好,輸出結果美觀漂亮,是“統計產品與服務解決方案”軟件。除了數據錄入及部分命令程序等少數的輸入工作需要鍵盤鍵,而對于那些常見的統計方法,SPSS的命令語句、子命令及選擇項的大部分都是由“對話框”的操作完成。所以不需要花大量時間來記憶這些大量的命令、過程或選擇項。SPSS具有完整的數據輸入、編輯、統計分析、報表、圖形制作等功能,自帶11種類型136個函
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 代發企業活動方案
- 代理門檻活動方案
- 代賬公司漲價活動方案
- 以大帶小閱讀活動方案
- 仿課教研活動方案
- DB61T-牛羊無布魯氏菌病區建設 第3部分 檢查消毒站(點)編制說明
- 企業三聯系活動方案
- 企業人才進校園活動方案
- 企業八一活動方案
- 企業冬奧宣傳活動方案
- 【MOOC】心理學與生活-南京大學 中國大學慕課MOOC答案
- 酒店客房服務員培訓課件(演示)
- 新教科版科學四年級上冊實驗報告單(2020年適用-共30個試驗)
- 高斯算法(專題一)(專項練習)六年級下冊數學人教版
- 沖壓機床安全操作規程(3篇)
- 《形勢與政策》2022-2023學年 第二學期學習通超星期末考試答案章節答案2024年
- 城市軌道交通工程施工現場安全風險點清單
- 抖音直播帶貨合作協議書范本
- 2023年寧夏社區網格員真題九十天沖刺打卡單選題+多選題+填空題+判斷題+客觀題B卷
- 2024年四川省樂山市中考地理試卷(含答案)
- 2024年河南資本市場白皮書
評論
0/150
提交評論