相關分析和回歸分析SPSS實現doc_第1頁
相關分析和回歸分析SPSS實現doc_第2頁
相關分析和回歸分析SPSS實現doc_第3頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、相關分析與回歸分析、試驗目標與要求本試驗項目的目的是學習并使用 SPSS軟件進行相關分析與回歸分析,具體 包括:(1) 皮爾遜pearson簡單相關系數的計算與分析(2) 學會在SPS上實現一元及多元回歸模型的計算與檢驗。(3) 學會回歸模型的散點圖與樣本方程圖形。(4) 學會對所計算結果進行統計分析說明。(5) 要求試驗前,了解回歸分析的如下內容。參數a、B的估計回歸模型的檢驗方法:回歸系數B的顯著性檢驗(t 檢驗);回歸 方程顯著性檢驗(F 檢驗)。二、試驗原理1相關分析的統計學原理相關分析使用某個指標來表明現象之間相互依存關系的密切程度。 用來測度 簡單線性相關關系的系數是Pearson

2、簡單相關系數。2回歸分析的統計學原理 相關關系不等于因果關系,要明確因果關系必須借助于回歸分析。回歸分析 是研究兩個變量或多個變量之間因果關系的統計方法。 其基本思想是, 在相關分 析的基礎上,對具有相關關系的兩個或多個變量之間數量變化的一般關系進行測 定,確立一個合適的數據模型, 以便從一個已知量推斷另一個未知量。 回歸分析 的主要任務就是根據樣本數據估計參數, 建立回歸模型, 對參數與模型進行檢驗 與判斷,并進行預測等。線性回歸數學模型如下:yi0 1 xi1 2x i2k xik i在模型中,回歸系數是未知的,可以在已有樣本的基礎上,使用最小二乘法 對回歸系數進行估計,得到如下的樣本回歸

3、函數:? ? ? ?yi 0 1xi1 2xi2k xik ei回歸模型中的參數估計出來之后,還必須對其進行檢驗。如果通過檢驗發現 模型有缺陷, 則必須回到模型的設定階段或參數估計階段, 重新選擇被解釋變量 與解釋變量及其函數形式,或者對數據進行加工整理之后再次估計參數。回歸模 型的檢驗包括一級檢驗與二級檢驗。 一級檢驗又叫統計學檢驗,它是利用統計學 的抽樣理論來檢驗樣本回歸方程的可靠性,具體又可以分為擬與優度評價與顯著 性檢驗;二級檢驗又稱為經濟計量學檢驗,它是對線性回歸模型的假定條件能否 得到滿足進行檢驗,具體包括序列相關檢驗、異方差檢驗等。三、試驗演示內容與步驟1 連續變量簡單相關系數的

4、計算與分析在上市公司財務分析中,常常利用資產收益率、凈資產收益率、每股凈收益 與托賓Qfi4個指標來衡量公司經營績效。本試驗利用 SPS對這4個指標的相關性 進行檢驗。操作步驟與過程:打開數據文件“上市公司財務數據(連續變量相關分析).sav ” ,依次選擇 “【分析】-【相關】-【雙變量】”打開對話框如圖,將待分析的4個指標移入右邊的變量列表框內。其他均可選擇默認項,單擊 ok提交系統運行。圖 5.1 Bivariate Correlations 對話框結果分析:表給出了 Pearson簡單相關系數,相關檢驗t統計量對應的p值。相關系數右上 角有兩個星號表示相關系數在0.01的顯著性水平下顯

5、著。從表中可以看出,每股收益、凈資產收益率與總資產收益率3個指標之間的相關系數都在0.8以上,對應 的p值都接近0,表示3個指標具有較強的正相關關系,而托賓 0值與其他3個變量 之間的相關性較弱。表5.1 Pearson簡單相關分析Correlations每股收益率凈資產收益率資產收益率托賓Q值每股收益率Pearson1.877(*).824(*)-.073CorrelationSig. (2-tailed).000.000.199N315315315315凈資產收益率Pearson.877(*)1.808(*)-.001CorrelationSig. (2-tailed).000.000.9

6、83N315315315315資產收益率Pearson.824(*).808(*)1.011CorrelationSig. (2-tailed).000.000.849N315315315315托賓Q值Pearson-.073-.001.0111CorrelationSig. (2-tailed).199.983.849N315315315315* Correlation is significant at the 0.01 level (2-tailed).2元線性回歸分析實例分析:家庭住房支出與年收入的回歸模型在這個例子里,考慮家庭年收入對住房支出的影響,建立的模型如下:yixi i其中,

7、yi是住房支出,xi是年收入 線性回歸分析的基本步驟及結果分析:(1) 繪制散點圖 打開數據文件,選擇【圖形】-【舊對話框】-【散點/點狀】,如圖5.2所示圖5.2散點圖對話框選擇簡單分布,單擊定義,打開子對話框,選擇X變量與Y變量,如圖5.3所示單擊ok提交系統運行,結果見圖5.4所示圖 5.3 Simple Scatterplot 子對話框從圖上可直觀地看出住房支出與年收入之間存在線性相關關系7 00-6 005 004 003 00-681 00-80080 86.00 BOO 10.0012.0014.0016.0018.0020 00年收入圖5.4散點圖(2)簡單相關分析選擇【分析】

8、一【相關】一【雙變量】,打開對話框,將變量“住房支出” 與“年收入”移入variables列表框,點擊ok運行,結果如表5.2所示表5.2住房支岀與年收入相關系數表Correlations住房支岀(千美元)年收入(千美元)住房支岀(千美元)Pearson Correlation1.966(*)Sig. (2-tailed).000N2020年收入(千美元)Pearson Correlation.966(*)1Sig. (2-tailed).000N2020* Correlation is significant at the 0.01 level (2-tailed).從表中可得到兩變量之間的

9、皮爾遜相關系數為0.966,雙尾檢驗概率p值尾0.0000.05,故變量之間顯著相關。根據住房支出與年收入之間的散點圖與相關 分析顯示,住房支出與年收入之間存在顯著的正相關關系。在此前提下進一步進行回歸分析,建立一元線性回歸方程。(3)線性回歸分析步驟1:選擇菜單【分析】一【回歸】一【線性】”,打開Linear Regression 對話框。將變量住房支出y移入Dependent列表框中,將年收入x移入Independents 列表框中。在Method框中選擇Enter選項,表示所選自變量全部進入回歸模型。圖 5.5 Lin ear Regresssi on 對話框步驟2:單擊Statisti

10、cs 按鈕,如圖在Statistics子對話框。該對話框中設置要輸出的統計量。這里選中估計、模型擬合度復選框。圖5.6 Statistics 子對話框估計:輸出有關回歸系數的統計量,包括回歸系數、回歸系數的標準 差、標準化的回歸系數、t統計量及其對應的P值等。置信區間:輸出每個回歸系數的95%的置信度估計區間。協方差矩陣:輸出解釋變量的相關系數矩陣與協差陣。模型擬合度:輸出可決系數、調整的可決系數、回歸方程的標準誤差、 回歸方程F檢驗的方差分析。步驟3:單擊繪制按鈕,在Plots子對話框中的標準化殘差圖選項欄中選中正 態概率圖復選框,以便對殘差的正態性進行分析。圖5.7 plots 子對話框步

11、驟4:單擊保存按鈕,在Save子對話框中殘差選項欄中選中未標準化復選框, 這樣可以在數據文件中生成一個變量名尾res_1的殘差變量,以便對殘差進行進 一步分析。圖5.8 Save子對話框其余保持Spss默認選項。在主對話框中單擊ok按鈕,執行線性回歸命令,其 結果如下:表5.3給出了回歸模型的擬與優度(RSquare)、調整的擬與優度(Adjusted R Square)、估計標準差(Std. Error of the Estimate )以及 Durbin Watson 統計量。從結果來看,回歸的可決系數與調整的可決系數分別為0.934與0.93 ,即住房支出的90%以上的變動都可以被該模型

12、所解釋,擬與優度較高。表5.4給出了回歸模型的方差分析表,可以看到,F統計量為252.722,對應的 p值為0,所以,拒絕模型整體不顯著的原假設,即該模型的整體是顯著的。表5.5給出了回歸系數、回歸系數的標準差、標準化的回歸系數值以及各個回 歸系數的顯著性t檢驗。從表中可以看到無論是常數項還是解釋變量x,其t統計量對應的p值都小于顯著性水平0.05,因此,在0.05的顯著性水平下都通過了 t 檢驗。變量x的回歸系數為0.237,即年收入每增加1千美元,住房支出就增加0.237 千美元。表5.3回歸模型擬與優度評價及 Durbin Watson檢驗結果Model Summary(b)ModelR

13、R SquareAdjusted RSquareStd. Error of the Estimate1.966(a).934.930.37302a Predictors: (Constant),年收入(千美元) b Dependent Variable:住房支出(千美元)表5.4方差分析表ANOVA(b)ModelSum ofSquaresdfMean SquareFSig.1Regression35.165135.165252.722.000(a)Residual2.50518.139Total37.67019a Predictors: (Constant), 年收入(千美元) b Depe

14、ndent Variable: 住房支出(千美元)表5.5回歸系數估計及其顯著性檢驗Coefficients(a)ModelUnstandardizedCoefficientsStandardizedCoefficientsBetatSig.BStd. Error1(Constant).890.2044.356.000年收入(千美元).237.015.96615.897.000a Dependent Variable:住房支出(千美元)為了判斷隨機擾動項是否服從正態分布,觀察圖5.9所示的標準化殘差的P P圖,可以發現,各觀測的散點基本上都分布在對角線上, 據此可以初步判斷殘差 服從正態分布為

15、了判斷隨機擾動項是否存在異方差,根據被解釋變量 y與解釋變量x的散點 圖,如圖5.4所示,從圖中可以看到,隨著解釋變量x的增大,被解釋變量的波動 幅度明顯增大,說明隨機擾動項可能存在比較嚴重的異方差問題, 應該利用加權 最小二乘法等方法對模型進行修正。Normal P-P Plot of Regressi on Stan dardized ResidualDependent Variable:住房支出 (千美元)1.0 -0.8 -uc deLceDKC0.6 -0.40.20.0 -0.00.20.40.60.81.0Observed Cum Prob圖5.9標準化殘差的P-P圖四、備擇試驗現有19872003年湖南省全社會固定資產投資總額 NINV與GD兩個指標的年 度數據,見下表。試研究全社會固定資產投資總額與 GD的數量關系,并建立全 社會固定資產投資總額與GD之間的線性回歸方程。湖南省全社會固定資產投資與GD年度數據年份GDP(億元)NINV (億元)年份GDP(億元)NINV(億元)1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論