應用商務統計-線性回歸_第1頁
應用商務統計-線性回歸_第2頁
應用商務統計-線性回歸_第3頁
應用商務統計-線性回歸_第4頁
應用商務統計-線性回歸_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、首都經濟貿易大學統計學院背景、目標、變量和分析背景、目標、變量和分析案例背景目前中國的資本市場逐漸成熟,投資于股市成為眾多企業乃至個人的重要理財方式。因此就成為投資人最重要的決策依據。本案例隨機抽取深市和滬市2002年和2003年各500個樣本,對上市公司的凈資產收益率(return on equity, ROE)進行預測。案例目標與變量目標:盈利預測因變量:下一年的凈資產收益率(ROE)自變量:當年的財務信息 樣本容量:2002年500;2003年500 自變量ROEt: 當年凈資產收益率當年凈資產收益率ATO: 資產周轉率資產周轉率(asset turnover ratio)LEV: 債務

2、資本比率債務資本比率(debt to asset ratio)反映公司基本債務狀況PB: 市倍率市倍率(price to book ratio)反映公司預期未來成長率ARR: 應收賬款應收賬款/ /主營業務收入主營業務收入(account receivable over total income)反映公司的收入質量自變量PM: 主營業務利潤主營業務利潤/ /主營業務收入主營業務收入(profit margin)反映公司利潤狀況GROWTH: 主營業務增長率主營業務增長率(sales growth rate)反映公司已實現的當年增長率INV: 存貨存貨/ /資產總計資產總計(inventory

3、to asset ratio)反映公司的存貨狀況ASSET: (對數)資產總計(對數)資產總計(log-transformed asset)反映公司的規模對模型的進一步分析哪個自變量在預測方面最有用?哪個自變量是最重要的?如何使用模型進行預測?獲得對數據的整體性認識獲得對數據的整體性認識讀取數據在SPSS中打開數據文件roe.sav在R環境下將數據讀入系統并顯示,使用如下語句:數據的概括性度量SPSS:Analyze Descriptive Statistics ExploreR語句:變量間相關性分析SPSS:Analyze Correlate BivariateR語句:SPSS:Graph

4、ScatterR語句: plot(a1$ROEt,a1$ROE)模型、假設和參數估計模型、假設和參數估計模型形式及假設線性回歸模型模型假設獨立性假設同方差假設正態性假設iippiiixxxy22110參數估計模型:最小二乘估計量:方差估計量:iippiiixxxy22110222110ippiiixxxyRSS12pnRSS擬合優度 總平方和殘差平方和R-Square2yySSTi2iiyySSESSTSSER12參數估計的軟件實現SPSS:Analyze Regression LinearR語句:lm1=lm(ROEROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSE

5、T,data=a1) summary(lm1)F檢驗假設檢驗統計量拒絕域iHvsiHii0:0:10,1/1p n pSSTSSEpFFSSEnp ,1,1p n pFF T檢驗假設檢驗統計量拒絕域0:0:10iiHvsH 1in pTtv x 2/1 , 1pntT顯著性檢驗的結論從F檢驗的結果看,模型的線性關系是顯著的。從T檢驗的結果看,ROEt和LEV兩個變量通過了檢驗,GROWTH變量在顯著性水平降至0.1時也可以通過檢驗,因此這三個變量與因變量的線性關系較為顯著。注意,這不說明應該刪除其它變量!注意,這不說明應該刪除其它變量!異方差性、非正態性、異常值同方差性檢驗同方差性檢驗同方差性

6、檢驗同方差性檢驗正態性檢驗若 , 并且則有),(2Nt qPtqPt正態性檢驗,zq. zq進一步可以得到以及所以在正態性假設下,殘差 與 應該成線性關系。zt正態性檢驗殘差:將殘差排序:Y:X:n,21 n21 n,21nnnnzzz/2/1,將上面的方法應用于本案例目標1:檢驗模型是否符合三個假設目標2:找出異常值SPSS實現方法:以預測值為X軸,殘差為Y軸畫散點圖;畫Q-Q圖R語句:par(mfrow=c(2,2)#設置畫圖為2x2的格式 plot(lm1,which=c(1:4) #畫出lm1中對應于模型檢驗的4張圖,包括殘差圖、QQ圖和Cook距離圖檢驗發現47號數據為異常值,需要將

7、其消除 語句:a1=a1(-47)含義及檢驗什么是多重共線性?如果存在如下回歸方程能不能把它變成下面這樣如果對這個方程進行回歸會發生什么事?bxayxbxbay21第一個例子假如有兩個變量x1和x2,用最小二乘法得到如下參數估計量。第二個例子假如有三個變量x1、x2和x3,用最小二乘法得到如下參數估計量。方差膨脹因子定義下面的回歸形式為輔助回歸令 為輔助回歸的判定系數則方差膨脹因子為:它反映了在多大程度上第i個自變量所包含的信息被其他自變量覆蓋2iRexbaxijjji211iiRVIF方差膨脹因子R語句:所有的VIF值都小于10且接近1,所以沒有多重共線性問題。AIC 和 BICAIC方法比較保守,其中p為自變量個數,與RSS成反比。使AIC達到最小的模型是最優的BIC相對不那么保守,因此保留的變量可能會比較少。log1log 22RSSAICnpn log1 log 2logRSSB

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論