相關性分析及回歸分析_第1頁
相關性分析及回歸分析_第2頁
相關性分析及回歸分析_第3頁
相關性分析及回歸分析_第4頁
相關性分析及回歸分析_第5頁
已閱讀5頁,還剩24頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、12q相關分析、回歸分析等數據處理與分析的方法。q掌握相關性分析理論及模型建立的方法q理解相關系數等參數的經濟意義q掌握回歸分析理論及模型建立的方法q理解擬合度等相關參數的意義qExcel學習重點qExcel中的數據分析工具q回歸q相關系數3q相關分析是對兩個變量之間線形關系的描述與度量q變量之間是否存在關系?q如果存在關系,他們之間是什么樣的關系?q變量之間的關系強度如何?q樣本所反映的變量之間的關系能否代表總體變量之間的關系?q相關分析步驟q繪制散點圖判斷變量之間的關系形態q如果是線形相關,可以用相關系數來度量兩個變量之間的關系強度q對相關系數進行顯著性檢驗,以判斷樣本所反映的關系是否能用

2、來代表兩個變量總體上的關系。4q通過圖形方式對變量之間的關系形態進行大致的描述qA-正相關:一個變量增加或減少時,另一個變量也相應增加或減少;qB-負相關:一個變量增加或減少時,另一個變量卻減少或增加;qC-非線性相關:變量之間的關系近似地表現為一條曲線;qD-無相關:說明兩個變量是獨立的,即由一個變量值,無法預測另一個變量值。(a)(b)(c)(d)5q相關系數:根據樣本數據計算的兩個變量之間線形相關程度的統計量,用符號“r來表示。)()()()YY()XX()YY)(XX()SS)(SS(SSr222222YYXXXYnYYnXXnYXXY6q相關系數r是對兩變量線性相關的測量,數值的范圍

3、從-1到0,到+1,表達變量間的相關強度。qr值為+1表示兩組數完全正相關qr值為-1表示兩組數完全負相關,說明它們間存在反向關系,一個變量變大時另外一個就變小q當r值為0時表示兩變量之間不存在線性關系q相關系數取值范圍限于:r qExcel中計算相關系數有兩種方法qExcel數據分析功能qCORREL()函數7q文件/選項/Excel選項q加載項/分析工具庫/Excel加載項/單擊“跳轉”q在加載宏對話框中勾選“分析工具庫”8q根據表中的數據計算不良貸款、貸款余額、累計應收貸款、貸款項目個數、固定資產投資額之間的相關系數q法1:數據/數據分析/相關系數/做如下圖所示設置q可見,不良貸款與各項

4、貸款余額的相關性最高q法2-利用CORREL()函數也可以求出上述任意兩個變量之間的相關系數q=CORREL(Array1,Array2)qarray1和 array2為需要確定相關性的兩組數據q兩種方法的區別q方法1可以求出一批變量之間的相關系數q方法2只可以求出2個變量之間的相關系數10q回歸分析側重考察變量之間的數量伴隨關系,并通過建立變量之間的數學表達式將這種關系描述出來,進而確定一個或幾個自變量的變化對另一個特定變量(因變量)的影響程度,從而由自變量的取值預測因變量的可能值。q從一組樣本數據出發,確定變量之間的數學關系式。q對該關系式的可信度進行各種統計檢驗,并從影響某一特定變量的諸

5、多變量中找出哪些變量的影響是顯著的,哪些是不顯著的。q利用所求的關系式,根據一個或幾個變量的取值來估計或預測另一個特定變量的取值,并給出這種估計或預測的可靠程度。q回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析。按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。11q回歸基本上可視為一種擬合過程,即用最恰當的數學方程去擬合一組由一個因變量和一個或多個自變量所組成的原始數據。q最簡單的形式是線性回歸,它有一個因變量和一個自變量,因此就是用一個線性方程y=a+bx+去擬合一系列對變量x和y的數據觀察值的過程。 xy1x( ,)iix y( ,)iix yyab

6、x1213 1415q根據數據建立散點圖q自變量放在X軸,因變量放在Y軸q簡單線性擬合q添加趨勢線(類型為“線性”),選定“顯示公式”和“顯示R2值” q得到趨勢線(線性)方程和R216q加載宏分析工具庫q數據數據分析回歸q在“回歸”對話框輸入X值和Y值的區域q選擇“標志”q確定輸出區域q將X代入線性方程,進行預測qX=210,Y=1379.37217判定系數R2 是對估計的回歸方程擬合優度的度量,取值范圍0,1。 R2越接近1,表明回歸直線與觀測點越接近,回歸直線的擬合程度越好。R2 = 0.8463=84.63%50%說明方程擬合程度較好18q已知一種新牌子化肥的不同施用量對莊稼產量的影響

7、如下表。請你確定當化肥施用量為5.5克時估計預期的產量。化肥施用量x (克)012345678910產量 (公斤)0.210.350.410.460.50.520.530.530.530.510.4919q根據數據建立散點圖q自變量放在X軸,因變量放在Y軸q添加趨勢線q類型為多項式 q選定“顯示公式”和“顯示R2值”q結果很明顯,擬合程度從線性方程的60%提高到二次方程的97%。q反映出觀察到的飽和程度。產量與化肥施用量y = -0.0066x2 + 0.0897x + 0.2419R2 = 0.974200.10.20.30.40.50.6024681012化肥(克)產量(公斤)20q假設莊

8、稼以每公斤4元的價格出售,化肥要以每克0.2元的價格購買。請確定能產生最大利潤的化肥施用量。(運用規劃求解)q總收益=價格產量=4元(-0.0066X2+0.0897x+0.2419)q總成本=化肥成本化肥施用量=0.2X21q多元線性回歸模型的一般形式 q多元線性回歸預測步驟 22q某一生產空調的企業將其連續15年的銷量和員工的薪酬及當地的平均戶總收入情況的數據作了一個匯總,這些數據顯示在工作表“多元回歸補充”中。該企業的管理人員試圖根據這些數據找到銷量與其他兩個變量之間的關系,以便進行銷量的預測并為未來的預算工作提供參考。試根據這些數據分析一下,建立何種模型比較合適,并假設未來某年員工的薪

9、酬為25萬元,平均戶總收入為33.4的情況下,預測該年的銷量。23R2 = 0.9984=99.84%50%說明方程擬合程度較好q建立回歸方程q銷量=5.92*員工薪酬+8.65*平均戶總收入+105.44q預測值= 5.92* 250+8.65* 33.4 +105.44q利用示例1中的數據,構建不良貸款對其他變量的估計方程。置信度為95%。q數據-數據分析-回歸q以不良貸款為因變量q以各項貸款余額、本年累計應收貸款、貸款項目個數、本年固定資產投資額為自變量q進行回歸模型估計2425q可見,需要剔除本年累計應收貸款、貸款項目個數、本年固定資產投資額3個自變量q只用各項貸款余額作為自變量構建回

10、歸模型26q構建不良貸款對貸款余額的估計方程qy=-0.82929+0.03789xq回歸系數0.03789表示貸款余額每增加1億元,不良貸款平均增加0.03789億元27q課堂練習:示例1-6q作業:P200-2、3、5,7,9、11、17、18q所有用到的數據請自行安排組織寫入到excel,每個題目一個工作表q在做回歸分析時,不要只擺結果,也請認真做好分析q是否可以構建回歸方程-R2、F、t統計量的分析q回歸方程是什么q如果需要進行預測,請寫出預測結果q國內生產總值(GDP)和國民生產總值(GNP)在經濟學中常作為衡量國家或地區經濟發展綜合水平的重要指標。對影響GDP的幾個重要因素進行分析,可以為我國國民經濟發展走勢提供理論與數據支持。qGDP的計算方法一般有支出法和收入法。支出法核算GDP,就是從產品的使用出發,把一年內購買的各項最終產品的支出加總而計算出的該年內生產的最終產品的市場價值。在現實生活中,產品和勞務的最后使用,主要是居民消費、企業投資、政府購買和出口。考慮到數據的可得性,考慮選取全社會固定資產投資、社會消費品零售額、進出口貿易總額、地方財政收入這四個變量作為解釋變量來研究GDP的變化情況。q上海對外貿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論