應(yīng)用統(tǒng)計學(xué)(第二版)第 8 章 相關(guān)分析與回歸分析_第1頁
應(yīng)用統(tǒng)計學(xué)(第二版)第 8 章 相關(guān)分析與回歸分析_第2頁
應(yīng)用統(tǒng)計學(xué)(第二版)第 8 章 相關(guān)分析與回歸分析_第3頁
應(yīng)用統(tǒng)計學(xué)(第二版)第 8 章 相關(guān)分析與回歸分析_第4頁
應(yīng)用統(tǒng)計學(xué)(第二版)第 8 章 相關(guān)分析與回歸分析_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1第8章相關(guān)分析和回歸分析2相關(guān)分析(掌握)線性回歸分析(掌握)回歸模型的統(tǒng)計檢驗和預(yù)測(掌握)非線性回歸模型(了解)

主要內(nèi)容和學(xué)習(xí)目標(biāo)

38.1.1相關(guān)關(guān)系的概念和種類

1.相關(guān)關(guān)系的概念在社會經(jīng)濟發(fā)展變化中,客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,客觀現(xiàn)象(變量)之間的數(shù)量依存關(guān)系可分為兩種類型:確定性關(guān)系和相關(guān)關(guān)系。相關(guān)關(guān)系是指現(xiàn)象之間客觀存在的非確定性的數(shù)量依存關(guān)系。8.1相關(guān)分析4如:商品的消費量(y)與居民收入(x)之間的關(guān)系

變量間關(guān)系是不能用函數(shù)關(guān)系精確表達的,一個變量的取值不能由另一個變量唯一確定。各觀測點分布在直線周圍。52.相關(guān)關(guān)系的種類(1)按相關(guān)的方向可以分為正相關(guān)和負(fù)相關(guān)。(2)按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)。(3)按涉及的變量或因素的個數(shù)可以分為單相關(guān)與復(fù)相關(guān)。(4)按相關(guān)的表現(xiàn)形式可分為線性相關(guān)與非線性相關(guān)。6相關(guān)關(guān)系的種類的關(guān)系圖78.1.2

相關(guān)分析的圖表和意義

1、相關(guān)圖表相關(guān)表和相關(guān)圖可直觀地表達變量之間的相關(guān)關(guān)系的程度。相關(guān)表是將具有相關(guān)關(guān)系的原始數(shù)據(jù),按某一順序平行排列在一張表上,以觀察它們之間的相互關(guān)系。8表8-1高校人數(shù)和周邊飯店季營業(yè)額飯店學(xué)生人數(shù)(千人)x季營業(yè)額(千元)y飯店學(xué)生人數(shù)(千人)x季營業(yè)額(千元)y12586161372610572015738888201694811892214951211710262029相關(guān)圖也稱為分布圖或散點圖,它是在平面直角坐標(biāo)中把相關(guān)關(guān)系的原始數(shù)據(jù)用點描繪出來,通常以直角坐標(biāo)的橫軸代表自變量x,縱軸代表因變量y。相關(guān)圖所反映的變量之間的相關(guān)關(guān)系的方向和程序比相關(guān)表更為清晰,也更為直觀。10圖8-1學(xué)生人數(shù)和季營業(yè)額相關(guān)圖

11122.相關(guān)分析的意義(1)相關(guān)分析可以確定變量之間相關(guān)關(guān)系的方向和程度(2)相關(guān)分析可以衡量回歸估計的精確程度138.1.3簡單線性相關(guān)1.相關(guān)系數(shù)相關(guān)系數(shù)是描述相關(guān)的兩個變量之間相關(guān)關(guān)系密切程度的數(shù)量指標(biāo)。早在1890年,英國著名統(tǒng)計學(xué)家KarlPearson便提出了一個測定兩個變量線性相關(guān)的計算方法,通常稱為積差相關(guān)系數(shù)或簡單相關(guān)系數(shù)。14總體相關(guān)系數(shù):式中:——是變量X和Y的協(xié)方差——是變量X的標(biāo)準(zhǔn)差——是變量Y的標(biāo)準(zhǔn)差樣本相關(guān)系數(shù):15計算學(xué)生人數(shù)和季營業(yè)額的相關(guān)系數(shù)

【例8.2】利用表8-1的數(shù)據(jù),計算學(xué)生人數(shù)x(萬人)和季營業(yè)額y(萬元)的相關(guān)系數(shù)。162.相關(guān)系數(shù)的性質(zhì)

(1)(2)若,表示變量x與變量y為線性正相關(guān)關(guān)系;若,表示變量x與變量y為線性負(fù)相關(guān)關(guān)系。(3)若,表示兩變量完全線性相關(guān),即變量x與變量y之間存在確定的函數(shù)關(guān)系。若,表示兩變量完全線性正相關(guān);若,表示兩變量完全線性負(fù)相關(guān)。(4)若,表示兩變量不存在線性相關(guān)。17(5)當(dāng)時,表示兩變量存在不同程度的線性相關(guān)。的數(shù)值越接近于1,表示兩變量之間線性相關(guān)程度越高;反之的數(shù)值越接近于0,表示兩變量之間線性相關(guān)程度越低。通常認(rèn)為:微弱相關(guān);低度相關(guān)顯著相關(guān);高度相關(guān)(6)相關(guān)系數(shù)不受變量值水平和計量單位的影響。18根據(jù)給定的顯著性水平和自由度n-2,查找t分布中的相應(yīng)臨界值。如果,就否定原假設(shè),認(rèn)為r在統(tǒng)計上是顯著的,即總體相關(guān)系數(shù)不為零,總體變量間存在線性相關(guān)關(guān)系。3.相關(guān)系數(shù)的顯著性檢驗提出假設(shè):計算t檢驗統(tǒng)計量:

19檢驗高校學(xué)生人數(shù)與周邊飯店季營業(yè)額之間的相關(guān)系數(shù)是否顯著,顯著性水平

=0.05。第一步:提出假設(shè)第二步:構(gòu)造并計算檢驗統(tǒng)計量20第三步:確定臨界值。根據(jù)給定的顯著性水平

=0.05和自由度10-2=8,查找t分布表或利用Excel計算,得到臨界值。第四步:決策。由于所以拒絕原假設(shè),說明高校學(xué)生人數(shù)與周邊飯店季營業(yè)額之間存在著顯著的正線性相關(guān)關(guān)系。218.2.1回歸分析

回歸分析是根據(jù)已知變量估計未知變量的一種統(tǒng)計方法,它是以對未知變量(因變量)同其他變量(自變量)相互關(guān)系的觀察為基礎(chǔ),在某種精確度下,預(yù)測未知變量的數(shù)值。8.2

線性回歸分析22回歸分析的內(nèi)容和步驟:①選擇適當(dāng)?shù)幕貧w模型。②進行參數(shù)估計。③進行模型的檢驗。④進行預(yù)測。即根據(jù)回歸方程進行適當(dāng)?shù)慕?jīng)濟預(yù)測,這是回歸分析的最終目的。231.總體回歸方程與樣本回歸方程例:研究家庭消費支出與家庭收入之間的關(guān)系,一個總體由50戶家庭組成,并按人均月收入水平劃分成組內(nèi)收入水平大致相同的10個組。24圖8-4不同收入水平的家庭消費支出散點分布圖總體回歸線PRL隨機試驗所有可能結(jié)果的集合稱為總體或樣本空間第一節(jié)古典回歸模型由圖中看出總體回歸直線是線性的,用函數(shù)的形式來表示:

(1)

這是直線的數(shù)學(xué)表達式,在式(1)中,

E(Y|Xi)表示給定X值相應(yīng)的(或條件的)Y的均值,稱為Y的條件期望或條件均值下標(biāo)i代表第i個子總體。如,x=2時,y的條件均值為即收入水平為2000元的4個家庭的平均消費支出為1500元。第一節(jié)古典回歸模型注意:

E(Y|Xi)是Xi的函數(shù)(在此例中是線性函數(shù))。這意味著Y依賴于Xi,一般稱之為Y對X的回歸。回歸可簡單地定義為在給定X值的條件下Y值分布的均值。換句話說,總體回歸直線經(jīng)過Y的條件期望值。式(1)是總體回歸函數(shù)(PopulationRegressionFunction,PRF)的數(shù)學(xué)形式。在本例中,總體回歸函數(shù)是線性函數(shù)。第一節(jié)古典回歸模型

為參數(shù)(parameters),也稱回歸系數(shù)(regressioncoefficients)。

又稱為截距(intercept),是當(dāng)X為0時Y的均值

又稱為斜率(slope),斜率度量了X每變動一單位,Y

的均值的變化率。

例,如果斜率為0.5,那么,當(dāng)收入x每增加1單位(千元),Y的(期望)均值將增加0.5個單位(千元);即,平均而言,消費支出將增加0.5千元。

第一節(jié)古典回歸模型模型的隨機設(shè)定從圖中可看出單個家庭的消費支出與平均消費支出之間存在著一定的離差,即

(2)

其中,表示隨機誤差項(stochastic,randomerrorterm)或簡稱為誤差項。29表8-4從表8-3的總體中抽取一個隨機樣本

XYXY10.7763.2021.1074.0031.7084.3041.6594.5052.50106.0030圖8-5總體回歸線與樣本回歸線第一節(jié)古典回歸模型得到一條很好地“擬合”了樣本數(shù)據(jù)的直線,稱之為樣本回歸線(sampleregressionlines,SRL)。可能從K個不同的樣本中得到K條不同的樣本回歸直線,所有的這些樣本回歸線不可能都相同。每一條直線也最多是對真實總體回歸線的近似。第一節(jié)古典回歸模型用樣本回歸函數(shù)(sampleregressionfunction,SRF)來表示樣本回歸線。

(3)

表示總體條件均值,E(Y|Xi)的估計量;

表示

的估計量;

表示

的估計量;第一節(jié)古典回歸模型建立隨機的樣本回歸函數(shù):

(4)其中ei為殘差項(residualterm),或簡稱為殘差(residual)。第一節(jié)古典回歸模型回歸分析的主要目的是根據(jù)樣本回歸函數(shù)來估計總體回歸函數(shù),352.相關(guān)分析與回歸分析的聯(lián)系與區(qū)別(1)相關(guān)分析與回歸分析的聯(lián)系①相關(guān)分析和回歸分析具有共同的研究對象②相關(guān)分析和回歸分析需要相互補充③相關(guān)分析是回歸分析的前提④回歸分析是相關(guān)分析的拓展36(2)相關(guān)分析與回歸分析的區(qū)別①變量的地位不同②變量的性質(zhì)不同③研究的目的不同④研究的方法不同⑤所起的作用不同378.2.2一元線性回歸模型1.回歸模型的基本假定回歸模型是描述因變量如何依賴自變量和隨機誤差項的方程。一元線性回歸模型只涉及一個自變量,可表述為:第一節(jié)古典回歸模型隨機誤差項是服從正態(tài)分布的實隨機變量。零均值假定。即,同方差假定,即對于自變量所有觀察值,隨機誤差項

的方差都相同。非自相關(guān)假定,即與自變量不同觀察值對應(yīng)的隨機誤差項之間是互不相關(guān)、互不影響的自變量變量與隨機誤差項不相關(guān)假定。無多重共線性假定。回歸模型的基本假定2.最小二乘估計(OLS)

殘差是Yi的真實值與估計值之差,即普通最小二乘法(ordinaryleastsquares,OLS),即選擇參數(shù)

和,使得全部觀察值的殘差平方和最小。用數(shù)學(xué)形式表示為:最小二乘原理就是所選樣本回歸函數(shù)使得所有Y的估計值與真實值差的平方和最小。求解聯(lián)立方程解得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論