第二章簡單線性回歸模型_第1頁
第二章簡單線性回歸模型_第2頁
第二章簡單線性回歸模型_第3頁
第二章簡單線性回歸模型_第4頁
第二章簡單線性回歸模型_第5頁
已閱讀5頁,還剩35頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1

第二章

簡單線性回歸模型

計量經濟學引子:中國旅游業總收入將超過3000億美元嗎?

未來我國旅游需求將快速增長,根據中國政府所制定的遠景目標,到2020年,中國入境旅游人數將達到2.1億人次;國際旅游外匯收入580億美元,國內旅游收入2500億美元。到2020年,中國旅游業總收入將超過3000億美元,相當于國內生產總值的8%至11%。(來源:《2008年中國旅行社發展研究咨詢報告》)

(參考現狀:第一產業占GDP的15%,建筑業占GDP的7%)●什么決定性因素能使中國旅游業總收入超過3000億美元?●旅游業的發展與這種決定性因素的數量關系究竟是什么?●怎樣具體測定旅游業發展與這種決定性因素的數量關系?23

第一節回歸分析與回歸函數

一、相關分析與回歸分析

1、經濟變量之間的相互關系

性質上可能有三種情況:◆確定性的函數關系

Y=f(X)可用數學方法計算◆不確定的統計關系—相關關系

Y=f(X)+ε(ε為隨機變量)可用統計方法分析

◆沒有關系不用分析

◆相關關系的描述

最直觀的描述方式——坐標圖(散布圖、散點圖))

4函數關系相關關系(線性)沒有關系相關關系(非線性)2、相關關系55

相關關系的類型

從涉及的變量數量看

簡單相關多重相關(復相關)●

從變量相關關系的表現形式看

線性相關——散布圖接近一條直線非線性相關——散布圖接近一條曲線●

從變量相關關系變化的方向看

正相關——變量同方向變化,同增同減負相關——變量反方向變化,一增一減不相關6

3、相關程度的度量—相關系數

如果和總體的全部數據都已知,和的方差和協方差也已知,則

X和Y的總體線性相關系數:

其中:-----X的方差-----Y的方差-----X和Y的協方差特點:●總體相關系數只反映總體兩個變量

的線性相關程度●對于特定的總體來說,

的數值是既定的,總體相關系數

是客觀存在的特定數值。●總體的兩個變量

和的全部數值通常不可能直接觀測,所以總體相關系數一般是未知的。

7如果只知道X和Y的樣本觀測值,則X和Y的樣本線性相關系數為:

其中:和分別是變量X和Y的樣本觀測值,和分別是變量X和Y樣本值的平均值注意:是隨抽樣而變動的隨機變量。X和Y的樣本線性相關系數:相關系數較為簡單,也可以在一定程度上測定變量間的數量關系,但是對于具體研究變量間的數量規律性還有局限性。

X和Y都是相互對稱的隨機變量,●

線性相關系數只反映變量間的線性相關程度,不能說明非線性相關關系●

樣本相關系數是總體相關系數的樣本估計值,由于抽樣波動,樣本相關系數是隨抽樣而變動的隨機變量,其統計顯著性還有待檢驗

8對相關系數的正確理解和使用94、回歸分析回歸的古典意義:

高爾頓遺傳學的回歸概念

(父母身高與子女身高的關系)子女的身高有向人的平均身高"回歸"的趨勢回歸的現代意義:一個被解釋變量對若干個解釋變量依存關系的研究回歸的目的(實質):由解釋變量去估計被解釋變量的平均值10●被解釋變量Y的條件分布和條件概率:

當解釋變量X取某固定值時(條件),Y的值不確定,Y的不同取值會形成一定的分布,這是Y的條件分布。

X取某固定值時,Y取不同值的概率稱為條件概率。●被解釋變量Y的條件期望:對于X

的每一個取值,對Y所形成的分布確定其期望或均值,稱為Y的條件期望或條件均值,用表示。注意:Y的條件期望是隨X的變動而變動的

YX明確幾個概念(為深刻理解“回歸”)11●回歸線:對于每一個X的取值,都有Y的條件期望

與之對應,代表Y的條件期望的點的軌跡形成的直線或曲線稱為回歸線。●回歸函數:被解釋變量Y的條件期望

隨解釋變量X的變化而有規律的變化,如果把Y的條件期望表現為X的某種函數

,這個函數稱為回歸函數。回歸函數分為:總體回歸函數和樣本回歸函數

X

Y12每月家庭可支配收入

X2000250030003500400045005000550060006500131215301631184320372277246929243515352113401619172619742210238828893338372139541400171317862006232525263090365038654108每1548175018352265241926813156380240264345月1688181418852367252228873300408741654812家173819851943248526653050332142984380庭180020412037251527993189365443124580消19022186207826892887335338424413費220021792713291335344074支231222982898303837104165出2316292331673834

Y238730533310249831873510268932861591191520922586275430393396385340364148舉例:假如已知由100個家庭構成的總體的數據

(單位:元)二、總體回歸函數(PRF)13消費支出的條件期望與收入關系的圖形對于本例的總體,家庭消費支出的條件期望與家庭收入基本是線性關系,可以把家庭消費支出的條件均值表示為家庭收入的線性函數:14

1.總體回歸函數的概念

前提:假如已知所研究的經濟現象的總體的被解釋變量Y和解釋變量X的每個觀測值,那么,可以計算出總體被解釋變量Y的條件期望并將其表現為解釋變量X的某種函數這個函數稱為總體回歸函數(PRF)

本質:

總體回歸函數實際上表現的是特定總體中被解釋變量隨解釋變量的變動而變動的某種規律性。

計量經濟學的根本目的是要探尋變量間數量關系的規律,也就要努力去尋求總體回歸函數。15

●條件期望表現形式例如Y的條件期望是解釋變量X的線性函數,可表示為:

●個別值表現形式(隨機設定形式)對于一定的,Y的各個別值并不一定等于條件期望,而是分布在的周圍,若令各個與條件期望的偏差為,顯然是個隨機變量則有

2.總體回歸函數的表現形式PRF●作為總體運行的客觀規律,總體回歸函數是客觀存在的,但在實際的經濟研究中總體回歸函數通常是未知的,只能根據經濟理論和實踐經驗去設定。計量經濟學研究中“計量”的根本目的就是要尋求總體回歸函數。●我們所設定的計量模型實際就是在設定總體回歸函數的具體形式。●總體回歸函數中Y與X的關系可以是線性的,也可以是非線性的。

163.如何理解總體回歸函數17計量經濟學中,線性回歸模型的“線性”有兩種解釋:◆就變量而言是線性的:Y的條件期望(均值)是X的線性函數

◆就參數而言是線性的:Y的條件期望(均值)是參數β的線性函數

注意:在計量經濟學中,線性回歸模型主要指就參數而言是“線性”的,只要對參數而言是線性的,都可以歸于線性回歸。“線性”的判斷◆概念

在總體回歸函數中,反映除X以外其他所有因素對Y

的影響。◆性質

是其期望為0具有一定分布的隨機變量重要性:隨機擾動項的性質決定著計量經濟分析結

果的性質和計量經濟方法的選擇18

三、隨機擾動項●是未知影響因素的代表(理論的模糊性)●

是無法取得數據的已知影響因素的代表(數據欠缺)●

是眾多細小影響因素的綜合代表(非系統性影響)●

模型可能存在設定誤差(變量、函數形式的設定)●

模型中變量可能存在觀測誤差(變量數據不符合實際)●

變量可能有內在隨機性(人類經濟行為的內在隨機性)19引入隨機擾動項的原因樣本回歸線:

對于X的一定值,取得Y的樣本觀測值,可計算其條件均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數:如果把被解釋變量Y的樣本條件均值

表示為解釋變量X的某種函數,這個函數稱為樣本回歸函數(SRF)

20XYSRF四、樣本回歸函數(SRF)21

樣本回歸函數如果為線性函數,可表示為

其中:是與相對應的Y的樣本條件均值和分別是樣本回歸函數的參數

個別值(實際值)形式:被解釋變量Y的實際觀測值不完全等于樣本條件均值,二者之差用表示,稱為剩余項或殘差項:則或樣本回歸函數的函數形式條件均值形式:●樣本回歸線隨抽樣波動而變化:每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,(SRF不唯一)

●樣本回歸函數的函數形式應與設定的總體回歸函數的函數形式一致。

●樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸線,它至多只是未知的總體回歸線的近似表現。22樣本回歸函數的特點

SRF1SRF2

YX

A

X

23PRFSRF樣本回歸函數與總體回歸函數的關系

如果能夠通過某種方式獲得和的數值,顯然:●和是對總體回歸函數參數和的估計●是對總體條件期望的估計●

在概念上類似總體回歸函數中的,可視

為對的估計。24對比:

總體回歸函數

樣本回歸函數對樣本回歸的理解25

目的:

計量經濟分析的目標是尋求總體回歸函數。即用樣本回歸函數SRF去估計總體回歸函數PRF。由于樣本對總體總是存在代表性誤差,SRF總會過高或過低估計PRF。要解決的問題:尋求一種規則和方法,使其得到的SRF的參數和盡可能“接近”總體回歸函數中的參數和的真實值。這樣的“規則和方法”有多種,如矩估計、極大似然估計、最小二乘估計等。其中最常用的是最小二乘法。回歸分析的目的

一、簡單線性回歸的基本假定

為什么要作基本假定?●只有具備一定的假定條件,所作出的估計才具有良好的統計性質。●模型中有隨機擾動項,估計的參數是隨機變量,顯然參數估計值的分布與擾動項的分布有關,只有對隨機擾動的分布作出假定,才能比較方便地確定所估計參數的分布性質,也才可能進行假設檢驗和區間估計等統計推斷。假定分為:◆對模型和變量的假定◆對隨機擾動項的假定

26第二節簡單線性回歸模型的最小二乘估計例如對于

●假定模型設定是正確的(變量和模型無設定誤差)●假定解釋變量X在重復抽樣中取固定值。

●假定解釋變量X是非隨機的,或者雖然X是隨機的,但與擾動項u是不相關的。(從變量X角度看是外生的)注意:解釋變量非隨機在自然科學的實驗研究中相對容易滿足,經濟領域中變量的觀測是被動不可控的,X非隨機的假定并不一定都滿足。271.對模型和變量的假定

假定1:零均值假定:

在給定X的條件下,的條件期望為零

假定2:同方差假定:

在給定X的條件下,的條件方差為某個常數

28X

Y2.對隨機擾動項u的假定29

假定3:無自相關假定:

隨機擾動項的逐次值互不相關

假定4:解釋變量是非隨機的,或者雖然是隨機的但與擾動項不相關

30假定5:對隨機擾動項分布的正態性假定,假定服從均值為零、方差為的正態分布

(說明:正態性假定并不影響對參數的點估計,所以有時不列入基本假定,但這對確定所估計參數的分布性質是需要的。且根據中心極限定理,當樣本容量趨于無窮大時,的分布會趨近于正態分布。所以正態性假定有合理性)由于其中的和是非隨機的,是隨機變量,因此Y是隨機變量,

的分布性質決定了的分布性質。

對的一些假定可以等價地表示為對的假定:

假定1:零均值假定

假定2:同方差假定假定3:無自相關假定

假定5:正態性假定

31在對的基本假定下Y的分布性質1.OLS(OrdinaryLeastSquares)

的基本思想●理想的估計結果應使估計的與真實的的差(即剩余)總的來說越小越好●因可正可負,總有,所以可以取最小,即在觀測值Y和X確定時,的大小決定于和。要解決的問題::如何尋求能使

最小的

和。32二、普通最小二乘法(OLS)

=最小稱之為正規方程,求解得33取偏導數并令其為0,可得正規方程整理得即2.正規方程和估計量34

參數估計優劣的評價標準:(1)無偏性:如果,則稱是參數

的無偏估計量,否則是有偏估計,存在其偏倚。(2)有效性:既是無偏的同時又具有最小方差特性的估計量。(3)一致性:當樣本容量n趨于無窮大時,依概率收斂于總體參數的真實值,4.OLS估計量的統計性質

1、線性特性:

為Y的線性函數

2、

無偏特性:

3、最小方差特性

(有效性)在所有的線性無偏估計中,OLS估計具有最小

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論