


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、雙變量回歸模型一個人為的例子研究每周家庭消費支出丫對可支配收入X的關系 將家庭劃分為收入差不多的10組。每周家庭收入美元X80100120140160180200220240260Y5565798010211012013513715060708493107115136137145152每周65749095110120140140155175家庭708094103116130144152165178消費758598108118135145157175180支出-88-113125140-160189185-115-162-191總計32546244570767875068510439661211
2、表格給出了以X的定值為條件的丫的條件分布 計算給定X的丫的概率,即P 丫/X 。計算條件均值,即EY/X= Xi作圖平均的說,隨著X的增加,丫也在增加。條件均值落在一根有正斜率的直線上,總體回歸線(population regression lin® , 丫 對 X 的回歸。對每一個Xi都有丫值的一個總體和相應的均值,回 歸線是穿過了這些條件均值的線??傮w回歸函數(PRF)的概念圖中看到,每一條件均值 E(Y/Xi)都是Xi的一個 函數,并且是線性函數。E(Y/Xi f(Xi r 2Xi:1和:2是未知但固定的參數,被分別稱為截距和斜 率參數。“線性一詞的含義對變量為線性非線性的例子
3、:E(Y/Xi <2Xi2對參數為線性非線性的例子:E(Y/XJ= i'Xi本課程中,只對參數是線性的PRF的隨機設定隨著家庭收入的增加,家庭消費平均的說也增加。 但某一個別家庭的消費支出卻不一定。個別家庭的消費支出聚集在收入為X I的所有家庭 的平均消費支出的周圍。丫E(Y/XJ *E(Y/X i)代表相同收入水平的所有家庭的平均消費 支出,稱為系統性(systematic)成分,u】稱為隨 機或非系統性(non-systematic)成分。假定E(Y/X i)是對X i為線性的,那么Y = E(Y/XJ Ui =2Xi UiE(ui/Xi 0隨機干擾項的意義1. 理論的模糊性
4、2 數據的欠缺3 核心變量與周邊變量4人類行為的內在隨機性5 糟糕的替代變量6節省原那么7錯誤的函數形式樣本回歸函數以上討論局限在與X值相對應的Y值總體現在我們考慮抽樣問題樣本:YX7 08 06 510 09 012 09 514 011016 011518 012 02 0 014 02 2 015 52 4 015 02 6 0我們能從樣本預測整個總體中對應于選定X的平均每周消費支出Y嗎?從N個不同的樣本會得到N個不同的SRF,并且這些SRF不大會是一樣的能不能設計一種規那么使SRF盡可能的“接近 PRF樣本回歸函數sample regression function, SRF£
5、; = % + 紐SRF隨機形式:Y = i? + %Xj+u回歸分析的主要目的是根據y =廉+眄Xi+a來估計Y 二【/i T圖形YiE(Y/XJ普通最小二乘法UHY-Y?= Yi_l?#Xi選擇一個SRF,使得殘差和' Ui八Y -Y?盡可能小圖但正負殘差可以相互抵消最小二乘準那么是要定出SRF使得:工 Ui2=Z Yi-S?2 八Yi一 rXJ2消費-收入的例子中,估計到的結果:Y?二 24.4545 0.5091Xi-OLS估計量是由可觀測的量X和丫表達的,因此這 些量是可以計算的-這些量是點估計量回歸線的性質:1它通過Y和X的樣本均值2. 估計的Y(= Y?)等于實測的Y均值
6、3. 殘差u?i的均值為零。4. 離差形式5. 殘差L?i和預測的Y I值不相關6. 殘差?和X I不相關最小二乘法的根本假定回歸分析的目的是從磨和就2推斷P 1和P 2需要對Y i的產生方式作出某些假定。經典線性回歸模型(CLRM)1 0個假設:1. 線性回歸模型。回歸模型對參數是線性的。2. 在重復抽樣中X是固定的,即假定X是非隨機的。3. 干擾項u i的均值為零,即u i的條件均值為零,E(w/Xi) = 0圍繞均值分布,正負相抵,u對丫沒有影響。4. 同方差性或u i的方差相等。Var(q/X)二 Eg - E(ui)/Xi2二 E(u2/Xi)二二 2Homoscedasticity
7、 and Heteroscedasticity 圖形 )方差隨收入增加而增加,富裕家庭的方差大,可靠性那么越 來越小。5. 各個干擾項之間無自相關。cov(Uj,Uj/Xj,Xj)二 EU -E(uJ/XiUj -E(Uj)/Xj= E(Ui/XJE(Uj/Xj)=0無序列相關,正相關,負相關。(圖形)6. Ui和Xi的協方差為零。Cov(ui, Xj) = 0-干擾u和變量X是不相關的-因為如果u和X相關,就不可能評價它們各自對 丫的影 響。7. 觀測次數n必須大于待估計的參數個數。換言之,觀 測次數必須大于解釋變量的個數。8. X值要有變異性變量一定要變!9正確的設定了回歸模型-模型應該包
8、括哪些變量-模型的函數形式為何?(Phillips Curve model)10.沒有完全的多重共線性。以上假定都是關于PRF的,而不是關于SRF的,但OLS 估計量的一些性質和關于PRF的假定相類似。如=0和 E(w/Xj = 0 ,、嘆=0和 Cov(Uj,XJ=0,但 SRF 不復制對 CLRM 的全部假定,如 Cov(Ui,Uj) = Cov(i?,i?j)這些假定有多真實?-假定是為了便于我們逐步開展我們的主體研究-便于在以后的篇章里深入的分析復雜的情況。最小二乘估計量的特性:高斯-馬爾可夫定理OLS估計量?2,是:2的最優線性無偏估計量Best Lin earUnbias Esti
9、mator -BLUE線性的,無偏的,有效的公式,圖最小二乘估計量的精度或標準誤差 估計量隨看樣本不同而不同,用什么衡量精度?se( ?2)二匚2' Xi2va=2n送xise(%)=、x2n'x2"2為u |的方差,由以下公式計算:n-2為二2兼代表其中刁2是真正的但未知的二2的OLS估計量 自由度u2那么表示殘差平方和RSS。u I和Yi的條件方差?2的方差與二2成正比,而與Xj2成反比閩的方差與 2和無Xj2成正比,而與E x2和樣本大小n 成反比。鳳和之間可能相互依存_ _ 2covB?,眄=-X var% = -X瓦Xj時和之間的協方差與X的符號有關,如果X
10、是正的,那 么協方差是負的,這時假設 叫被過高估計,聲2將會被過低估 計。U I的正態性假定以前假定U I的期望值為零,之間不相關,方差不變。 OLS估計量BLUE。如果進行假設檢驗,必須知道U i的分布,從而得知3 的分布。除了以前的假定,Uj NIDO,2NID no rmally and in depe nden tly distributed 為什么設為正態分布?-中心極限定理為U I的正態性假定提供了理論依據-即使變量個數并不是很多或這些變量不是嚴格的獨立 分布,它們的總和仍可視為正態分布。-U】為正態,氏和陀也都應該是正態的。-正態分布比擬簡單正態假定下OLS估計量的性質 BLUE 一致性(consistency)時是正態分布的E?)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論