多元回歸分析推斷_第1頁
多元回歸分析推斷_第2頁
多元回歸分析推斷_第3頁
多元回歸分析推斷_第4頁
多元回歸分析推斷_第5頁
已閱讀5頁,還剩45頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多元回歸分析推斷第1頁,共50頁,2022年,5月20日,13點33分,星期二受教育年限與每小時工資如果受教育年限的單位為月如果受教育年限的單位為日第2頁,共50頁,2022年,5月20日,13點33分,星期二OLS估計量的抽樣分布高斯-馬爾科夫假定假定1:關于參數線性 y=0 + 1 x1 + 2 x2 + + k xk + u假定2:隨機抽樣假定3:不存在完全共線性假定4:零條件均值 E(u|x1, x2 , , xk ) = 0假定5:同方差性 Var(u|x1 , , xk ) =2OLS估計量是BULUE 線性性、無偏性、最小方差性第3頁,共50頁,2022年,5月20日,13點33

2、分,星期二CLM假定高斯-馬爾科夫假定假定6:正態性 u N(0,2)CLM假定下,y的條件分布: y=0+1x1+2x2+kxk+u y|x N(0+1x1+2x2+kxk,2) 在CLM假定下,OLS估計量 的抽樣分布是什么?第4頁,共50頁,2022年,5月20日,13點33分,星期二線性性 服從正態分布無偏性 的期望為j方差 定理4.1: CLM假定下,以自變量x為條件,有第5頁,共50頁,2022年,5月20日,13點33分,星期二檢驗單參數假設:t檢驗H0:1=0 H1: 10 零假設與備擇假設構造統計量0受教育年限與每小時工資 Z檢驗第6頁,共50頁,2022年,5月20日,13

3、點33分,星期二 Z檢驗與t檢驗 定理4.2:標準化估計量的t分布 CLM假定下,以自變量x為條件,有第7頁,共50頁,2022年,5月20日,13點33分,星期二 顯著性檢驗(t檢驗)原假設(null hypothesis):例子:原假設(H0: b3=0)意味著,教育水平和工作經驗相同時,男性和女性的工資沒有差異。 log(wage)= b0+b1 educ+b2exper+b3female+u 對于一元回歸,斜率系數的顯著性檢驗: y=0+1x +u 原假設(H0: b1=0)意味著什么?H0:j=0 第8頁,共50頁,2022年,5月20日,13點33分,星期二原假設與備擇假設(alt

4、ernative hypothesis) 如原假設不成立,該如何:雙側備擇假設: 相應的檢驗為雙側檢驗(two-tailed test)單側備擇假設: 或者 相應的檢驗為單側檢驗(one-tailed test)H0:j=0 H1: j0 H0:j=0 H1: j0H0:j=0 H1: j0 第13頁,共50頁,2022年,5月20日,13點33分,星期二備擇假設: 左側是拒絕域。H1: j0 y=0+1x1+2x2+kxk+u若 ,拒絕H0,xj對y的影響是統計顯著的。 若 ,不能拒絕H0,xj對y的影響統計上不顯著。 第15頁,共50頁,2022年,5月20日,13點33分,星期二若原假設

5、和備擇假設為:統計量的計算相同,判定規則不同:單側檢驗和雙側檢驗的比較:t統計量的計算及其數值完全相同,臨界值不同;查臨界值時,t分布自由度相同,但如果顯著水平為, 雙側檢驗使用/2,單側檢驗使用;同樣的顯著水平下,單側檢驗更容易拒絕原假設,得出 自變量統計顯著的結論。H0:j=0 H1: j0.05,接受原假設t(n-k-1)-t0.025t0.025p/20tp值0.05,接受原假設t(n-k-1)t0.05p0tp值0若對于(H0:j=0 H1: j0),應如何計算?第21頁,共50頁,2022年,5月20日,13點33分,星期二將給定的顯著性水平與p值比較:若p值 ,則在顯著性水平下拒

6、絕原假設若p值 ,則在顯著性水平 下不能拒絕原假設這一準則對于所有的檢驗都適用第22頁,共50頁,2022年,5月20日,13點33分,星期二用語的提醒不能拒絕=接受?經濟或實際顯著性與統計顯著性經濟或實際顯著性取決于參數估計值的大?。胺枺┙y計顯著性取決于t統計量的值樣本很大的情況下,標準差很小,此時容易出現統計顯 著而經濟意義上不顯著的情況使用較小的顯著水平樣本較小時,標準差較大,容易出現不顯著的情況 使用較大的顯著水平養老金計劃的參與率 其他問題第23頁,共50頁,2022年,5月20日,13點33分,星期二培訓津貼對企業廢品率的影響hrsemp顯著嗎?需要多大的顯著水平?第24頁,共

7、50頁,2022年,5月20日,13點33分,星期二 多重共線性與統計顯著性回歸參數估計量的方差變大多重共線性使得t 統計量的值( )變小 接受H0:0(不顯著)的概率增大 重要的解釋變量被舍去,檢驗失去意義第25頁,共50頁,2022年,5月20日,13點33分,星期二置信區間第26頁,共50頁,2022年,5月20日,13點33分,星期二由于:由大括號內不等式表示置信水平為1-時j的置信區間:得:P t/2 = 1- -t/2 0 t/2 第27頁,共50頁,2022年,5月20日,13點33分,星期二研發支出模型log(sales)系數的置信區間:第28頁,共50頁,2022年,5月20

8、日,13點33分,星期二 案例1:規模報酬是不變的嗎?考慮柯布道格拉斯生產函數模型: Q=AKL對數化處理后,建立相應的計量模型為:ln Q=lnA+lnK+lnL+u關于規模報酬不變的原假設可以表示為:H0:+=1 H1: +1 如何通過模型變換,利用t檢驗對上述假設進行檢驗?檢驗關于參數的單個線性組合假設第29頁,共50頁,2022年,5月20日,13點33分,星期二定義參數:原假設變換為:t統計量:其中 = +H0: =1 H1: 1第30頁,共50頁,2022年,5月20日,13點33分,星期二能否直接將作為模型參數進行估計?原模型變換為:ln Q=lnA+lnK+(-)lnL+u 即

9、: = + = - lnQ=lnA+ln(K/L)+lnL+u若定義參數:原假設變為標準的顯著性檢驗:應如何對模型進行變換? = +-1H0: =0 H1: 1第31頁,共50頁,2022年,5月20日,13點33分,星期二任意關于參數單個線性組合的檢驗都可以同樣處理!多受一年??平逃幕貓蟊鹊蒙隙嘁荒瓯究平逃龁??將“待檢驗的理論”轉化為關于參數的假設:定義參數1=1-2 ,原假設為變換后的模型: ln(wage)=0+ 1 jc +2univ + 3exper+uH0: 1 =2 H1: 1 2H0:1 =0 H1:1 0 ln(wage)=0+1 jc +2totcoll+3exper+u

10、totcoll=jc+univ 案例2:專科和本科的教育回報相同嗎?第32頁,共50頁,2022年,5月20日,13點33分,星期二估計結果:5%顯著水平下,能認為??坪捅究频慕逃貓笙嗤瑔??若令2=2 -1:原假設和備擇假設是什么?給出變換后的模型形式。能直接給出模型的估計結果嗎?結論會發生變化嗎?第33頁,共50頁,2022年,5月20日,13點33分,星期二對于多元回歸模型: y=0+1 x1+2 x2+k xk + u若自變量x1、 x2、 xk都無助于解釋y,意味著什么?原假設和備擇假設:如何檢驗? 若原假設成立,SSE相對于SSR將很??? 多個線性約束的檢驗:F檢驗 方程(回歸整體

11、)的顯著性檢驗(P143)H0: 1= 2= k=0 (或R2=0) H1: j(j=1,2,k)不全為零SST=SSE+SSR第34頁,共50頁,2022年,5月20日,13點33分,星期二計算F統計量: 或者給定顯著性水平,查找臨界值進行判斷: 若:FF,拒絕原假設H0 認為至少有某些自變量能夠解釋y 。第35頁,共50頁,2022年,5月20日,13點33分,星期二第36頁,共50頁,2022年,5月20日,13點33分,星期二 多重共線性的典型表現 當模型的擬合優度(R2)很高,F值很高,但某些重要變量不顯著或符號與預期相反(方差很大,t值很低),說明解釋變量間可能存在多重共線性。 例

12、如:中國電信業務總量變化的影響因素是郵政業務總量、中國人口數、市鎮人口占總人口的比重、人均GDP、全國居民人均消費水平。 y = 24.94 + 2.16 x1 3.03 x2 + 33.7 x3 + 1.29 x4 - 2.03 x5+et (0.7) (1.6) (-0.8) (1.0) (1.5) (-1.2) R2 = 0.99, F = 106.3第37頁,共50頁,2022年,5月20日,13點33分,星期二棒球運動員薪水模型:若控制加入聯盟的年份和每年參加比賽次數,運動員的 表現影響薪水嗎?原假設和備擇假設:排除性約束: 若原假設為真,控制其他變量的情況下,其對被解釋變 量沒有影

13、響,應該從模型排除! 一般的排除性約束檢驗 ln(salary)=0+1 years+2gamesyr+3bavg+4hrunsyr+5rbisyr+uH0: 3= 4= 5=0 H1: 3、 4和 5不全為零第38頁,共50頁,2022年,5月20日,13點33分,星期二如何檢驗?不能通過單個系數的顯著性檢驗實現!模型中某些變量不顯著可能是多重共線性造成的,其中某個變量排除后,消除了共線性,其他不顯著的變量可能會變得顯著。第39頁,共50頁,2022年,5月20日,13點33分,星期二考慮兩種模型:不受約束模型:受約束模型,即認為原假設成立時的模型:若原假設真的成立,即 ,不受約束模 型和受

14、約束模型的估計結果應該差異不大,兩者的殘差平方和(SSR)應該比較接近若原假設不成立,受約束回歸模型設定錯誤,兩者的SSR差距較大受約束模型的殘差平方( SSRr )和一定不小于不受約束 模型的殘差平方和( SSRur ),即 SSRr SSRur,為什么? ln(salary)=0+1 years+2gamesyr+3bavg+4hrunsyr+5rbisyr+u ln(salary)=0+1 years+2gamesyr+u 3= 4= 5=0 第40頁,共50頁,2022年,5月20日,13點33分,星期二一般情形: y=0+1 x1+2 x2+k xk + u原假設和備擇假設:受約束模

15、型: y=0+1 x1+2 x2+k-q xk-q + uF統計量:H0: k-q+1= k=0 H1: j(j=k-q+1,k)不全為零分子自由度q:原假設中約束條件個數 分母自由度n-k-1:無約束模型的自由度第41頁,共50頁,2022年,5月20日,13點33分,星期二F統計量的另一種形式給定顯著性水平,查找臨界值進行判斷: 若:FF,拒絕原假設H0 xk-q+1、xk是聯合顯著的。第42頁,共50頁,2022年,5月20日,13點33分,星期二 不受約束模型 受約束模型運動員的表現影響薪水嗎?第43頁,共50頁,2022年,5月20日,13點33分,星期二F統計量和t統計量若原假設是

16、單個參數約束,如 F檢驗和t檢驗的結論會一致嗎?完全一致,因為:區別: t檢驗可用于檢驗單側對立假設, F檢驗不行 對于單個參數約束,建議使用t檢驗問題4.5(p143)H0:j=0 H1: j0 第44頁,共50頁,2022年,5月20日,13點33分,星期二對于模型: y=0+1 x1+2 x2+k xk + u原假設和備擇假設:受約束模型: 將約束條件施加到模型參數中不受約束模型:原始模型F統計量:H0: 參數滿足q個約束條件 H1: q個約束條件不全部成立 更一般的線性約束檢驗第45頁,共50頁,2022年,5月20日,13點33分,星期二住房價格的決定方程:若住房評估理性,則住房出售

17、價格完全決定于其評估價 值,評估價值既定時,建筑面積、使用面積和房間數應 該對住房價格沒有影響。住房評估理性嗎?原假設和備擇假設: ln(price)=0+1 log(assess)+2log(lotsize)+3log(sqrft)+4bdrms+uH0: 1=1, 2= 3= 4=0 H1:約束條件不全成立第46頁,共50頁,2022年,5月20日,13點33分,星期二不受約束回歸:受約束回歸 如何回歸?F統計量 ln(price)=0+ log(assess)+u ln(price)=0+1 log(assess)+2log(lotsize)+3log(sqrft)+4bdrms+u規模報酬不變檢驗 ln Q=lnA+lnK+lnL+u原假設和備擇假設: H0:+=1 H1: +1 受約束回歸的形式?第47頁,共50頁,2022年,5月20日,13點33分,星期二 p值=P(F F) F檢驗的P值F值p值將給定的顯著性水平與p值比較:若p值 ,則在顯著性水平下拒絕原假設若p值 ,則在顯著性水平 下不能拒絕原

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論