多重共線性問題_第1頁
多重共線性問題_第2頁
多重共線性問題_第3頁
多重共線性問題_第4頁
多重共線性問題_第5頁
已閱讀5頁,還剩25頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多重共線性問題1第1頁,課件共30頁,創作于2023年2月8.1問題的種類和原因1、完全多重共線性

一個自變量剛好是其他自變量的線性組合如果存在

c1X1i+c2X2i+…+ckXki=0

i=1,2,…,n

其中:ci不全為0,則稱為解釋變量間存在完全共線性(perfectmulticollinearity)。矩陣X至少有一列向量可由其他列向量(不包括第一列)線性表出,它是非滿秩的。模型設定問題識別問題2第2頁,課件共30頁,創作于2023年2月2、近似多重共線性如果存在

c1X1i+c2X2i+…+ckXki+vi=0

i=1,2,…,n

其中ci不全為0,vi為隨機誤差項,則稱為近似共線性(approximatemulticollinearity)或交互相關(intercorrelated)。主要是數據問題,也有模型設定問題

8.1問題的種類和原因3第3頁,課件共30頁,創作于2023年2月

3、實際經濟問題中的多重共線性一般地,產生多重共線性的主要原因有以下三個方面:(1)經濟變量相關的共同趨勢

時間序列樣本:經濟繁榮時期,各基本經濟變量(收入、消費、投資、價格)都趨于增長;衰退時期,又同時趨于下降。橫截面數據:生產函數中,資本投入與勞動力投入往往出現高度相關情況,大企業二者都大,小企業都小。8.1問題的種類和原因4第4頁,課件共30頁,創作于2023年2月(2)滯后變量的引入

在經濟計量模型中,往往需要引入滯后經濟變量來反映真實的經濟關系。例如,消費=f(當期收入,前期收入)顯然,兩期收入間有較強的線性相關性。(3)樣本資料的限制由于完全符合理論模型所要求的樣本數據較難收集,特定樣本可能存在某種程度的多重共線性。一般經驗:

時間序列數據樣本:簡單線性模型,往往存在多重共線性。

截面數據樣本:問題不那么嚴重,但多重共線性仍然是存在的。8.1問題的種類和原因5第5頁,課件共30頁,創作于2023年2月8.2(近似)多重共線性的危害1、普通最小二乘法估計量的方差和標準差變大,即精確度下降;2、置信區間變寬;3、t值不顯著;4、R平方值較高,但t值并不都顯著;5、OLS估計量及其標準差對數據的微小變化非常敏感,即它們趨于不穩定;6第6頁,課件共30頁,創作于2023年2月以二元線性模型

y=1x1+2x2+為例:

恰為X1與X2的線性相關系數的平方r2,即X1對X2回歸的擬合優度。由于r2

1,故1/(1-r2)17第7頁,課件共30頁,創作于2023年2月多重共線性使參數估計值的方差增大,1/(1-r2)為方差擴大因子(VarianceInflationFactor,VIF)當完全不共線時,r2=0

當近似共線時,0<r2<1方差膨脹因子表相關系數平方00.50.80.90.950.960.970.980.990.999方差膨脹因子12510202533501001000當完全共線時,r2=1,8第8頁,課件共30頁,創作于2023年2月8.2(近似)多重共線性的危害6、回歸系數符號有誤;7、難以衡量各個解釋變量對回歸平方和(ESS)或者R2的貢獻??傊S著多重共線性程度的提高,參數方差會急劇上升到很大的水平,理論上使最小二乘法估計的有效性、可靠性和價值都受到影響,實踐中參數估計的穩定性和可靠程度下降。9第9頁,課件共30頁,創作于2023年2月8.3多重共線性的測定1、R2較高、F檢驗通過但有些系數不能通過t檢驗;2、解釋變量兩兩高度相關:檢驗解釋變量相互之間的樣本相關系數;3、方差擴大(膨脹)因子檢驗;4、狀態數檢驗。注意:沒有一種檢驗方法能夠使我們徹底解決多重共線性問題。多重共線性是一個程度問題。

10第10頁,課件共30頁,創作于2023年2月方差擴大因子檢驗分析已知記為,為。11第11頁,課件共30頁,創作于2023年2月當時,當時,自變量xj的方差擴大因子(VarianceInflationFactor)定義為矩陣(X’X)-1中第k個對角元素,即12第12頁,課件共30頁,創作于2023年2月上式中表示把xk作為因變量,其余自變量作為自變量進行回歸得到的決定系數。這個值越大,表示該變量與其余自變量的線性依存程度越強,則自變量的共線性越嚴重。常以方差擴大因子是否大于10來判斷第k個解釋變量是否存在較強的、必須加以處理的多重共線性。還可以用所有自變量所對應的方差擴大因子的平均數,當其大于10時,表示變量間存在嚴重的共線性。13第13頁,課件共30頁,創作于2023年2月VIF的EViews計算首先建立以某個自變量為因變量、其余自變量為自變量的多元回歸方程.然后計算VIF,命令如下:scalarvif=1/(1-equation_name.@R2)其中R2是R2,調用系數格式為

equation_name.@coefs(n)14第14頁,課件共30頁,創作于2023年2月實例一:美國機動車汽油消費的影響因素分析給出1950-1987年間美國機動車汽油消費量和影響消費量的變量數值。其中格變量表示:QMG為機動車汽油消費量(單位:千加侖);CAR為汽車保有量;PMG為機動車汽油零售價格;POP為人數;RGNP為按1982年美元計算的GNP(單位:十億美元);PGNP為GNP指數(以1982年為100)。以汽油消費量為因變量,其他變量為自變量,建立回歸模型。變量CAR與POP、RGNP之間相關系數較大,存在多重共線性。15第15頁,課件共30頁,創作于2023年2月實例二:1960至1982年期間美國的雞肉需求:有關變量:平均每人雞肉消費量(Y),每人實際可支配收入(X2),雞肉的實際零售價格(X3),豬肉的實際零售價格(X4),牛肉的實際零售價格(X5)初步回歸相關矩陣輔助回歸16第16頁,課件共30頁,創作于2023年2月狀態數檢驗狀態指數將X矩陣的每一列xk用其模相除以實現標準化,然后再求X’X矩陣的特征值,取其中最大的除以最小的后再求平方根,得到該矩陣的“狀態數”,記為:

通常當大于20或30時,認為存在較明顯的多重共線性。

17第17頁,課件共30頁,創作于2023年2月確定哪些解釋變量的系數受到多重共線性的影響:先計算各個特征值的“狀態指數”

這些狀態指數的水平在1到之間,很可能有好幾個超過20-30的“危險”水平。18第18頁,課件共30頁,創作于2023年2月8.4多重共線性的克服和處理1、增加樣本容量

樣本容量越大,變量相關性越小,相關越難。但有局限性,不一定解決問題2、差分方程3、模型修正4、嶺回歸方法、主成分分析方法等19第19頁,課件共30頁,創作于2023年2月差分方程線性回歸模型為且已知X1和X2之間存在多重共線性問題。作如下變換:

改用差分方程進行回歸,受多重共線性的影響比較小。20第20頁,課件共30頁,創作于2023年2月模型修正(1)刪減解釋變量(利用檢驗結論、經驗等),但從模型中刪減解釋變量可能導致“模型設定誤差”。(2)重新考慮模型(利用原模型回歸信息、經驗等)(3)變量變換(4)先驗信息參數約束21第21頁,課件共30頁,創作于2023年2月先驗信息參數約束例:生產函數,經對數變換為:

如果預先知道所研究的經濟有規模報酬不變的性質,即函數中的參數滿足就可以克服多重共線性。22第22頁,課件共30頁,創作于2023年2月嶺回歸方法設一個多元線性回歸模型為普通最小二乘估計的公式為當解釋變量間存在嚴重的多重共線性時,矩陣接近于奇異。用代替代入最小二乘估計的公式,得到:其中稱為“嶺回歸參數”,一般,是用矩陣對角線上元素和構成的對角線矩陣。

23第23頁,課件共30頁,創作于2023年2月估計量的數學期望為:24第24頁,課件共30頁,創作于2023年2月8.5案例——中國糧食生產函數根據理論和經驗分析,影響糧食生產(Y)的主要因素有:農業化肥施用量(X1,萬噸);糧食播種面積(X2,萬公斤)

成災面積(X3,千公頃);農業機械總動力(X4,公頃);

農業勞動力(X5,萬人)已知中國糧食生產的相關數據,建立中國糧食生產函數:

Y=0+1X1+2X2+3X3

+4X4

+4X5

+25第25頁,課件共30頁,創作于2023年2月1、用OLS法估計上述模型:R2接近于1;給定=5%,得F臨界值F0.05(5,12)=3.11

F=638.4>15.19,故認上述糧食生產的總體線性關系顯著成立。但X4

、X5

的參數未通過t檢驗,且符號不正確,故解釋變量間可能存在多重共線性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)26第26頁,課件共30頁,創作于2023年2月2、檢驗簡單相關系數發現:X1與X4間存在高度相關性。列出X1,X2,X3,X4,X5的相關系數矩陣:27第27頁,課件共30頁,創作于2023年2月3、找出最簡單的回歸形式可見,應選第1個式子為初始的回歸模型。分別作Y與X1,X2,X4,X5間的回歸:

(25.58)(11.49)R2=0.8919F=132.1DW=1.56

(-0.49)(1.14)

R2=0.075F=1.30DW=0.12

(17.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論