計(jì)量經(jīng)濟(jì)學(xué)知識(shí)點(diǎn)講解7_第1頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)知識(shí)點(diǎn)講解7_第2頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)知識(shí)點(diǎn)講解7_第3頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)知識(shí)點(diǎn)講解7_第4頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)知識(shí)點(diǎn)講解7_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

如何尋找工具變量?得工具者得實(shí)證計(jì)量

尋找到一個(gè)好的工具變量可以直接在MIT博士畢業(yè),可見找工具變量是一件有挑戰(zhàn)性

的事情。在我看來,找工具變量是一項(xiàng)有趣的智力活動(dòng),除了需要一個(gè)人有經(jīng)濟(jì)學(xué)的素養(yǎng)和

邏輯,還需要這個(gè)人知識(shí)面廣,自然、地理、人文、世俗智慧和經(jīng)驗(yàn)等,通常,這跟一個(gè)人

熟悉的領(lǐng)域,由長(zhǎng)期觀察和思考產(chǎn)生的洞見有關(guān)。當(dāng)然還需要?點(diǎn)運(yùn)氣,學(xué)術(shù)不是苦思冥想,

也許做一個(gè)夢(mèng),喝一杯下午茶,靈感就閃現(xiàn)了。

工具變量的原理最早出現(xiàn)在菲利普?萊特(PhilipG.Wright)1928年寫的書《TheTariff

onAnimalandVegetableOils》里。

為了進(jìn)一步解釋這個(gè)原理,首先給出一個(gè)典型的線性回歸模型:

y=po+pixi+px+c(1)

這里y為被解釋變量,xi為自變量,或者解釋變量,也即“因"。大寫的X為外生控制

項(xiàng)向量(也即一組假定為外生的其他控制變量,例如年齡、性別等等),£則為誤差項(xiàng)。如果£

與刈不相關(guān),那么我們可以利用OLS模型對(duì)方程進(jìn)行無偏估計(jì)。然而,如果一個(gè)重要變量

X2被模型(1)遺漏了,且XI和X2也相關(guān),那么對(duì)型的OLS估計(jì)值就必然是有偏的。此時(shí),

X1被稱作“內(nèi)生”的解釋變量,這就是“內(nèi)生性”問題。

遇到“內(nèi)生性”問題抻木辦?有一個(gè)方法就是找工具變量Z。

2工具變量(IV)可以用來解決

1)遺漏變量偏差

2)經(jīng)典的測(cè)量誤差問題

3)聯(lián)立性(逆向因果)

3工具變量的條件

變量z可以作為變量x的有效工具變量,當(dāng)滿足:工具變量必須外生,Cov(z,u)=0,

工具變量必須與內(nèi)生變量x相關(guān),即,Cov(z,x)¥0

Cov(z,u)=0無法驗(yàn)證,Cov(z,x),0可以驗(yàn)證

對(duì)工具變量的兩個(gè)要求之間有一個(gè)非常重要的差別。因?yàn)镃ov(z,u)是z與不可觀測(cè)的誤

差u的協(xié)方差,我們無法對(duì)它進(jìn)行驗(yàn)證或哪怕是檢驗(yàn):我們必須求助于經(jīng)濟(jì)行為或內(nèi)心感受

來維持這一假定。相比之下,給定一個(gè)來自總體的隨機(jī)樣本,z與x相關(guān)(在總體中)的條件

則可加以檢驗(yàn)。做到這一點(diǎn)最容易的方法是估計(jì)一個(gè)x與z之間的簡(jiǎn)單回歸。

就是說,Cov(z,u)=0無法驗(yàn)證,我們只能依賴常識(shí)和經(jīng)濟(jì)理論,這需要理論修養(yǎng)和積

累。

但是我們可以檢驗(yàn)是否Cov(z,x)翔,即檢驗(yàn)

Ho:pi=0x=p()+piz+v

這個(gè)回歸有時(shí)被稱為第一?階段回歸。

4我們要什么樣的IV

現(xiàn)在我們來看課上那個(gè)講教育回報(bào)的經(jīng)典例子

在教育回報(bào)率的例子中,假定真實(shí)模型將對(duì)數(shù)工資對(duì)教育和能力回歸:現(xiàn)在能力不可觀

測(cè),而且沒有代理變量IQ

事實(shí)上使用的回歸:洛對(duì)數(shù)工資對(duì)教育回歸,但由于誤差項(xiàng)包含能力,并且教育水平與

能力相關(guān),此時(shí)會(huì)出現(xiàn)教育的內(nèi)生性問題。

z應(yīng)當(dāng)對(duì)y無偏效應(yīng),也不應(yīng)當(dāng)與其它影響y的因素相關(guān)。z必然與內(nèi)生解釋變量x有

著正的或負(fù)的關(guān)系。就是說Z不能和U有關(guān),而且Z只能通過影響X來間接地影響Y。

log(wagc)方程,educ的工具變量z必須:(1)與能力(以及其它影響工資的不可觀測(cè)的因

素)不相關(guān),(2)與教育相關(guān)。諸如一個(gè)人的社會(huì)福利登記號(hào)的最后一位數(shù)字之類的變量,兒

乎一定滿足第一個(gè)必需條件:與能力不相關(guān),因?yàn)樗请S機(jī)決定的。然而,該變量與教育不

相關(guān),因而是educ的一個(gè)低劣的工具變量。

所謂的用于遺漏變量的代理變量因相應(yīng)的原因也是低劣的IVo例如,在遺漏能力的

log(wage)例子中,abil的代理變最應(yīng)該盡可能地與abil高度相關(guān)。而匚具變員必須與abil不

相關(guān)。因此,盡管IQ是abil的一個(gè)好的代理變量候選者,它卻不是educ的好的工具變量。

對(duì)其它可能的工具變量候選者,這些必需條件更加不確定。勞動(dòng)經(jīng)濟(jì)學(xué)家已在工資方程

中使用家庭背景變量作為教育的IV。例如I,母親的教育(motheduc)與孩子的教育是正相關(guān)的,

這一點(diǎn)通過收集勞動(dòng)者數(shù)據(jù)樣本并做cduc對(duì)mothcduc的簡(jiǎn)單回歸便可以看出來。因此,

motheduc滿足方程Cov⑵x)#0。問題是,母親的教育也可能與孩子的能力相關(guān)(通過母親的

能力和可能通過孩子幼年所受的教養(yǎng)的質(zhì)量)。

educ的另一個(gè)IV選擇是成長(zhǎng)過程中兄弟姊妹的數(shù)目(sibs)。一般地說,較多的兄弟姊妹

與較低的平均教育水平相我系。這樣,如果兄弟姊妹的數(shù)目與能力不相關(guān),它可以充當(dāng)educ

的工具變量。

IV與OLS估計(jì)比較

A

IV與OLS的標(biāo)準(zhǔn)差的不同之處僅在于將x對(duì)z回歸得到的Rx,z^2由于Rx,z2<l,IV的

標(biāo)準(zhǔn)差會(huì)比較大。就是左老師說的比誰更有效,如果做出來

當(dāng)Cov(x,u)¥0,OLS不是一致估計(jì),IV是一致估計(jì)。x和z的相關(guān)性越強(qiáng),IV的標(biāo)

準(zhǔn)差越小。

舉個(gè)例子:對(duì)已婚女性進(jìn)行教育的回報(bào)估計(jì)。

我們看到,教育回報(bào)的IV估計(jì)值為5.9%,大約是OLS估計(jì)值的一半。這表明OLS估

計(jì)值過高,且與遺漏的能力變量的偏誤相一致。但我們應(yīng)該記住,這些都是僅從一個(gè)樣本中

得出的估計(jì)值:我們根本不知道0.109是否高于真正的教育回報(bào),或者0.059更接近真正的

教育回報(bào)。其次,IV估計(jì)量的標(biāo)準(zhǔn)誤是OLS標(biāo)準(zhǔn)誤的2.5(().035/0.014)倍。運(yùn)用OLS得出的

仇的95%置信區(qū)間比運(yùn)用IV得出的要窄得多;事實(shí)上,IV的置信區(qū)間確實(shí)包含了OLS估

計(jì)值。

5IV的問題

值得注意的是盡管當(dāng)Z與u不相關(guān),而z與x存在著正的或負(fù)的相關(guān)時(shí),IV是一致性

的,但當(dāng)Z與X只是弱相關(guān)時(shí)IV估計(jì)值可能有大的標(biāo)準(zhǔn)誤。Z與X之間的弱相關(guān)可能產(chǎn)生

甚至是更加嚴(yán)重的后果:即使Z與u只是適度相關(guān),IV估計(jì)量也會(huì)有大的漸近偏誤。

這就是左老師講的弱工具變量問題。

理論上說,Z必須是嚴(yán)格外生的,但是如果工具變量與內(nèi)生變量有一點(diǎn)相關(guān),即使很小,

仍然可能造成估計(jì)的問題,Z和X關(guān)系越小,這個(gè)工具變量就越有風(fēng)險(xiǎn),這個(gè)叫弱T具變

量。

后來左老師舉了Angrist那個(gè)教育和出生季度的例子。

Angrist&Krueger(1991)利用美國(guó)的男性人口調(diào)查數(shù)據(jù),提出了educ的一個(gè)巧妙的二值

工具變量。如果該男性是在第一季度出生的,令frstqrt等于1,否則為0。誤差項(xiàng)——特別

是能力——似乎應(yīng)該與出生季度不相關(guān)。但是,frsiqri還要與educ相關(guān)。事實(shí)表明,在基于

出生季度的總體中,教育年數(shù)確實(shí)有系統(tǒng)性差異。Angrist和Krueger認(rèn)為是緣于在各州實(shí)行

的義務(wù)就學(xué)法,這很有說服力。簡(jiǎn)單地說,年初出生的學(xué)生往往入學(xué)較晚。因此,他們?cè)谶_(dá)

到義務(wù)教育年齡時(shí)(大部分州定為16歲),所受的教育略少于入學(xué)較早的學(xué)生。

因?yàn)榻逃陻?shù)在各出生季度之間的變化僅僅是微乎其微的一一這意味著我們做對(duì)的回

歸來獲得的結(jié)果非常小——Angrist和Krueger需要很大的樣本容量來得到一個(gè)合理而準(zhǔn)確

的IV估計(jì)值。利用1920至1929年之間出生的247199位男性的數(shù)據(jù),得出教育回報(bào)的OLS

估計(jì)值為.0801(標(biāo)準(zhǔn)誤為.0004),IV估計(jì)值為.0715(.0219"見于Angrist和Krueger的論文中

的表IIL注意到OLS估計(jì)值的t統(tǒng)計(jì)量那么大(約為200),然而IV估計(jì)值的t統(tǒng)計(jì)量?jī)H為

3.26。因而IV估計(jì)值在統(tǒng)計(jì)上不為(),但其置信區(qū)間比基于OLS估計(jì)值的置信區(qū)間寬得多。

Angrist和Krueger有一個(gè)有趣的發(fā)現(xiàn):IV估計(jì)值與OLS估計(jì)值相差并不多。實(shí)際上,

利用下一個(gè)十年中出生的男性的數(shù)據(jù),得出IV估計(jì)值稍微高于OLS估計(jì)值。對(duì)此可以這樣

解釋:說明在用OLS估計(jì)工資方程時(shí)不存在遺漏能力論偏誤。可是,Angrist和Krueger的

論文在計(jì)量經(jīng)濟(jì)學(xué)界受到了非難。如同Bound,Jaeger和Bakcr(1995)討論的那樣,它不能明

顯地判斷出生季節(jié)與影響工資的諸因素不相關(guān),縱然這些因素沒有被人觀測(cè)到。

6自我選擇(self-selection)的問題

舉個(gè)例子,Angrisi(1990)研究了,參加越南戰(zhàn)爭(zhēng)的老兵,其終身收入因參加越戰(zhàn)而受到

的影響。一個(gè)簡(jiǎn)單模型為:income=veteran+others

其中veteran是二值變量。疑問在于,用OLS估計(jì)該方程時(shí),可能存在一個(gè)自我選擇

(self-selection)的問題:也許人們因?yàn)槟軓能婈?duì)中得到最多的收入而選擇參軍,或者參軍的決

策與其他對(duì)收入有影響的特征相關(guān)。這些問題將導(dǎo)致veteran與u相關(guān)。

Angrist指出,越南戰(zhàn)爭(zhēng)的征兵抽簽提供了一個(gè)自然試驗(yàn)(naturalexperiment),從而產(chǎn)生

了veteran的一個(gè)工具變量。年輕人被分給的征兵抽簽號(hào)決定了他們是否會(huì)被征召去服役于

越南戰(zhàn)爭(zhēng)。因?yàn)樗纸o的號(hào)碼(畢竟)是隨機(jī)分配的,征兵抽簽號(hào)與誤差項(xiàng)u不相關(guān)似乎是可

信的。而得到號(hào)碼足夠小(指號(hào)碼小于某個(gè)數(shù))的人必須服役于越南戰(zhàn)爭(zhēng),使得成為老兵的概

率與抽簽號(hào)相關(guān)。如果以上兩點(diǎn)都是正確的,征兵抽簽號(hào)是veteran的一個(gè)好的IV候選者。

7MJStata做ivreg處理內(nèi)生性怎么玩?

【問題及方法】

內(nèi)生性,每個(gè)實(shí)證人的痛。內(nèi)生性主要的三個(gè)來源:測(cè)量誤差、遺漏變量和逆向因果。

1、變量的內(nèi)生性。

這個(gè)是沒有辦法單獨(dú)檢驗(yàn)的。當(dāng)有合適工具變量時(shí)候,是可以檢驗(yàn)的,就是Hausman檢

驗(yàn)

2、工具變量的外生也。

這個(gè)也是沒辦法檢驗(yàn)的。當(dāng)有很多工具變量時(shí)候,可以檢驗(yàn)是否有不是外生的,就是“過

度識(shí)別”問題

3、工具變量的相關(guān)性。

這個(gè)可以說成是“弱工具變量”問題,檢驗(yàn)可以通過一階段的F值。還可以利用Partial

R2o

4、估計(jì)方法

stata里面有這么幾個(gè)2sls,2slssmaKlimkgmm,各自適用情況:small適合小樣本;

liml適合弱工具變量;gmm適合異方差。

【例子】

webusehsng2

*Fitaregressionvia2SLS,requestingsmall-samplestatisticsivregress2slsrentpcturban

(hsngval=famineiregion),small

*FitaregressionusingtheLIMLestimatorivregresslimlrentpcturban(hsngval=famine

iregion)

*FitaregressionviaGMMusingthedefaultheleroskedaslicily-robusiweightmatrixivregress

gmmrentpcturban(hsngval=famineiregion)

*FitaregressionviaGMMusingaheteroskedasticity-robustweightmatrix,requesting

nonrobuststandarderrorsivregressgininrentpcturban(hsngval=famineiregion),vce(unadjusted)

*檢驗(yàn)

cstatafirststagc,allforcenonrobust\\\可以查看第一階段F值,已經(jīng)partialR2

estatoverid\\\查看是否過度識(shí)別

estatendogenous\\\查看是否異方差

regress2slsrentpcturbanhsngval

eslstorem1

ivregress2slsrentpcturban(hsngval=famineiregion)

eststorem2

hausmanmlm2\\\內(nèi)生檢驗(yàn)

工具變量的合理性

為了加深理解,也為了好玩,我們來看看人大經(jīng)濟(jì)論壇上兩個(gè)被繞暈的人的對(duì)話:

甲:一個(gè)計(jì)量方程y=a+bx+u,x如果有內(nèi)生性,則需要找一個(gè)工具變量z。理論上來

說,工具變量Z必須與殘差項(xiàng)U不相關(guān),與被工具的變量X相關(guān)。但是x與u是相關(guān)的。

實(shí)際上U總是會(huì)通過影響X來影響L的(因?yàn)閁與X相關(guān)而X與Z相關(guān))。請(qǐng)問,這算不算工

具變量Z與殘差項(xiàng)U相關(guān).從而導(dǎo)致工具變量Z無效?我考慮,這個(gè)U與Z之間的影響是間

接的。是不是只要不是直接的影響就可以?因?yàn)殚g接地影響好像是必然存在的。

比如說,阿西莫格魯(Acemoglu)那篇著名的關(guān)于制度與經(jīng)濟(jì)增長(zhǎng)的論文,把殖民時(shí)代的

死亡率作為工具變量,但如果其他影響經(jīng)濟(jì)增長(zhǎng)的因素通過影響殖民時(shí)代的制度來影響殖民

時(shí)代的死亡率,那么死亡率這個(gè)工具變量不還是和殘差項(xiàng)相關(guān)嗎?

乙:我跟你的理解不一樣。X是內(nèi)生變量,說明在X背后有一個(gè)或者多個(gè)外生變量可

以解釋X,你所謂的那個(gè)工具變量Z就是那個(gè)主要解釋X的外生變量。如果你可以找到這

個(gè)解釋X的外生變量,那就可以使得X與Z相關(guān)(因?yàn)榭梢越=a+bZ這樣的回歸方程,

那肯定相關(guān)),另外直接莊X解釋Y的話,因?yàn)閄是內(nèi)生變量(也就是個(gè)二傳手),Z這個(gè)外

生變量被包含在誤差項(xiàng)里面了,所以誤差項(xiàng)與X會(huì)相關(guān)。但是你如果已經(jīng)把Z給找出來了,

并用工具變量法進(jìn)行二階段回歸或者GMM的話,那么內(nèi)生性問題就被消除了。

單方程回歸分析的解釋變量只能是外生變量,如果存在二傳手(內(nèi)生變量)那么就需要多

一步建立外生變量(工具變量)與那個(gè)內(nèi)生變量的關(guān)系(即工具變量對(duì)內(nèi)生變廉的回歸方程,

然后使用方程估計(jì)值取代原來的內(nèi)生變量進(jìn)行原方程的同歸)。所以找工具變量是需要很強(qiáng)

的理論知識(shí)的,工具變量?定是外生變量,如果還是找個(gè)內(nèi)生的變量那就沒有意義了,多了

個(gè)三轉(zhuǎn)手罷了。

甲:你好像沒回答我的問題,“如果己經(jīng)把Z給找出來了,并用工具變量法進(jìn)行二階段

回歸或者GMM的話,那么內(nèi)生性問題就被消除了”。可是得先確定z與誤差項(xiàng)不相關(guān),才

能找出合適的z啊。我的問題就是,如果誤差項(xiàng)通過影響x來影響z的(因?yàn)檎`差項(xiàng)與x相

關(guān)而X與Z相關(guān)),此時(shí)我找出的Z還是不是合適的工具變量。

乙:誤差項(xiàng)只是包含Z,不是影響Z。誤差項(xiàng)包含了Z,Z與X相關(guān)(并且Z是X的原

因),所以從現(xiàn)象上看就變成X與誤差項(xiàng)相關(guān)了。你找到的Z跟誤差項(xiàng)無關(guān),跟X相關(guān),而

且從理論上解釋得通,那么就可以當(dāng)工具變量來用。另外工具變量一定要是外生變量,它只

能影響別人不能被別人影響,也就是它只能是原因不能作為結(jié)果。(不然內(nèi)生性問題還是沒

有解決)

甲:”誤差項(xiàng)只是包含Z,不是影響Z。誤差項(xiàng)包含了Z,Z與X相關(guān)(并且Z是X的原

因),所以從現(xiàn)象上看就變成X與誤差項(xiàng)相…”可是誤差項(xiàng)完全有可能包含z之外的影響x

的因素啊,也就是影響x的因素可能不止z一個(gè)啊,那樣的話這個(gè)z以外的誤差項(xiàng)包含的因

素,不就可以通過與x相關(guān)進(jìn)而與z相關(guān)了嗎?這樣工具變量z不就無效了嗎?

乙:我個(gè)人覺得因?yàn)檫@里的Z也可以是范指,當(dāng)然誤差項(xiàng)可能包含多個(gè)外生變量。一般

不可能100%窮盡所有的可以影響X的外生變量,誤差項(xiàng)與X的相關(guān)性小到一定程度就可

以收手了。

z變量需要是外生變量,如果誤差項(xiàng)里面還有其他的因素可?以影響Z變量,那就說明Z

變量也是內(nèi)生變量,這就是一個(gè)多層次的因果關(guān)系了,右因與果之間有多重的中間變量。呵

呵~我牛角尖就鉆到這一步了,頭暈了。接下來等待其他高人的見解了!

同學(xué)們可以想一想,如果你是乙,你會(huì)怎么回答甲的問題。

8關(guān)于工具變量選擇

1,IV應(yīng)該盡量是外生的(如歷史/自然/氣候/地理之類),它應(yīng)該在理論上對(duì)被解釋變量

(以下稱Y)沒有直接影響,但應(yīng)該通過影響被工具的變量(以下稱X)而間接影響被解粹變量

Yo

2,如果上述理論邏輯通的話,將內(nèi)生變量X作為解釋變量,IV和其他變量(X2)作為解

釋變量,看IV是否顯著,它應(yīng)該顯著。如果選了多個(gè)IV,就用FTEST看其是否都不顯著。

同時(shí),如果在多個(gè)IV中,有一個(gè)是確定為外生的,那么,可以用Sargantestofoveridentif

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論