




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
如何尋找工具變量?得工具者得實(shí)證計(jì)量
尋找到一個(gè)好的工具變量可以直接在MIT博士畢業(yè),可見找工具變量是一件有挑戰(zhàn)性
的事情。在我看來,找工具變量是一項(xiàng)有趣的智力活動(dòng),除了需要一個(gè)人有經(jīng)濟(jì)學(xué)的素養(yǎng)和
邏輯,還需要這個(gè)人知識(shí)面廣,自然、地理、人文、世俗智慧和經(jīng)驗(yàn)等,通常,這跟一個(gè)人
熟悉的領(lǐng)域,由長(zhǎng)期觀察和思考產(chǎn)生的洞見有關(guān)。當(dāng)然還需要?點(diǎn)運(yùn)氣,學(xué)術(shù)不是苦思冥想,
也許做一個(gè)夢(mèng),喝一杯下午茶,靈感就閃現(xiàn)了。
工具變量的原理最早出現(xiàn)在菲利普?萊特(PhilipG.Wright)1928年寫的書《TheTariff
onAnimalandVegetableOils》里。
為了進(jìn)一步解釋這個(gè)原理,首先給出一個(gè)典型的線性回歸模型:
y=po+pixi+px+c(1)
這里y為被解釋變量,xi為自變量,或者解釋變量,也即“因"。大寫的X為外生控制
項(xiàng)向量(也即一組假定為外生的其他控制變量,例如年齡、性別等等),£則為誤差項(xiàng)。如果£
與刈不相關(guān),那么我們可以利用OLS模型對(duì)方程進(jìn)行無偏估計(jì)。然而,如果一個(gè)重要變量
X2被模型(1)遺漏了,且XI和X2也相關(guān),那么對(duì)型的OLS估計(jì)值就必然是有偏的。此時(shí),
X1被稱作“內(nèi)生”的解釋變量,這就是“內(nèi)生性”問題。
遇到“內(nèi)生性”問題抻木辦?有一個(gè)方法就是找工具變量Z。
2工具變量(IV)可以用來解決
1)遺漏變量偏差
2)經(jīng)典的測(cè)量誤差問題
3)聯(lián)立性(逆向因果)
3工具變量的條件
變量z可以作為變量x的有效工具變量,當(dāng)滿足:工具變量必須外生,Cov(z,u)=0,
工具變量必須與內(nèi)生變量x相關(guān),即,Cov(z,x)¥0
Cov(z,u)=0無法驗(yàn)證,Cov(z,x),0可以驗(yàn)證
對(duì)工具變量的兩個(gè)要求之間有一個(gè)非常重要的差別。因?yàn)镃ov(z,u)是z與不可觀測(cè)的誤
差u的協(xié)方差,我們無法對(duì)它進(jìn)行驗(yàn)證或哪怕是檢驗(yàn):我們必須求助于經(jīng)濟(jì)行為或內(nèi)心感受
來維持這一假定。相比之下,給定一個(gè)來自總體的隨機(jī)樣本,z與x相關(guān)(在總體中)的條件
則可加以檢驗(yàn)。做到這一點(diǎn)最容易的方法是估計(jì)一個(gè)x與z之間的簡(jiǎn)單回歸。
就是說,Cov(z,u)=0無法驗(yàn)證,我們只能依賴常識(shí)和經(jīng)濟(jì)理論,這需要理論修養(yǎng)和積
累。
但是我們可以檢驗(yàn)是否Cov(z,x)翔,即檢驗(yàn)
Ho:pi=0x=p()+piz+v
這個(gè)回歸有時(shí)被稱為第一?階段回歸。
4我們要什么樣的IV
現(xiàn)在我們來看課上那個(gè)講教育回報(bào)的經(jīng)典例子
在教育回報(bào)率的例子中,假定真實(shí)模型將對(duì)數(shù)工資對(duì)教育和能力回歸:現(xiàn)在能力不可觀
測(cè),而且沒有代理變量IQ
事實(shí)上使用的回歸:洛對(duì)數(shù)工資對(duì)教育回歸,但由于誤差項(xiàng)包含能力,并且教育水平與
能力相關(guān),此時(shí)會(huì)出現(xiàn)教育的內(nèi)生性問題。
z應(yīng)當(dāng)對(duì)y無偏效應(yīng),也不應(yīng)當(dāng)與其它影響y的因素相關(guān)。z必然與內(nèi)生解釋變量x有
著正的或負(fù)的關(guān)系。就是說Z不能和U有關(guān),而且Z只能通過影響X來間接地影響Y。
log(wagc)方程,educ的工具變量z必須:(1)與能力(以及其它影響工資的不可觀測(cè)的因
素)不相關(guān),(2)與教育相關(guān)。諸如一個(gè)人的社會(huì)福利登記號(hào)的最后一位數(shù)字之類的變量,兒
乎一定滿足第一個(gè)必需條件:與能力不相關(guān),因?yàn)樗请S機(jī)決定的。然而,該變量與教育不
相關(guān),因而是educ的一個(gè)低劣的工具變量。
所謂的用于遺漏變量的代理變量因相應(yīng)的原因也是低劣的IVo例如,在遺漏能力的
log(wage)例子中,abil的代理變最應(yīng)該盡可能地與abil高度相關(guān)。而匚具變員必須與abil不
相關(guān)。因此,盡管IQ是abil的一個(gè)好的代理變量候選者,它卻不是educ的好的工具變量。
對(duì)其它可能的工具變量候選者,這些必需條件更加不確定。勞動(dòng)經(jīng)濟(jì)學(xué)家已在工資方程
中使用家庭背景變量作為教育的IV。例如I,母親的教育(motheduc)與孩子的教育是正相關(guān)的,
這一點(diǎn)通過收集勞動(dòng)者數(shù)據(jù)樣本并做cduc對(duì)mothcduc的簡(jiǎn)單回歸便可以看出來。因此,
motheduc滿足方程Cov⑵x)#0。問題是,母親的教育也可能與孩子的能力相關(guān)(通過母親的
能力和可能通過孩子幼年所受的教養(yǎng)的質(zhì)量)。
educ的另一個(gè)IV選擇是成長(zhǎng)過程中兄弟姊妹的數(shù)目(sibs)。一般地說,較多的兄弟姊妹
與較低的平均教育水平相我系。這樣,如果兄弟姊妹的數(shù)目與能力不相關(guān),它可以充當(dāng)educ
的工具變量。
IV與OLS估計(jì)比較
A
IV與OLS的標(biāo)準(zhǔn)差的不同之處僅在于將x對(duì)z回歸得到的Rx,z^2由于Rx,z2<l,IV的
標(biāo)準(zhǔn)差會(huì)比較大。就是左老師說的比誰更有效,如果做出來
當(dāng)Cov(x,u)¥0,OLS不是一致估計(jì),IV是一致估計(jì)。x和z的相關(guān)性越強(qiáng),IV的標(biāo)
準(zhǔn)差越小。
舉個(gè)例子:對(duì)已婚女性進(jìn)行教育的回報(bào)估計(jì)。
我們看到,教育回報(bào)的IV估計(jì)值為5.9%,大約是OLS估計(jì)值的一半。這表明OLS估
計(jì)值過高,且與遺漏的能力變量的偏誤相一致。但我們應(yīng)該記住,這些都是僅從一個(gè)樣本中
得出的估計(jì)值:我們根本不知道0.109是否高于真正的教育回報(bào),或者0.059更接近真正的
教育回報(bào)。其次,IV估計(jì)量的標(biāo)準(zhǔn)誤是OLS標(biāo)準(zhǔn)誤的2.5(().035/0.014)倍。運(yùn)用OLS得出的
仇的95%置信區(qū)間比運(yùn)用IV得出的要窄得多;事實(shí)上,IV的置信區(qū)間確實(shí)包含了OLS估
計(jì)值。
5IV的問題
值得注意的是盡管當(dāng)Z與u不相關(guān),而z與x存在著正的或負(fù)的相關(guān)時(shí),IV是一致性
的,但當(dāng)Z與X只是弱相關(guān)時(shí)IV估計(jì)值可能有大的標(biāo)準(zhǔn)誤。Z與X之間的弱相關(guān)可能產(chǎn)生
甚至是更加嚴(yán)重的后果:即使Z與u只是適度相關(guān),IV估計(jì)量也會(huì)有大的漸近偏誤。
這就是左老師講的弱工具變量問題。
理論上說,Z必須是嚴(yán)格外生的,但是如果工具變量與內(nèi)生變量有一點(diǎn)相關(guān),即使很小,
仍然可能造成估計(jì)的問題,Z和X關(guān)系越小,這個(gè)工具變量就越有風(fēng)險(xiǎn),這個(gè)叫弱T具變
量。
后來左老師舉了Angrist那個(gè)教育和出生季度的例子。
Angrist&Krueger(1991)利用美國(guó)的男性人口調(diào)查數(shù)據(jù),提出了educ的一個(gè)巧妙的二值
工具變量。如果該男性是在第一季度出生的,令frstqrt等于1,否則為0。誤差項(xiàng)——特別
是能力——似乎應(yīng)該與出生季度不相關(guān)。但是,frsiqri還要與educ相關(guān)。事實(shí)表明,在基于
出生季度的總體中,教育年數(shù)確實(shí)有系統(tǒng)性差異。Angrist和Krueger認(rèn)為是緣于在各州實(shí)行
的義務(wù)就學(xué)法,這很有說服力。簡(jiǎn)單地說,年初出生的學(xué)生往往入學(xué)較晚。因此,他們?cè)谶_(dá)
到義務(wù)教育年齡時(shí)(大部分州定為16歲),所受的教育略少于入學(xué)較早的學(xué)生。
因?yàn)榻逃陻?shù)在各出生季度之間的變化僅僅是微乎其微的一一這意味著我們做對(duì)的回
歸來獲得的結(jié)果非常小——Angrist和Krueger需要很大的樣本容量來得到一個(gè)合理而準(zhǔn)確
的IV估計(jì)值。利用1920至1929年之間出生的247199位男性的數(shù)據(jù),得出教育回報(bào)的OLS
估計(jì)值為.0801(標(biāo)準(zhǔn)誤為.0004),IV估計(jì)值為.0715(.0219"見于Angrist和Krueger的論文中
的表IIL注意到OLS估計(jì)值的t統(tǒng)計(jì)量那么大(約為200),然而IV估計(jì)值的t統(tǒng)計(jì)量?jī)H為
3.26。因而IV估計(jì)值在統(tǒng)計(jì)上不為(),但其置信區(qū)間比基于OLS估計(jì)值的置信區(qū)間寬得多。
Angrist和Krueger有一個(gè)有趣的發(fā)現(xiàn):IV估計(jì)值與OLS估計(jì)值相差并不多。實(shí)際上,
利用下一個(gè)十年中出生的男性的數(shù)據(jù),得出IV估計(jì)值稍微高于OLS估計(jì)值。對(duì)此可以這樣
解釋:說明在用OLS估計(jì)工資方程時(shí)不存在遺漏能力論偏誤。可是,Angrist和Krueger的
論文在計(jì)量經(jīng)濟(jì)學(xué)界受到了非難。如同Bound,Jaeger和Bakcr(1995)討論的那樣,它不能明
顯地判斷出生季節(jié)與影響工資的諸因素不相關(guān),縱然這些因素沒有被人觀測(cè)到。
6自我選擇(self-selection)的問題
舉個(gè)例子,Angrisi(1990)研究了,參加越南戰(zhàn)爭(zhēng)的老兵,其終身收入因參加越戰(zhàn)而受到
的影響。一個(gè)簡(jiǎn)單模型為:income=veteran+others
其中veteran是二值變量。疑問在于,用OLS估計(jì)該方程時(shí),可能存在一個(gè)自我選擇
(self-selection)的問題:也許人們因?yàn)槟軓能婈?duì)中得到最多的收入而選擇參軍,或者參軍的決
策與其他對(duì)收入有影響的特征相關(guān)。這些問題將導(dǎo)致veteran與u相關(guān)。
Angrist指出,越南戰(zhàn)爭(zhēng)的征兵抽簽提供了一個(gè)自然試驗(yàn)(naturalexperiment),從而產(chǎn)生
了veteran的一個(gè)工具變量。年輕人被分給的征兵抽簽號(hào)決定了他們是否會(huì)被征召去服役于
越南戰(zhàn)爭(zhēng)。因?yàn)樗纸o的號(hào)碼(畢竟)是隨機(jī)分配的,征兵抽簽號(hào)與誤差項(xiàng)u不相關(guān)似乎是可
信的。而得到號(hào)碼足夠小(指號(hào)碼小于某個(gè)數(shù))的人必須服役于越南戰(zhàn)爭(zhēng),使得成為老兵的概
率與抽簽號(hào)相關(guān)。如果以上兩點(diǎn)都是正確的,征兵抽簽號(hào)是veteran的一個(gè)好的IV候選者。
7MJStata做ivreg處理內(nèi)生性怎么玩?
【問題及方法】
內(nèi)生性,每個(gè)實(shí)證人的痛。內(nèi)生性主要的三個(gè)來源:測(cè)量誤差、遺漏變量和逆向因果。
1、變量的內(nèi)生性。
這個(gè)是沒有辦法單獨(dú)檢驗(yàn)的。當(dāng)有合適工具變量時(shí)候,是可以檢驗(yàn)的,就是Hausman檢
驗(yàn)
2、工具變量的外生也。
這個(gè)也是沒辦法檢驗(yàn)的。當(dāng)有很多工具變量時(shí)候,可以檢驗(yàn)是否有不是外生的,就是“過
度識(shí)別”問題
3、工具變量的相關(guān)性。
這個(gè)可以說成是“弱工具變量”問題,檢驗(yàn)可以通過一階段的F值。還可以利用Partial
R2o
4、估計(jì)方法
stata里面有這么幾個(gè)2sls,2slssmaKlimkgmm,各自適用情況:small適合小樣本;
liml適合弱工具變量;gmm適合異方差。
【例子】
webusehsng2
*Fitaregressionvia2SLS,requestingsmall-samplestatisticsivregress2slsrentpcturban
(hsngval=famineiregion),small
*FitaregressionusingtheLIMLestimatorivregresslimlrentpcturban(hsngval=famine
iregion)
*FitaregressionviaGMMusingthedefaultheleroskedaslicily-robusiweightmatrixivregress
gmmrentpcturban(hsngval=famineiregion)
*FitaregressionviaGMMusingaheteroskedasticity-robustweightmatrix,requesting
nonrobuststandarderrorsivregressgininrentpcturban(hsngval=famineiregion),vce(unadjusted)
*檢驗(yàn)
cstatafirststagc,allforcenonrobust\\\可以查看第一階段F值,已經(jīng)partialR2
estatoverid\\\查看是否過度識(shí)別
estatendogenous\\\查看是否異方差
regress2slsrentpcturbanhsngval
eslstorem1
ivregress2slsrentpcturban(hsngval=famineiregion)
eststorem2
hausmanmlm2\\\內(nèi)生檢驗(yàn)
工具變量的合理性
為了加深理解,也為了好玩,我們來看看人大經(jīng)濟(jì)論壇上兩個(gè)被繞暈的人的對(duì)話:
甲:一個(gè)計(jì)量方程y=a+bx+u,x如果有內(nèi)生性,則需要找一個(gè)工具變量z。理論上來
說,工具變量Z必須與殘差項(xiàng)U不相關(guān),與被工具的變量X相關(guān)。但是x與u是相關(guān)的。
實(shí)際上U總是會(huì)通過影響X來影響L的(因?yàn)閁與X相關(guān)而X與Z相關(guān))。請(qǐng)問,這算不算工
具變量Z與殘差項(xiàng)U相關(guān).從而導(dǎo)致工具變量Z無效?我考慮,這個(gè)U與Z之間的影響是間
接的。是不是只要不是直接的影響就可以?因?yàn)殚g接地影響好像是必然存在的。
比如說,阿西莫格魯(Acemoglu)那篇著名的關(guān)于制度與經(jīng)濟(jì)增長(zhǎng)的論文,把殖民時(shí)代的
死亡率作為工具變量,但如果其他影響經(jīng)濟(jì)增長(zhǎng)的因素通過影響殖民時(shí)代的制度來影響殖民
時(shí)代的死亡率,那么死亡率這個(gè)工具變量不還是和殘差項(xiàng)相關(guān)嗎?
乙:我跟你的理解不一樣。X是內(nèi)生變量,說明在X背后有一個(gè)或者多個(gè)外生變量可
以解釋X,你所謂的那個(gè)工具變量Z就是那個(gè)主要解釋X的外生變量。如果你可以找到這
個(gè)解釋X的外生變量,那就可以使得X與Z相關(guān)(因?yàn)榭梢越=a+bZ這樣的回歸方程,
那肯定相關(guān)),另外直接莊X解釋Y的話,因?yàn)閄是內(nèi)生變量(也就是個(gè)二傳手),Z這個(gè)外
生變量被包含在誤差項(xiàng)里面了,所以誤差項(xiàng)與X會(huì)相關(guān)。但是你如果已經(jīng)把Z給找出來了,
并用工具變量法進(jìn)行二階段回歸或者GMM的話,那么內(nèi)生性問題就被消除了。
單方程回歸分析的解釋變量只能是外生變量,如果存在二傳手(內(nèi)生變量)那么就需要多
一步建立外生變量(工具變量)與那個(gè)內(nèi)生變量的關(guān)系(即工具變量對(duì)內(nèi)生變廉的回歸方程,
然后使用方程估計(jì)值取代原來的內(nèi)生變量進(jìn)行原方程的同歸)。所以找工具變量是需要很強(qiáng)
的理論知識(shí)的,工具變量?定是外生變量,如果還是找個(gè)內(nèi)生的變量那就沒有意義了,多了
個(gè)三轉(zhuǎn)手罷了。
甲:你好像沒回答我的問題,“如果己經(jīng)把Z給找出來了,并用工具變量法進(jìn)行二階段
回歸或者GMM的話,那么內(nèi)生性問題就被消除了”。可是得先確定z與誤差項(xiàng)不相關(guān),才
能找出合適的z啊。我的問題就是,如果誤差項(xiàng)通過影響x來影響z的(因?yàn)檎`差項(xiàng)與x相
關(guān)而X與Z相關(guān)),此時(shí)我找出的Z還是不是合適的工具變量。
乙:誤差項(xiàng)只是包含Z,不是影響Z。誤差項(xiàng)包含了Z,Z與X相關(guān)(并且Z是X的原
因),所以從現(xiàn)象上看就變成X與誤差項(xiàng)相關(guān)了。你找到的Z跟誤差項(xiàng)無關(guān),跟X相關(guān),而
且從理論上解釋得通,那么就可以當(dāng)工具變量來用。另外工具變量一定要是外生變量,它只
能影響別人不能被別人影響,也就是它只能是原因不能作為結(jié)果。(不然內(nèi)生性問題還是沒
有解決)
甲:”誤差項(xiàng)只是包含Z,不是影響Z。誤差項(xiàng)包含了Z,Z與X相關(guān)(并且Z是X的原
因),所以從現(xiàn)象上看就變成X與誤差項(xiàng)相…”可是誤差項(xiàng)完全有可能包含z之外的影響x
的因素啊,也就是影響x的因素可能不止z一個(gè)啊,那樣的話這個(gè)z以外的誤差項(xiàng)包含的因
素,不就可以通過與x相關(guān)進(jìn)而與z相關(guān)了嗎?這樣工具變量z不就無效了嗎?
乙:我個(gè)人覺得因?yàn)檫@里的Z也可以是范指,當(dāng)然誤差項(xiàng)可能包含多個(gè)外生變量。一般
不可能100%窮盡所有的可以影響X的外生變量,誤差項(xiàng)與X的相關(guān)性小到一定程度就可
以收手了。
z變量需要是外生變量,如果誤差項(xiàng)里面還有其他的因素可?以影響Z變量,那就說明Z
變量也是內(nèi)生變量,這就是一個(gè)多層次的因果關(guān)系了,右因與果之間有多重的中間變量。呵
呵~我牛角尖就鉆到這一步了,頭暈了。接下來等待其他高人的見解了!
同學(xué)們可以想一想,如果你是乙,你會(huì)怎么回答甲的問題。
8關(guān)于工具變量選擇
1,IV應(yīng)該盡量是外生的(如歷史/自然/氣候/地理之類),它應(yīng)該在理論上對(duì)被解釋變量
(以下稱Y)沒有直接影響,但應(yīng)該通過影響被工具的變量(以下稱X)而間接影響被解粹變量
Yo
2,如果上述理論邏輯通的話,將內(nèi)生變量X作為解釋變量,IV和其他變量(X2)作為解
釋變量,看IV是否顯著,它應(yīng)該顯著。如果選了多個(gè)IV,就用FTEST看其是否都不顯著。
同時(shí),如果在多個(gè)IV中,有一個(gè)是確定為外生的,那么,可以用Sargantestofoveridentif
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《連鎖經(jīng)營(yíng)》課件項(xiàng)目三連鎖
- 幼兒園小班數(shù)學(xué)認(rèn)識(shí)數(shù)字15課件
- 2025年國(guó)際商務(wù)英語(yǔ)考試題及答案
- 主動(dòng)呼吸循環(huán)技術(shù)
- 2025年中級(jí)會(huì)計(jì)考試試題及答案
- 2025年國(guó)際商務(wù)專業(yè)主管考試試卷及答案
- 超高層施工課件
- 幼兒園中班安全教育第一課
- 2025年電焊工職業(yè)資格考試試題及答案
- 江蘇省無錫市澄西片2025屆英語(yǔ)八年級(jí)第二學(xué)期期末調(diào)研試題含答案
- 2025年北森人才測(cè)評(píng)試題及答案2024
- 電焊工職業(yè)技能鑒定高級(jí)工理論題庫(kù)
- 火災(zāi)逃生自救知識(shí)培訓(xùn)
- 無線覆蓋系統(tǒng)施工方案
- 2024年公路水運(yùn)工程施工企業(yè)(主要負(fù)責(zé)人和安全生產(chǎn)管理人員)考核題庫(kù)(含答案)
- 醫(yī)療物資配送應(yīng)急預(yù)案
- 2023年江門市建筑工匠大比武建筑電工技術(shù)文件
- 衛(wèi)星導(dǎo)航產(chǎn)品培訓(xùn)
- 游戲中的物理奧秘
- 2023-2024學(xué)年廣東省深圳市南山區(qū)八年級(jí)(下)期末歷史試卷
- 食品應(yīng)急演練課件
評(píng)論
0/150
提交評(píng)論