




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.一般檢查
假設系數為0,t比較大則拒絕假設,認為系數不為0.
假設系數為O,P比較小則拒絕假設,認為系數不為0.
假設方程不顯著,F比較大則拒絕假設,認為方程顯著。
2.小樣本運用0LS進行估計的前提條件為:
(1)線性假定。即解釋變量與被解釋變量之間為線性關系。這一前提可以通過將非線性
轉換為線性方程來解決。
(2)嚴格外生性。即隨機擾動項獨立于所有解釋變量:與解釋變量之間所有時候都是正
交關系,隨機擾動項盼望為0。(工具變量法解決)
(3)不存在嚴格的多重共線性。一般在現實數據中不會出現,但是設立過多的虛擬變量
時,也許會出現這種現象。Stata可以自動剔除。
(4)擾動項為球型擾動項,即隨即擾動項同方差,無自相關性。
3.大樣本估計時,一般規定數據在30個以上就可以稱為大樣本了。大樣本的前提是
⑴線性假定
(2)漸進獨立的平穩過程
(3)前定解釋變量,即解釋變量與同期的擾動項正交。
(4)E(XiXit)為非退化矩陣。
(5)gt為鞅差分序列,且其協方差矩陣為非退化矩陣。
與小樣本相比,其不需要嚴格的外生性和正太隨機擾動項的規定。
4.命令
穩健標準差回歸:regyxlx2x3,robust回歸系數與OLS同樣旭標準差存在差
異。假如認為存在異方差,則使用穩健標準差。使用穩健標準差可以對大樣本進行檢查。
只要樣本容量足夠大,在模型出現異方差的情況下,使用穩健標準差時參數估計、假設
檢查等均可正常進行,即可以很大限度上消除異方差帶來的副作用
對單個系數進行檢查:test1nq=1
線性檢查:一…
5.假如回歸模型為非線性,不方便使用OLS,則可以采用最大似然估計法(MLE),或者非線性
最小二乘法(NLS)
6.違反經典假設,即存在異方差的情況。截面數據通常會出現異方差。
因此檢查異方差可以:
(1)看殘差圖,但只是直觀,也許并不準確。
rvfplot(residua|—versus-fittedplot)與擬合值的散點圖
rvpp1otvarname(residual-versus-predictorplot)與解釋變量的散點圖
擾動項的方差隨觀測值而變動,表達也許存在異方差。
(2)懷特檢查:
estatimtest,white(post-estimationinformationmatrixtest)
P比較小,則拒絕同方差假設,表達存在異方差,不能用OLS。反之則證明為同方
差。
(3)BP檢查
estathe11est,iid(默認設立為使用擬合值y八)
estathettest,rhsiid(使用方程右邊的解釋變量,而不是y")
estathettest[varlist],iid(使用某個指定的解釋變量)
P小,則拒絕原假設。
假如存在異方差,則可以:
(1)使用0LS+穩健標準差robust
(2)廣義最小二乘法(GLS)
(3)加權最小二乘法(WLS)
predictel,res(預測殘差)
ge2=elA2
輔助回歸:
g1ne2=log(e2)
regIne21nq,noc
Predict1ne2f計算輔助回歸的擬合值
ge2f=exp(lne2f)去掉對數即權重之倒數
regIntcInqInpIInpkInpf[aw=l/e2f]
regyxlx2x3[aw=l/var](aw表達analytica1weight,var表達隨即擾動項的方
差。)
或者:
predictu,residuals
predictyf,xb
genlnu2=ln(uA2)
genyf2=yfA2
quietIyreg1nu2yfyf2
predictnlu2f=exp(xb())
gensd=sqrt(u2f)
vw1sIntcInqInplInpfInpk,sd(sd)
(4)可行廣義最小二乘法(FGLS)
FGLS所做的過程和GLS同樣,只是GLS假設擾動項的方差已知,若要用GLS,必須
計算得到擾動項方差,而FGLS則是在未知方差的情況下求方差并最終通過將異方差轉換
為同方差后再運用OLS的結果。因此,GLS和FGLS在過程上是一致的。
6.自相關
時間序列中容易出現自相關,而截面數據也也許存在空間自相關。人為解決數據如移動平
均等做法也也許導致自相關。
檢查自相關可以:
⑴作圖,但并不嚴格。
定義滯后算子L.(只有時間序列數據和面板數據才干定義時間變量。)
tssetyaear
一階差分:D.x=xt-xt-1D2.X=xt—xt-2
LD.表達一階差分的滯后值
畫圖:scatterelL.e1
acel(看自相關圖)
pace1(看偏相關圖)
(2)BG檢查
estatbgodfrey(默認p=l)
estatbgodfrey,lags(p)
estatbgodfrey,nomissO(使用不添加。的BG檢查)
使用命令ac查看自相關圖,或者設立較大的p值進行顯著性檢查,t期不顯著了,則選
擇P=T-1
記錄檢查P值小,則拒絕假設。
(3)box-pierceQ檢查/Ljung?BoxQ
regyx1x2x3
predicteI,resid
wntestqel(使用stata提供的默認滯后期)
wntestqel,lags(p)(使用自己設定的滯后期)
(4)DW檢查:現在已經不常用,由于其只能檢查一階自相關。
estatdwatson
自相關的解決方法:
⑴使用OLS+異方差自相關穩健的標準差(HeteroskedasticityandAutocorrelation
ConsistentStandardError,HAC)
neweyyxlx2x3,1ag(p)(HAC標準差,必須制定滯后階數p)
滯后期數選擇n7/4
(2)使用OLS+聚類穩健的標準差(clusterrobuststandarderror)面板數據中經常使用
聚類穩健的標準差。
regyxlx2x3,cluster(state)(聚類穩健標準差,假設"state”為聚類變量)
(3)使用可行廣義最小二乘法(FGLS)
praisyxlx2x3(使用默認的PW估計法)
praisyxlx2x3,core(使用CO估計法)
(4)修改模型設定,也許自相關是由于漏掉了自相關的解釋變量。
7多重共線性
在回歸后,使用命令VIF
estatvif經驗表達,vif<10,則不存在多重共線性。
假如存在多重共線性,但是只關心整個方程預測被解釋變量的能力,或者只關心變量的
顯著性,則不必理睬多重共線性,由于多重共線性只是對單個解釋變量的解釋能力估計出
現了偏差。存在多重共線性,則逐個剔除。
8.漏掉變量(解決擾動項嚴格外生性的問題)
漏掉變量與解釋變量不相關時,擾動項與解釋變量不相關QLS估計仍然一致,但擾動項方
差過大,影響估計的精確度
假如漏掉變量與解釋變量相關,擾動項與解釋變量則會相關,導致OLS估計不再一致。
出現“漏掉變量偏差”。
所以可以不研究某些解釋變量而只對感愛好的解釋變量進行研究,但是重要的是漏掉解釋
變量不能與解釋變量相關。解決漏掉解釋變量的方法有:
(1)加入盡也許多的控制變量(controlvarible),從理論上說明漏掉變量與擾動項不
相關,或很弱的相關
(2)使用代理變量(proxyvariable),這在控制變量不可得的時候采用,如用IQ代替
能力
(3)工具變量法
(4)使用面板數據(短面板、長面板、動態面板)
(5)隨即實驗和自然實驗
9.選擇解釋變量的個數的時候,要選擇適當的方式。
⑴按照變量個數使得矯正可決系數最大的準則選擇個數(假如加入變量,反倒A-R變小,
則去掉加入的變量。)
(2)赤池信息準則(AICakaikeInformat!onCriteria)
(3)貝葉斯信息準則(BayesianInformationCriteria)
(4)漢南-昆信息準則(Hanan-QuinnInformationCriteria)但這一準則不常用
命令:estatic
取AICBIC最大時候的變量個數
1。.解決極端數據:
regyxlx2x3
predictlev,leverage(列出所有解釋變量的影響力值)
gsort-1ev(將所有的觀測值按照lev的降序排列)
sum1ev(看LVE的最大值和平均值)
listlev必(列出影響力最大的三個值)
可以將極端數據加入和省略進行對比。
10虛擬變量
M個定性的量,最多可以有(M-1)個虛擬變量
設立虛擬變量:generated二(year>=1978)
如希望將每個省設立為虛擬變量,則需要:tabulateprovince,generate(pr)
回歸簡化為:regyxlx2x3pr2—pr31
11.工具變量法
這可以解決擾動項與自變量的相關問題,設立的工具變量需要與擾動項無關而與內生解
釋變量相關。傳統的工具變量法一般通過兩階段最小二乘法TSLS、2SLS(twostageleas
tsquare)o第一階段,工具變量對內生解釋變量回歸;第二階段,被解釋變量對工具變量的
擬合值進行回歸。多個工具變量的線性組合仍然可以作為工具變量。
命令:ivregress2slsdepvar[var1ist1](var1ist2=inslist)
Depvar為被解釋變量,varIist1為外生解釋變量,var1ist2為內生解釋變
量,instlist為工具變量。如:
ivregress2s1syxl(x2=z1z2)
ivregress2s1syxl(x2x3=z1z2z3z4),rfirst
(r表達用異方差的標準差,first表達在結果中顯示第一階段的回歸。)
在面板數據中執行2SLS可以用:xtivregdepvar[varlis11](varlist_2=varli
st_iv)(詳見heIpxtivreg)
檢查工具變量與解釋變量的相關性:即檢查工具變量是否為弱工具變量,
命令:estatfirststageza1Iforcenonrobust(a11表達顯示每個內生變量的記
錄量,而非僅僅所有內生變量綜合的記錄量,forcenonrobust表達及時在進行工具變量
法時用了穩健標準差,也仍然允許計算estatfirststage)
解決弱工具變量的方法涉及
A.尋找更強的工具變量
B.弱工具變量較多,則舍棄弱工具變量,
C.用有限信息最大似然估計法(Limitedinformationmaximumlikelihoo
destimation,LIML)LIML與2sLs漸進等價,但在弱工具變量的情況下,LlM
L的小樣本性質也許優于2SLS.
命令為:ivregressIimldepvar[varlist1](varlist2=instIist)
過度辨認(即多余的工具變量的個數)命令為:estatoverid但并不能告訴哪些工具變
量無效。
使用工具變量的前提是存在內生解釋變量(即解釋變量與擾動項相關),這也需要檢
查。假如所有解釋變量都是外生變量則用OLS比用工具變量法更有效,反之應當用工具
變量法。豪斯曼檢查就是假設所有解釋變量都為外生變量。
豪斯曼檢查的stata命令:
regyxlx2
estimatesstoreo1s(存儲OLS的結果)
ivregress2sIsyx1(x2=zlz2)(假設懷疑x2為內生變量)
estimatesstoreiv(存儲2SLS的結果)
hausmanivols,constantsigmamore(根據存儲的結果進行豪斯曼檢查)
但uguo存在異方差,則OLS并不是最有效的,傳統額豪斯曼檢查不合用于異方差的情形,
解決方法是“自助法”;或者使用“杜賓?吳一豪斯曼DWH檢查”也可以合用于存在異方
差的情況。命令:estatendogenous
在球型擾動項的假定下,2SLS是最有效的,但是假如擾動項存在異方差或者自相關,則
廣義矩估計(generalizedmethodofmomerits,GMM)更有效。GMM與2sLs的
關系就相稱于GLS與OLS之間的關系。
GMM過程:
seeinstallivreg2(安裝程序ivreg2)
seeinstal1ranktest(安裝此外一個在運營ivreg2時需要用到的輔助程序
ranktest)
usedata
xtsetpanelvartimevar(設立面板變量和時間變量)
ivreg2yxl(x2=z1z2),gmm2s
12.短面板:(固定效應和隨機效應模型)
N大T小的一般叫做短面板。面板數據的優點為:可以解決漏掉變量的問題,可以提
供更多動態行為的信息,樣本較多從而估計更準確。但面板數據一般不滿足獨立同分布的
假設。
解決面板數據的一個方法是將面板數據當作橫截面數據解決進行OLS回歸,稱為“混
合回歸”,但它忽略了同一個聚類存在的相關問題。雖然通常可以假定面板數據不同個體的
擾動項的獨立性,但是對于同一個體卻存在固定效應和隨機效應。
固定效應模型通常可以采用組內估計法(FE)和一階差分法(FD)。當T=2時,FD=FE;
當T>2,擾動項獨立同分布時,FE優于FD。因此,實踐用FE較多,而對動態面板,則用FD
較多。
隨機效應的存在使得OLS估計是一致但無效的。可使用廣義最小二乘法(FGLS)來
進行估計。也可以使用組間估計量(BE)
用豪斯曼檢查選擇是選用固定效應模型還是隨機效應模型,假如記錄量大于零界值,則
拒絕假設。假如假設成立,RE最有效,但是不合用于異方差的情形。解決方法是自助法和
輔助回歸。
非平衡面板經常會損失數據,導致破壞樣本的隨機性。
xtsetpaneIvatimevar(設定面板數據的面板個體變量和時間變量)
encodecountry,gen(entry)(為面板個體編號使得面板個體為整數)
顯示面板數據記錄特性:
xtdes(顯示面板數據結構,是否為平衡面板)
xtsum(顯示組內、組間和整體的記錄指標)
xttabvarname(顯示組內、組間與政體的分布頻率)
xtlinevarname(對每個個體分別顯示該變量的時間序列圖,假如希望疊放,則選擇
overlay)
regyxlx2x3,vce(clusterid)(混合回歸,VCE是以id為cIuster
的聚類穩健標準差,由于同一地區不同時間擾動項之間一般存在自相關.)VCE是考慮到
了同一聚類之間的同方差現象。
xtregYX1X2X3,fevce(c1usterid)(使用固定效應模型回歸)
得到的回歸中rh。表達來自個體效應ui的比例。
XtregYX1X2X3,fe中的F檢查通過,則可以使用混合回歸模型。若拒絕假設
(P小),則FE更優,每個個體都有自己的固定效應。但此時的由于沒有使用穩健回歸,因此
F檢查并不有效,還需要進一步用LSDV法觀測。
LSDV法的stata命令為:
xi:xtregyxlx2x3i.id,vce(clusterid)(xi為增添互動項int
eractionexpansion,i.id表達根據擬定個體變量id生成的虛擬變量,在這里是state)(P
小,則說明個體虛擬變量很顯著,因此,不滿足無個體效應的假設,則不能用混合回歸模
型。)
對于固定效應模型,也可以用一階差分法FD的命令:
xtserialyxlx2x31output(我的stata不能辨認xtserial咋回事?)一
般認為FE比FD有效,故較少使用FDo
也可以在固定效應中考慮時間效應,即雙向固定效應:
tabyeargen(year)定義年度虛擬變量
xtregYX1X2X3year2-year7,fevce(c1usterid)(明明是statal2.為什么
說數據太多不能計算?要把前面的計算保存等清空,那后面怎么對比?)
testyearlyear2year3o?year7對年度虛擬變量的聯合檢查為
檢查存在時間效應和固定效益后,還也許存在隨機效應,對隨機效應進行檢查:
xtregyx1x2x3,revce(clusterid)(隨機效應FGLS)
xtregyxlx2x3,mle(隨機效應MLE)
檢查個體隨機效應存在一個LM檢查,需要在隨機效應估計之后進行:
.re—evce(clusersta.
estimatesstoreRE
xttest0
假如P很小,則拒絕假設,認為在“隨即效應”與“混合回歸”之間,應當選擇“隨即效
應”。
假如數據質量不好,可以考慮使用組間估計量,但會損失較多信息量。
regyxlx2x3zbe
estimatesstoreBE
選用固定效應模型還是隨機效應模型運用豪斯曼檢查
xtregyx1x2x3zfe
estimatesstoreFE
xtregyx1x2x3zre
estimatesstoreRE
hausmanFERE,constantsigmamore
p小,則強烈拒絕使用隨機效應模型,而應采用固定效應模型。
但是假如聚類穩健標準差和普通標準差相差較大,則傳統的豪斯曼檢查并不合用。這
時需要進行輔助回歸。
為一航=國-包-祝8+(、/動+(跖—海)]
目前在stata中需要手動進行。環節如下:
quietlyxtregfata1beertaxspirconsunrateperinek,re
sealartheta=e(theata)(從回歸中得到THETA)
globa1yandxforhausmanfata1beertaxspirconsunrateperinek
(使用yandxforhausman時,代表了所有使用的變量)
foreachxofvarlist$yandxforhausman{
bystate:egenmean'x'=mean(zxz)到底用什么表達?
genmd'x'='x'-mean'x"
genred"x'='x'-theata*mean'x'
)
quietlyxtregredfatalredbeertaxredspirconsredunrateredperinck
mdbeertaxmdspirconsmdunratemdperinck,vce(clusterstate)
testmdbeertaxmdspirconsmdunratemdperinck
檢查發現P小,則拒絕r=0的假設,應當選用固定效應模型。
(疑問:那中間那個式子呢?)
面板數據在回歸之前要通過平穩性檢查,其解決環節簡化為:面板數據單位根檢查一協
整檢查一回歸。一般為了方便,采用相同單位根檢查LLC檢查和不同單位根檢查Fisher-
ADF檢查(非面板數據一般采用ADF檢查)。兩種檢查均拒絕存在單位根的元假設,則認為
序列平穩。
13.長面板和動態面板(不能像短面板那樣假定獨立同分布,而應當運用廣義最小二乘法FGLS
進行估計,解決組內和組間的自相關。)
解釋變量包含被解釋變量的滯后項,則為動態面板,反之為靜態面板.
(1)僅解決組內自相關的FGLS
tabstate,gen(state)考慮個體效應,生成州虛擬變量。
gent=year-1962考慮時間趨勢,生成時間趨勢變量
regYX1X2X3State2-statel0t,vce(clusterstate)用LSDV估計雙向固定
效應模型
estimatesstore0LS
考慮組內自相關的情形:用命令stpcse
stpcseYX1X2X3state2-statelOt,corr(ar1)約束條件為自回歸系數都相同的
一階。
考慮各組自回歸系數不同的組內自相關情形
stpcseYX1X2X3state2-state101,corr(psar1)
假如僅考慮不同個體擾動項存在異方差而忽略自相關,則可以用
stpcseYXIX2X3state2-statel0t,hetonly
將以上各估計的系數及標準差列表便于比較:
究竟應當采用OLS還是采用AR1,則需要檢查自相關。
(2)同時解決組內自相關和組間同期相關的FGLS的命令xtg1s
xtglsYXIX2X3state2-state101,paneIs(iid/het/cor)corr(arl/psarl)
iid表達不同個體(組間)的擾動項獨立且具有相同的方差,het表達不同個體的擾動
項獨立但具有不同的方差,cor表達不同個體的擾動項同期相關且具有不同的方差。Corr
表達組內,解釋同前。假如加上igls則表達用的迭代FGLS,而非兩步FGLS.
若執行xtgls或者xtpcse時沒有使用個體虛擬變量,則為隨機效應模型,若使用了則為
固定效應模型。
⑶長面板數據自相關和異方差檢查
組間異方差檢查,運用似然比檢查
XtglsYXlX2X3,iglspane1(het)(允許異方差的迭代式FGLS估計)
Estimatesstorehetro(將異方差條件下的估計結果儲存為hetero)
XtgIsyxlx2x2,igls(同方差條件下的FGLS)
Estimatesstorehomo(將同方差條件下的估計結果儲存為homo)
localdf=e(N_g)-1(計算自由度,即約束條件個數,其中e(N_g)為個體個數)
lrtestheterohomo,df(zdfz)(制定自由度,進行似然比檢查。)符號到底是如
何的?
P=0,則強烈拒絕LR檢查的“組間同方差”假設。
另一種檢查組間異方差的方法為xttest3,只能在xtreg,fe或者xtgls之后使用:
Sscinstallxttest3(安裝命令"xttest3")
Xttest3(進行組間異方差檢查)這個超級簡樸~~
組內自相關檢查通過下載命令xtseriaI來實現這個檢查
netinstaIIstO039(安裝命令stserial)為什么下不了?
xtserialyxlx2x3,output(進行組內組相關檢查,若P小,則強烈決絕不存在一
階組內自相關的假設。)
組間截面相關檢查:非官方xttest2?其僅能在xtgls,ivreg2,和xtreg,fe后使用,
且能用于場面版
sscinstallx11est2(安裝xttest2)
xttest2(組間截面相關檢查)
當這一種方法無法檢查時,可以采用另一種方法,xtcsd命令,長短面板都能用,用在fe之
后?
sscinstallxtcsd(安裝命令"xtcsdn)
xtcsd,Pesaranabsshow(pesaran的檢查,服從正態分布)
xtcsd,friedmanabsshow(friedman的檢查,服從喀方分布)
xtcsd,freesabsshow(frees的檢查)
對于長面板除了可以讓不同個體擁有不同的截距項外還可以使其擁有不同的斜率,這成為
“變系數模型”,假如其系數為常數,則可分別回歸,但假如各個體擾動項相關,則應當把所
有個體回歸方程疊放,然后使用“似不相關回歸"(SUR)旭由于參數估計較多,會損失自
由度。假如考慮“部分變系數模型",則SUR不再合用,而應用LSDV法,引入虛擬變量,以
及虛擬變量與可變細數解釋變量的互動項(參見helpxi)
假如將系數看作是隨機的,則FGLS估計模型,即運用OLS殘差估計協方差矩陣中的參數,
然后再使用GLS,命令為:
Xtrcyxlx2x3,betas(betas表達顯示對每一組系數的估計),其附帶參數穩定
性檢查
雖然面板數據能在一定限度上解決漏掉變量問題,但假如存在內生解釋變量,還是需要
用工具變量法,先解決漏掉問題,再使用2SLS
對于動態面板,就算是組內估計量(FE)也是不一致的。
差分GMM和水平GMM結合就成了系統GMM估計。
差分GMM的stata命令為:
xtabonddepvar[indepvars],1ags(p)maxidep(q)pre(var1ist)endogen
ous(varlist)inst(varIist)twostepvce(robust)
如:xtabond1wageoccsouthsmsaind,1ags(2)maxldep(3)pre(wks,
Iag(l,2))endogenous(ms,Iag(0,2))endogenous(union,Iag(0,2))twostepvce(ro
bust)
差分GMM存在的前提是擾動項不存在自相關,對此要進行檢查,需要擾動項的差分
不存在二階或更高階自相關即可。
命令為:estatabond,p小,則存在自相關,P大,則不存在自相關。
更高階自相關的檢查為:estatabondartests(3)
由于使用過多的工具變量,還需要進行過度辨認檢查
先回歸,但要去掉最后的vce(robust)
estatsargan
系統GMM的stata命令為:
xtdpdsysdepvar[indepvars],Iags(p)maxIdep(q)pre(var1ist)endo
genous(varlist)inst(varlist)twostepvce(robust)
若要對比差分GMM和系統GMM的系數和標準差,則用命令:
estimatestableDGMMSGMM,bse
14.離散被解釋變量(通常不適合用OLS,而應當用二值模型,probit1ogit和多值選擇模
型)
假如F為標準正態的累積分布函數,則P模型為Probit模型,若F為邏輯分布的累積
分布函數,則P模型為Logit模型。計算Logit模型通常比Probit模型更方便。
二值模型的Stata命令為:
probityx1x2x3
logityx1x2x3
probit和1ogit的分布函數不同,因此參數不能直接比較,需要分別計算兩者的邊際效
應,再進行比較,STATA進行解決的命令為:
mfx(計算在樣本均值處的邊際效應)
mfx,at(Xl=0)(計算在Xl=0時,X2,X3取值樣本均值處的邊際效應)
mfx,eyex(計算在樣本均值處的彈性)
predictyhat(計算發生概率的預測值,并記為yhat),對于Logit模型,系數表達解釋變
量x增長一個單位將引起的“對數幾率比”的邊際變化。
衡量二值模型的擬合優度采用“準R2”,判斷擬合優度還可以通過計算預測準確的比
例,相應STAT命令為:
estatc1as
logti和probit模型雖然估計系數不同,但其估計系數沒有可比性,其mfx計算出的邊際
效應及準R2與對的預測比幾乎一致。
假如接受似然比檢查(LR),則可用同方差probit模型估計。在存在異方差的情況下進
行probit模型估計為:
hetprobYX1X2X3,het(varIist)那自相關呢?
多值選擇模型:
多值選擇模型的stata命令為:
m1ogitYXIX2X3,base(#)(多值logit選擇模型,base的用來指定參照組)
mlogitYXIX2X3,rrrbase(#)(多值logit選擇模型,回報re1ativeriskratio)
mprobitYXIX2X3,base(#)(多值probit選擇模型)
排序數列模型的stata命令:orderedprobit/1ogit
oprobitYX1X2X3
ologitYXIX2X3
oprobit
預測:predictp2p3p4p5
列出第一個觀測值的預測結果:listp2p3p4p5in1/1,
ologit
預測:predictr2r3r4r5
列出第一個觀測值的預測結果:listr2r3r4r5in]/l,
計數模型
(1)有些被解釋變量僅能取非負整數,如金牌數量,看病次數等,一般用泊松回歸。St
ata命令為
poissonyxlx2x2,r(穩健標準差)
estatgof(goodnessoffitnes擬合優度檢查)
泊松回歸的局限是其盼望和方差一定相等,但有些被解釋變量的方差明顯大于盼望,即
存在“過度分散”,則可以考慮“負二項回歸"(negativebinomiaIregression),使
用MLE估計。Nbregyxlx2x2,r
假如計數數據中具有大量的零值,則可以使用“零膨脹泊松回歸”。這可以Vuong記
錄量來檢查,假如Vuong記錄量很大,則選擇零膨脹泊松回歸或者零膨脹負二項泊松回歸。
零膨脹泊松回歸的stata命令為:
zipyx1x2x3,inflate(varlist)vuong(零膨脹泊松回歸)
zipnbyx1x2x3zinflate(varlist)vuong(零膨脹負二項回歸)
15.受限制的被解釋變量(斷尾回歸、截取回歸)
斷尾回歸stata命令:
truncregyx1x2x3,I1(#)(左邊斷尾)
truncregYXlX2X3,u1(#)(右邊斷尾)
truncregYXIX2X3,ll(#)ul(#)(雙邊斷尾)
截取回歸stata命令:tobit模型
tobityxlx2x3,11(#)
tobityx1x2x3,u1(#)
tobityx1x2x3,11(#)u1(#)
樣本選擇模型的stata命令:
Heckmanyx1x2x3,select(z1z2)(默認使用MLE,選擇方程的被解釋變量為y),
最下的似然比檢查P很小,則認為樣本選擇模型合用。
Heckmanyxlx2x3,seIect(zlz2)twostep(兩步法,選擇方程的被解釋變量
為y)
Heckmanyx1x2x3,se1ect(w=zlz2)(默認使用MLE,選擇方程的
被解釋變量為w)
16時間序列
(平穩時間序列、非平穩時間序列。AR自回歸模型、MA為移動平均模型結合起來為AR
MA模型、自回歸分布滯后模型ADL、向量自回歸模型VAR、向量移動平均過程VMA、
格蘭杰因果檢查:條件是變量協整)
⑴自相關和偏自相關
corrgramsy,1ags(#)第1至#階ACF和PACF
acy,1ags(#)
pacy,Iags(#)
(2JARIMA
arimay,ar(]/#),ma(1/#)或者
arimay,arima(#p,#d,#q)#P表達#階自回歸,#q表達#階移動平均,#d表達
#階差分達成平穩過程。
檢查殘差是否存在自相關:
predictel,res
corrgrameljags(#)(檢查殘差是否存在第1到第#階自相關)
(3)ADL和ARMAX
ARMAX的stata命令
arimayx1x2x3,ar(#)ma(#)
對于時間序列,一方面要設立時間項,tsettimevar
對于非平穩時間序列,一方面要用差分使其平穩:gdxl=d.x1(當然差分后會缺失一個變
量)
假如自相關系數和偏自相關系數都存在斷尾,則考慮ARMA模型:理由
計算信息準則estatic(目的是什么?根據信息準則判斷哪一個模型更優)還可以
去掉不顯著的階,回歸后再運用信息準則比較。
(4)VAR
varsocxyz,maxlag(#)(計算信息準則,最大滯后期默認值為4),根據信息準則可以
估計VAR系統的階數
varxyz(進行VAR估計,默認滯后期為2)
varxyzjags(1/3)(滯后期為一至三期)
varxyz,1ags(3)(滯后期為第三期)
varxyz,dfk(假如樣本容量過小,可以用dfk進行自由度調整)
varxyz,small(顯示小樣本記錄量)
varxyz,exog(wl,w2)(引入外生變量w1,w2)
varbasicxyz,irf(估計VAR模型,畫脈沖響應圖,未正交化)
varwle(進行VAR估計后,對每個方程及所有方程的各階系數聯合顯著性進行wald
檢查,wle表達waldlag-exc1usionstatistics)
var1mar(估計后,對殘差是否自相關進行LM檢查)
varnorm(檢查殘差是否服從正態分布)
varstable,graph(進行VAR估計后,檢查VAR系統是否為平穩過程,假如平穩則所
有特性值都在單位圓內。)
vargranger(估計后,進行格蘭杰因果檢查)
irfcreatefilename,set(filename)step(#)replace(建立脈沖文獻,是
脈沖文獻"filename”成為當前的脈沖文獻,step表達考察兒期的脈沖響應函數,默認為
8,replace代表替代已有的文獻名)
irfgr叩hirf(畫脈沖響應圖,未正交化)
irfgraphoirf(畫正交化的脈沖響應圖)
fcastcomputeprefix,step(#)(估計VAR后,計算被解釋變量的未來#期的預測值,
并把預測值賦予被解釋變量加上前綴“prefix”之后的變量名,如可以加F-)
fcastgraphvarlist,observed(執行命令ufcastcomputen后,將變量“va
rlist”所代表的預測值畫圖,其中“observed”表達與實際觀測值比較)
17非平穩的時間序列
有擬定性趨勢存在的時候,則成為不平穩,去掉時間因素,則成為平穩序列的我們叫
它為趨勢平穩序列;存在結構變動則為非平穩序列;存在隨機趨勢則也為非平穩序列。稱平
穩時間序列為零階單整,假如時間序列的一階差分為平穩,則稱為一階單整,也稱為單位根過
程,D階差分為平穩,則成為“d階單整”。單位根是用來檢查是否平穩的。假如時間序列
存在單位根,則為非平穩序列。
假如序列非平穩,則也許帶來A.自回歸系數的估計值向左偏向于O;B.t檢查失效;C.兩
個互相獨立的變量也許出現偽回歸或偽相關?
進行單位根檢查的方法有:
(1)DF檢查,使用一階自回歸來檢查單位根,規定擾動項為獨立白噪聲,故擾動項無自相關,
若有自相關,則可以引入更高階的滯后項來控制。
(2)ADF檢查,多階。在進行ADF檢查時,擬定滯后階數P的大小,采用最大滯后階數P
max=[12.(T/100)”'],(stata命令為:di12*(t/10O)A(l/4)然后使用由大到小的序
貫t規則,看ADF檢查中最后一階回歸系數是否顯著,也可以使用信息準則。
ADF檢查的Stata命令為:
dfullery(DF檢查,不包含滯后差分項),若DF記錄量較小,則拒絕單位根存在
假設。
dfu1lery,lags(p)(包含p階滯后差分項)
dfu1leryfnoconstant(不帶常數項)
dfuI1ery,trend(帶時間趨勢項)
dful1ery,regress(顯示回歸結果)e
(3)phiIIips—perron單位根檢查(PP檢查)
PP檢查使用一階自回歸,但使用異方差自相關穩健的標準差對DF記錄量進行修正。
pperrony(默認設立帶常數項,不帶時間趨勢項)
pperrony,|noc|onstant(不帶常數項)
pperrony,trend(帶時間趨勢項)
pperronv,regress(顯示回歸結果)
(4)DF-GLS單位根檢查,是去趨勢后再使用ADF檢查
dfglsy(默認帶時間趨勢項,自動根據信息準則選擇最佳滯后期數)
dfgIsy,notrend(不帶時間趨勢項)
(5)KPSS單位根檢查,將假設改為“時間序列為平穩”。
sscinsta11kpss(下載安裝KPSS程序)
kpssy(默認涉及時間趨勢)
kpssynotrend(不帶時間趨勢項)
假如進行單位根檢查認為是非平穩的,則要判斷為I⑴或者是1(2)。
協整概念和stata操作:
協整檢查就是為了考察幾個變量之間的長期均衡關系
檢查協整秩的檢查,即擬定有多少個線性無關的協整向量,(檢查中打星號的是線性
無關的協整向量)。stata命令:
vecranky1y2...yn,Iags(#)(默認設立涉及常數項,但不涉及時間趨勢項)
vecranky1y2...yn,1ags(#)trend(none)(不涉及常數項,也不涉及時
間趨勢項)
vecranky1y2...yn,lags(#)trend(trend)(涉及常數項,也涉及時間趨勢
項)
vecrankyly2...yn,max(顯示最大特性值記錄量及其臨界值)
做完協整秩檢查,并確認h>=l后,就可以對VECM模型(誤差修正模型)進行最大似然
估計。做VECM模型的目的是?
vecyly2...yn,lags(#)(默認設立涉及常數項,但不涉及時間趨勢項)
vecyly2...yn,1ags(#)trend(none)(不涉及常數項,也不涉及時間趨勢項)
vecyly2...yn,lags(#)trend(trend)(涉及常數項,也涉及時間趨勢項)后面
加rank(1)表達什么?回歸后表格里面的數據的含義是什么?最后一列為協整方程代表的
長期均衡關系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 期末應用題專項訓練:四則運算(含解析)-2024-2025學年數學四年級下冊人教版
- 建筑施工特種作業-建筑起重機械司機(物料提升機)真題庫-2
- 建筑施工特種作業-建筑起重機械安裝拆卸工(塔式起重機)真題庫-1
- 三孩政策題目及答案
- 2023年學業水平合格考試三年分類匯編(真題)-專題七人口02人口遷移
- 國家標準關于《機械制圖》的基本規定(三)
- 2023-2024學年廣東省揭陽市高二下學期7月期末教學質量測試數學試題(解析版)
- 2025屆福建省廈門市高三第二次質量檢測語文試題(解析版)
- 2025年秋三年級上冊語文同步教案 梳理與交流、初試身手
- 清吧轉讓協議書
- 灌腸操作評分標準
- 醫學類基礎知識考題大全
- 2019年盲樣考核方案匯總
- 天醫門符法修煉與祝由移病法
- 義務教育科學課程標準(2022年版)
- 美國CLIA88質量要求
- 貨物運輸托運單
- 年公開選拔副科級領導干部試題及答案
- 喉鏡使用簡單介紹PPT課件
- 不停車稱重系統
- 中國重汽集團章丘工業園簡介-12頁word資料
評論
0/150
提交評論