




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
計(jì)量經(jīng)濟(jì)學(xué)多元線性回歸第1頁,共56頁,2023年,2月20日,星期四2本章大綱數(shù)據(jù)的測(cè)度單位換算對(duì)OLS統(tǒng)計(jì)量的影響對(duì)函數(shù)形式的進(jìn)一步討論擬合優(yōu)度和回歸元選擇的進(jìn)一步探討預(yù)測(cè)和殘差分析第2頁,共56頁,2023年,2月20日,星期四3課堂提綱重新定義變量的影響估計(jì)系數(shù)R平方t統(tǒng)計(jì)量函數(shù)形式 對(duì)數(shù)函數(shù)形式含二次式的模型含交叉項(xiàng)的模型第3頁,共56頁,2023年,2月20日,星期四4
重新定義變量為什么我們想這樣做?數(shù)據(jù)測(cè)度單位變換經(jīng)常被用于減少被估參數(shù)小數(shù)點(diǎn)后的零的個(gè)數(shù),這樣結(jié)果更好看一些。既然這樣做主要為了好看,我們希望本質(zhì)的東西不改變。第4頁,共56頁,2023年,2月20日,星期四5
重新定義變量:一個(gè)例子以下模型反映了嬰兒出生體重與孕婦吸煙量和家庭收入之間的關(guān)系:(1)考慮如下單位變換:(2)出生體重單位由盎司變?yōu)榘?3)香煙的支數(shù)變?yōu)榘鼣?shù)估計(jì)結(jié)果列于下表
第5頁,共56頁,2023年,2月20日,星期四6Table6.1Y(column)(1)bwght(2)bwghtlbs(3)bwghtX(rows)Cigs-0.4634(0.0916)-0.0289(0.0057)--Packs-----9.268(1.832)Faminc0.0927(0.0292)0.0058(0.0018)0.0927(0.0292)Intercept116.794(1.049)7.3109(0.0656)116.974(1.049)Observations138813881388R-squared0.02980.02980.0298SSR557,485.512177.5778557.485.51SER20.0631.253920.063第6頁,共56頁,2023年,2月20日,星期四7
改變被解釋變量測(cè)度單位的影響因?yàn)?磅=16盎司,被解釋變量被除以16。比較第1列與第2列。(1)中被估參數(shù)/16=(2)中被估參數(shù)(1)中被估參數(shù)的標(biāo)準(zhǔn)差/16=(2)中被估參數(shù)的標(biāo)準(zhǔn)差(1)和(2)中t統(tǒng)計(jì)量相同R平方相同(1)中SSR/(16*16)=(2)中SSR(1)中SER(標(biāo)準(zhǔn)差)/16=(2)中SER第7頁,共56頁,2023年,2月20日,星期四8改變解釋變量測(cè)度單位的影響現(xiàn)在香煙數(shù)量單位變?yōu)榘,F(xiàn)在比較第(1)列和第(3)列。變量faminc系數(shù)和截距項(xiàng)的估計(jì)值和其標(biāo)準(zhǔn)差分析同上。packs的系數(shù)估計(jì)值和標(biāo)準(zhǔn)差變?yōu)?0倍。t統(tǒng)計(jì)量相同R平方相同SSR相同SER相同第8頁,共56頁,2023年,2月20日,星期四9重新定義變量改變變量y的測(cè)度單位會(huì)導(dǎo)致系數(shù)和標(biāo)準(zhǔn)差相應(yīng)的改變,所以解釋變量系數(shù)顯著性和對(duì)其解釋沒有改變。改變一個(gè)變量x的測(cè)度單位會(huì)導(dǎo)致該變量系數(shù)和標(biāo)準(zhǔn)差的相應(yīng)改變,所以所有解釋變量顯著性和對(duì)其解釋沒有改變。如果被解釋變量以對(duì)數(shù)形式出現(xiàn),改變被解釋變量度量單位對(duì)任何斜率系數(shù)沒有影響。來自log(cy)=log(c)+log(y),改變y測(cè)度單位將改變截距,不改變斜率系數(shù)。第9頁,共56頁,2023年,2月20日,星期四10Beta系數(shù)考慮如下形式的樣本回歸方程:
?=200+20,000x1
+0.2x2我們能說x1是最重要的變量嗎?現(xiàn)在,查看以下各個(gè)變量的單位:y單位:美元x1單位:美分x2單位:千美元第10頁,共56頁,2023年,2月20日,星期四11Beta系數(shù)上例揭示了什么問題?被估計(jì)系數(shù)的大小是不可比較的。一個(gè)相關(guān)的問題是,當(dāng)變量大小差別過大時(shí),在回歸中因運(yùn)算近似而導(dǎo)致的誤差會(huì)比較大。第11頁,共56頁,2023年,2月20日,星期四12Beta系數(shù)有時(shí),我們會(huì)看見“標(biāo)準(zhǔn)化系數(shù)”或“Beta系數(shù)”,這些名稱有著特殊的意義使用Beta系數(shù)是因?yàn)橛袝r(shí)我們把y和各個(gè)x替換為標(biāo)準(zhǔn)化版本——也就是,減去均值后除以標(biāo)準(zhǔn)離差。系數(shù)反映對(duì)于一單位x的標(biāo)準(zhǔn)離差的y的標(biāo)準(zhǔn)離差。第12頁,共56頁,2023年,2月20日,星期四13Beta系數(shù)第13頁,共56頁,2023年,2月20日,星期四14Beta系數(shù)第14頁,共56頁,2023年,2月20日,星期四15例子第15頁,共56頁,2023年,2月20日,星期四16函數(shù)形式OLS也可以用在x和y不是嚴(yán)格線性的情況,通過使用非線性方程,使得關(guān)于參數(shù)仍為線性。可以取x,y(一個(gè)或全部)的自然對(duì)數(shù)可以用x的平方形式可以用x的交叉項(xiàng)第16頁,共56頁,2023年,2月20日,星期四17對(duì)數(shù)模型的解釋如果模型是ln(y)=b0+b1ln(x)+ub1是y對(duì)于x的彈性如果模型是ln(y)=b0+b1x+ub1近似是,給定一單位x的改變,y的百分比變化,常被稱為半彈性。第17頁,共56頁,2023年,2月20日,星期四18為什么使用對(duì)數(shù)模型?取對(duì)數(shù)后變量的斜率系數(shù),不隨變量測(cè)度單位改變。如果回歸元和回歸子都取對(duì)數(shù)形式,斜率系數(shù)給出對(duì)彈性的一個(gè)直接估計(jì)。對(duì)于y>0的模型,條件分布經(jīng)常偏斜或存在異方差,而ln(y)就小多了,所以ln(y)的分布窄多了,限制了異常(或極端)觀測(cè)值(outliers)的影響。第18頁,共56頁,2023年,2月20日,星期四19一些經(jīng)驗(yàn)法則什么類型的變量經(jīng)常用對(duì)數(shù)形式?肯定為正的錢數(shù):工資,薪水,企業(yè)銷售額和企業(yè)市值。非常大的變量:如人口,雇員總數(shù)和學(xué)校注冊(cè)人數(shù)等。什么類型的變量經(jīng)常用水平值形式?用年測(cè)量的變量:如教育年限,工作經(jīng)歷,任期年限和年齡可以以水平值或?qū)?shù)形式出現(xiàn)的變量:比例或百分比變量:失業(yè)率,養(yǎng)老保險(xiǎn)金參與率等。第19頁,共56頁,2023年,2月20日,星期四20對(duì)數(shù)形式的限制一個(gè)變量取零或負(fù)值,則不能使用對(duì)數(shù)。如果y非負(fù)但可以取零,則有時(shí)使用log(1+y)。當(dāng)數(shù)據(jù)并非多數(shù)為零時(shí),使用log(1+y)估計(jì),并且假定變量為log(y),解釋所得的估計(jì)值,是可以接受的。第20頁,共56頁,2023年,2月20日,星期四21慎重使用對(duì)數(shù)形式注意到,當(dāng)y取對(duì)數(shù)形式時(shí),更難以預(yù)測(cè)原變量的值,因?yàn)樵P驮试S我們預(yù)測(cè)log(y)而不是y。第21頁,共56頁,2023年,2月20日,星期四22含二次式的模型對(duì)于形式為y=b0+b1x+b2x2+u的模型,我們不能單獨(dú)將b1解釋為關(guān)于x,y變化的度量,我們需要將b2也考慮進(jìn)來,因?yàn)榈?2頁,共56頁,2023年,2月20日,星期四23如果感興趣的是,給定x的初始值和變動(dòng),預(yù)測(cè)y的變化,那么可以直接使用(1)。一般來說,我們可以使用x的平均值,中值,或上下四分位數(shù)來預(yù)測(cè)y,取決于我們感興趣的問題。含二次式的模型第23頁,共56頁,2023年,2月20日,星期四24含二次式的模型第24頁,共56頁,2023年,2月20日,星期四253.737.3724.4experwage第25頁,共56頁,2023年,2月20日,星期四26
對(duì)含二次式模型的進(jìn)一步討論假如x的系數(shù)為正,x2的系數(shù)為負(fù)。那么,y首先隨x上升而上升,但最終轉(zhuǎn)向隨x上升而下降。第26頁,共56頁,2023年,2月20日,星期四27
對(duì)含二次式模型的進(jìn)一步討論假如x的系數(shù)為負(fù),x2的系數(shù)為正。那么,y首先隨x上升而下降,但最終轉(zhuǎn)向隨x上升而上升。第27頁,共56頁,2023年,2月20日,星期四28
交叉項(xiàng)對(duì)于形式為y=b0+b1x1+b2x2+b3x1x2+u的模型,我們不能單獨(dú)將b1解釋為關(guān)于x1,y變化的度量,我們需要將b3也考慮進(jìn)來,因?yàn)榈?8頁,共56頁,2023年,2月20日,星期四擬合優(yōu)度每一個(gè)觀察值可被視為由解釋部分和未解釋部分構(gòu)成:定義:SST=SSE+SSR29第29頁,共56頁,2023年,2月20日,星期四30擬合優(yōu)度(續(xù))我們?cè)鯓雍饬课覀兊臉颖净貧w線擬合樣本數(shù)據(jù)有多好呢?可以計(jì)算總平方和(SST)中被模型解釋的部分,稱此為回歸R2R2=SSE/SST=1–SSR/SST第30頁,共56頁,2023年,2月20日,星期四31
更多關(guān)于R2當(dāng)回歸中加入另外的解釋變量時(shí),R2通常會(huì)上升。如果OLS使此解釋變量取任何非零系數(shù),那么加入此變量之后,SSR降低了。實(shí)際操作中,被估計(jì)系數(shù)精確取零是極其罕見的,所以,當(dāng)加入一個(gè)新解釋變量后,一般來說,SSR會(huì)降低。第31頁,共56頁,2023年,2月20日,星期四32
調(diào)整過的R2(TheAdjustedR-squared)因此,R2增加并不意味著加入新的變量一定會(huì)提高模型擬合度。調(diào)整過的R2是R2一個(gè)修正版本,當(dāng)加入新的解釋變量,調(diào)整過的R2不一定增加。第32頁,共56頁,2023年,2月20日,星期四33
調(diào)整過的R2調(diào)整過的R2是1減去OLS殘差的樣本方差(修正過自由度之后)與y的樣本方差之比。調(diào)整過的R2的三個(gè)有用性質(zhì):因?yàn)?n-1)/(n-k-1)>1,所以調(diào)整過的R2總比R2小。加入一個(gè)解釋變量有兩個(gè)相反的效果。(1)SSR降低導(dǎo)致調(diào)整過的R2增加。(2)(n-1)/(n-k-1)增加導(dǎo)致調(diào)整過的R2降低。調(diào)整過的R2可能是負(fù)的,發(fā)生在以下情況:所有解釋變量使殘差平方和下降的太少,不足以抵消因子(n-1)/(n-k-1)。
R2只有在過原點(diǎn)回歸中才可能為負(fù)。第33頁,共56頁,2023年,2月20日,星期四34
比較R2和AdjustedR2R2和調(diào)整過的R2告訴我們,解釋變量是否很好地預(yù)測(cè)了,或“解釋”了,手頭數(shù)據(jù)中被解釋變量的值。R2和調(diào)整過的R2并沒有告訴我們被包含變量是否統(tǒng)計(jì)顯著解釋變量是否是被解釋變量變動(dòng)的真正原因是否有遺漏變量偏誤,或是否選取了最合適的解釋變量組合第34頁,共56頁,2023年,2月20日,星期四35R2和AdjustedR2在決定某個(gè)變量是否應(yīng)該被加入模型時(shí),R2和AdjustedR2并非理想的工具。決定一個(gè)解釋變量是否屬于模型的因素應(yīng)該是,該解釋變量在總體中對(duì)y的局部效應(yīng)是否為零。第35頁,共56頁,2023年,2月20日,星期四36擬合優(yōu)度和解釋變量選擇的進(jìn)一步探討AdjustedR-Squared第36頁,共56頁,2023年,2月20日,星期四37我們定義總體R2為:y的變異在總體中能被解釋變量解釋的比例,為調(diào)整過的R2仍不是總體R2的一個(gè)無偏估計(jì)量,因?yàn)閮蓚€(gè)無偏估計(jì)量的比例不是一個(gè)無偏估計(jì)量。擬合優(yōu)度和解釋變量選擇的進(jìn)一步探討第37頁,共56頁,2023年,2月20日,星期四38調(diào)整過的R2最根本的吸引力,在于它對(duì)向模型增加自變量的懲罰。如果我們向回歸模型加入一個(gè)新的解釋變量,當(dāng)且僅當(dāng)新變量的t統(tǒng)計(jì)量的絕對(duì)值大于1時(shí),調(diào)整過的R2增加。擬合優(yōu)度和解釋變量選擇的進(jìn)一步探討第38頁,共56頁,2023年,2月20日,星期四39利用調(diào)整的R2在兩個(gè)非嵌套模型中進(jìn)行選擇如果兩個(gè)模型中任何一個(gè)都不是另一個(gè)的特例,則兩個(gè)模型是非嵌套的。F統(tǒng)計(jì)量只允許我們檢驗(yàn)嵌套的模型,因?yàn)橛邢拗频哪P褪菬o限制模型的特例。我們需要一些在無嵌套模型間進(jìn)行選擇的指導(dǎo)。第39頁,共56頁,2023年,2月20日,星期四40當(dāng)變量有不同函數(shù)形式時(shí),通過比較調(diào)整過的R2,在不同的解釋變量的非嵌套組合中進(jìn)行選擇,是頗有價(jià)值的。例如,一個(gè)模型是y=b0+b1x1+b2log(x2), 另一個(gè)是y=b0+b1x1+b2x2+b3x22。 如果第一個(gè)模型調(diào)整過的R平方為0.3,而第二個(gè)為0.6,我們傾向于選擇第二個(gè)模型利用調(diào)整的R2在兩個(gè)非嵌套模型中進(jìn)行選擇第40頁,共56頁,2023年,2月20日,星期四41
調(diào)整過的R2的限制:我們不能利用它在關(guān)于因變量函數(shù)形式不同的模型間進(jìn)行選擇利用調(diào)整的R2在兩個(gè)非嵌套模型中進(jìn)行選擇第41頁,共56頁,2023年,2月20日,星期四42
預(yù)測(cè)分析:估計(jì)量第42頁,共56頁,2023年,2月20日,星期四43預(yù)測(cè)分析:標(biāo)準(zhǔn)差第43頁,共56頁,2023年,2月20日,星期四44
預(yù)測(cè)分析:置信區(qū)間第44頁,共56頁,2023年,2月20日,星期四45預(yù)測(cè)分析:一個(gè)特殊y的置信區(qū)間第45頁,共56頁,2023年,2月20日,星期四46預(yù)測(cè)分析:y0的預(yù)測(cè)區(qū)間第46頁,共56頁,2023年,2月20日,星期四47預(yù)測(cè)分析:y0的預(yù)測(cè)區(qū)間第47頁,共56頁,2023年,2月20日,星期四48有時(shí),檢驗(yàn)個(gè)體觀測(cè)值來看它的因變量高于還是低于預(yù)測(cè)值是有用的。也就是,檢驗(yàn)個(gè)體觀測(cè)值的殘差。殘差分析第48頁,共56頁,2023年,2月20日,星期四49殘差分析例:將房價(jià)對(duì)一些可觀測(cè)特點(diǎn)回歸,得預(yù)測(cè)值,算出殘差。殘差為負(fù)則說明根據(jù)可觀測(cè)因素房價(jià)偏低。負(fù)的程度最大值的大小說明我們還沒有控制因素的重要程度。可為改值建立預(yù)測(cè)區(qū)間。第49頁,共56頁,2023年,2月20日,星期四50
y=b0+b1x1+b2x2+...bkxk+u5.DummyVariables第50頁,共56頁,2023年,2月20日,星期四51虛擬變量虛擬變量是一個(gè)取值為1或0的變量。例:male(=1ifaremale,0otherwise),south(=1ifinthesouth,0otherwise),etc.虛變量也稱二值變量。第51頁,共56頁,2023年,2月20日,星期四52虛擬變量考慮只有一個(gè)解釋變量(x)和一個(gè)虛擬變量(d)的簡單模型。
y=b0+d0d+b1x+u
該模型可以看做是一個(gè)截距的變化。Thiscanbeinterpretedasaninterceptshift若d=0,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CASTEM 1006-2022科技評(píng)估報(bào)告編制通用要求
- T/CAQI 362-2023寵物食品用益生菌通則
- T/CAQI 145-2020地理標(biāo)志產(chǎn)品龍口粉絲
- T/CAPA 1-2019脂肪注射移植
- 京東2025年java開發(fā)測(cè)試面試題及答案
- 眾安保險(xiǎn)java研三面試題及答案
- 定期疫苗檢查管理制度
- 高中消防面試題及答案
- 醫(yī)院護(hù)士長競聘演講稿
- 主持人自我介紹演講稿
- 遼寧省名校聯(lián)盟2025年高考模擬卷押題卷數(shù)學(xué)(三)
- 2024年四川巴中事業(yè)單位招聘考試真題答案解析
- 以好家風(fēng)涵養(yǎng)好作風(fēng)-新時(shí)代領(lǐng)導(dǎo)干部家風(fēng)建設(shè)專題課件
- 2025年甘肅省武威第二十中學(xué)生物七年級(jí)下冊(cè)新人教版期中模擬練習(xí)題(含答案)
- 銀行客戶經(jīng)理培訓(xùn)課件
- 藥品理化檢驗(yàn)培訓(xùn)
- 腹部帶蒂皮瓣護(hù)理
- 倉庫7s管理制度培訓(xùn)
- 復(fù)式交分道岔檢查課件
- 學(xué)校防恐防暴應(yīng)急演練方案
- 2025-2030中國斯特林制冷機(jī)行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
評(píng)論
0/150
提交評(píng)論