




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
雙變量模型假設檢驗第一頁,共七十八頁,2022年,8月28日第一部分線性回歸模型經濟計量學的基礎工具第2章線性回歸的基本思想——雙變量模型第3章雙變量模型:假設檢驗第二頁,共七十八頁,2022年,8月28日X(收入)Y(博彩支出)1501752002252502753003253503750總體回歸線(PRL)第三頁,共七十八頁,2022年,8月28日X(收入)Y(博彩支出)1501752002252502753003253503750總體回歸線(PRL)樣本回歸線(SRL)第四頁,共七十八頁,2022年,8月28日X(收入)Y(博彩支出)對某個Xi,有一個觀測值Yi。總體與樣本回歸線第五頁,共七十八頁,2022年,8月28日PRF隨機或統計總體回歸函數(StochasticorstatisticalPRF)非隨機或確定總體回歸函數(deterministicornonstochasticPRF)
SRF均值形式的樣本回歸函數隨機形式的樣本回歸函數第六頁,共七十八頁,2022年,8月28日估計????總體回歸線/函數樣本回歸線/函數
PRL/PRFSRL/SRF怎樣構造SRL/SRF,使這個估計做得盡量好?(b1、
b2盡可能地接近B1、B2)估計第七頁,共七十八頁,2022年,8月28日X(收入)Y(博彩支出)最小二乘準則第八頁,共七十八頁,2022年,8月28日B1、B2的估計對于上式,給定一組X、Y的數據,b1、b2選得不同,殘差平方和的值就不同。用微分法解該問題。第九頁,共七十八頁,2022年,8月28日注:小寫的x和y代表X和Y的離差形式,即樣本值減去樣本均值。b1和b2分別為B1和B2的OLS估計量第十頁,共七十八頁,2022年,8月28日例1:博彩支出YX18150241752620023225302502727534300353253335040375表2-2回歸結果:第三章之后Eviews演示第十一頁,共七十八頁,2022年,8月28日回歸分析的第一階段:參數估計
回歸分析的第二階段:統計檢驗第3章完成第十二頁,共七十八頁,2022年,8月28日第3章
雙變量模型:假設檢驗第十三頁,共七十八頁,2022年,8月28日X(收入)Y(博彩支出)1501752002252502753003253503750總體回歸線(PRL)樣本回歸線(SRL)第十四頁,共七十八頁,2022年,8月28日雙變量模型:假設檢驗問題:——估計的回歸直線的“優度”如何?也就是說,怎樣判別它確實是真實的總體回歸函數的一個好的估計量呢?可是總體未知哦……需要總體函數的更多信息……第十五頁,共七十八頁,2022年,8月28日雙變量模型:假設檢驗X是非隨機的隨機誤差項u是隨機的Y由于Y的生成是在隨機誤差項(u)上加上一個非隨機項(X),因而Y也就變成了隨機變量。于是必須對yi的分布做一番討論。所有這些意味著:只有假定隨機誤差項是如何生成的,才能判定樣本回歸函數對真實回歸函數擬合的好壞。第十六頁,共七十八頁,2022年,8月28日3.1
古典線性回歸模型的基本假定
(ClassicalLinearRegressionModel,CLRM)
第十七頁,共七十八頁,2022年,8月28日關于函數基本形式的假定:1.參數線性假定:回歸模型是參數線性的,但不一定是變量線性的。(一元線性)(多元線性)第十八頁,共七十八頁,2022年,8月28日解釋變量X與擾動項u不相關假定當X是非隨機變量,即確定性變量時,該條件自動滿足;當X是隨機變量時,該假定要求X與u不相關。第十九頁,共七十八頁,2022年,8月28日關于隨機誤差項(擾動項)的假定:
3.零均值假定:給定解釋變量的值,隨機誤差項的期望值為0。即:結合假定2,該條件等價于:
P42:圖3-1第二十頁,共七十八頁,2022年,8月28日4.同方差(homoscedasticity)假定:不同的擾動項具有相同的方差。即:
否則稱為異方差。結合假定2,同方差假定等價于:
P43:圖3-2第二十一頁,共七十八頁,2022年,8月28日5.無自相關或序列相關(noautocorrelation)假定:不同擾動項之間的協方差為零,即:該假定等價于:
P43:圖3-3第二十二頁,共七十八頁,2022年,8月28日
6.回歸模型的設定是正確的,即模型不存在設定偏差(Specificationbias)或設定誤差(specificationerror)。(正確設定?第7章:判定標準)
7.擾動項服從正態分布。結合3和4即為:第二十三頁,共七十八頁,2022年,8月28日假定
3:對給定的X值,隨機干擾項u的條件均值為零:假定
1:線性模型。回歸模型對參數而言是線性的。如:假定2:解釋變量X與擾動誤差項u不相關。(X是非隨機的比這一假定更強)最小二乘法的基本假定
——古典線性回歸模型(CLRM)第二十四頁,共七十八頁,2022年,8月28日假定
4:同方差性。給定X值,對所有的觀測,ui的方差都是相同的。即ui的條件方差是一常數:假定
5:各個干擾之間無自相關。給定任意兩個X值:Xi和Xj,ui和uj之間的相關為零:i和j為兩次不同的觀測,而cov表示協方差。第二十五頁,共七十八頁,2022年,8月28日假定
6:回歸模型是正確設定的。即在實證分析中所使用的模型不存在設定偏誤。不難看出,上述6大假定全是針對解釋變量X及誤差項u所作的,實際上是對總體回歸函數PRF的假定。為什么假定?現實意義?如不滿足會怎樣?如何知道這些假定是否滿足?——第二部分對任何一門學科的探求,都需要做一些假定
√
有助于逐步明確問題
×
這些假定是現實所必需第二十六頁,共七十八頁,2022年,8月28日3.1
古典線性回歸模型的基本假定
(ClassicalLinearRegressionModel,CLRM)
第二十七頁,共七十八頁,2022年,8月28日3.3
OLS估計量的性質第二十八頁,共七十八頁,2022年,8月28日3.3OLS估計量的性質P46高斯—馬爾柯夫定理:在滿足古典線性回歸模型(CLRM)假定的條件下,OLS估計量是BLUE。(BestLinearUnbiasedEstimator)三層含義:首先,OLS估計量是線性的。即是關于的線性組合。
第二十九頁,共七十八頁,2022年,8月28日其次,OLS估計量是無偏的。重復抽樣,做很多次OLS估計,估計量的均值可以十分逼近真實值(即SRF十分接近PRF)。最后,在所有線性無偏估計量中,OLS估計量的方差最小(最優,精度最高,最有效率)第三十頁,共七十八頁,2022年,8月28日3.2OLS估計的精度——估計量的方差與標準誤第三十一頁,共七十八頁,2022年,8月28日3.2OLS估計的精度
——估計量的方差與標準誤由于Y是隨機變量,而b1和b2是它的函數,因此b1和b2也是隨機變量。當數據從一個樣本變到另一個樣本時,它們的值會出現擺動。因此,需要找一個量來度量這種擺動的大小,即衡量估計量b1和b2的精度/可靠性。——這個量就是估計量的方差及標準誤。第三十二頁,共七十八頁,2022年,8月28日通過計算,雙變量線性回歸OLS估計量的
標準誤(P351)為:其中,σ2為常數,是假定4中ui的共同方差。第三十三頁,共七十八頁,2022年,8月28日上述表達式中,除了σ之外,其他量的值均可從樣本數據直接得到,σ需要通過樣本來估計:其中,分子為回歸的殘差平方和(RSS),分母為回歸的自由度(d.f.)。被稱為回歸的標準誤(區別于前面回歸估計量b1和b2的標準誤)。第三十四頁,共七十八頁,2022年,8月28日雙變量模型:假設檢驗同方差,由下式來估計:是殘差平方和(RSS);(n-2)稱為自由度。回歸標準誤(Standarderroroftheregression,SER)第三十五頁,共七十八頁,2022年,8月28日例:博彩支出一例的方差和標準誤第三十六頁,共七十八頁,2022年,8月28日用OLS法估計出b1,b2(得到了SRF)在一定的假設前提下,OLS估計量的性質用方差和標準誤,衡量了OLS估計的精度
回歸分析的第一階段:參數估計
回歸分析的第二階段:統計檢驗
完成第三十七頁,共七十八頁,2022年,8月28日雙變量模型的統計檢驗在博彩支出一例中,
疑問:可以認為總體回歸函數中真實的B2就等于0.08,或據此認定B2不為0嗎?若采用表2-3的抽樣結果進行OLS估計:表2-3YX23150181752420025225282502727531300293253335034375第三十八頁,共七十八頁,2022年,8月28日雖然OLS法得到的b2最大程度地擬合了樣本點,并且如果重復足夠多次抽樣,多個b2的均值就等于B2
;但是b2畢竟不是B2
,由于抽樣波動性,b2的數值會隨樣本的變化而不同。因此,對于總體回歸函數中的參數是否等于0(或某個假設值),需要用一個正式的檢驗過程來驗證—假設檢驗第三十九頁,共七十八頁,2022年,8月28日1、假設檢驗:顯著性檢驗法(1)零假設與備擇假設零假設,假設檢驗中首先要提出一個有待根據樣本信息來檢驗的、關于總體的某種說法或論斷,稱之為原假設或“0假設”,記為H0(它一般是研究者想收集證據予以反對的假設)例如H0:
B2=0,H0:
B1=0備擇假設,與原假設對立的假設,也稱“研究假設”,即為預備在拒絕原假設時所選擇的假設,記為H1
第四十頁,共七十八頁,2022年,8月28日總體參數假設的三種形式H0:m=m0;H1:m≠m0
H0:m=m0;H1:m<m0(或H0:m≥m0;H1:m<m0)H0:m=m0;H1:m>m0(或H0:m≤m0;H1:m>m0)上述三種類型的假設檢驗依次稱為雙側檢驗(或雙尾檢驗)、左側檢驗(或左尾檢驗)和右側檢驗(或右尾檢驗),左側檢驗和右側檢驗通稱為單側檢驗(或單尾檢驗)。第四十一頁,共七十八頁,2022年,8月28日(2)檢驗的基本思想合理構造一定的統計量,利用該統計量在零假設下的抽樣分布,結合樣本數據算出該統計量的值,并在事先確定的顯著性水平下(能容忍的犯錯誤概率),決定是否接受零假設。第四十二頁,共七十八頁,2022年,8月28日CLRM假設7:擾動項服從正態分布。結合3和4即為:系數b1,b2,是ui的線性函數,所以:第四十三頁,共七十八頁,2022年,8月28日雙變量模型:假設檢驗在假設“總體回歸函數Yi=B1+B2Xi+ui中,誤差項ui服從均值為零,方差為的正態分布,即,ui~N(0,)”之下:第四十四頁,共七十八頁,2022年,8月28日標準化:用估計量代替方差:第四十五頁,共七十八頁,2022年,8月28日(3)檢驗回歸系數是否為零——t檢驗用得最多的是:檢驗斜率系數是否為零。這樣一個“
0”零假設(“Zero”nullhypothesis),也稱之為稻草人假設(strawmanhypothesis)。選擇這樣一個假設,是為了看Y究竟是否與X有關。如果X與Y就無關,那么再檢驗假設,B2=-2或B2為其他任何值就沒有意義了。當然,如果零假設為真,則就沒有必要把X包括到模型之中。因此,如果X確實屬于這個模型,那么,我們就期望拒絕“0”零假設H0而接受備擇假設H1,比如說,B2≠0。用于這一檢驗的統計量為:通常稱為t統計量,可由OLS估計結果算得。(EViews軟件在報告回歸結果時自動給出)第四十六頁,共七十八頁,2022年,8月28日雙變量模型:假設檢驗假設檢驗正態分布第四十七頁,共七十八頁,2022年,8月28日例:博彩支出一例的t統計量第四十八頁,共七十八頁,2022年,8月28日統計學術語的運用(非常重要!!!)在t檢驗的基礎上,如果決定“不能拒絕H0
”,不是說它毫無疑問是真的,而是根據樣本提供的信息,我們沒有理由去拒絕它。類似的例子:法庭宣布嫌疑犯無罪≠清白不能拒絕H0第四十九頁,共七十八頁,2022年,8月28日(4)第一、二類錯誤與p值H0:B2=B2*拒絕H0接受H0H0為真棄真錯誤第一類錯誤判斷正確H0不為真判斷正確取偽錯誤第二類錯誤第五十頁,共七十八頁,2022年,8月28日在假設檢驗中,理想的做法是把這兩種錯誤發生的概率都盡量降低。但不幸的是,在樣本容量一定的條件下,無法做到!(嚴一點,取偽少,但棄真多;松一點,棄真少,但取偽多)。為解決該問題,在古典方法中,假定第一類錯誤(棄真)更嚴重,因而首先關注犯棄真錯誤的概率——用α表示,稱為顯著性水平(levelofsignificance)最常用的顯著性水平值為1%,5%和10%(越來越容易拒絕H0)第五十一頁,共七十八頁,2022年,8月28日關于回歸中報告的p值
p值,又稱“精確顯著性水平”,它表示的是一個零假設H0可被拒絕的最低顯著性水平,換句話說,它直接給出了拒絕H0所犯一類(棄真)錯誤的概率(p值越低,拒絕H0的證據越充分)決策原則當p值小于給定的顯著性水平α拒絕H0第五十二頁,共七十八頁,2022年,8月28日博彩支出一例拒絕H0犯一類(棄真)錯誤的概率為0.0001,即0.01%,小于5%的顯著性水平,因此拒絕H0,認為B2在統計上顯著異于零,X對Y有顯著影響。p值第五十三頁,共七十八頁,2022年,8月28日假設檢驗在博彩例中,t=7.262>2,由此拒絕B2=0的零假設,認為B2顯著(顯著異于0),即從統計的角度,每周可支配收入X所對每周博彩支出Y具有顯著的影響。第五十四頁,共七十八頁,2022年,8月28日3.6:擬合回歸直線的優度度量:判定系數r2t值都是統計顯著的,樣本回歸函數很好的擬合了樣本數據。并非每個Y值都準確落在估計的PRF上估計的回歸線擬合真實Y值的優劣程度如何?擬合優度如何?第五十五頁,共七十八頁,2022年,8月28日2、判定系數r2
:擬合優度的度量P53擬合優度:樣本回歸線對數據擬合得多好(1)Yi變異的分解XYYi的總變異未被回歸解釋由回歸解釋SRF(OLS回歸得到)第五十六頁,共七十八頁,2022年,8月28日TSS(thesumofsquares)—總平方和ESS(explainedsumofsquares)——解釋平方和RSS(residualsumofsquares)——殘差平方和
Y的總變異當中,由回歸解釋的部分所占的百分比越大,樣本回歸線對樣本點的擬合就越好推導見P53第五十七頁,共七十八頁,2022年,8月28日(2)判定系數r2
coefficientofdetermination
r2↗,SRF對數據擬合得越好,擬合優度↗r2:在Y的總變異當中,由回歸解釋的部分(可由X的變異來解釋的部分)所占的百分比因此r2還可用于度量模型的解釋力。第五十八頁,共七十八頁,2022年,8月28日r2的性質它是一個非負量它的界限為[0,1]。
r2=1,完美擬合;
r2=0,選錯了解釋變量,對于y的變動,回歸模型沒有任何解釋力。第五十九頁,共七十八頁,2022年,8月28日雙變量模型:假設檢驗樣本相關系數(samplecoefficientofcorrelation)r,它是度量兩變量X與Y之間線性相關程度的指標相關系數也能夠根據判定系數r2來計算:第六十頁,共七十八頁,2022年,8月28日3.9正態性檢驗:誤差項ui服從正態分布嗎?假設ui是同分布的,是嗎?ei作為ui的樣本,可以進行檢驗。具體方法參照教材:P58第六十一頁,共七十八頁,2022年,8月28日1殘差直方圖檢驗法(基于直觀)第六十二頁,共七十八頁,2022年,8月28日2正態概率圖檢驗法正態概率圖(NormaProbabilityPlot,NPP)(在專用的正態概率紙上作圖)。在橫軸上(X軸),標出所關注變量的值,在縱軸上(Y軸),標出該變量服從正態分布所對應的均值。因此,若該變量的確來自正態總體,則正態概率圖將近似為一直線。第六十三頁,共七十八頁,2022年,8月28日利用MINTAB軟件作出Widget一例的正態概率圖(殘差)第六十四頁,共七十八頁,2022年,8月28日3Jarque-Bera檢驗第六十五頁,共七十八頁,2022年,8月28日偏度系數S:對概率密度函數對稱性的度量如果偏度S的值為正,則其概率密度為正偏或右偏;如果S的值為負,則其概率密度為負偏或左偏。第六十六頁,共七十八頁,2022年,8月28日峰度系數K:對概率密度函數的“胖瘦”的度量概率密度函數的峰度K小于3時,成為低峰態的(胖的或短尾的),峰度K大于3時,稱為尖峰態的(瘦的或長尾的)。正態分布的峰度K為3,這樣的概率密度函數稱為常峰態的。第六十七頁,共七十八頁,2022年,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 業務合同執行狀態跟蹤統計表
- 線上線下游戲融合-洞察闡釋
- 2025大學食堂餐飲承包合同
- 煙草種植現場調研與質量控制合同范本
- 保密項目參觀保密協議書模板
- 車輛抵押貸款風險分析合同模板
- 柴油儲備庫建設與購銷合作協議
- 2025紅楓葉收購合同書范本
- 2025合同違約后損害賠償的相關規定
- 2025合同范本:電腦租賃合同示范文本
- 河北省石家莊市2025年八年級下學期語文期末模擬試卷七套及答案
- 危大工程管理辦法課件
- 2025屆上海市嘉定區八下數學期末考試試題含解析
- 四川省眉山市東坡區東坡區東坡中學2025年數學七下期末調研模擬試題含解析
- 2025年4月自考00158資產評估試題及答案含評分標準
- 車間原輔材料消耗管理
- 2025國家開放大學《員工勞動關系管理》形考任務1234答案
- 2025年廣西文化和旅游廳所屬事業單位招聘考試備考題庫
- 物聯網環境下精準作物生長監測與預警系統-全面剖析
- 2025-2030深水采油樹行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 高鐵動車組運維成本分析-全面剖析
評論
0/150
提交評論