大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 第1章 導(dǎo)論_第1頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 第1章 導(dǎo)論_第2頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 第1章 導(dǎo)論_第3頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 第1章 導(dǎo)論_第4頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 第1章 導(dǎo)論_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章導(dǎo)論1第1章導(dǎo)論本章主要內(nèi)容什么是經(jīng)濟(jì)計(jì)量學(xué)計(jì)量經(jīng)濟(jì)學(xué)的起源與發(fā)展計(jì)量經(jīng)濟(jì)分析的步驟大數(shù)據(jù)與計(jì)量經(jīng)濟(jì)分析計(jì)量經(jīng)濟(jì)分析軟件21.1什么是計(jì)量經(jīng)濟(jì)學(xué)31.1.1經(jīng)濟(jì)計(jì)量學(xué)的定義計(jì)量經(jīng)濟(jì)學(xué)(Econometrics)是以一定的經(jīng)濟(jì)理論和統(tǒng)計(jì)資料為基礎(chǔ),使用數(shù)學(xué)和統(tǒng)計(jì)推斷等工具,以建立計(jì)量經(jīng)濟(jì)模型為主要手段,定量研究具有隨機(jī)特性的經(jīng)濟(jì)變量之間的關(guān)系,進(jìn)而探究經(jīng)濟(jì)主體之間互動(dòng)規(guī)律的一門(mén)科學(xué)。41.1.2計(jì)量經(jīng)濟(jì)學(xué)的分類(lèi)從研究的內(nèi)容上分,可分為理論計(jì)量經(jīng)濟(jì)學(xué)和應(yīng)用計(jì)量經(jīng)濟(jì)學(xué):理論計(jì)量經(jīng)濟(jì)學(xué)以討論計(jì)量經(jīng)濟(jì)學(xué)方法為主,以數(shù)理統(tǒng)計(jì)為主要工具,其內(nèi)容包括計(jì)量經(jīng)濟(jì)學(xué)方法的理論基礎(chǔ)、計(jì)量經(jīng)濟(jì)學(xué)方程的參數(shù)估計(jì)和檢驗(yàn)方法、特殊模型的估計(jì)與檢驗(yàn)方法等,側(cè)重于研究如何建立一個(gè)性能優(yōu)良的模型來(lái)揭示經(jīng)濟(jì)變量之間的數(shù)量關(guān)系。應(yīng)用計(jì)量經(jīng)濟(jì)學(xué)以建立和應(yīng)用計(jì)量經(jīng)濟(jì)學(xué)模型為主,是各種具體的宏觀和微觀計(jì)量經(jīng)濟(jì)學(xué)模型的設(shè)定和應(yīng)用,并且應(yīng)用計(jì)量經(jīng)濟(jì)學(xué)側(cè)重于討論如何用好計(jì)量經(jīng)濟(jì)學(xué)模型對(duì)具體的經(jīng)濟(jì)現(xiàn)象進(jìn)行定量分析。51.1.2計(jì)量經(jīng)濟(jì)學(xué)的分類(lèi)從研究的廣度上分,可分為狹義計(jì)量經(jīng)濟(jì)學(xué)和廣義計(jì)量經(jīng)濟(jì)學(xué):狹義的計(jì)量經(jīng)濟(jì)學(xué)主要是運(yùn)用因果分析、回歸分析方法對(duì)經(jīng)濟(jì)現(xiàn)象進(jìn)行研究,“其內(nèi)容90%是回歸”(美國(guó)經(jīng)濟(jì)學(xué)家克萊因),主要目的是揭示并定量地刻畫(huà)經(jīng)濟(jì)變量之間的因果關(guān)系。大多數(shù)的計(jì)量經(jīng)濟(jì)學(xué)教科書(shū)屬于狹義計(jì)量經(jīng)濟(jì)學(xué)的范疇。廣義計(jì)量經(jīng)濟(jì)學(xué)包含的內(nèi)容更廣,不但包括狹義計(jì)量經(jīng)濟(jì)學(xué)的全部?jī)?nèi)容,還包括時(shí)間序列分析、投入產(chǎn)出分析、數(shù)理經(jīng)濟(jì)分析及優(yōu)化方法等,類(lèi)似于我國(guó)的數(shù)量經(jīng)濟(jì)學(xué),是一類(lèi)用于研究,分析經(jīng)濟(jì)現(xiàn)象的定量方法的總稱(chēng)。61.1.3計(jì)量經(jīng)濟(jì)學(xué)的性質(zhì)計(jì)量經(jīng)濟(jì)學(xué)本質(zhì)上屬于經(jīng)濟(jì)學(xué)的范疇,而經(jīng)濟(jì)學(xué)的定量研究離不開(kāi)數(shù)學(xué)、統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)理論這三個(gè)方面。計(jì)量經(jīng)濟(jì)學(xué)假設(shè)經(jīng)濟(jì)系統(tǒng)是一個(gè)隨機(jī)過(guò)程,服從某一客觀運(yùn)行規(guī)律,任何觀測(cè)經(jīng)濟(jì)數(shù)據(jù),都是從這個(gè)隨機(jī)經(jīng)濟(jì)系統(tǒng)產(chǎn)生出來(lái)的。計(jì)量經(jīng)濟(jì)學(xué)的主要任務(wù)就是基于觀測(cè)經(jīng)濟(jì)數(shù)據(jù),以經(jīng)濟(jì)理論為指導(dǎo),利用統(tǒng)計(jì)推斷的方法,識(shí)別經(jīng)濟(jì)變量之間的因果關(guān)系,揭示經(jīng)濟(jì)運(yùn)行規(guī)律。71.1.3計(jì)量經(jīng)濟(jì)學(xué)的性質(zhì)1.數(shù)理經(jīng)濟(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)數(shù)理經(jīng)濟(jì)學(xué)主要是用數(shù)學(xué)形式或方程描述經(jīng)濟(jì)理論,可以不考慮對(duì)經(jīng)濟(jì)理論的測(cè)度和經(jīng)驗(yàn)驗(yàn)證。計(jì)量經(jīng)濟(jì)學(xué)卻必須關(guān)注經(jīng)濟(jì)理論、經(jīng)濟(jì)假說(shuō)是否正確,是否與經(jīng)驗(yàn)相符。81.1.3計(jì)量經(jīng)濟(jì)學(xué)的性質(zhì)相對(duì)收入假說(shuō)“示范”效應(yīng)數(shù)學(xué)上可表示為式(1.1.1):9

式(1.1.1)就是一個(gè)數(shù)理經(jīng)濟(jì)學(xué)方程,該方程揭示了經(jīng)濟(jì)變量之間的“確定性”數(shù)學(xué)關(guān)系,但不研究其數(shù)學(xué)關(guān)系的定量測(cè)度問(wèn)題。考慮到的非主要因素的影響、隨機(jī)變化、觀測(cè)誤差和模型數(shù)學(xué)形式設(shè)定偏差,如式(1.1.2)。式(1.1.2)就是一個(gè)計(jì)量經(jīng)濟(jì)學(xué)模型。計(jì)量經(jīng)濟(jì)學(xué)模型主要研究的是如何利用數(shù)學(xué)方程與實(shí)際數(shù)據(jù)來(lái)驗(yàn)證經(jīng)濟(jì)理論,反映的是經(jīng)濟(jì)變量之間存在的不確定性的相關(guān)關(guān)系,側(cè)重于經(jīng)濟(jì)變量之間關(guān)系的定量測(cè)度和描述。1.1.3計(jì)量經(jīng)濟(jì)學(xué)的性質(zhì)2.經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)統(tǒng)計(jì)學(xué)與經(jīng)濟(jì)學(xué)緊密結(jié)合的產(chǎn)物是經(jīng)濟(jì)統(tǒng)計(jì)學(xué)。經(jīng)濟(jì)統(tǒng)計(jì)學(xué)側(cè)重于對(duì)描述性經(jīng)濟(jì)變量或其指數(shù)的觀測(cè)記錄和整理,而不是如何驗(yàn)證經(jīng)濟(jì)理論。經(jīng)濟(jì)統(tǒng)計(jì)學(xué)揭示、刻畫(huà)重要經(jīng)濟(jì)變量的性質(zhì)以及它們之間的數(shù)量關(guān)系,也就是通常所說(shuō)的典型經(jīng)驗(yàn)事實(shí)。在經(jīng)驗(yàn)典型特征事實(shí)基礎(chǔ)上,以經(jīng)濟(jì)理論為指導(dǎo),對(duì)經(jīng)濟(jì)現(xiàn)象進(jìn)行計(jì)量經(jīng)濟(jì)建模,并基于經(jīng)濟(jì)觀測(cè)數(shù)據(jù)對(duì)計(jì)量經(jīng)濟(jì)模型進(jìn)行統(tǒng)計(jì)推斷,從中找出經(jīng)濟(jì)變量的因果關(guān)系及經(jīng)濟(jì)運(yùn)行規(guī)律,解釋經(jīng)驗(yàn)典型特征事實(shí),這是計(jì)量經(jīng)濟(jì)學(xué)的范疇。經(jīng)濟(jì)數(shù)據(jù)是計(jì)量經(jīng)濟(jì)學(xué)實(shí)證研究的原材料。計(jì)量經(jīng)濟(jì)學(xué)的推斷結(jié)論的科學(xué)性很大程度取決于經(jīng)濟(jì)數(shù)據(jù)的質(zhì)量?jī)?yōu)劣。101.2計(jì)量經(jīng)濟(jì)學(xué)的起源與發(fā)展111.2.1計(jì)量經(jīng)濟(jì)學(xué)的起源1776年亞當(dāng)·斯密(AdamSmith)《國(guó)富論》的發(fā)表,標(biāo)志著經(jīng)濟(jì)學(xué)作為一門(mén)獨(dú)立的社會(huì)科學(xué)的誕生。1838年,法國(guó)數(shù)理經(jīng)濟(jì)學(xué)家古諾(A.Cournot)在其出版的《財(cái)富理論的數(shù)學(xué)原理》一書(shū)中認(rèn)為,可以把需求、經(jīng)濟(jì)供給、價(jià)格等經(jīng)濟(jì)變量之間的關(guān)系視為函數(shù)關(guān)系,并明確提出可以用數(shù)學(xué)語(yǔ)言描述某些經(jīng)濟(jì)規(guī)律。1926年,挪威經(jīng)濟(jì)學(xué)家弗里希(R.Frisch)仿照生物計(jì)量學(xué)(Biometrics)一詞,提出了計(jì)量經(jīng)濟(jì)學(xué)(Econometrics),它的提出標(biāo)志著計(jì)量經(jīng)濟(jì)學(xué)的誕生。1930年,弗里希出版了《用完全回歸體系的統(tǒng)計(jì)合流分析》,進(jìn)一步深化了計(jì)量經(jīng)濟(jì)學(xué)的定量分析技術(shù),并聯(lián)合其他學(xué)者創(chuàng)立了計(jì)量經(jīng)濟(jì)學(xué)會(huì)和專(zhuān)業(yè)刊物Econometrica,這標(biāo)志著計(jì)量經(jīng)濟(jì)學(xué)作為一門(mén)獨(dú)立學(xué)科的正式誕生。上世紀(jì)30年代,世界經(jīng)濟(jì)“大蕭條”危機(jī)之后,經(jīng)濟(jì)學(xué)出現(xiàn)了“凱恩斯革命”,這是對(duì)新古典經(jīng)濟(jì)學(xué)的一種否定。凱恩斯革命使經(jīng)濟(jì)學(xué)家更加重視經(jīng)濟(jì)現(xiàn)實(shí)問(wèn)題,凱恩斯以問(wèn)題為導(dǎo)向的研究范式,開(kāi)辟了計(jì)量經(jīng)濟(jì)學(xué)作為實(shí)證研究主要方法論的發(fā)展與應(yīng)用空間。121.2.2計(jì)量經(jīng)濟(jì)學(xué)的發(fā)展經(jīng)典計(jì)量經(jīng)濟(jì)學(xué)的核心內(nèi)容是經(jīng)典線性回歸模型,一般具有幾個(gè)基本假定,這些假定包括:(1)模型是線形的;(2)不存在多重共線性;(3)自變量和誤差項(xiàng)之間不相關(guān);(4)誤差項(xiàng)同方差,并且誤差項(xiàng)之間不相關(guān);(5)誤差項(xiàng)服從正態(tài)分布等。只有滿足經(jīng)典線性回歸模型的基本假設(shè),回歸模型的參數(shù)估計(jì)才具有一系列的優(yōu)良統(tǒng)計(jì)特性,與之相關(guān)的各種假設(shè)檢驗(yàn)才精確可靠。然而,現(xiàn)實(shí)中大多數(shù)經(jīng)濟(jì)觀測(cè)數(shù)據(jù)都不能夠滿足這些假設(shè),而現(xiàn)代計(jì)量經(jīng)濟(jì)學(xué)正是通過(guò)放松線性回歸模型的經(jīng)典假設(shè)而建立起來(lái)的,因而更貼近經(jīng)濟(jì)現(xiàn)實(shí),更一般化,涵蓋了更多的計(jì)量經(jīng)濟(jì)學(xué)模型,發(fā)展了更多的計(jì)量經(jīng)濟(jì)學(xué)理論與方法。131.2.2計(jì)量經(jīng)濟(jì)學(xué)的發(fā)展隨著大數(shù)據(jù)時(shí)代的到來(lái),經(jīng)濟(jì)觀測(cè)數(shù)據(jù)正以指數(shù)增長(zhǎng)的速度快速增加,如何在計(jì)量分析方法中應(yīng)用大數(shù)據(jù)成為計(jì)量學(xué)者們面對(duì)的新的挑戰(zhàn)。傳統(tǒng)的計(jì)量模型分析的主要是數(shù)字型的結(jié)構(gòu)化數(shù)據(jù),而大數(shù)據(jù)還包括大量的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),如文本、圖形、音頻、視頻、GPS定位、衛(wèi)星燈光圖片、基于時(shí)空的行程軌跡等數(shù)據(jù),并且即使是數(shù)字型數(shù)據(jù),也包含一些新型數(shù)據(jù)形式,例如區(qū)間數(shù)據(jù)、函數(shù)數(shù)據(jù)、符號(hào)數(shù)據(jù)等。當(dāng)前,大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析已成為計(jì)量經(jīng)濟(jì)學(xué)研究的新領(lǐng)域。141.3計(jì)量經(jīng)濟(jì)分析的步驟151.3計(jì)量經(jīng)濟(jì)分析的步驟計(jì)量經(jīng)濟(jì)學(xué)更注重對(duì)真實(shí)世界內(nèi)在運(yùn)行規(guī)律的檢驗(yàn)及利用現(xiàn)實(shí)數(shù)據(jù)來(lái)檢驗(yàn)?zāi)硞€(gè)經(jīng)濟(jì)理論或定量估計(jì)某種經(jīng)濟(jì)關(guān)系,這就是實(shí)證分析方法。在應(yīng)用計(jì)量經(jīng)濟(jì)學(xué)的方法進(jìn)行實(shí)證分析時(shí),我們需要遵循一定的范式,即計(jì)量經(jīng)濟(jì)研究的基本步驟,這些步驟包括明確任務(wù)(確定要研究的問(wèn)題)、模型設(shè)定(運(yùn)用經(jīng)濟(jì)學(xué)的理論對(duì)這一問(wèn)題進(jìn)行思考,或?qū)δ骋滑F(xiàn)象進(jìn)行研究,分析變量之間的關(guān)系、選擇并建立計(jì)量模型)、獲取樣本數(shù)據(jù)、估計(jì)模型參數(shù)、進(jìn)行模型檢驗(yàn)、應(yīng)用計(jì)量模型解釋變量之間的關(guān)系并進(jìn)行預(yù)測(cè)。161.3.1明確任務(wù)確定要研究的問(wèn)題,這個(gè)問(wèn)題可能來(lái)自于長(zhǎng)時(shí)間對(duì)于某一現(xiàn)象的關(guān)注,也有可能來(lái)自于你對(duì)某一問(wèn)題突發(fā)奇想的好奇。例如要研究中國(guó)家庭消費(fèi)支出受家庭收入與財(cái)產(chǎn)的影響有多大;要分析新上市的一款智能產(chǎn)品的定價(jià)與其銷(xiāo)售量的關(guān)系;想知道一家商場(chǎng)的用電量與溫度之間的關(guān)系等。任務(wù)明確后,還要考慮模型的適用環(huán)境。171.3.2模型設(shè)定1.確定變量18按照因果關(guān)系劃分,計(jì)量經(jīng)濟(jì)學(xué)中的變量可以分為被解釋變量(也稱(chēng)因變量)和解釋變量(也稱(chēng)自變量)。被解釋變量就是要研究的問(wèn)題,解釋變量就是對(duì)所研究的問(wèn)題具有重要影響的因素。建立計(jì)量經(jīng)濟(jì)學(xué)模型的關(guān)鍵是確定解釋變量,一般方法是根據(jù)經(jīng)濟(jì)理論和實(shí)際經(jīng)驗(yàn)判斷影響被解釋變量的主要因素,再根據(jù)研究工作需要進(jìn)行具體確定。1.3.2模型設(shè)定2.模型形式的設(shè)定19根據(jù)經(jīng)濟(jì)理論設(shè)定模型的形式,例如經(jīng)濟(jì)學(xué)生產(chǎn)函數(shù)、需求函數(shù)、消費(fèi)函數(shù)、投資函數(shù)等模型的數(shù)學(xué)形式;根據(jù)經(jīng)驗(yàn)和事實(shí)分析研究問(wèn)題的主要影響因素,根據(jù)樣本數(shù)據(jù)繪制解釋變量與被解釋變量之間關(guān)系的散點(diǎn)圖,通過(guò)散點(diǎn)圖觀察變量間關(guān)系,據(jù)此確定模型的形式。如菲利普斯曲線、庫(kù)茲涅茨曲線、增長(zhǎng)曲線的確定。當(dāng)遇到模型的數(shù)學(xué)形式難以事先設(shè)定的情況時(shí),可以選擇多種不同的形式進(jìn)行模擬試算,然后根據(jù)模擬效果選擇較為理想的數(shù)學(xué)形式。1.3.2模型設(shè)定3.分析參數(shù)符號(hào)和變化范圍20

事先判斷出參數(shù)的符號(hào)和變化范圍,并用來(lái)檢驗(yàn)?zāi)P偷墓烙?jì)是否合理。例如對(duì)于Cobb-Douglas生產(chǎn)函數(shù):

式中,y表示產(chǎn)出,A表示技術(shù)進(jìn)步,估計(jì)值應(yīng)大于0,α和β分別表示資本K和勞動(dòng)力L的產(chǎn)出彈性,估計(jì)值應(yīng)介于0~1之間。如果模型估計(jì)的參數(shù)符號(hào)和范圍與預(yù)想的不相符,則需認(rèn)真查找原因,找出問(wèn)題的根源。1.3.3獲取數(shù)據(jù)1.獲取數(shù)據(jù)21一方面可以從諸如政府統(tǒng)計(jì)部門(mén)、學(xué)術(shù)機(jī)構(gòu)、專(zhuān)業(yè)數(shù)據(jù)收集機(jī)構(gòu)等獲取所需要的數(shù)據(jù),這類(lèi)數(shù)據(jù)通常都是經(jīng)過(guò)加工的非原始數(shù)據(jù),也稱(chēng)二手?jǐn)?shù)據(jù)。

另一方面,也可以根據(jù)研究需要自己設(shè)計(jì)問(wèn)卷,進(jìn)行訪談,直接獲取企業(yè)或網(wǎng)站數(shù)據(jù),這類(lèi)數(shù)據(jù)稱(chēng)為一手?jǐn)?shù)據(jù)。1.3.3獲取數(shù)據(jù)常用的國(guó)內(nèi)數(shù)據(jù)可以從以下數(shù)據(jù)庫(kù)獲得:22中經(jīng)網(wǎng)數(shù)據(jù)庫(kù)。其內(nèi)容涵蓋宏觀經(jīng)濟(jì)、行業(yè)經(jīng)濟(jì)、區(qū)域經(jīng)濟(jì)以及世界經(jīng)濟(jì)等各領(lǐng)域。萬(wàn)得(Wind)數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)以宏觀經(jīng)濟(jì)指標(biāo)和金融市場(chǎng)信息為主,內(nèi)容涵蓋股票、基金、債券、外匯、保險(xiǎn)、期貨、金融衍生品等領(lǐng)域。中國(guó)家庭動(dòng)態(tài)追蹤調(diào)查(CFPS)。反映中國(guó)社會(huì)經(jīng)濟(jì)、人口、教育和健康的變遷情況的數(shù)據(jù)。1.3.3獲取數(shù)據(jù)常用的國(guó)內(nèi)數(shù)據(jù)可以從以下數(shù)據(jù)庫(kù)獲得:23中國(guó)健康與養(yǎng)老追蹤調(diào)查(CHARLS)。采集年齡在45歲以上(包括45歲)的中國(guó)居民的情況,包括個(gè)人基本信息、家庭結(jié)構(gòu)、經(jīng)濟(jì)收支狀況、健康狀況(含實(shí)際體格測(cè)量)、醫(yī)療服務(wù)利用和醫(yī)療保險(xiǎn)以及社區(qū)基本情況等。中國(guó)健康與營(yíng)養(yǎng)調(diào)查(CHNS)。調(diào)查內(nèi)容包括家庭和個(gè)人的基本特征、收入和支出狀況、健康情況、營(yíng)養(yǎng)攝入、醫(yī)療保險(xiǎn)及使用等情況,以及社區(qū)基礎(chǔ)設(shè)施、公共服務(wù)等環(huán)境特征。中國(guó)家庭收入調(diào)查(CHIP)。調(diào)查信息由城鎮(zhèn)住戶調(diào)查、農(nóng)村住戶調(diào)查和流動(dòng)人口調(diào)查三個(gè)部分組成,詳細(xì)記錄了家庭收入與消費(fèi)信息。1.3.3獲取數(shù)據(jù)常用的國(guó)際數(shù)據(jù)可以從以下數(shù)據(jù)庫(kù)獲得:24當(dāng)前人口調(diào)查(CPS)。反映美國(guó)家庭基本信息的月度調(diào)查數(shù)據(jù)。提供了美國(guó)勞動(dòng)力市場(chǎng)就業(yè)、失業(yè)情況、工作時(shí)間、收入支出以及相應(yīng)的人口統(tǒng)計(jì)信息。長(zhǎng)期追蹤調(diào)查(NLS)。收集了美國(guó)勞動(dòng)人口長(zhǎng)期勞動(dòng)力市場(chǎng)表現(xiàn)及其他重要生活決策信息的一系列調(diào)查數(shù)據(jù)。醫(yī)療支出面板調(diào)查(MEPS)。是針對(duì)美國(guó)家庭、個(gè)人、醫(yī)療服務(wù)提供者以及企業(yè)雇主的一系列大規(guī)模調(diào)查。提供了關(guān)于醫(yī)療保健支出、醫(yī)療服務(wù)利用以及醫(yī)療保險(xiǎn)覆蓋等與醫(yī)療和健康有關(guān)的全面信息。資產(chǎn)價(jià)格研究數(shù)據(jù)庫(kù)(CRSP)。提供與美國(guó)證券交易相關(guān)的基礎(chǔ)與衍生金融產(chǎn)品數(shù)據(jù)。主要包括美國(guó)股票數(shù)據(jù)庫(kù)、美國(guó)資產(chǎn)組合配置數(shù)據(jù)庫(kù)、美國(guó)財(cái)政數(shù)據(jù)庫(kù)以及美國(guó)共同基金數(shù)據(jù)庫(kù)等。賓夕法尼亞大學(xué)世界表(ThePennWorldTable,PWT)。1.3.3獲取數(shù)據(jù)2.數(shù)據(jù)類(lèi)型25常用的統(tǒng)計(jì)數(shù)據(jù)主要有時(shí)間序列數(shù)據(jù)、截面數(shù)據(jù)、面板數(shù)據(jù)(也稱(chēng)混合數(shù)據(jù))。1.3.3獲取數(shù)據(jù)(1)時(shí)間序列數(shù)據(jù)26時(shí)間序列數(shù)據(jù)即按時(shí)間先后順序采樣得到的數(shù)據(jù)。

例如GDP、失業(yè)、就業(yè)、貨幣供給、政府赤字、股票價(jià)格等數(shù)據(jù),都是按照一定時(shí)間間隔收集得到的。

這個(gè)時(shí)間間隔可以是年、季度、月、周、日、時(shí)、分、秒等。宏觀數(shù)據(jù)一般為年、季度、月度數(shù)據(jù)。如果時(shí)間間隔以時(shí)、分、秒為單位,則為高頻數(shù)據(jù),在金融市場(chǎng)分析中,高頻數(shù)據(jù)的研究日益受到重視。1.3.3獲取數(shù)據(jù)(2)截面數(shù)據(jù)27截面數(shù)據(jù)即不同觀測(cè)對(duì)象在某一時(shí)間點(diǎn)的觀測(cè)數(shù)據(jù),如每十年進(jìn)行一次的人口普查數(shù)據(jù)、同一天甚至同一時(shí)刻各地的天氣情況數(shù)據(jù)、某一次選舉的選舉結(jié)果數(shù)據(jù)等,都是截面數(shù)據(jù)。

截面數(shù)據(jù)由于收集的時(shí)間成本比較低,在經(jīng)濟(jì)分析中是一種常見(jiàn)的數(shù)據(jù)類(lèi)型,更多應(yīng)用在微觀經(jīng)濟(jì)行為的分析中,在一些宏觀政策分析中也有應(yīng)用。1.3.3獲取數(shù)據(jù)(3)面板數(shù)據(jù)28面板數(shù)據(jù)即時(shí)間序列數(shù)據(jù)與橫截面數(shù)據(jù)的混合數(shù)據(jù)。例如某省所屬10個(gè)城市從2000年到2019年20年間研發(fā)投入的統(tǒng)計(jì)資料。還有一類(lèi)面板數(shù)據(jù)是同一個(gè)橫截面單位的跨期調(diào)查數(shù)據(jù)。例如,中國(guó)家庭動(dòng)態(tài)追蹤調(diào)查(CFPS)每隔兩年進(jìn)行一次追蹤調(diào)查,在每一期的調(diào)查中,都調(diào)查同樣的家庭。它提供了研究家庭行為動(dòng)態(tài)變化的有效信息。這種面板數(shù)據(jù)也稱(chēng)縱向數(shù)據(jù)或微觀面板數(shù)據(jù)。1.3.3獲取數(shù)據(jù)大數(shù)據(jù)時(shí)代獲取數(shù)據(jù)需要注意29選取數(shù)據(jù)時(shí),應(yīng)選擇有公信力的權(quán)威機(jī)構(gòu)發(fā)布的數(shù)據(jù),若自行采集一手?jǐn)?shù)據(jù),也必須注意數(shù)據(jù)的可信性和科學(xué)性。收集到的數(shù)據(jù),還要進(jìn)行數(shù)據(jù)預(yù)處理,才能用于建立模型,滿足可比性和一致性的要求。大數(shù)據(jù)時(shí)代80%以上的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)可以通過(guò)數(shù)據(jù)處理后轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化數(shù)據(jù)作為變量引入計(jì)量模型中。大數(shù)據(jù)并不代表全樣本,不論多“大”,還是復(fù)雜經(jīng)濟(jì)系統(tǒng)的一種樣本信息,建立在抽樣理論基礎(chǔ)上的統(tǒng)計(jì)分析與計(jì)量建模,其基本統(tǒng)計(jì)思想仍然適用。1.3.4估計(jì)模型參數(shù)模型參數(shù)估計(jì)方法是計(jì)量經(jīng)濟(jì)學(xué)實(shí)證分析的核心內(nèi)容,一般可根據(jù)經(jīng)濟(jì)變量的性質(zhì)不同,估計(jì)方法的特性、方法本身的難易程度等因素,選擇適當(dāng)?shù)墓烙?jì)方法對(duì)模型參數(shù)進(jìn)行估計(jì),如最小二乘法、極大似然估計(jì)等方法。301.3.5模型檢驗(yàn)經(jīng)濟(jì)模型是對(duì)客觀經(jīng)濟(jì)現(xiàn)象的一種抽象,要科學(xué)的應(yīng)用計(jì)量經(jīng)濟(jì)學(xué)模型,必須首先檢驗(yàn)其準(zhǔn)確性和可靠性,模型檢驗(yàn)的實(shí)質(zhì)是對(duì)已得到的參數(shù)估計(jì)值進(jìn)行評(píng)價(jià),研究其在理論上是否有意義,統(tǒng)計(jì)上是否顯著,進(jìn)而研究模型是否正確反映經(jīng)濟(jì)系統(tǒng)諸因素之間的關(guān)系,只有通過(guò)檢驗(yàn)的模型才能應(yīng)用于實(shí)際經(jīng)濟(jì)系統(tǒng)分析中。計(jì)量經(jīng)濟(jì)學(xué)模型需要通過(guò)四個(gè)方面的檢驗(yàn)。311.3.5模型檢驗(yàn)1.經(jīng)濟(jì)意義檢驗(yàn)32經(jīng)濟(jì)意義檢驗(yàn)主要是檢驗(yàn)參數(shù)估計(jì)值的正、負(fù)符號(hào)及數(shù)值的大小,檢驗(yàn)其在經(jīng)濟(jì)意義上的合理性。

例如在消費(fèi)函數(shù)中,消費(fèi)一般會(huì)隨著收入的增加而提高,且消費(fèi)的增幅通常會(huì)低于收入的增幅,因此收入變量的參數(shù)估計(jì)值應(yīng)為正數(shù),且應(yīng)在0~1之間,如果參數(shù)估計(jì)結(jié)果與預(yù)期不相符,則應(yīng)分析原因,是否數(shù)據(jù)有問(wèn)題,樣本不具有代表性等,分析原因并采取有效的辦法加以修正。1.3.5模型檢驗(yàn)2.統(tǒng)計(jì)學(xué)檢驗(yàn)33統(tǒng)計(jì)學(xué)檢驗(yàn)主要指對(duì)模型的可靠性進(jìn)行檢驗(yàn),判斷參數(shù)估計(jì)值的可信程度。基本的統(tǒng)計(jì)學(xué)檢驗(yàn)包括擬合優(yōu)度檢驗(yàn)、解釋變量參數(shù)的顯著性檢驗(yàn),模型的顯著性檢驗(yàn)等。

我們既要關(guān)注統(tǒng)計(jì)檢驗(yàn),更要關(guān)注經(jīng)濟(jì)意義檢驗(yàn)。例如,醫(yī)藥公司采用一種新藥治療癌癥,需要分析新藥的效果,統(tǒng)計(jì)檢驗(yàn)顯著往往告訴我們的是該藥是否有效,而現(xiàn)實(shí)生活中,患者通常更關(guān)心該藥的效果究竟有多大。后一個(gè)問(wèn)題所涉及的便是研究結(jié)果的經(jīng)濟(jì)意義檢驗(yàn)的問(wèn)題。1.3.5模型檢驗(yàn)3.計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)34計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)是由計(jì)量經(jīng)濟(jì)學(xué)理論確定的準(zhǔn)則給出的,主要用于檢驗(yàn)?zāi)P偷挠?jì)量經(jīng)濟(jì)學(xué)性質(zhì)。基本的計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)方法包括隨機(jī)擾動(dòng)項(xiàng)的序列相關(guān)性檢驗(yàn)、異方差檢驗(yàn)、解釋變量多重共線性檢驗(yàn)等。

如果模型存在序列相關(guān)、異方差或多重共線性,則必須通過(guò)各種統(tǒng)計(jì)和數(shù)據(jù)處理方法加以消除,否則會(huì)導(dǎo)致計(jì)量經(jīng)濟(jì)模型在應(yīng)用與分析中產(chǎn)生失真。1.3.5模型檢驗(yàn)4.預(yù)測(cè)檢驗(yàn)35計(jì)量經(jīng)濟(jì)模型的預(yù)測(cè)檢驗(yàn)主要是檢驗(yàn)參數(shù)估計(jì)值的穩(wěn)定性,測(cè)試當(dāng)樣本數(shù)據(jù)發(fā)生變化時(shí),參數(shù)估計(jì)值是否敏感。

例如可以通過(guò)增加樣本容量,或更換新的樣本數(shù)據(jù),重新估計(jì)模型參數(shù),將新的估計(jì)值與原估計(jì)值進(jìn)行比較,如果估計(jì)結(jié)果變化較大,則說(shuō)明模型不夠穩(wěn)健,需要對(duì)模型進(jìn)行進(jìn)一步修正和調(diào)整。

即使模型的穩(wěn)健性較好,如果進(jìn)行預(yù)測(cè),也應(yīng)注意樣本外預(yù)測(cè)(外推)的時(shí)間不能太長(zhǎng),否則很可能預(yù)測(cè)誤差較大。1.3.6模型應(yīng)用解釋因變量和自變量之間的因果關(guān)系及其作用機(jī)制,并對(duì)所研究問(wèn)題的內(nèi)在機(jī)理和邏輯進(jìn)行分析;利用模型進(jìn)行外推預(yù)測(cè),估計(jì)因變量的未來(lái)走勢(shì)。兩種應(yīng)用最終都是為決策(可以是政府決策、企業(yè)決策、個(gè)體決策等)提供支持的。361.4大數(shù)據(jù)與計(jì)量經(jīng)濟(jì)分析371.4.1大數(shù)據(jù)與小數(shù)據(jù)1.大數(shù)據(jù)大數(shù)據(jù)的規(guī)模大是其顯著特征,但據(jù)此推斷大數(shù)據(jù)意味著總體的思想則在大多數(shù)情況下是不正確的。例如,大數(shù)據(jù)時(shí)代“互聯(lián)網(wǎng)+”的迅猛發(fā)展是導(dǎo)致大量數(shù)據(jù)產(chǎn)生的主要原因。中國(guó)的網(wǎng)民人數(shù)已經(jīng)超過(guò)9.4億(2020年6月),互聯(lián)網(wǎng)的普及率達(dá)到67%,但是網(wǎng)絡(luò)輿論并不等同于民意,一個(gè)重要原因是,網(wǎng)民不能代表現(xiàn)實(shí)中的全體公民,而且活躍網(wǎng)民也不能代表全體網(wǎng)民。除了規(guī)模大以外,大數(shù)據(jù)還具有來(lái)源廣泛、更新實(shí)時(shí)、價(jià)值密度低等特點(diǎn)。381.4.1大數(shù)據(jù)與小數(shù)據(jù)2.小數(shù)據(jù)體量較小、實(shí)時(shí)性偏低、離線采集數(shù)據(jù)比較多,沒(méi)有大數(shù)據(jù)多源異構(gòu)的特征,多來(lái)源于調(diào)查問(wèn)卷數(shù)據(jù)、企業(yè)運(yùn)營(yíng)數(shù)據(jù)等。一方面,小數(shù)據(jù)基本采集于單一數(shù)據(jù)源,如國(guó)家統(tǒng)計(jì)局公布的經(jīng)濟(jì)指標(biāo)數(shù)據(jù)、企業(yè)CRM系統(tǒng)、財(cái)務(wù)系統(tǒng)等數(shù)據(jù),而大數(shù)據(jù)傾向于采集多種數(shù)據(jù)源,如大多來(lái)自于網(wǎng)絡(luò);另一方面,小數(shù)據(jù)基本以結(jié)構(gòu)化數(shù)據(jù)為主,而大數(shù)據(jù)涵蓋了種種非結(jié)構(gòu)化數(shù)據(jù),如圖片數(shù)據(jù)、客服系統(tǒng)的語(yǔ)音留言、網(wǎng)站日志數(shù)據(jù)等。391.4.1大數(shù)據(jù)與小數(shù)據(jù)3.兩者關(guān)系小數(shù)據(jù)一般來(lái)說(shuō)都比較準(zhǔn)確,信息含金量高,分析成本較低;而大數(shù)據(jù)價(jià)值密度較低,需要沙里淘金,分析成本也比較高;大數(shù)據(jù)涉及的維度比較多,多數(shù)情況只能研究和解決相關(guān)性問(wèn)題,而不是因果性問(wèn)題。而小數(shù)據(jù)研究則能精確衡量某些因素對(duì)消費(fèi)者行為的影響。“大數(shù)據(jù)”不能取代“小數(shù)據(jù)”,也不應(yīng)把大數(shù)據(jù)與小數(shù)據(jù)割裂開(kāi)來(lái),“大”與“小”是相對(duì)的,小數(shù)據(jù)也有大價(jià)值。401.4.2大數(shù)據(jù)對(duì)計(jì)量建模的挑戰(zhàn)1.數(shù)據(jù)形式多元化大數(shù)據(jù)一方面表現(xiàn)在可得數(shù)據(jù)形式的多元化,除了傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)外,還包括文本數(shù)據(jù)、音頻數(shù)據(jù)、視頻數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù)。另一方面,傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)的形式也日益多元化,從簡(jiǎn)單的點(diǎn)數(shù)據(jù),擴(kuò)展到區(qū)間數(shù)據(jù)、符號(hào)數(shù)據(jù)和函數(shù)型數(shù)據(jù)等。如何對(duì)信息含量豐富、數(shù)據(jù)形式多層次化的區(qū)間數(shù)據(jù)、符號(hào)數(shù)據(jù)和函數(shù)型數(shù)據(jù)進(jìn)行計(jì)量建模,是富有挑戰(zhàn)性的研究工作。411.4.2大數(shù)據(jù)對(duì)計(jì)量建模的挑戰(zhàn)2.數(shù)據(jù)變量維度高在傳統(tǒng)的實(shí)證研究中,一般假設(shè)模型是一個(gè)比較簡(jiǎn)單的線性形式,變量是根據(jù)理論或根據(jù)經(jīng)驗(yàn)、共識(shí)進(jìn)行選擇。大數(shù)據(jù)在具有海量信息優(yōu)勢(shì)的同時(shí),又具有信息價(jià)值密度低的特點(diǎn)。在利用大數(shù)據(jù)進(jìn)行計(jì)量經(jīng)濟(jì)分析時(shí),給定樣本中可供分析使用的變量維度會(huì)很高,甚至出現(xiàn)遠(yuǎn)遠(yuǎn)高于樣本量的情況,我們把這樣的數(shù)據(jù)一般形象地稱(chēng)之為“胖大數(shù)據(jù)”。在高維數(shù)據(jù)中如何更有效地篩選信息成為大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析所面臨的一個(gè)重要挑戰(zhàn)。421.4.2大數(shù)據(jù)對(duì)計(jì)量建模的挑戰(zhàn)3.變量關(guān)系更復(fù)雜大數(shù)據(jù)不僅表現(xiàn)為數(shù)據(jù)形式的多樣化,還主要表現(xiàn)為變量之間關(guān)系的復(fù)雜化。已有的計(jì)量經(jīng)濟(jì)建模方法不能很好地刻畫(huà)經(jīng)濟(jì)變量之間的復(fù)雜關(guān)系,從而嚴(yán)重制約了計(jì)量建模在宏觀經(jīng)濟(jì)預(yù)測(cè)和實(shí)時(shí)監(jiān)控中的有效性,這也是亟需解決的研究難點(diǎn)之一。431.4.2大數(shù)據(jù)對(duì)計(jì)量建模的挑戰(zhàn)4.網(wǎng)絡(luò)數(shù)據(jù)分析大數(shù)據(jù)時(shí)代“互聯(lián)網(wǎng)+”的迅猛發(fā)展也導(dǎo)致了新的網(wǎng)絡(luò)型數(shù)據(jù)的產(chǎn)生。新興的網(wǎng)絡(luò)型數(shù)據(jù)給已有計(jì)量經(jīng)濟(jì)理論與方法帶來(lái)了新的挑戰(zhàn),對(duì)于網(wǎng)絡(luò)數(shù)據(jù)建模、網(wǎng)絡(luò)形成的建模,以及網(wǎng)絡(luò)稀疏性處理等關(guān)鍵問(wèn)題都需要更深入的理論研究和更多的應(yīng)用嘗試。441.4.3機(jī)器學(xué)習(xí)、

統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)的關(guān)系大數(shù)據(jù)時(shí)代作為一種實(shí)現(xiàn)人工智能算法的“機(jī)器學(xué)習(xí)”,必然在各個(gè)領(lǐng)域得到廣泛應(yīng)用。所謂機(jī)器學(xué)習(xí),即MachineLearning(ML),是指用某些算法指導(dǎo)計(jì)算機(jī)利用已知數(shù)據(jù)得出適當(dāng)?shù)哪P停⒗么四P蛯?duì)新的情境給出判斷的過(guò)程。與傳統(tǒng)的為解決特定任務(wù)的軟件程序不同,機(jī)器學(xué)習(xí)是用大量的數(shù)據(jù)來(lái)“訓(xùn)練”,通過(guò)各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)的。由于機(jī)器學(xué)習(xí)會(huì)使用很多統(tǒng)計(jì)方法,因此統(tǒng)計(jì)學(xué)家也稱(chēng)之為統(tǒng)計(jì)學(xué)習(xí)。451.4.3機(jī)器學(xué)習(xí)、

統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)的關(guān)系學(xué)科預(yù)測(cè)因果推斷可解釋性主要方法機(jī)器學(xué)習(xí)*****最優(yōu)化、算法統(tǒng)計(jì)學(xué)*******漸進(jìn)理論計(jì)量經(jīng)濟(jì)學(xué)*******漸進(jìn)理論461.4.3機(jī)器學(xué)習(xí)、

統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)的關(guān)系47在研究目標(biāo)上,機(jī)器學(xué)習(xí)的主要目標(biāo)在于預(yù)測(cè),統(tǒng)計(jì)則側(cè)重于統(tǒng)計(jì)建模與推斷,計(jì)量經(jīng)濟(jì)學(xué)則著重于因果推斷;

在方法論上,機(jī)器學(xué)習(xí)主要使用最優(yōu)化方法,經(jīng)常表現(xiàn)為最小化某個(gè)目標(biāo)函數(shù)或損失函數(shù)。對(duì)于統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)而言,主要使用概率統(tǒng)計(jì)的漸進(jìn)理論,也稱(chēng)為大樣本理論。機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)及計(jì)量經(jīng)濟(jì)學(xué)之間存在密切的聯(lián)系,并互為借鑒與融合。目前,機(jī)器學(xué)習(xí)的方法正在加速進(jìn)入統(tǒng)計(jì)學(xué)與計(jì)量

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論