大學論文:基于ARIMA模型的股價預測研究_第1頁
大學論文:基于ARIMA模型的股價預測研究_第2頁
大學論文:基于ARIMA模型的股價預測研究_第3頁
大學論文:基于ARIMA模型的股價預測研究_第4頁
大學論文:基于ARIMA模型的股價預測研究_第5頁
已閱讀5頁,還剩36頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于ar i ma模型的股價預測研究摘要隨著我國金融市場的逐步放開、股票市場的迅猛發展,股票市場作為整個國民經濟 的重要基石之一,其地位和作用也日益突出.如何有效地控制金融市場風險,促使金融 市場有效、健康的運行,已成為我國金融機構面臨的重大挑戰.而通過歷史數據,建立 arima模型,能較好地預測股價的發展趨勢,從而使股票的投資者和管理者獲得最大的 冋報或最小的損失。本文利用同花順軟件收集深市同德化工(002360)股票從2010年3 月3 h-2016年4月25日間的每日收盤價,其中樣本數據采用股指對數收益率作為樣 本數據,并采用其數據進行平穩、零均值化處理,模型識別和模型定階,在使用最小二

2、 乘法估計參數后,建立arima模型;最后利用已建模型預測出未來3天的股票開盤價指 數,并與實際數據相對照,計算模型預測誤差,驗證arima模型是否適合于所選股票的 短期預測。關鍵詞:股價artma模型comparison of urban and rural residents in hebei provinceli da directed by lecturer liu linghuiabstractin recent years, under the guidance of the national integration strategy launched in beijing, ti

3、anjin, hebei provinee, by means of its regional advantages hebei province efforts to build "one hour life circle.11 accelerate the flow of population makes the structural differences in hebei household consumption size changedn order to better describe this difference, and this differenee is a

4、measure of the size of the paper to survive and consumption, development and enjoyment and con sumption and con sumption in total consumpti on in proporti on to the share of differe nces and build differe ntiated consumpti on structure .in this paper, descriptive statistics, found that the proportio

5、n of urban and rural consumption structure differenee in survival consumption and enjoyment and consumption of large differences in the development and consumption of a smaller proportion of the status quo.then analyzed to find a comprehensive description of the size difference factor by factor anal

6、ysis reveals that the reason for the difference gen erated by the status quo.finally, the spec訐ic economic development in hebei provinee, hebei provinee, is given to promote the coordinated development of urban and rural consumption policy recommendations.key words: urban and rural residents consump

7、tion differences compare research摘要i英文摘要ii目錄1前言21概念界定51.1城鎮和鄉村的界定51.2本研究中的消費結構52指標體系的建立與原數據的選取202.1河北省城鄉居民消費結構體系的建立202.2河北省城鄉居民消費結構數據錯誤!未定義書簽。3河北省消費結構的描述性統計分析233.1恩格爾系數分析233.2衣著和房屋消費分析243.3交通通信和文化教育消費分析253.4家用服務和醫療保健消費分析274河北省消費結構的因子分析284原數據與數據預處理284.1.1原始數據的選取284.1.2數據預處理294.2確定公共因子和載荷矩陣304.3因子旋轉與兩

8、個公因子的實際含義314.4計算因子得分與差異趨勢325結論與建議335差異現狀分析335.2原因分析335.3 建議34參考文獻35附錄36致謝38-xx.a刖b隨著社會的進步及科技的快速發展,中國的股票市場也日益完善,并且逐步 成為我國最重要的資本市場之一。由股份公司在籌集資本時向投資者發行的種 有價證券稱為股票。它可以顯示出投資者股權身份和權力,股票持有者可以根據 所持的股份享有專有的權力。它也是股票持有者承擔義務的憑證。只有股份有限 公司可以發售股票,并且它只能發給持股者持股證明,同吋不能轉售,所以股票 市場就是股票轉讓、流通和買賣的場地,它包含交易所市場及場外交易市場。股 票是一種“

9、投資小、收益大”同時伴隨高風險的投資行為,所以無論是投資者還 是股票的管理者,預測股價的發展走勢,通過了解股價的發展走勢來進行投資與 管理尤為重要。而所謂的股票價格趨勢分析就是借助某種工具通過對股價現有的 情況來對未來的股價進行預測,已有研究表明應用時間序列分析理論可以對未來 的股價進行分析和研究。實際上,應用吋間序列分析知識的領域是十分廣泛的。吋間序列分析的應用 一般有兩個目的:一個是通過給出的數據生成模型,二是根據歷史數據,預測出 將來的可能取值。學者常常能通過一定順序的吋間點來觀察所獲得的數據,如日 股票開盤價、某城市的降水量、每毫秒心電活動的狀況、月價格指數、年銷售量 等等。在觀察這些

10、數據吋發現它們之間具有相依性。通過對這些具有相依性的數 據進行觀察與研究來找出其發展規律,并利用其規律來擬合出數學模型,這些數 學模型可以用來預測數據的未來發展走向。而artma模型就是其最重要的時間序 列模型之一。他能很好地預測股價的發展趨勢,從而使股票的投資者和管理者得 到最大的收益。隨著社會的快速進步和發展,股票市場也逐漸成為我國經濟發展和金融活 動的陰晴表。正規股票市場最早出現在美國。如果股票交易市場出現了不良影響, 那么勢必會影響經濟及其金融的發展。在股市活躍的投資者和管理者都知道股市 唯一不變的性質就是它是每分每秒都在變化。這就需要我們借助某種工具來研究 股價的趨勢走向。我們使用時

11、間序列分析對股價進行分析,進而達到“投資小, 收益大”的目的。通過對股價數據的分析,利用吋間序列分析中的模型對其建模, 進而了解股價的未來走向。吋間序列分析在很多領域應用得十分廣泛。1970年,george e. p. box和 gwi 1 ym m. jenkins 著寫了一本名為(time series analysis-forecasting and control)的書1。此書引起了廣泛的關注和重視。其后國內外學者通過多個領 域對吋間序列分析進行研究,并且出版了許多專著和專門的期刊。如1994年, j. hami 1 ton 著寫time series analysis2。2003 年

12、,美國的經濟學家 robert f. engle和英國的經濟學家clive w j. grange因在經濟吋間序列分析上取得了巨大的成就而獲得諾貝爾經濟學獎3。1999年,查正洪利用時間序列分析對上證綜合指數進行建模分析與研 究,從而建立了 arima模型4o馮盼和曹顯兵在“基于arma模型的股價分析 與預測的實證研究”中5,利用單位根檢驗首先確定原序列的平穩性,從而利 用差分法使其變得平穩并通過adf檢驗,然后建立arma模型,并利用猜想法確 定卩和9的值。再確定模型的參數值來確保模型的參數顯著,最后對于所建的模 型進行殘差檢驗來確定模型的合理性,并利用所建模型對股價進行預測。通過對 比實際

13、值和預測值,可以看出所建模型是較為合理的。郭雪、王彥波的“基于 arma模型對滬市股票指數的預測” 6及鄧軍、楊宣、王瑋等的“運用arma模 型對股價預測的實證研究” 7和邵麗娜的“基于arma模型對招商銀行股票價格 的預測” 8,這些文章都是應用arima模型對其數據進行建模與預測。總之,目前的研究是在arima模型的基礎上對股票進行分析來建立模型 和擬合模型,最終達到預測的目的,從而使股票受益者達到利益最大化。木文主要關注的是arma模型在股價指數擬合和預測方面的應用9 o我們 知道,arma模型是基于數據序列為線性、平穩的假設前提下的,而事實上,經 濟時間序列的一個重要特征是存在趨勢性及

14、非線性成分,即通常認為時間序列具有以下形式:q)= x(/)+sa)+ca)其屮x為趨勢性成分,s為季節性成分,c(r)為隨機性成分。arma模 型是針對隨機性成分° 的建模。對季節性成分$(如果存在的話),通常采 用季節調整;對趨勢性成分x(r),通常采用階差分的辦法去除趨勢性,使之 平穩,然后用arma (p, q)模型擬合,此即為arima (p, d, q)模型,然而對于 某些數據樣木,比如文所選取的深市同德化工(002360)股票2015年8月一2016 年3月的對數數據序列,雖然存在明顯的趨勢,對其進行一階差分后固然消除了 趨勢成分使序列平穩,然而得到的序列自相關性不明顯

15、,在顯著性水平下與歷史 數據呈不相關性,即為一個白噪聲序列。木文考慮的是用一arima模型來擬合 時間序列的趨勢性成分。下面是論文的框架:第二章首先闡述時間序列模型ar、ma、arma及arima的概念;其次 紹ar、ma和arma模型參數的估計、模型的檢驗和選擇模型的標準;最后說明 arima模型的差分階數的確定和適用標準。第三章采用arima模型對深市同德化工(002360)股票進行分析預測, 分別介紹了指數組成的來源,模型的識別和定階、檢驗,并比較了預測結果。第四章結束語。1時間序列的理論模型與方法概述本文在這一章里主要介紹時間序列的相關概念以及模型,以便為下面章節 的順利展開做一個鋪墊

16、。時間序列(time series)系指以時間順序型態出現之一 連串觀測值集合,或更確切的說,對某動態系統(dynamic system)隨時間連續觀 察所產生有順序的觀測值集合。1.1時間序列模型的含義時間序列是以時間順序生成的觀測值的集合10。分為連續型時間序列和 離散型時間序列。本文中我們討論離散型時間序列,它是某一過程中的某一個變 量或一組變量z在一系列時刻上如:山,為自變量,且4 <,2 <</,”)得到 的離散有序數集合必,即某一過程在也,時刻的觀測值,一般為離 散等間隔的數字時間序列,屬于隨機過程的一次樣本實現。如:某產品價格的月 度數據、某產品產量的年度數據、

17、消費品價格指數的季度數據以及股票價格的口 數據等等都是以時間序列的形式岀現的。隨機過程指隨時間順次發展且遵從概率法則的統計現象。1.2隨機時間序列模型隨機時間序列的一個最基本特征就是相鄰兩個數據z間有相互依賴性,即: 兩個隨機數據呈現一定的相關。時間序列分析就是依據不同時刻變量的相關關系 進行分析,生成隨機動態模型來揭示其相關結構并進行預測。本文主要采用 arima模型的時間序列預測方法。1.3平穩時間序列利用arima模型對時間序列進行分析的時候,要求序列是平穩的。非平穩的 時間序列要轉化為平穩時間序列再利用arima模型進行預測。1.3.1隨機平穩時間序列隨機平穩過程如果一個隨機過程在,和

18、f+k時刻變量概率分布的隨機特性 不隨時間的改變而改變,我們便稱其為隨機平穩過程。隨機平穩過程的聯合分布 和條件分布均不隨時間變化而發牛變化,即過程的隨機性具有時間上的不變性, 在圖形上表現為所有的樣木點皆在某一水平線上下隨機地波動。由隨機平穩過程 產生的時間序列即為隨機平穩時間序列。如果序列兒是平穩的,則對任意匚“和 m都有(厶,陸)與(z+川冷說)是同分布的。所以平穩時間序列兒有以下性質:1、序列的數學期望臥x)= e(x)是常數,記為綣;2、序列的方差廠知)是常數,所以e(yt-uy)2 = el(yt+m-uy)23、序列的自協方差:=cov(x,x+*) = e(x-“j(x+,”-

19、“v)是常數,所 以,對于任意 2v(x*) = cov£,s)。白噪聲過程是一種特殊的平穩序列,也是最簡單的平穩吋間序列。如果 一個平穩序列山對于任何都有/為常數e©) = u, co v0,= 0, r, s為任取的時刻且心$就稱叮是一個白噪聲。當叮是獨立序列時,稱叮為獨立白噪聲。當弘=°時,稱為零均值白噪聲;當xoq'1時,稱為標準白噪聲;平穩時間序列的線性模型111、自回歸模型(autoregressive model)如果一個隨機平穩時間序列在任意時刻的取值丫,都可以表示成為過 去。個時刻上的數值九丿-2,,)的線性組合加上/時刻的殘差,并且構成

20、殘 差的序列表現白噪聲的性質。這樣的序列就可以用自回歸模型表示為:x = c+0 x-i + 02 兒2 + + 0/p +£屛=1,2,t其中:參數c為常數;如 財,是自冋歸模型系數,且e嚴;p為自回歸 模型的階數;s是均值為°,方差為夕的白噪聲序列。可以表示為上述形式的平穩序 列模型稱為自m歸模型。"階自m歸模型簡記為ar (p).2、移動平均模型(moving average model)如果一個隨機平穩時間序列丫在任意時刻/的取值都可以表示為過去q 個時刻殘差序列憶的加權平均值和呂的和,并且殘差序列憶表現為白噪聲的 性質。這樣的時間序列用移動平均模型可以表

21、示成為:= + ©+&£/_ + &2&一2 + + bqdq,( = '2,t其屮:參數"為常數;殂&2,,是自回歸模型系數,且為自回歸模 型的階數;呂是均值為°,方差為k的白噪聲序列。符合上述形式的模型稱為移 動平均模型。9階移動平均模型簡記為:ma(q)o3 自冋歸移動平均模型(autoregressive moving average model)自冋歸移動平均過程是自冋歸過程和移動平均過程的組合。所以自冋歸移動平均模型可以表示成為:開=c + 0| yt_x + 02開一2 + + opvi-p + &#

22、163;/ + &1呂-1 + &2呂一2 + + 3q£_q,1 -,t顯然此模型是ar(p)和ma(q)的混合形式,稱為混合模型,常記作arma( p, q)o 當 p = 0時,a7?ma(0,g) = ma;當防0時,arma( p, 0)二ar( p)。其中:參數c為常數;如 帕是自回歸模型系數,且©h0;g為自回歸模 型的階數;是均值為0,方差為,的白噪聲序列。上述形式的平穩時間序列稱 為自回歸移動平均模型,簡記為arma (p, q)o4、自回歸求積移動平均模型(autoregressive integrated moving average

23、model)如果一個時間序列模型是非平穩的,在建模的過程中我們必須把他差分 /次,把它變為平穩的,然后用arma (p, q)作為它的模型,那么,我們就說那 個原始的時間序列是arima (p, d, q),我們把它稱作是一個自回歸求積移動平 均模型。132非平穩時間序列非平穩序列時間序列的統計規律隨著時間推移而不斷發生變化,即生成變 量時間序列的隨機過程的特征隨時間變化。只要平穩過程中的三個條件不完全滿 足,它所生成的時間序列就是非平穩時間序列。非平穩時間序列分為兩種:1、趨勢平穩的時間序列時間序列有確定性的時間趨勢,去除這種趨勢 后即為平穩時間序列。用方程表示為:x =/(/) +w,其屮

24、兀表示為時間序列在/時刻的取值;/表示為時間的函數;坷表示為殘差序列,并且為一平穩時間序列。一般我們討論的只有線性趨勢平穩的時間序列。所以可以表示為:x =。+ 0/ + ut對于線性趨勢平穩的時間序列,去掉完全確定的線性趨勢后所形成的時 間序列就是一個平穩時間序列。b|j:的= x_(q + 0/)為一平穩的時間序列。所以我們可以采用最小二乘法估計這個趨勢,然后利用所估計出來的趨 勢進行預測。判斷一個時間序列是否能用線性模型擬合這種上升趨勢,就要對 uf=yt-(a/3t)的平穩性進行檢驗。因為。和0未知,所以通過最小二乘法估計 出。和“,然后對估計的殘差帀=x 一(藥+丙)進行平穩性檢驗。

25、2、差分平穩時間序列經過一次或者多次差分后的平穩時間序列稱為差 分平穩時間序列12, 13。非平穩時間序列轉化為平穩序列所要經過的差分的次 數被稱為差分平穩序列的階。記為1曲為差分階數, 。一般一階差分記為4丫,即:= 人仏為差分運算符同樣d階差分記為即一般來說一個非平穩時間序列經過次差分以后都會變成一個平穩的時間 序列。1.3.3隨機平穩時間序列樣本的數字特征1、時間序列的樣本均值(mean)2、時間序列的樣本方差(variance)3、時間序列樣本的自協方差(auto coefficient)4、時間序列樣本自相關函數(autocorrelation coefficient)1 n-k活(

26、ft)( c噸幾)丿 pki n-s(-f)267zo5、時間序列樣本偏自相關函數(partial autocorrelation coefficient)冃-工叭_pjy=i,s = 3,4,5,其中s代表滯后量,% =(pz、j (pgj, j = 1,2,-11.4時間序列模型的建模步驟建立時間序列模型的整個過程由數據預處理、模型的識別、參數估計和模型 檢驗四個部分組成14-20時間序列模型建立基礎是平穩時間序列。因此,我們在得到一組樣本數據后, 應先檢查該組數據的平穩性。1.4.1判斷時間序列的平穩性根據平穩時間序列的特征對其平穩性進行判斷,常見的時間序列平穩性檢驗 主要有以下幾種:利

27、用散點圖進行平穩性判斷根據自相關函數判斷單 位根檢驗。(1)散點圖檢驗圖2-1平穩時問序列的散點圖圖2-1主要是看時間序列力畀2,yj的各觀測值是否在歹的均值上下 來回波動,并且具有相等的方差。這種方法簡單易行,但往往結果過于粗糙,精度不高。根據樣本自相關函數判斷如果樣本自相關函數隨著k的增大,而呈現迅速衰減的狀態,則認為該 序列是平穩的;如果衰減非常緩慢則認為該序列是非平穩的。(2)單位根檢驗考慮簡單的ar (1)過程其中,憶是白噪聲時間序列,而且只有岡j時序列才是平穩的;當 園1時,序列兒呈現爆炸性,即會逐漸增大為非平穩序列。所以可以寫成x e 或者(i 2厶)x = et其中厶為滯后算子

28、,表示時間序列的滯后。如丿的一期滯后可表示為厶3), 即:£(x)= x-i所以,厶"0;)=兒”/ = 1,2廠yj平穩的條件就是其特征方程1 -久厶=o的根的絕對值大于1。此方程l=i的唯一的根為一刁,所以平穩性耍內°,因此檢驗神平穩吐的原假設和備假 設為:/o:|a|>1h:a<1接收原假設ho表明序列是非平穩序列,而拒絕原假設表明序列是平穩 序列;如果久=1,則該過程為隨機游走過程,是一種特殊的差分平穩過程, 是非平穩的。階自回歸過程ap(p),則可以表示成:x =入yt+久2兒2+久屛一 + et其特征方程:1_ 人厶厶2&q =0只

29、有當此方程所有根的絕對值都大于1,才能有過程x =人 y,. + 入 >-2 + + 心)1“ + £t是平穩的,如果有一個特征方程根為1,則必有一個單位根,這時方程二人yt+久2乳-2+久屛一“+et可以寫成:x 一=人開-1 + 入 x-2 + + 心兀一“+呂一 z-1而對于ar(1)模型,則有:z =內l +呂d )c-因為大多數的經濟事件序列2為正,所以假設可以寫成:/7, :<0通過這樣變換,可以把檢驗原參數2 = 1,轉化為檢驗5 = °是否成立,這類檢驗可以分別用兩個t檢驗進行:h =由于統計量a.a2-13頑和麗并不服從/分布,而稱之為萬統計量

30、,其極限分布由富勒(fuller)所決定,迪基(dickey)給出其分布經驗上的粗略估計。所以此檢驗又稱辿基一富勒檢驗,即df檢驗。后來麥金農(mackinnon)通過蒙 特卡洛模擬法系統模擬出了這些臨界值,相比丁檢驗,他們要大得多。因為"臨界值依賴于m歸方程的類型,所以,對于另外兩種類型的方 程:% =。+ 內二+ 呂和) = a + 0/ + £t迪克一富勒還編制了另外兩個萬統計表。(3 ) adf檢驗(augmented dickey- fuller test)在adf檢驗中,我們假設隨機誤差項是相互獨立的,不存在自相關,但 是大多數的經濟事件序列是不滿足此項調價的,

31、當不滿足時我們采用擴展的迪基 一富勒檢驗(augmented dickey, 一 fuller test)方法。所以原來模型變為:p;=1(1)p)1 二 “+內l+y 為)l+呂(2)px = “+x 乃)1】+£i片1檢驗步驟如下1、估計模型(3),在給定adf臨界值的顯著水平下,如果參數顯著的 不為零,則序列不存在單位根,序列平穩,結束檢驗,反之進入第一步;2、給定山0,在給定adf臨界值的顯著水平下,如果參數"顯著的不 為零,存在時間趨勢,進入第3步;否則進入第4步;3、用丁分布檢驗力=°,如果參數$顯著的不為零,則序列不存在單位 根,序列平穩,否則序列不

32、平穩,結束檢驗。4、估計模型(2),在給定adf臨界值的顯著水平下,如果參數顯著的 不為零,則序列不存在單位根,序列平穩,結束檢驗,反之進入第5步;5、給定0 = °,在給定adf臨界值的顯著水平下,如果參數/顯著的不 為零,表明含有常數項,則進入第3步,否則進行下一步;6、估計模型(1),在給定adf臨界值的顯著水平下,如果參數/顯著的 不為零,則序列不存在單位根,序列平穩:結束檢驗,反之序列不平穩。1.4.2模型的識別arma模型識識別的方法21-22有很多種,這里我們只考慮使用自相關函 數和偏才函數的拖尾和截尾性,來初步判斷所采用的模型類型。移動平均過程的自相關系數特征對于移動

33、平均過程則有:砒)二“var() = (1 + 0; + 0; + +所以,(0 + 0+1g + 0+2&2 + + qpqjb, j = 1,2,q °,j>q0 + 0+lg + &汁2&2 + + 昭一丿pi =<1 + &:+0;,丿= 1,2,q°,j>q所以,當移動平均的階為9時,間隔期大于9的自相關函數值為零。a 一-,氏 + 在樣本充分大的條件下,自相關函數的95%置信區間為i3'_2_ 2、 所以如果自相關函數°廠°'在大樣本的情況下如果落入i麻,眉)區間內,則在5%的

34、顯著水平下不拒絕久的假設。|/9.|>-7= 所以在實踐中當k>q時,如果平均20個&中至多有一個使4,那么我們認為血在k=q處截尾。自回歸過程的自相關系數特征因為是自回歸過程,則有:e(yt) =%=入開+右卩2+ 2昇p+岸7 =久 17j- + 入?j-2 + + 切 yj-p 所以,pj = pi- + lpj-2 + + ppj-ppk解得:其屮,c為任意常數,z/為特征多項式e(z) = l-入z-人z,2/"的特征根,所以在原模型平穩性條件下,q被負指數所控制,隨丿的增大,°絕對值 下降,但是不會到某一點以后突然被截斷,所以是非截尾的。自回

35、歸過程的偏相關函數特征偏相關系數的定義必與乙的偏相關系數是去掉人必一2,,冷鬥的線性影 響后簡單的相關系數。表示如下:巒=pj = coir(y 廠 e(%|兒必亠,)j+i|)例如在ar過程中兀=。11兒1+弓,%=021兒1+022兒2+弓,其中0代表偏相關系數。偏相關系數的計算基于yule-walker方程組:p、=(p+(p2p+ 竹pp- 門二必+卩+卩宀pp =叭 p p +(p2pp-x + + <pppp-k解得:叭嚴ps =1(02加)i-a25-1ps-y/ps-pbj;=!741-2>"其中$代表滯后量,%=叭一山-叭®7“ j a、s因此

36、對于ar(p) 過程,當時,和加之間不存在直接相關,所以這時所有的久都為零,呈 現0階截尾狀態。所以在實踐中當k>p時,“如果平均20個久中至多有一個使""'石,那么我們認為截尾在k = p處。自回歸滑動平均模型自相關函數和偏相關函數的特征若0序列與久序列皆不截尾,被負指數函數控制收斂到零,則x很有可 能是arma序列。總結零均值平穩序列模型的自相關和偏相關函數的統計特征如下:表1 arma(p, g)模型的白相關系數和偏相關系數特征模型相關系數偏相關系數ar(p)拖尾p階截尾ma(q)q階截尾拖尾arma(p,q)拖尾拖尾1.4.3模型的定階基本思想:確定一

37、個函數,該函數既要考慮用某一模型擬合原始數據的接近 程度,同時又考慮模型中所含參數的個數。當該函數取最小值時,就是最合適的 階數。基于基本思想,如果選擇的滯后長度與真實的滯后長度相同時,模型估計值 與觀測值的誤差應該最小,所以可以用誤差平方和或者均方誤表示:丁工(兀一刃)2sse =工( - 刃)2mse =旦曰或者t但是由于隨著解釋變量的增加,sse和mse都呈現減小狀態,這樣的模 型擬合度很高,但是擬合效果不一定高,考慮到自由度的影響我們通常都采用 aic準則和bic準則。atc 準則(akaike,s informal ion criterion), atc 準則又稱為最小信 息準則,它

38、是由日本學者赤池首先提出并成功地應用于ar模型的分析定階中, 該方法也可用來辨識arma模型的階數。舒瓦茨準則(schwa z bayesian information cri ter ion)比赤池準貝ij增加了更嚴格的懲罰條件。舒瓦特信息準則 通常簡寫為btc準則(有的書本也稱sbc準則或者sc準則,本文中采用bic準 則)atc及bic的定義函數為:其中有不同的變形:取對數可得:a/c( p、q) =) + % o + %bic( p,q) = in& ) + 2(p + q)in(7%2、根據對數似然函數變換:aic(p,q) = 2in% + xp + q%bic(陽)=-2

39、加 % + 2(卩 + 口乂7%其中t為樣本容量°k = p + q代表模型中參數的個數,如果有常數項,pzyt e2被p+q+i代替,f是噪聲項方差的估計,t ,在對數函數中inl-in(a2) + k2, k是與參數無關的量。理論上,aic和bic要盡可能的小,當模型擬合優度上升時,aic和bic 的值會趨近于-只。若模型a的aic (或者是bic)小于模型b,則稱模型a優于模 型b。對于每個模型回歸變量的增加會導致 w 的增加,但殘差平方和會減少。 如果回歸變量對模型沒有解釋力,在模型屮增加回歸變量只會使aic和bic增加。 因為in(t) > 2 ,這樣btc增加冋歸變

40、量的邊際成本較大,bic與aic相比總是傾 向于選擇更簡練的模型。在這兩個準則中,bic更具有大樣木特性,在樣本容量無限大時,aic 原則的模型階數要大于bic,準則選擇的模型階數,bic準則漸趨一致,而aic 更傾向于選擇參數過多的模型,然而在小樣木的情況下aic準則的效用要優于 bic準則。1.4.4模型參數的估計模型參數的估計主耍采用最小二乘或者極大似然估計,這兩種方法的估計精 度較高,所以稱為精估計。本文主要采用eviews軟件,直接給出了參數的估計 值。1.4.5模型檢驗模型的檢驗主要從以下幾個方而判斷:(1)、所有的系數是否都顯著不為 零;(2)、殘差序列是否為h噪聲;(3)、預測

41、是否準確;(4)、是否有更大的擬合優 度和更小的aic值和bic值;(5)、是否有更簡單的模型;(6)、是否有直觀意義 和經濟理論基礎:1、對于殘差序列是否為白嗓聲,耍繪制殘差得自相關和偏相關圖,看自相 關系數和偏相關系數是否在0. 05的置信區間內。2、box-piece q 統計量給出°統計量計算函數°,7為樣本長度,0;是樣本子相關系數,加主觀給定,一般在15-20之間,一般令吩歷。原假設殘差匕是片噪聲過程,統計量"漸進服從rn-p-q)分布,如果模 型中含有常數項,貝u模型漸進服從才5-i-q)的,所以給定置信度1-0(。 通常為0.05或者0.01),若

42、(加一一9),則不能拒絕殘差是白噪音的假設, 檢驗通過,否則檢驗不能通過。3、d. w 值d. w值源于durbin-wstson檢驗,主要是檢查殘差序列的自相關特性。dw統計量又稱統計量,其函數表達式為:因為°可以看作是均與"山之間的自相關系數,又由于自相關系數處于1和1z間,所以統計量位于0到4之間。又以下關系:時,殘差之間存在正相關; 時,殘差之間不存在相關;d2時,殘差之間存在負相關。durbin-wstson檢驗給出了不同的樣本容量和不同的自變量個數在不同的 顯著水平(10%,5%,1%)的檢驗臨界值。一般來說如果d. w值距離2較遠,就認 為有一定程度的自相關。

43、但同時值得注意的一點是:durbin-wstson檢驗只能檢 驗殘差序列的一階相關,不能檢驗殘差序列的高階相關。4、樣木決定系數和修正的用因為模型的總方差進行分解為:n“廠刃2 = £(記-刃'+£(“ -九)'1=1t=l/=1即sst = ssr + sse而r2£(記-刃2ssrstssesst乩-刃2r=l修止疋的取值范圍一般為0,1,也可能是絕對值很小的負數。同一類型的模型,修正疋越高,越接近1,擬合越理想。當修正f等于1吋,表明模型完 全擬合。1.5預測評價中的其他指標預測評價中的其他指標是1 n=-刃誤差均值 n 1=1i nmae

44、= -yyl-y 絕對誤差“曰mape=±y-y'絕對誤差百分比nf=lytrmse=丄£ 均方根誤差率v " © iji mtheil inequality coefficient 二 v "t+i * n ,=r+, the 訂不等系數取值在0-1之間。當等于0時,表示100%的擬合;(1 t+n2丄h"芻】丿1 t+n$ (y? yf)2偏倚比率(bias proportion) = n t=t+,偏倚比率側量預測平均值與實際平均值之差的平方占誤差均方的比率;1 t+n£('/ yt )2方差比率(va

45、riance proportion) = /=7,+1,方差比率測量的是%的預測值和實際值的分布偏倚標準之差的平方占誤差均方的比;2d - 嚀”1 t+n yf)2協方差比率(covariance proport ion) = nt=r+i,協方差比率是測2d-廠)sq”占誤差均方的比率,其中t表示樣本容量,n表示樣本外預測數,刃 表示預測值,表示實際值。2 ar1ma模型在同德化工(002360)股票中的定量分析2.1同德化工(002360)股票的日開盤指數選樣同德化工是由山西同德化工有限公司整體變更設立的股份有限公司,股本總 額4000萬元。2006年1月18 r,同德化工在山四省工商行政

46、管理局辦理了變 更登記,注冊號為:1400002004534。2007年12月20日,公司注冊資本增加到 4500萬元,并在山西省工商行政管理局辦理了變更登記,注冊號為: 140000200045347o本文選取同德化工(002360)股票從2010年3月3日到2016年4月25日 的每日收盤價的對數收益率作為樣本數據,其中每日股票的對數收益率尺為相 鄰交易口收盤價e的自然對數一階差分,即ri(pd(pj,數據來源于同 花順軟件。2.2時間序列的平穩性檢驗2.2.1散點圖檢驗由圖3-1可以看出,序列符合零均值同方差的特征。可以大致的估計,同德 化工股票f1線時間序列的一階差分是平穩的。2.2.

47、2自相關系數判斷由圖32所示,殘差序列的自相關系數在滯后期1后都顯著落在置信區間內, 可大致斷定一階差分序列是平穩的。20,090,000 20,110,000 20,130,000 20,150,000 20,170,000圖3-1同德化工股票口線時間序列的一階差分圖10.0680.0686.44830.01120.0170.0136.87010.03230.0020.0046.87800.07640.0050.005691320.14150.0140.0147.19810.20660.0110.0097.37910.28770.0550.05711.5710.11680.0110.0181

48、1.7260.1649-0.044-0.04414.4230.108100.0030.00314.4390.154110.0330.03515.9700.142120.0190.02316.4800.170130.0200.02217.0240.198140.0110.00517.2050.245150.0030.00117.2150.306160.0040.00117.2390.370仃0.0210.02117.8740.397180.0120.00418.0830.450190.0250.02318.9800.458200.072-0.07026.3550.154210.0200.0122

49、6.9210.173220.0190.01327.4090.196230.0310.02728.8050.187240.0420.04431.3090.145250.0300.02632.5510.143260.0080.01632.6520.172270.0110.00532.8210.203280.0120.00733.0300.235290.0240.01733.8790.244300.0010.00433.8820.286310.0230.01934.6540.298320.0220.02535.3540.313330.0070.00435.4270.354340.0140.01435

50、7110.38835-0.0040.000357330.434360.0070.007357970.478圖3-2同德化工口線時間序列h相關和偏相關系數圖目標河北省城主要因素 食品x、 衣著x2 居住x3家電與服務x。 居民醫療x5消交通通訊x6 費結文教x?構體其他x8系3河北省消費結構的描述性統計分析31恩格爾系數分析恩格爾系數指的是食品支出占消費總支出的比重。由恩格爾定律可知:一個 家庭收入越少,家庭收入中用來購買食物的支岀所占的比例就越大,隨著家庭收 入的增加,家庭收入中用來購買食物的支出比例則會下降。恩格爾系數是反映居民消費水平的重要指標,它的值越低,居民的消費水平 越高。恩格爾系數

51、達59%以上為貧困,50-59%為溫飽,40-50%為小康,30-40%為 富裕,低于30%為最富裕。由表2和表3可以得到如下的恩格爾系數變化折現對比圖:城農村29.3526.17年份 200520062007200820092010201120122013圖1河北省恩格爾系數對比圖從上圖中可以清楚的看到許多現象。第一,從變化趨勢看,十年中城鄉居民恩格爾系數都有所下降。這充分說明 在這十年中,隨著我省經濟的發展,我省城市和鄉村居民的消費水平都有所提高。第二,從變化幅度看,農村居民恩格爾系數變化幅度較大,城鎮恩格爾系數 變化幅度較小。說明農村在這十年的發展中,消費水平提高的幅度比城市大,也 展示

52、了農村消費水平提高,消費結構轉型的巨大潛力。第三,從具體細節看,在2008年城鄉恩格爾系數較上一年有所上升,可能 是經濟危機導致居民消費水平下降。特別是在2011年農村居民恩格爾系數小于 了城市,這可能和國家在經濟危機后為了促進農村消費而實行的家電下鄉等的一 系列政策有關。隨著經濟的復蘇,和消費水平的穩步提高,到2014年城市居民 的恩格爾系數又低于鄉村。3.2衣著和房屋消費分析根據表2和表3可以得到如下的城鄉居民衣著和房屋消費對比圖如圖2和圖3o城請農村年份 200520062007200820092010201120122013圖2河北省衣著消費城鄉對比圖城農村22.5213.06年份 2

53、00520062007200820092010201120122013圖3河北省住房消費城鄉對比圖上面兩幅圖反映了一個非常值得注意的現彖:在2005年到2014年這十年間,城鎮居民在衣著方面的消費比例都是高于農 村居民,而農村居民在住房方面的消費比例都高于城鎮。這種現象的產生有其深刻的社會現實根源。盡管在城鄉一體化發展的今天, 城鄉居民之間在收入水平的上的差距述是存在的,加之消費觀念的不同,城鎮居 民更加注重對生活質量和時尚元素的追求,導致了城鎮居民以更高的比例在衣著 上消費。在這十年里,我省經濟發展的總趨勢就是農村居民城鎮化,越來越多的 農村居民為了追求更美好的生活,來到了基礎設施相對完善的

54、城市,并在城市中 買了自己的商品房,再加上城市居民本身就生活在城市,他們本身有自己的住房, 對住房消費的需求不大,有很大一部分住房消費僅是為了投資,所以農村居民用 更高的比例來用于住房消費。3.3交通通信和文化教育消費分析根據表2和表3可以得到如下的城鄉居民交通通信和文化教育消費對比圖如 圖4和圖5:城備農村15.1113.9年份 200520062007200820092010201120122013圖4河北省交通通信消費城鄉對比圖-城農村年份 200520062007200820092010201120122013圖5河北省文化教育消費城鄉對比圖從圖4和圖5可以看出,在交通通信和文化教育兩個方面消費的比例城鎮的 都高于農村的,但是這種比例的差異并不是特別的大,尤其是在交

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論