基于SPSS的時間序列分析技術研究_第1頁
基于SPSS的時間序列分析技術研究_第2頁
基于SPSS的時間序列分析技術研究_第3頁
基于SPSS的時間序列分析技術研究_第4頁
基于SPSS的時間序列分析技術研究_第5頁
已閱讀5頁,還剩31頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 摘 要國內生產總值(GDP)預測問題,由于其輸入向量維數多,影響因素復雜,具有很強的非線性,輸入向量的各分量間存在著復雜的耦合關系,是典型的“黑箱”模型,各數據直接的相互影響關系沒有明確的表達式等原因,預測難度比較大。考慮到支出法計算GDP,綜合前人的研究成果本文認為,影響GDP的指標有多個,但起主要作用的只有四個:固定資產投資、人口數量、資本形成總額和居民消費。研究工作中,我收集了我國1992到2011共20年的GDP作為數據,運用時間序列分析的基本的分析方法隨機時序分析,進行模型識別、參數估計和模型檢驗,應用選定時間序列方法預測未來GDP,并討論此時間序列類型、誤差的主要來源。關鍵詞:國

2、內生產總值(GDP) GDP預測 時間序列分析 參數評估 32北京郵電大學世紀學院畢業設計(論文) ABSTRACTABSTRACTGross domestic product (GDP) forecast of the input vector dimension, affecting factors are very complex, highly nonlinear and complex coupling between the input vector component is a typical black box modelthe data directly there is n

3、o clear interaction between the expression of reason, forecasting more difficult. Taking into account the expenditure approach of GDP, integrated previous research paper argues that indicators of the impact of GDP, but the total amount of only four plays a major role: investment in fixed assets, pop

4、ulation, capital formation and household consumption.Research, I collected the 1992-2011 total of 20 years of GDP as data, use the random timing of the basic analysis methods of analysis of time series analysis, model identification, parameter estimation and model checking, application of the select

5、ed time series methods to predict the futureGDP, and discuss the main source of this type of time series error.Keywords: gross domestic product (GDP) GDP forecasts time series analysis parameter estimation 北京郵電大學世紀學院畢業設計(論文) 目錄目 錄摘 要IABSTRACTII目 錄III緒 論11.1 問題提出的背景和內容11.1.1 問題提出的背景11.1.2 問題研究的內容11.2

6、 國內外研究現狀21.2.1關于SPSS21.2.2關于時間序列技術31.2.3關于GDP31.3 GDP的概念及其核算51.4 GDP 預測的意義61.5 中國經濟發展的現狀61.6論文的主要研究內容71.6.1 基本思路71.6.2 文章結構安排7第2章 GDP時間序列預測模型82.1指數平滑模型82.1.1 指數平滑概念82.1.2 指數平滑計算82.2自回歸模型建模112.2.1 自回歸概念112.2.2 自回歸建模112.3 ARIMA模型建模步驟112.3.1數據平穩化處理112.3.2模型識別122.3.3參數估計132.3.4參數估計13第3章 GDP時間序列預測模型的構建14

7、3.1 指標選取與數據處理143.2 我國GDP的時間序列模型153.3 模型預測及分析分析23結論25參考文獻26致 謝27北京郵電大學世紀學院畢業設計(論文) 緒論緒 論1.1 問題提出的背景和內容1.1.1 問題提出的背景國內生產總值(GDP)受經濟基礎、人口增長、資源、科技文化、環境、體制、發展戰略等諸多因素的影響,這些因素之間又有著錯綜復雜的關系,因此,運用結構性的時間序列模型分析和預測GDP往往比較困難。將歷年的GDP 作為時間序列,根據過去的數據得出其變化規律,建立預測模型,用此來預測未來的發展變化,有著重要的意義。改革開放以來,我國經濟飛速發展。2001年排名已升到世界第六位,

8、而到2011年已排名世界第二。GDP反映了全社會最終產品和勞務產品的總價值,是衡量一個國家和地區經濟發展的重要指標。因此,對我國GDP變化趨勢的研究,能夠更準確地把握我國經濟發展的動向。使我國能夠有一個穩定明確的目標,達到更好的發展。1.1.2 問題研究的內容通過本課題的研究,學習并熟練掌握SPSS軟件技術,利用時間序列分析方法,建立我國GDP時間序列模型,分析經濟增長的內在特征。并對未來我國經濟發展做出預測,為政府制定經濟發展戰略提供依據。GDP反映了全社會最終產品和勞務產品的總價值,是衡量一個國家和地區經濟發展的重要指標。因此,對我國GDP變化趨勢的研究,能夠更準確地把握我國經濟發展的動向

9、。國內生產總值受經濟基礎、人口增長、資源、科技文化、環境、體制、發展戰略等諸多因素的影響,這些因素之間又有著錯綜復雜的關系,因此,運用結構性的時間序列模型分析和預測GDP往往比較困難。將歷年的GDP 作為時間序列,根據過去的數據得出其變化規律,建立預測模型,用此來預測未來的發展變化。因此,在本課題中我們要收集歷年的GDP數值,即數據的準備階段;然后對數據進行觀察及檢驗,總體把握時間序列發展變化的特征,這是選擇恰當模型進而對數據進行深入分析的前提;通過數據的觀察和檢驗階段得到對序列變化特征的總體把握后,就可根據分析的需要對數據進行不要的變換等預處理;之后根據時間序列的特征和分析的要求,選擇恰當模

10、型進行數據建模和分析。運用經過比較選擇之后的最優模型對我國未來GDP進行預測,并根據結果對當前的狀況找出改善的途徑和方法。1.2 國內外研究現狀1.2.1關于SPSSSPSS是軟件英文名稱的首字母縮寫,愿意為Statistical Package for the Social Sciences,即“社會科學統計軟件包”。最近伴隨著SPSS產品服務領域的擴大和服務深度的增加,SPSS公司已經決定將之英文全稱更改為Statictial Product and Service solution,意為“統計產品與服務解決方案”。1968年,美國三位斯坦福大學的學生開發了最早的SPSS統計軟件系統,并基

11、于這一系統于1975年在芝加哥合伙成立了SPSS公司。迄今SPSS軟件已經有30余年的成長歷史。全球約有25萬家產品用戶,它們分布于通訊、醫療、銀行、證券、保險、制造、商業、市場研究、科研教育等多個領域和行業,是世界上應用最廣泛的專業統計軟件。在國際學術界有條不成文的規定,即在國際學術交流中,凡是用SPSS軟件完成的計算和統計分析,可以不必說明算法,由此可見其影響之大和信譽之高。1994年至1998年間,SPSS公司陸續并購了SYSTAT公司、BMDP軟件公司、Quantime公司、ISL公司等,并將各公司的主打產品收納到SPSS旗下,從而使SPSS公司由原來的單一統計產品開發與銷售轉向企業、

12、教育科研及政府機構提供全面信息統計決策支持服務,成為走在了最新流行的“數據倉庫”和“數據挖掘”領域前沿的一家綜合統計軟件公司。SPSS為您提供揭示客戶需求、預測客戶行為的解決方案,并把客戶關系管理(CRM)和商業智能(Business intelligengce)有機地結合在一起,使您和您的客戶之間可以建立更好的互動關系。SPSS解決方案廣泛應用于市場研究、電信、衛生保健、銀行、財務、金融、保險、制造業、零售等領域。總之,SPSS是全球專業統計分析軟件和解決方案的領導者。SPSS向用戶提供包括統計分析和數據挖掘的專業軟件產品,SPSS預測分析技術把數據應用于戰略工作中,有效判定當前狀況并對未來

13、重大事件進行預測。全球有25萬多的商業、學術和公共行業用戶采用SPSS技術增加收入、降低成本,優化業務流程,發現并購防欺詐。在全球財富1000家企業中,有95%的企業是SPSS的客戶。1988年,中國高教學會首次推廣了這種軟件,從此成為國內教育科研人員最常用的工具。1.2.2關于時間序列技術時間序列是指將某種現象某一個統計指標在不同時間上的各個數值,按時間先后順序排列而形成的序列。時間序列法是一種定量預測方法,亦稱簡單外延方法。在統計學中作為一種常用的預測手段被廣泛應用。時間序列分析在第二次世界大戰前應用于經濟預測。二次大戰中和戰后,在軍事科學、空間科學、氣象預報和工業自動化等部門的應用更加廣

14、泛。時間序列分析(Time series analysis)是一種動態數據處理的統計方法。該方法基于隨機過程理論和數理統計學方法,研究隨機數據序列所遵從的統計規律,以用于解決實際問題。時間序列分析的作用有很多。可以反映社會經濟現象的發展變化過程,描述現象的發展狀態和結果;可以研究社會經濟現象的發展趨勢和發展速度;可以探索現象發展變化的規律,對某些社會經濟現象進行預測;利用時間序列可以在不同地區或國家之間進行對比分析,這也是統計分析的重要方法之一。近年來,時間序列分析已經滲入到交通運輸,智能控制,神經網絡模擬,生物,醫學,水文,氣象,經濟學,空間科學等眾多領域,發揮著無可比擬的作用。時間序列分析

15、技術在國內外都運用的非常廣泛,發揮著很重要的作用。1.2.3關于GDP近幾年來,世界經濟已擺脫連續4年的增長緩慢和不景氣狀態,并開始步入新一輪的經濟上升周期,世界經濟增長率在1991年下降到04的基礎上,1992年提高到08,1993年為17,1994年上升到31,預計1995年可達35,90年代下半期大體可保持3的增長率,略高于80年代29的水平。而2007年8月以來,隨著美國次貸危機的全面爆發,美、歐金融市場受到了較大的負面影響,這種影響不可避免地滲透到實體經濟當中,且不斷向其他國家和地區擴散。面對各種經濟危機,要想更好更快更準的掌握自己經濟的發展,對經濟的研究與預測是必不可少的,而國內生

16、產總值是衡量一個國家實力的重要指標。因此,各國對各自國內生產總值的研究與預測也格外重視。在美國,國內生產總值由商務部負責分析統計,慣例是每季估計及統計一次。每次在發表初步預估數據(The Preliminary Estimates)后,還會有兩次的修訂公布(The First Revision & The Final Revision),主要發表時間在每個月的第三個星期。國內生產總值通常用來跟去年同期作比較,如有增加,就代表經濟較快,有利其貨幣升值;如減少,則表示經濟放緩,其貨幣便有貶值的壓力。以美國來說,國內生產總值能有3%的增長,便是理想水平,表明經濟發展是健康的,高于此水平表示有通貨壓力

17、;低于1.5%的增長,就顯示經濟放緩和有步入衰退的跡象。1978 年到2001 年,中國GDP 年均增長超過9 %。2001 年GDP超過1. 1 萬億美元,排名升到世界第六位。GDP反映了全社會最終產品和勞務產品的總價值,是衡量一個國家和地區經濟發展的重要指標。今年上半年,在汽車和樓市兩大市場調整的影響下,我國消費增速明顯減緩。2011年1-6月,社會消費品零售總額累計同比增長16.8%,較上年同期回落1.4個百分點。與一季度相比,二季度消費對GDP的貢獻減少,也成為GDP小幅降溫的主要原因。交通銀行金融研究中心高級宏觀分析師唐建偉認為,受高通脹抑制、消費淡季以及汽車和房產兩大市場仍將繼續調

18、整的影響,三季度可能難以看到社會消費品增速的顯著反彈。今年上半年農村居民人均現金收入實際增長13.7%,連續三個季度超過GDP增速和城鎮居民收入增速。預計下半年隨著物價漲幅的回落,居民實際收入仍將保持增長態勢,這將促使今年三季度末到四季度,社會消費品零售總額同比增速或將觸底反彈。唐建偉預計,2011年全年社會消費品零售名義增速將能保持在17%左右。盛來運表示,下半年中國宏觀經濟運行中面臨最大的挑戰仍是如何進一步處理好保持經濟平穩較快發展、調整經濟結構和管理通脹預期的關系。今年以來,央行已連續三次上調金融機構人民幣存貸款基準利率和連續六次上調存款準備金率。“目前的貨幣政策效果有所顯現,但還沒有完

19、全發揮出來。下半年的總體政策還會偏緊,但是應該不會出現連續加息和調整存款準備金率等大幅度的政策調整。預測三季度還會有一次加息。” 中國銀行金融研究所研究員周景彤說。隨著時代的進步,我國發展迅速,國家經濟將會不斷繁榮。1.3 GDP的概念及其核算國內生產總值(GDP)就是在一定時期內(通常是一年)某國(地區)境內生產要素所生產的全部最終產品(物品和勞務)市場價值的總和。從1978年到2007年,我國的GDP數值從3624億元增加到246619億元,2009年進一步增加到335353 億元。1)GDP是生產要素所有者的報酬,生產要素:指企業進行生產活動必須使用的投入品。生產的價值,都要轉化為生產要

20、素報酬和企業利潤,即轉化為要素提供者和企業經營者的收入。生產要素資本勞動土地企業家才能要素報酬利息工資租金利潤2)GDP測算的是最終產品的價值,中間產品價值不計入GDP,否則會造成重復計算。最終產品是由最后使用者購買的產品(或勞務)(如衣服)中間產品是供生產別種產品使用的產品(如棉花、紗、布)。3)GDP是一個生產概念,GDP測算的是一定時期內所生產的而不是售出的最終產品價值定義:庫存變動(存貨投資)生產額銷售額。不包括二手物品、不包括金融資產。4)GDP是一個地域概念,GDP表示某個地域范圍內的最終產品價值,GNP(國民生產總值)是一個國民概念。5)GDP是一個市場價值概念,GDP是市場活動

21、導致的價值,并且用貨幣加以衡量。計算公式如下:其要求,非市場活動(家務勞動、自己自足生產),不統計在GDP之內;按不同年份的價格計算的GDP不同;GDP的國際比較需使用PPP進行調整。GDP平減指數計算如下:GDP核算有三種方法:生產法(增值法、部門法)、支出法、收入法。(1) 產生算法:生產法又稱為部門法或增值法,各部門新創造的價值加總。增值產出投入。每個生產階段增值該階段各生產要素報酬之和整個生產階段增值總和所有最終產品的價值總和(2) 支出算法:通過核算整個社會在一定時期內購買最終產品的總支出,即最終產品的總賣價來計量GDP。(3) 收入算法總產出 = 總收入收入法是用產出帶來的收入來核

22、算GDP觀察:從根本上來講,一個經濟社會的收入都是屬于私人的;收入與產出永遠相等,因為產出形成之時,也是獲得收入之時。1.4 GDP 預測的意義國內生產總值(GDP)受經濟基礎、人口增長、資源、科技文化、環境、體制、發展戰略等諸多因素的影響,這些因素之間又有著錯綜復雜的關系,因此,運用結構性的時間序列模型分析和預測GDP往往比較困難。將歷年的GDP 作為時間序列,根據過去的數據得出其變化規律,建立預測模型,用此來預測未來的發展變化,有著重要的意義。改革開放以來,我國經濟飛速發展。2001年排名已升到世界第六位,而到2011年已排名世界第二。GDP反映了全社會最終產品和勞務產品的總價值,是衡量一

23、個國家和地區經濟發展的重要指標。因此,對我國GDP變化趨勢的研究,能夠更準確地把握我國經濟發展的動向。使我國能夠有一個穩定明確的目標,達到更好的發展。1.5 中國經濟發展的現狀在1978年到2010年的32年間,中國的經濟年平均增長9.9%,接近10%。在十一五的五年中即2006年到2010年,中國經濟實際年均增長為11.2%。7%是家寶總理3月份在兩會政府工作報告所說的,十二五經濟增長預期目標,是在明顯提高質量和效益的基礎上,年均增長7%。這是否說明十二五跟十一五相比,中國的經濟增長出現了大幅度地滑坡呢?可以從以下兩個角度來分析:1、從經濟增長的預期目標來看,十一五經濟增長預期目標是7.5%

24、,十二五經濟增長預期目標是7%,十二五跟十一五相比,只是回落了0.5個百分點,并沒有出現大幅度地下降。2、十一五經濟實際增長是11.2%,在十二五的五年中,中國經濟年平均增長9%,有的高于9%,從經濟實際增長的情況來看,十二五和十一五相比,經濟的實際增長雖然出現了兩個百分點左右的回落,但是并沒有大幅度的回落。由于過去的32年中國經濟年均增長9.9%,被國際社會譽為“中國經濟奇跡”。從世界經濟歷史來看,被稱之為“經濟奇跡”的國家不多,日本經濟奇跡在二戰以后,保持了20多年的年均10%的高速增長,德國保持年均接近10%的經濟的高增長。在未來30年中,中國如果能夠保持年均6%的經濟增長,就可再造中國

25、經濟奇跡。1.6論文的主要研究內容1.6.1 基本思路通過本課題的研究,學習并熟練掌握SPSS軟件技術,利用時間序列分析方法,建立我國GDP時間序列模型,分析經濟增長的內在特征。并對未來我國經濟發展做出預測,為政府制定經濟發展戰略提供依據。1.6.2 文章結構安排第一章為緒論。第二章為GDP時間序列預測模型。第一節簡單介紹了SPSS軟件技術、要素及構成;第二節介紹了時間序列預測模型的發展及現狀;第三節詳細介紹了時間序列預測模型的算法。第三章為我國GDP時間序列模型的構建。第四章為模型的比較。指數平滑法、自回歸法、ARIMA模型和季節調整方法進行分析第五章是本文的結尾章,對全文做了總結與概括。北

26、京郵電大學世紀學院畢業設計(論文) 第2章 GDP時間序列預測基本方法2.1時間序列分析的數據預處理2.1.1 差分運算一階差分 階差分 步差分 差分方法是一種非常簡便、有效的確定性信息提取方法,Cramer分解定理在理論上保證了適當階數的差分一定可以充分提取確定性信息。差分運算的實質是使用自回歸的方式提取確定性信息: 差分方式的選擇: 序列蘊含著顯著的線性趨勢,一階差分就可以實現趨勢平穩。 序列蘊含著曲線趨勢,通常低階(二階或三階)差分就可以提取出曲線趨勢的影響。對于蘊含著固定周期的序列進行步長為周期長度的差分運算,通常可以較好地提取周期信息。2.1.2 平穩性檢驗平穩性是某些時間序列具有的

27、一種統計特征。對于平穩的序列我們就可以運用已知的時間序列模型對其進行分析預測。因此對數據進行平穩性檢驗是時間序列分析法的關鍵步驟。平穩時間序列有兩種定義,根據限制條件的嚴格程度,分為嚴平穩時間序列和寬平穩時間序列。 對序列的平穩性有兩種檢驗方法,一種是根據時序圖和自相關圖顯示的特征做出判斷的圖檢驗方法;一種是構造檢驗統計量進行假設檢驗的方法。通常我們都選用圖檢驗方法檢驗序列平穩性并用單位根統計檢驗法加以輔助。(1) 自相關圖法自相關函數和偏自相關函數的定義:構成時間序列的每個序列值,之間的簡單相關關系稱為自相關。自相關程度由自相關系數度量,表示時間序列中相隔期的觀測值之間的相關程度。 (2-1

28、)其中,是樣本量,為滯后期,代表樣本數據的算術平均值。自相系數的取值范圍是并且越小,自相關程度越高。偏自相關是指對于時間序列,在給定的條件下,與之間的條件相關關系。其相關程度用偏自相關系數度量,有。 (2-2)其中是滯后期的自相關系數。如果序列的自相關系數很快地(滯后階數大于2或3時)趨于0,即落入隨機區間,時間序列是平穩的,反之時間序列是非平穩。若有更多的自相關系數落在隨機區間以外,即與零有顯著不同,時間序列就是不平穩的。自相關圖法僅從直觀的判斷平穩時間序列與非平穩時間序列的區別。也可用以下的方法在理論上檢驗。(2) 單位根檢驗法時間序列的平穩性還可以通過單位根檢驗來判斷,單位根檢驗目前常用

29、的兩種方法是DF和ADF。DF檢驗法是Dickey和Fuller在70年代和80年代的一系列文章中建立的。其基本思想是:一階回歸模型中,時,序列是平穩的。若,則序列是非平穩的,存在單位根,通過檢驗是否可能為1,判斷序列是否平穩序列。DF檢驗的假設是。(a) DF檢驗序列有如下三種形式:不包含常數項和線性時間趨勢項 (2-3)包含常數項 (2-4)包含常數項和線性時間趨勢項 (2-5)其中,。檢驗假設為: 序列存在單位根的零假設下,對參數估計值進行顯著性檢驗的t統計量不服從常規的t分布,DF(Diekey&Fuller)于1979年給出了檢驗用的模擬的臨界值,故稱檢驗稱為DF檢驗。一般地,如果序

30、列在0均值上下波動,則應該選擇不包含常數和時間趨勢項地檢驗方程,即(2-3)式;如果序列具有非0均值,但沒有時間趨勢,可選擇(2-4)作為檢驗方程;序列隨時間變化有上升或下降趨勢,應采用(2-5)的形式。(b) ADF檢驗在DF檢驗中,對于(2-3)式,常常因為序列存在高階滯后相關而破壞了隨機擾動項是白噪聲的假設,ADF檢驗對此做了改進。它假定序列服從AR(P)過程。檢驗分程為 (2-6)式中的參數視具體情況而定,一般選擇能保證是白噪聲的最小的值。與DF檢驗一樣,ADF檢驗也可以有包含常數項和同時含有常數和線性時間趨勢項兩形,只需在(2-6)式右邊加上或與。2.2時間序列分析基本模型2.2.1

31、指數平滑模型2.2.1.1 指數平滑概念指數平滑法是布朗(Robert G.Brown)所提出,布朗(Robert G.Brown)認為時間序列的態勢具有穩定性或規則性,所以時間序列可被合理地順勢推延;他認為最近的過去態勢,在某種程度上會持續到最近的未來,所以將較大的權數放在最近的資料。 指數平滑法是生產預測中常用的一種方法。也用于中短期經濟發展趨勢預測,所有預測方法中,指數平滑是用得最多的一種。簡單的全期平均法是對時間數列的過去數據一個不漏地全部加以同等利用;移動平均法則不考慮較遠期的數據,并在加權移動平均法中給予近期資料更大的權重;而指數平滑法則兼容了全期平均和移動平均所長,不舍棄過去的數

32、據,但是僅給予逐漸減弱的影響程度,即隨著數據的遠離,賦予逐漸收斂為零的權數。 也就是說指數平滑法是在移動平均法基礎上發展起來的一種時間序列分析預測法,它是通過計算指數平滑值,配合一定的時間序列預測模型對現象的未來進行預測。其原理是任一期的指數平滑值都是本期實際觀察值與前一期指數平滑值的加權平均。2.2.1.2 指數平滑計算指數平滑法的基本公式是: 式中, St-時間t的平滑值; yt-時間t的實際值; St 1-時間t-1的平滑值; a-平滑常數,其取值范圍為0,1; 由該公式可知: 1.St是yt和 St 1的加權算數平均數,隨著a取值的大小變化,決定yt和 St 1對St的影響程度,當a取

33、1時,St = yt;當a取0時,St = St 1。 2.St具有逐期追溯性質,可探源至St t + 1為止,包括全部數據。其過程中,平滑常數以指數形式遞減,故稱之為指數平滑法。指數平滑常數取值至關重要。平滑常數決定了平滑水平以及對預測值與實際結果之間差異的響應速度。平滑常數a越接近于1,遠期實際值對本期平滑值影響程度的下降越迅速;平滑常數a越接近于 0,遠期實際值對本期平滑值影響程度的下降越緩慢。由此,當時間數列相對平穩時,可取較大的a;當時間數列波動較大時,應取較小的a,以不忽略遠期實際值的影響。生產預測中,平滑常數的值取決于產品本身和管理者對良好響應率內涵的理解。 3.盡管St包含有全

34、期數據的影響,但實際計算時,僅需要兩個數值,即yt和St1,再加上一個常數a,這就使指數滑動平均具逐期遞推性質,從而給預測帶來了極大的方便。 4.根據公式,當欲用指數平滑法時才開始收集數據,則不存在y0。無從產生S0,自然無法據指數平滑公式求出S1,指數平滑法定義S1為初始值。初始值的確定也是指數平滑過程的一個重要條件。 如果能夠找到y1以前的歷史資料,那么,初始值S1的確定是不成問題的。數據較少時可用全期平均、移動平均法;數據較多時,可用最小二乘法。但不能使用指數平滑法本身確定初始值,因為數據必會枯竭。 如果僅有從y1開始的數據,那么確定初始值的方法有: 1)取S1等于y1; 2)待積累若干

35、數據后,取S1等于前面若干數據的簡單算術平均數,如:S1=(y1+ y2+y3)/3等等。 據平滑次數不同,指數平滑法分為:一次指數平滑法、二次指數平滑法和三次指數平滑法等。 (一) 一次指數平滑預測 當時間數列無明顯的趨勢變化,可用一次指數平滑預測。其預測公式為: yt+1=ayt+(1-a)yt 式中, yt+1-t+1期的預測值,即本期(t期)的平滑值St ; yt-t期的實際值; yt-t期的預測值,即上期的平滑值St-1 。 該公式又可以寫作:yt+1=yt+a(yt- yt)。可見,下期預測值又是本期預測值與以a為折扣的本期實際值與預測值誤差之和。 (二) 二次指數平滑預測 二次指

36、數平滑是對一次指數平滑的再平滑。它適用于具線性趨勢的時間數列。其預測公式為: yt+m=(2+am/(1-a)yt-(1+am/(1-a)yt=(2yt-yt)+m(yt-yt) a/(1-a) 式中,yt= ayt-1+(1-a)yt-1 顯然,二次指數平滑是一直線方程,其截距為:(2yt-yt),斜率為:(yt-yt) a/(1-a),自變量為預測天數。 (三) 三次指數平滑預測 三次指數平滑預測是二次平滑基礎上的再平滑。其預測公式是: yt+m=(3yt-3yt+yt)+(6-5a)yt-(10-8a)yt+(4-3a)yt*am/2(1-a)2+ (yt-2yt+yt)*a2m2/2(

37、1-a)2 式中,yt=ayt-1+(1-a)yt-1 它們的基本思想都是:預測值是以前觀測值的加權和,且對不同的數據給予不同的權,新數據給較大的權,舊數據給較小的權。指數平滑法的趨勢調整 一段時間內收集到的數據所呈現的上升或下降趨勢將導致指數預測滯后于實際需求。通過趨勢調整,添加趨勢修正值,可以在一定程度上改進指數平滑預測結果。調整后的指數平滑法的公式為: 包含趨勢預測(YITt)=新預測(Yt)+趨勢校正(Tt) 進行趨勢調整的指數平滑預測有三個步驟: 1、 利用前面介紹的方法計算第t期的簡單指數平滑預測(Yt); 2、 計算趨勢。其公式為: Tt=(1-b)Tt-1+b(Yt-Yt-1)

38、其中, Tt=第t期經過平滑的趨勢; Tt-1=第t期上期經過平滑的趨勢; b=選擇的趨勢平滑系數; Yt=對第t期簡單指數平滑預測; Yt-1=對第t期上期簡單指數平滑預測。 3、計算趨勢調整后的指數平滑預測值(YITt)。計算公式為:YITt=Yt+Tt2.3自回歸模型建模2.3.1 自回歸概念向量自回歸模型(簡稱自回歸模型VAR模型)是一種常用的計量經濟模型,由克里斯托弗西姆斯(Christopher Sims)提出。它是AR模型的推廣。2.3.2 自回歸建模VAR模型描述在同一樣本期間內的n個變量(內生變量)可以作為它們過去值的線性函數。 例1Yt = +Xt-1 + ut,t = 1

39、,2,n 本例中Y的現期值與X的一期滯后值相聯系,比較一般的情況是: Yt = +0Xt +1Xt-1 +sXt-s + ut,t = 1,2,n 即Y的現期值不僅依賴于X的現期值,而且依賴于X的若干期滯后值。這類模型稱為分布滯后模型,因為X變量的影響分布于若干周期。 例2Yt = +Yt-1 + ut, t = 1,2,n 本例中Y的現期值與它自身的一期滯后值相聯系,即依賴于它的過去值。一般情況可能是: Yt = f (Yt-1, Yt-2, , X2t, X3t, ) 即Y的現期值依賴于它自身若干期的滯后值,還依賴于其它解釋變量。 在本例中,滯后的因變量(內生變量)作為解釋變量出現在方程的

40、右端。這種包含了內生變量滯后項的模型稱為自回歸模型。 在這類模型中,由于在X和它的若干期滯后之間往往存在數據的高度相關,從而導致嚴重多重共線性問題。因此,分布滯后模型極少按(1)式這樣的一般形式被估計。通常采用對模型各系數j施加某種先驗的約束條件的方法來減少待估計的獨立參數的數目,從而避免多重共線性問題,或至少將其影響減至最小。這方面最著名的兩種方法是科克方法和阿爾蒙方法。2.4季節分解模型時間序列可以認為是四個基本部分共同組成的,及趨勢T,周期C,季節S,隨機R。組成方式可以分為加法型和乘法型。在實際中很難講趨勢和周期徹底分開,因此可以將這兩個放在一起考慮。操作步驟:第一步:創建時間序列,通

41、過序列圖和ACF觀察趨勢。第二步:使用分解法對數據進行預測。(1)分解數據。對price變量進行分解,分解后得到ERR_1,SAS_1,SAF_1,STC_1四個變量。(2)創建一個常數序列,t=1,2,3.n。(3)對STC_1和t序列進行曲線回歸。比較各個模型得出的結果,看哪個模型的R方最大,通過顯著性檢驗,也要在相關性表格中看是否通過了t檢驗。有的模型R方大,單是沒有通過F檢驗,或者自變量沒有通過t檢驗。(4)選擇擬合度最優的模型,寫出該模型的方程trend=常數+*t(常數和阿爾法是最優模型的參數)。(5)若使用乘法型分解法,預測變量f=trend*SAF_1,若使用乘法模型,則f=t

42、rend+SAF_1。該變量剔除了隨機因素的影響,包括季節因素、周期因素、趨勢因素的影響。(6)擬合price觀測值與預測值f的趨勢。SPSS操作 (1)分析-預測-季節性分解;(2)在Excel中創建t,拷貝到SPPS中;(3)分析-回歸-曲線估計,因變量選擇STC_1,自變量選擇t,選擇所有的模型,顯示ANOVA表格;(4)轉換-計算變量;(5)轉換-計算變量;(6)分析-預測-序列圖;第三步進行結果分析。2.5 ARIMA模型建模步驟2.5.1數據平穩化處理首先要對時間序列數據進行平穩性檢驗。可以通過時間序列的散點圖或折線圖對序列進行初步的平穩性判斷。一般采用ADF單位根檢驗來精確判斷該

43、序列的平穩性。對非平穩的時間序列,我們可以先對數據進行取對數或進行差分處理,然后判斷經處理后序列的平穩性。重復以上過程,直至成為平穩序列。此時差分的次數即為 模型中的階數。從理論上而言,足夠多次的差分運算可以充分地提取序列中的非平穩確定性信息。但應當注意的是,差分運算的階數并不是越多越好。因為差分運算是一種對信息的提取、加工過程,每次差分都會有信息的損失,所以在實際應用中差分運算的階數要適當,應當避免過度差分,簡稱過差分的現象。一般差分次數不超過2次。 數據平穩化處理后,模型即轉化為模型。2.5.2模型識別我們引入自相關系數和偏自相關系數這兩個統計量來識別模型的系數特點和模型的階數。若平穩序列

44、的偏相關函數是截尾的,而自相關函數是拖尾的,可斷定序列適合模型;若平穩序列的偏相關函數是拖尾的,而自相關函數是截尾的,則可斷定序列適合模型;若平穩序列的偏相關函數和自相關函數均是拖尾的,則序列適合模型。自相關函數成周期規律的序列,可選用季節性乘積模型。自相關函數規律復雜的序列,可能需要作非線性模型擬合。在平穩時間序列自相關函數和偏自相關函數上初步識別ARMA模型階數和q,然后利用AIC定則準確定階。AIC準則3:最小信息準則,同時給出ARMA模型階數和參數的最佳估計,適用于樣本數據較少的問題。目的是判斷預測目標的發展過程與哪一隨機過程最為接近。因為只有當樣本量足夠大時,樣本的自相關函數才非常接

45、近母體的自相關函數。具體運用時,在規定范圍內使模型階數從低到高,分別計算AIC值,最后確定使其值最小的階數是模型的合適階數。關于模型,AIC函數定義如下:式中:n平穩序列為樣本數,為擬合殘差平方和p,q為參數。 AIC準則定階方法可寫為:其中:M,N為ARMA模型階數的上限值,一般取為根號n或n/10。實際應用中p,q一般不超過2。2.5.3參數估計確定模型階數后,應對ARMA模型進行參數估計。本文采用最小二乘法OLS進行參數估計,需要注意的是,模型的參數估計相對困難,應盡量避免使用高階的移動平均模型或包含高階移動平均項的ARMA模型。2.5.4參數估計完成模型的識別與參數估計后,應對估計結果

46、進行診斷與檢驗,以求發現所選用的模型是否合適。若不合適,應該知道下一步作何種修改。這一階段主要檢驗擬合的模型是否合理。一是檢驗模型參數的估計值是否具有顯著性;二是檢驗模型的殘差序列是否為白噪聲。參數估計值的顯著性檢驗是通過t檢驗完成的Q檢驗的零假設是即模型的誤差項是一個白噪聲過程。Q統計量定義為近似服從分布,其中表示樣本容量,表示用殘差序列計算的自相關系數值,表示自相關系數的個數,表示模型自回歸部分的最大滯后值,表示移動平均部分的最大滯后值。用殘差序列計算Q統計量的值。顯然若殘差序列不是白噪聲,殘差序列中必含有其他成份,自相關系數不等于零。則Q值將很大,反之值將很小。判別規則是: 若,則接受。

47、 若,則拒絕。其中表示檢驗水平。第3章 GDP時間序列預測模型的構建3.1 指標選取與數據處理 關于數據的選取方面,由于考慮到改革開放近30年中國的經濟高速發展,相比之前的二三十年這個時間段的GDP增速較高,如果很籠統的囊括了六七十年代的數據的話,模型的分析以及預測效果可能并不是非常的理想,或者說和改革開放后的30多年相比,之前的發展階段不一樣的年代的數據對本文所構建模型的分析及預測顯得并不是很重要。下面以我國19812010年國內生產總值數據為例,該數據從中國統計年鑒 2011中查找。介紹用時間序列分析法對數據分析的過程,并通過其預測2009及2010兩年的國內生產總值與實際的國內生產總值比

48、較,選取最為合理的預測方法對未來5年我國GDP的做出預測。實際上2011年的GDP數據已經可以查閱,但為了數據的權威性,選擇了中國統計年鑒 2011中GDP數據,而且并不影響模型的分析和預測效果。根據應用時間序列的基本原理知識我們得知,在進行建模之前,首先要對數據進行一些簡單的處理。本文主要是對GDP時間序列數據進行平穩性檢查,然后再進行平穩化處理。另外本文的實證分析,采用了Eviews軟件來對數據進行各種處理和分析。YEAR1234GDP總和1992497463587119847226923.519936500804490481174235333.9199490651108512447156

49、0148197.919951185814110155351929160793.719961426116601176712264471176.61997162571833719148248717897319981750119732203722680784402.319991879020765218592826389677.120002064723101243403112799214.6200123300256512686733837109655.2200225376279652971637276120332.7200328861.831007.133460.442493.5135822.8200

50、433420.636985.339561.749910.7159878.3200539117.442795.244744.458280.4184937.4200645315.850112.751912.868973.1216314.4200754755.96124364102.285709.2265810.3200866283.87419476548.397019.3314045.4200969816.978386.783099.7109599.5340902.8201082613.492265.497747.9128886.1401512.8201197101.2108674.2115443

51、.7150344.6471563.73.2 我國GDP的時間序列模型從3.1的數據中得出本節的指數平滑模型,如下圖:圖-圖-模型擬合擬合統計量均值SE最小值最大值百分位5102550759095平穩的 R 方-1.478.-1.478-1.478-1.478-1.478-1.478-1.478-1.478-1.478-1.478R 方.945.945.945.945.945.945.945.945.945.945RMSE30301.565.30301.56530301.56530301.56530301.56530301.56530301.56530301.56530301.56530301.

52、565MAPE13.116.13.11613.11613.11613.11613.11613.11613.11613.11613.116MaxAPE26.691.26.69126.69126.69126.69126.69126.69126.69126.69126.691MAE22232.838.22232.83822232.83822232.83822232.83822232.83822232.83822232.83822232.83822232.838MaxAE70053.520.70053.52070053.52070053.52070053.52070053.52070053.52070

53、053.52070053.52070053.520正態化的 BIC20.788.20.78820.78820.78820.78820.78820.78820.78820.78820.788模型統計量模型預測變量數模型擬合統計量Ljung-Box Q(18)離群值數平穩的 R 方正態化的 BIC統計量DFSig.GDP總和-模型_10-1.47820.78871.83217.0000指數平滑法模型參數模型估計SEtSig.GDP總和-模型_1無轉換Alpha (水平)1.000.2703.706.001圖-自回歸模型,如下:自相關圖序列:GDP總和滯后自相關標準 誤差aBox-Ljung 統計量值dfSig.b1.793.20814.5801.0002.615.20223.8152.0003.465.19729

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論