




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、時間序列分析模型,1 時間序列分析模型簡介,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,一、問題分析,二、模型假設,三、模型建立,四、模型預測,五、結果分析,六、模型評價與改進,一、時間序列分析模型概述,1、自回歸模型,2、移動平均模型,3、自回歸移動平均模型,二、隨機時間序列的特性分析,三、模型的識別與建立,四、模型的預測,時間序列的分類,隨機性時間序列模型的特點,把時間序列數據作為由隨機過程產生的樣本來分析 多數影響時間序列的因素具有隨機性質,因此時間序列的變動具有隨機性質 隨機過程分為平穩隨機過程和非平穩隨機過程 由平穩隨機過程產生的時間序列叫做平穩性時間序列 由非平穩隨
2、機過程產生的時間序列叫做非平穩性時間序列,平穩序列(stationary series) 基本上不存在趨勢的序列,各觀察值基本上在某個固定的水平上波動 或雖有波動,但并不存在某種規律,而其波動可以看成是隨機的 非平穩序列 (non-stationary series) 有趨勢的序列:線性的,非線性的 有趨勢、季節性和周期性的復合型序列,平穩時間序列,非平穩時間序列,平穩性時間序列,由平穩隨機過程產生的時間序列的性質: 概率分布函數不隨時間的平移而變化,即: P(Y1,Y2, ,Yt)=P(Y1+m,Y2+m, ,Yt+m) 期望值、方差和自協方差是不依賴于時間的常數,即: E(Yt)=E(Yt
3、+m) Var(Yt)= Var(Y t+m) Cov(Yt,Y t+k)= Cov(Y t+m,Y t+m+k) 隨機性時間序列模型是以時間序列的平穩性為基礎建立的,隨機性時間序列模型的特點,利用時間序列中的自相關關系進行分析和建摸 時間序列的自相關關系是指時間序列在不同時期觀測值之間的相關關系 許多因素產生的影響不是瞬間的,而是持續幾個時期或更長時間,因此時間序列在不同時期的值往往存在較強的相關關系 用自相關函數和偏自相關函數衡量時間序列中的自相關關系,時間序列的自相關關系,自相關函數 隨機過程的自相關函數 樣本的自相關函數 偏自相關函數 隨機過程的偏自相關函數 樣本的偏自相關函數,自相關
4、函數,對于平穩隨機過程,滯后期為 K 的自相關函數定義為滯后期為 K 的自協方差與方差之比,樣本自相關函數,樣本自相關函數的性質,可以用來判斷時間序列的平穩性 平穩性時間序列的樣本自相關函數值隨滯后期的延長很快趨近于零 可以較好描述季節性變動或其他周期性波動的規律 如果季節變化的周期是 12 期,觀測值 Yt 與 Yt+12,Yt+24,Yt+36之間存在較強自相關關系 因此,當 K=12,24,36,48,時,樣本自相關函數值在絕對值上大于它周圍的值,偏自相關函數值,滯后期為 K 的偏自相關函數值是指去掉 Y t+1,Y t+2,Y t+3, Y t+k-2,Y t+k-1 的影響之后,反映
5、觀測值Yt和Y t+k之間相關關系的數值,隨機性時間序列模型的特點,建摸過程是一個反復實驗的過程 借助自相關函數值和偏自相關函數值確定模型的類型 借助診斷性檢驗判斷模型的實用性,時間序列最佳模型的確定,模型分類,總類模型 移動平均模型 MA(q) (Moving Average) 自回歸模型 AR(p) (Autoregression) 混合自回歸移動平均模型 ARMA (p,q) 差分自回歸-移動平均模型 ARIMA (p,d,q),1 時間序列分析模型【ARMA模型 】簡介,ARMA模型是一類常用的隨機時間序列模型,是一種精度較高的時間序列短期預測方法,其基本思想是:某些時間序列是依賴于時
6、間 的一族隨機變量,構成該時間序列的單個序列值雖然具有不確定性,但整個序列的變化卻有一定的規律性,可以用相應的數學模型近似描述. 通過對該數學模型的分析研究,能夠更本質地認識時間序列的結構與特征,達到最小方差意義下的最優預測.,ARMA模型有三種基本類型: 自回歸(AR:Auto-regressive)模型 移動平均(MA:Moving Average)模型 自回歸移動平均(ARMA:Auto-regressive Moving Average)模型,一、概 述,1 時間序列分析模型【ARMA模型 】簡介,1、自回歸【 AR 】模型,自回歸序列 :,如果時間序列 是它的前期值和隨機項的線性函數
7、,即可表示為,【1】,【1】式稱為 階自回歸模型,記為AR( ),注1:實參數 稱為自回歸系數,是待估參數.隨機項 是相互獨立的白噪聲序列,且服從均值為0、方差為 的正態分布.隨機項與滯后變量不相關。,注2:一般假定 均值為0,否則令,1 時間序列分析模型【ARMA模型 】簡介,記 為 步滯后算子,即 ,則模型【1】可表示為,令 ,模型可簡寫為,AR( )過程平穩的條件是滯后多項式,的根均在單位圓外,即,的根大于1,【2】,1 時間序列分析模型【ARMA模型 】簡介,2、移動平均【MA】模型,移動平均序列 :,如果時間序列 是它的當期和前期的隨機誤差項的線性函數,即可表示為,【3】,式【3】稱
8、為,階移動平均模型,記為MA( ),注:實參數,為移動平均系數,是待估參數,1 時間序列分析模型【ARMA模型 】簡介,引入滯后算子,并令,則模型【3】可簡寫為,注1:移動平均過程無條件平穩,注2:滯后多項式,的根都在單位圓外時,AR過程與MA過程,能相互表出,即過程可逆,,【4】,即為MA過程的逆轉形式,也就是MA過程等價于無窮階的AR過程,注3:【2】滿足平穩條件時, AR過程等價于無窮階的MA 過程,即,1 時間序列分析模型【ARMA模型 】簡介,3、自回歸移動平均【ARMA】模型 【B-J方法建?!?自回歸移動平均序列 :,如果時間序列,是它的當期和前期的隨機誤差項以及,前期值的線性函
9、數,即可表示為,【5】,式【5】稱為,階的自回歸移動平均模型,記為ARMA,注1:實參數,稱為自回歸系數,,為移動平均系數,,都是模型的待估參數,注2:【1】和【3】是【5】的特殊情形,注3:引入滯后算子,模型【5】可簡記為,【6】,注4:ARMA過程的平穩條件是滯后多項式,的根均在單位圓外,可逆條件是滯后多項式,的根都在單位圓外,1 時間序列分析模型【ARMA模型 】簡介,二、隨機時間序列的特性分析,1、時序特性的研究工具,(1)自相關,構成時間序列的每個序列值,相關關系稱為自相關。自相關程度由自相關系數,表示時間序列中相隔,期的觀測值之間的相關程度。,之間的簡單,度量,,注1:,是樣本量,
10、,為滯后期,,代表樣本數據的算術平均值,注2:自相關系數,的取值范圍是,且,越接近1,自相關程度越高,1 時間序列分析模型【ARMA模型 】簡介,(2)偏自相關,偏自相關是指對于時間序列,,在給定,的條件下,,與,之間的條件相關關系。,其相關程度用,度量,有,偏自相關系數,其中,是滯后,期的自相關系數,,1 時間序列分析模型【ARMA模型 】簡介,2、時間序列的特性分析,(1)隨機性,如果一個時間序列是純隨機序列,意味著序列沒有任何規律性,序列諸項之間不存在相關,即序列是白噪聲序列,其自相關系數應該與0沒有顯著差異。可以利用置信區間理論進行判定。 在B-J方法中,測定序列的隨機性,多用于模型殘
11、差以及評價模型的優劣。,(2)平穩性,若時間序列,滿足,1)對任意時間,,其均值恒為常數;,2)對任意時間,和,,其自相關系數只與時間間隔,有關,而與 的起始點無關。,那么,這個時間序列就稱為平穩時間序列 。,和,1 時間序列分析模型【ARMA模型 】簡介,序列的平穩性也可以利用置信區間理論進行判定.需要注意的是,在B-J方法中,只有平穩時間序列才能直接建立ARMA模型,否則必須經過適當處理使序列滿足平穩性要求,在實際中,常見的時間序列多具有某種趨勢,但很多序列通過差分可以平穩,判斷時間序列的趨勢是否消除,只需考察經過差分后序列的自相關系數,(3)季節性,時間序列的季節性是指在某一固定的時間間
12、隔上,序列重復出現某種特性.比如地區降雨量、旅游收入和空調銷售額等時間序列都具有明顯的季節變化.,一般地,月度資料的時間序列,其季節周期為12個月;,季度資料的時間序列,季節周期為4個季.,1 時間序列分析模型【ARMA模型 】簡介,判斷時間序列季節性的標準為: 月度數據,考察,時的自相關系數是否,與0有顯著差異;,季度數據,考察,系數是否與0有顯著差異。,時的自相關,說明各年中同一月(季)不相關,序列不存在季節性,否則存在季節性.,若自相關系數與0無顯著不同,,實際問題中,常會遇到季節性和趨勢性同時存在的情況,這時必須事先剔除序列趨勢性再用上述方法識別序列的季節性,否則季節性會被強趨勢性所掩
13、蓋,以至判斷錯誤.,包含季節性的時間序列也不能直接建立ARMA模型,需進行季節差分消除序列的季節性,差分步長應與季節周期一致.,1 時間序列分析模型【ARMA模型 】簡介,三、模型的識別與建立,在需要對一個時間序列運用B-J方法建模時,應運用序列的自相關與偏自相關對序列適合的模型類型進行識別,確定適宜的階數,以及 (消除季節趨勢性后的平穩序列),1、自相關函數與偏自相關函數,(1)MA(,)的自相關與偏自相關函數,自協方差函數,是白噪聲序列的方差,1 時間序列分析模型【ARMA模型 】簡介,樣本自相關函數,MA(,)序列的自相關函數,在,這種性質稱為自相關函數的,步截尾性;,以后全都是0,,隨
14、著滯后期,這種特性稱為偏自相關函數的拖尾性,的增加,呈現指數或者正弦波衰減,趨向于0,,偏自相關函數,1 時間序列分析模型【ARMA模型 】簡介,(2)AR(,)序列的自相關與偏自相關函數,偏自相關函數,是,步截尾的 ;,自協方差函數,滿足,自相關函數,滿足,它們呈指數或者正弦波衰減,具有拖尾性,(3)ARMA(,)序列的自相關與偏自相關函數均是拖尾的,1 時間序列分析模型【ARMA模型 】簡介,2、模型的識別,自相關函數與偏自相關函數是識別ARMA模型的最主要工具,B-J方法主要利用相關分析法確定模型的階數.,若樣本自協方差函數,在,步截尾,則判斷,是MA(,)序列,若樣本偏自相關函數,在,
15、步截尾,則可判斷,是AR(,)序列,若,,,都不截尾,而僅是依負指數衰減,這時可初步認為,ARMA序列,它的階要由從低階到高階逐步增加,再通過檢驗來確定.,在,,,是,但實際數據處理中,得到的樣本自協方差函數和樣本偏自相關函數只是,和,的估計,要使它們在某一步之后全部為0幾乎是,而只能是在某步之后圍繞零值上下波動,故對于,和,不可能的,,的截尾性,只能借助于統計手段進行檢驗和判定。,1 時間序列分析模型【ARMA模型 】簡介,(1),的截尾性判斷,對于每一個,,計算,(,一般取,左右),考察其中滿足,或,的個數是否為,的68.3%或95.5%。,如果當,時,,明顯地異于0,而,近似為0,且滿足
16、上述不等式的個數達到了相應的比例,,則可近似地認為,在,步截尾,1 時間序列分析模型【ARMA模型 】簡介,(2),的截尾性判斷,作如下假設檢驗:,存在某個,,使,,且,統計量,表示自由度為,的,分布,的上側,分位數點,對于給定的顯著性水平,,若,,則認為,樣本不是來自AR(,)模型 ;,,可認為,樣本來自AR(,)模型 。,注:實際中,此判斷方法比較粗糙,還不能定階,目前流行的方法是H.Akaike,信息定階準則(AIC),1 時間序列分析模型【ARMA模型 】簡介,(3)AIC準則確定模型的階數,AIC定階準則:,是模型的未知參數的總數,是用某種方法得到的方差,的估計,為樣本大小,則定義A
17、IC準則函數,用AIC準則定階是指在,的一定變化范圍內,尋求使得,最小的點,作為,的估計。,AR(,)模型 :,ARMA,模型 :,1 時間序列分析模型【ARMA模型 】簡介,3、參數估計,在階數給定的情形下模型參數的估計有三種基本方法:矩估計法、逆函數估計法和最小二乘估計法,這里僅介紹矩估計法,(1)AR(,)模型,白噪聲序列,的方差的矩估計為,1 時間序列分析模型【ARMA模型 】簡介,(2)MA(,)模型,(3)ARMA,模型的參數矩估計分三步:,i)求,的估計,1 時間序列分析模型【ARMA模型 】簡介,ii)令,,則,的自協方差函數的矩估計為,iii)把,近似看作MA(,)序列,利用
18、(2),對MA(,)序列的參數估計方法即可,1 時間序列分析模型【ARMA模型 】簡介,4、模型檢驗,對于給定的樣本數據,AIC準則確定了模型的類型和階數,用矩估計法確定了模型中的參數,從而建立了一個ARMA模型,來擬合真正的隨機序列。但這種擬合的優劣程度如何,主要應通過實際應用效果來檢驗,也可通過數學方法來檢驗。,,我們通過相關分析法和,下面介紹模型擬合的殘量自相關檢驗,即白噪聲檢驗:,對于ARMA模型,應逐步由ARMA(1,1),ARMA(2,1),ARMA(1,2),ARMA(2,2),依次求出參數估計,對AR(,)和MA(,)模型,先由,和,初步定階,再求參數估計。,的截尾性,1 時間
19、序列分析模型【ARMA模型 】簡介,一般地,對ARMA,模型,取初值,和,它們均值為0),可遞推得到殘量估計,現作假設檢驗:,(可取它們等于0,因為,是來自白噪聲的樣本,令,1 時間序列分析模型【ARMA模型 】簡介,其中,取,左右。,則當,成立時,,服從自由度為,的,分布。,對給定的顯著性水平,,若,,則拒絕,,即模型與原隨機序列之間擬合得不好,,,則認為模型與原隨機序列之間擬合,需重新考慮,得較好,模型檢驗被通過。,建模;若,1 時間序列分析模型【ARMA模型 】簡介,四、模型的預測,若模型經檢驗是合適的,也符合實際意義,可用作短期預測.,B-J方法采用L步預測,即根據已知,個時刻的序列觀
20、測值,,對未來的,個時刻的序列值做出估計,,線性最小方差預測是常用的一種方法.,誤差的方差達到最小.,其主要思想是使預測,若,表示用模型做的L步平穩線性,最小方差預測,那么,預測誤差,并使,達到最小.,1 時間序列分析模型【ARMA模型 】簡介,1、AR(,)序列預測,模型(1):,的L步預測值為,其中,(,),1 時間序列分析模型【ARMA模型 】簡介,2、MA(,)的預測,對模型(3):,當,時,由于,可見所有白噪聲的時刻都大于,,故與歷史取值無關,,;,從而,當,時,各步預測值可寫成矩陣形式:,1 時間序列分析模型【ARMA模型 】簡介,遞推時,初值,均取為0。,2 長江水質污染的發展趨
21、勢預測 【CUMCM 2005A】,題中給出了“19952004年長江流域水質報告”中的主要統計數據和關于地表水環境質量標準的國標(GB3838-2002)中4個主要項目標準限值(見附錄1),其中I、II、III類為可飲用水.假如不采取更為有效的治理措施,根據過去10年的主要統計數據(見附錄2),對長江未來水質污染的發展趨勢做出預測分析,比如研究未來10年的情況.,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,一、問題分析,為了分析長江水質的發展變化情況,對未來10年全流域、支流、干流中三類水所占的比例做出預測.考慮到若僅用10年水文年的觀測數據來預測后10年的數據,顯然可利用的
22、數據量太少,所以我們將充分利用枯水期、豐水期和水文年的數據. 由于建立時間序列模型需要相等的時間間隔,所以我們將一年分為三段,1-4月、5-8月、9-12月. 對于每一年,1-4月的平均數據可直接取為枯水期的數據,5-8月的平均數據可直接取為豐水期的數據,而9-12月的數據可用【(水文年*12-枯水期*4-豐水期*4)/4=水文年*3-枯水期-豐水期】來估計(具體數據見附錄3).我們分別對全流域、干流、支流來建立時間序列模型,并將水質分為飲用水(I、II、III類)、污水(IV、V類)和劣V類水三類,注意到飲用水的比例可由其它兩類水的比例推算出來.,2 長江水質污染的發展趨勢預測 【CUMCM
23、 2005A】,二、模型假設,(2)假設枯水期、豐水期和水文年中,每個月各類水質的 百分比不變.,(1)問題中所給出的數據能客觀反映現實情況;,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,三、模型建立,對于各類水,根據它在各個時期所占的比例,通過作圖容易觀察發現,時間序列是非平穩的,而通過適當差分則會顯示出平穩序列的性質,所以我們將建立自回歸移動平均模型ARIMA(,).,在實際建模中,考慮到一期的數據應該與前期的數據有關,所以對差分后的平穩序列我們建立ARMA模型.,在這里,我們不考慮隨機干擾項,即,,因此建立AR模型,僅以預測干流中劣類水所占比例的 ARIMA 模型為例,
24、詳細敘述一下 ARIMA 建模過程。,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,1、數據篩選與處理,根據需要,我們將數據篩選并處理得到干流中劣類水所占 比例的時間序列:,=0,4,-4,0,1.5,-1.5,0,0,0,0,0, 0,0,0,0,0,0,0,6.9,5.1,5.4,7.9, 4.8,13.4,0,0,0,14.2,9.3,3.5,,2、對序列平穩化,觀察序列時序圖,發現序列有遞增趨勢,,因此,我們對序,,得到序列,列進行一階差分,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,0,4,-8,4,1.5,-3,1.5,0,0,0, 0,0,0,0,0
25、,0,0,0,6.9,-1.8,0.3, 2.5,-3.1,8.6,-13.4,0,0,14.2, -4.9,-5.8 ,劣類水所占比例時序圖,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,利用公式,計算此序列的自相關系數,可看出,,明顯異于0,說明此序列短期內具有很強的相關性,因此可初步認為經1階差分后的序列平穩,即,1階差分后的白噪聲檢驗結果如下:,在檢驗的顯著性水平取為0.05的條件下,P值大于0.05,故該差分后序列可視為白噪聲序列,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,3、對序列,進行零均值化,對序列,進行零均值化,得到新序列,=-0.11667,
26、3.88333,-8.11667,3.88333,1.38333,-3.11667,1.38333,-0.11667, -0.11667,-0.11667,-0.11667,-0.11667, -0.11667,-0.11667,-0.11667,-0.11667, -0.11667,-0.11667,6.78333,-1.91667, 0.18333,2.38333,-3.21667,8.48333, -13.51667,-0.11667,-0.11667,14.08333, -5.01667,-5.91667,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,4、對序列,求樣本自
27、協方差函數與樣本偏自相關函數,利用,(,)得樣本自協方差函數估計,利用,,(,)計算樣本自相關函數,通過,估計樣本偏自相關函數,得到,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,當,時,,具有截尾性,用AR(3)模型擬合序列,模型擬合原序列。對殘差序列進行檢驗,得到,,即用ARIMA(3,1,0),擬合檢驗統計量的概率P值都顯著大于顯著性檢驗水平0.05,可認為該殘差序列為白噪聲序列, 系數顯著性檢驗顯示三個參數均顯著。從而ARIMA(3,1,0)模型對該序列建模成功。,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,5、模型參數估計,通過公式,得到與上述參數顯著性檢驗一樣的結果:,= -3.16,,= -2.75,,= -3.30,,因此ARIMA(3,1,0)模型即為:,注:利用同樣的方法可以建立預測干流中其他兩類水、全流域和支流中的三類水所占比例的時間序列分析模型。,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,四、模型預測,利用上述模型,預測干流中劣類水未來10年所占比例,得到:,2 長江水質污染的發展趨勢預測 【CUMCM 2005A】,五、結果分析,在上述模型預測結果中,我們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 翠屏公安招聘警務輔助人員筆試真題2024
- 石大學前兒童保育學課件1-5泌尿系統
- 無人化操作下的安全監控策略-洞察闡釋
- 生理學教育領域面臨的挑戰與AI解決方案
- 家庭托育點的運營模式與管理標準化探索
- 云邊協同下嵌入式AI與物聯網教學系統設計
- 政法隊伍管理與監督機制的創新與完善
- 校企合作中的資源共享與利益共贏機制
- 2025至2030年中國電動升降機遙控器行業投資前景及策略咨詢報告
- 2025至2030年中國玻璃盤下水行業投資前景及策略咨詢報告
- 水系統中央空調項目可行性研究報告
- JG/T 504-2016陶粒加氣混凝土砌塊
- 2025年中考數學壓軸題專練:圓的各性質的綜合題(原卷版+解析)
- 生豬養殖綠色轉型與低碳技術應用
- 2025工貿安全考試題庫及答案
- 2025-2030中國保險中介機構行業市場發展現狀及競爭格局與投資前景研究報告
- 內在動機:自主掌控人生的力量
- 人教版八年級物理(下冊)期末考試題及答案
- 2025年4月自考00186國際商務談判試題及答案含評分標準
- 2025年教育管理專業考研試題及答案
- 山東省濟南市2025屆高三三模生物試卷(含答案)
評論
0/150
提交評論