時間序列分析的基本概念_第1頁
時間序列分析的基本概念_第2頁
時間序列分析的基本概念_第3頁
時間序列分析的基本概念_第4頁
時間序列分析的基本概念_第5頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二章時間序列分析的基本概念本章將介紹時間序列分析的一些基本概念,其中關于平穩性、自協方差函數和樣本自協 方差函數的概念尤為重要。由于時間序列是隨機過程的特例,所以我們首先介紹隨機過程的 一些基礎概念和基本理論,最后介紹一些差分方程理論和動態數據的預處理方法。 2.1隨機過程在對某些隨機現象的變化過程進行研究時,需要考慮無窮多個隨機變量,必須用一簇隨 機變量才能刻畫這種隨機現象的全部統計特征,這樣的隨機變量族通常稱為隨機過程。下面 為幾個常見的隨機過程的例子:例2.1 (隨機游動)設X1, X2,是一列獨立同分布的隨機變量序列,令S = S0 + X1 + X 2 + X則稱隨機變量序列sn

2、= 0,1,.為隨機游動。其中S0是與X1,X2,相互獨立(但是不同分布)的隨機變量,一般地,我們總是假定S =0。如果0P(X = 1)= P(X =-1)= 1/2nns 就是一般概率論與數理統計教材中提到的簡單隨機游動。 n例22 (布朗運動)英國植物學家布朗注意到漂浮在液面上的微小粒子不斷進行無規則 的運動,它是分子大量隨機碰撞的結果。這種運動后來稱為布朗運動。若記(X (t), r (t)為 粒子在平面坐標上的位置,則它是平面上的布朗運動。例2.3在通信工程中,電話交換臺在時間段0,t內接到的呼喚次數是與t有關的隨機 變量X(t),對于固定的t,X(t)是一個取非負整數的隨機變量,則

3、X(t),t g 0,8)是隨 機過程。下面介紹隨機過程的定義。隨機試驗所有可能結果組成的集合稱為這個試驗的樣本空 間,記為Q,其中的元素稱為樣本點或基本事件,Q的子集A稱為事件,樣本空間Q稱 為必然事件,空集稱為不可能事件,F是Q的某些子集組成的集合組,P是(。,F)上的 概率。定義2.1隨機過程是概率空間(。,F, P)上的一族隨機變量X(t), t g T,其中t是參 數,它屬于某個指標集T,T稱為參數集。隨機過程可以這樣理解:對于固定的樣本點0 g。,X(tQ0)就是定義在T上的一個 函數,稱之為X (t)的一條樣本路徑或一個樣本函數;而對于固定的時刻tG T, X(t) = X(tq

4、 )是概率空間。上的一個隨機變量,其取值隨著試驗的結果而變化,變化的 規律成為概率分布。隨機過程的取值稱為過程所處的狀態,狀態的全體稱為狀態空間,記為 S。根據T及S的不同,過程可以分成不同的類:依照狀態空間可分為連續狀態和離散狀態; 依照參數集可分為離散參數和連續參數過程。對于一維隨機變量,掌握了它的分布函數就能完全了解該隨機變量。對于多維隨機變量, 掌握了它們的聯合分布函數就能確定它們的所有統計特性。對于由一族或多個隨機變量形成 的隨機過程,要采用有限維分布函數族來刻畫其統計特性。定義2.2隨機過程的一維分布,二維分布,n維分布,等等,其全體尸(尤,x ),t,t e T,n 1七,tn

5、1 n 1 n稱為過程X (t)的有限維分布族。一個隨機過程的有限維分布族具有如下兩個性質:對稱性:對(1,2,n)的任一排列(jj ,jn),有 TOC o 1-5 h z F(x,x ) = F(x,,x )(2.1)t1,Fjn j1jn1 In 1 n相容性: HYPERLINK l bookmark29 o Current Document 對m 1滿t,tn 1 n 1 n足上述的對稱性和相容性,則必存在一個隨機過程X (t), t e T,使F(x,.,x ), t,,t e T, n 1恰好是X (t)的有限維分布族。t,%1 n 1 n柯爾莫哥洛夫定理說明,隨機過程的有限維分

6、布函數族是隨機過程概率特征的完整描 述。在實際問題中,要掌握隨機過程的全部有限維分布函數族是不可能的,一般是利用隨機 過程的某些統計特征,如下是一些常用的統計特征:定義2.3設X(t),teT是一個隨機過程,如果對任意t e T,EX(t)存在,則稱函數R X(t) = EX(t), t e T(2.3)為X(t),t e T的均值函數。稱,x (s, t) = E(X (s) - Rx (s)(X (t) - Rx (t), s, t e T(2.4)為X(t),t e T的協方差函數。稱Dx (t) = (t, t) = E X (t)-r x (t )2, s,te T(2.5)為X(t

7、),t e T的方差函數。均值函數是隨機過程X(t),t e T在時刻t的平均值,方差函數是隨機過程在時刻t對均 值(t)的偏離程度,而協方差函數和相關函數則反映了隨機過程在時刻s和t時的線性相 X關程度。 2.2平穩過程的特征及遍歷性有一類重要的過程,它處于某種平穩狀態,其主要性質與變量之間的時間間隔有關,與 所考察的起始點無關,這樣的過程稱為平穩過程。定義2.4如果隨機過程X (t), t e T對任意的t1,七e T和任意的h (使得 t + h e T,i = 1,2,,n),有:(X(t + h),X(t +h),,X(t + h)與(X(t),X(t ),,X(t )具有相同的聯合

8、分 TOC o 1-5 h z 12n12n布,記為 HYPERLINK l bookmark50 o Current Document (X(t + h), X(t + h),,X(t + h) = (X(t ), X(t ),X(t )(2.6)12n12n則稱X (t), t e T為嚴平穩的。對于嚴平穩過程而言,有限維分布關于時間是平移不變的,條件很強,不容易驗證。所 以引入另一種所謂的寬平穩過程或二階平穩過程。定義2.5設X(t),t e T是一個隨機過程,若X(t),t e T的所有二階矩都存在,并且對任 意t e T,EX(t) = r為常數,對任意s, t e T,r(s, t

9、)只與時間差t - s有關,則稱 X (t), t e T為寬平穩過程,簡稱平穩過程。若T是離散集,則稱平穩過程X (t),te T為平 穩序列。例2.4隨機過程定義為 X (t) = f (t + s ),0 t 8,其中f (t)是具有周期T的函數, e是區間(0,T)上均勻分布的隨機變量。問X(t)是否寬平穩過程?給出理由。解:f (t)是具有周期T的函數,因而是有界函數,是區間(0,T)上均勻分布的隨機1、1 C變量,因而E(X(t) =f (t + ) - Td =f (t + )-d(& +1) = 0,為常數,r(t, s) = E(X (t) - E(X (t) - (X (s

10、) - E(X (s)=E (X (t) X (s)1=f (t + ) f (t + + (s -1)-dI Var(X (t), t - s = nT;=0, t - s 豐 nT因而X(t)的二階矩都存在,均值函數為常數,協方差函數r(s,t)只與t s有關,因而是寬 平穩過程。對于平穩過程而言,由于r(s, t) = r(0, t - s),所以可以記為r(t - s)。對所有的t有 r(-t) = r(t),即為偶函數。所以r(t)的圖形關于坐標軸對稱,其在0點的值就是X(t)的 方差,并且|r(t)| 0n m n mn=1 m=1平穩隨機過程的統計特征完全由其二階矩函數確定。對固

11、定時刻t,均值函數和協方差 函數是隨機變量X(t)的取值在樣本空間Q上的概率平均,是由X(t)的分布函數確定的, 通常很難求得。在實際中,如果已知一個較長時間的樣本記錄,是否可按照時間取平均代替 統計平均呢?這是平穩過程的遍歷性所要討論的問題。由大數定律,設獨立同分布的隨機變量序列Xn,n = 1,2,具有EXn = p, DX =。2 頂lim P lim P N T8X-心k=11 這里,若將隨機序列X,n = 1,2,看作是具有離散參數的隨機過程,則萬tXk為 ly k=1隨機過程的樣本函數按不同時刻所取的平均值,該函數隨樣本不同而變化,是隨機變量。而EXn =旦是隨機過程的均值,即任意

12、時刻的過程取值的統計平均。大數定律表明,隨時間 n的無限增長,隨機過程的樣本函數按時間平均以越來越大的概率近似于過程的統計平均。 那么,只要觀測的時間足夠長,則隨機過程的每個樣本函數都能夠遍歷各種可能狀態。這種 特性稱為遍歷性或各態歷經性。定義2.6設X (t),-8t = lim t x (t)dt(2 7)T * 2T -T1X(t)X(t-T) = lim Jt x(t)X(t-T)dt(2 8)t * 2T -t為該過程的時間均值和時間相關函數。定義2.7設X(t),-8 t +8為均方連續的平穩過程,若1巧歹/(沖=卜X期 則稱該平穩過程的均值具有各態歷經性。若lim 二口 X(t)

13、X(t-T)dt = r (T)(2.10)T* 2T -TX則稱該平穩過程的協方差函數具有各態歷經性。定義2.8如果均方連續的平穩過程的均值和相關函數都具有各態歷經性,則稱該平穩過 程具有各態歷經性或遍歷性。定理22 (均值遍歷性定理)設X = X , n = 0, 1,土 2是平穩序列,其協方差函數為r(t),則X具有遍歷性n的充分必要條件是1,lim 它1r (t ) = 0(2.11)N F N :=0設X = Xf,-3t 3是平穩過程,則X具有遍歷性的充分必要條件是lim12t (1二)r (T) d = 0(2.12) TOC o 1-5 h z T3 T 02T證明:由于證明的

14、思路相同,這里只證明連續時間的均值遍歷性定理。首先計算X的 均值和方差。記-1 一X =t X (t)dtT2T -T則有. 一一. 一 一. 1 .EX = Elim X = lim E(X ) = lim EX (t)dtT 3 TT3TT3 2T -T進而var(又)=E(又-EX)2=Elim二t (X(t)-r)dt2T 3 2 T -T=lim 救Et (X(t)-R)dt2 T3 4J 2-T=lim 二 jT jT E(X (t) - R)(X (s) - R)dtds t3 4T2 -T -T(2.13)=lim jT jT y (t - s)dtds(2.13)T 3 4T

15、2 -T -T在上述積分中,作變換(T = t - Su = t + S則變換的Jacobi行列式值為-1 一1 1因而積分區域變換為頂點分別在T軸和U軸上的菱形區域:-2T Tb 2T。由于Y(T)是偶函數,故(2.13)式等于Um t “ 8T 2pT Y (T )dx2T-tdUm t “ 8T 2-2T-(2T-T I)1 .,=lim2t y (t )(2T - T |)dTt* 4T2 -2T1二凹矛 J2TY(T )(2T-t )dT1 .T(2.14)=Tim T ET Y(T )(1 2T)dT(2.14)故關于均值的遍歷性定理就化為上式極限是否趨于零的問題。于是由均方收斂的

16、定義 知這確實是等價的,定理結論得證。推論21若冬(t )| dt 3,則均值遍歷性定理成立。一8證明:當0 t 2T 時,|(1-t/2T),(t)| |r(t)|(2.15)1 2t (1 L)r(t)dt 2T|r(t)dt|T 0 TT 01 ., t0 lr (t) dt0(2.16)對于平穩過程的協方差函數的遍歷性定理,可以考慮隨機過程丫 = 丫 (t), -3 t 3,其中TT丫 (t) = (X(t+T) w)(X(t) w)T則EY (t) = r(t )。由定理的證明過程可見,均值具有遍歷性等價于var(X) = 0。因此可以 T類推協方差函數具有遍歷性等價于var(r(T

17、 ) = 0。于是有以下定理:定理2.1.3(協方差函數遍歷性定理)設X = Xt,-3 t 3是平穩過程,其均值函數為零,則協方差函數有遍歷性的充分 必要條件是(2.17)lim;2t (1號)(B(T ) - r2(0)dT =0(2.17)T 3 T 02/11其中B(r 1) = EX (t +T +T 1) X (t +T1) X (t +T) X (t)(2.18)在實際問題中,要嚴格驗證平穩過程是否滿足遍歷性的條件是比較困難的。遍歷性定理 的重要意義在于從理論上給出如下結論:一個實平穩過程,如果它是遍歷的,則可用任意一 個樣本函數的時間平均代替平穩過程的統計平均。在時間序列分析中

18、,還會經常遇到白噪聲過程,定義如下:定義2.9如果隨機過程X(t)(t = 1,2,)是由一個不相關的隨機變量序列構成,即對于所有s扒,隨機變量乂七和Xs的協方差均為零,即隨機變量乂七和Xs互不相關,則稱其為 純隨機過程。對于一個純隨機過程來說,若其期望和方差都為常數,則稱其為白噪聲過程。 白噪聲過程的樣本實現稱為白噪聲序列(White noise)。特別地,對于白噪聲序列%J,如果對于任意的s, t,則稱e則稱e 是一個白噪聲序列,記為ecov(e 點)=WN (口 ,b 2 )。(2.19)當eJ獨立時,稱eJ是一個獨立的白噪聲序列。對于一個獨立的白噪聲序列,當e 服從正態分布時,稱eJ是

19、一個正態白噪聲序列。 下面是隨機產生的1000個服從標準正態分布的白噪聲序列繪制的序列圖,見圖2.1。圖2.1圖2.1標準正態白噪聲序列 2.3線性差分方程2.3.1 一階差分方程假定當前時期t期的y (輸出變量)和另一個變量 (輸入變量)、及前一期的y之間 存在如下動態方程:yt =虬+3(2.20)則此方程稱為一階線性差分方程,這里假定為一個確定性的數值序列。差分方程就是關 于一個變量與它的前期值之間關系的表達式。(1)用遞歸替代法解差分方程根據方程(2.20),如果我們知道t = -1期的初始值口 口 y_i和的各期值,則可以通過 動態系統得到任何一個時期的值,即y =S+i y +ts

20、 +饑-is + . + 3(2.21)這個過程稱為差分方程的遞歸解法。(2)動態乘子: TOC o 1-5 h z 對于方程(2.21),如果隨y變動,而w ,w,,w都與y無關,則對y的影 0-11 2t-10 t響為:dy, 四 .己=。t 或 t+j =們(2.22)8s0t方程(2.22)稱為動態系統的乘子,或脈沖響應函數(即暫時性影響)。動態乘子依賴于j,即輸入的擾動和輸出y 的觀察值之間的時間間隔。 tt+j對于方程(2.20),當0。1時,動態乘子按幾何方式衰減到零;當-1。0,動態乘子 振蕩衰減到零;。1,動態乘子指數增加;。-1,動態乘子發散性振蕩。因此,。1,動態 系統穩

21、定,即給定巴的變化的后果將逐漸消失。1,系統發散。當0=1時,此時yt = y-1 +0 + st,即輸出變量的增量是所有輸入的歷 史值之和。 TOC o 1-5 h z 如果產生持久性變化,即巴,巴+1,.,st+j都增加一個單位,此時持久性影響為: dy dy dy .t+j + t+k + + t+ = 0 j +0 j -1 +. + 0 +1(2.23)ddsdtt+1t + j當0 1時,且jT8時,持久性影響為lim j+j + j+j + t+j = 1 + 0 0 j -1 + 0 j + = -j-(2.24)jK dsdsds1 -01-tt+1t+j如果考察s的一個暫時

22、性變化對輸出y的累積性影響,則和長期影響一致。 t2.3.2 p階差分方程如果動態系統中的輸出yt依賴于它的p期滯后值以及輸入變量st:(2.25)j =e j +e j +e +s(2.25)t 1 t12 t2p tp t此時可以寫成向量的形式,定義& =tjt 1 jt-1嘰:,F=*110,201,p1.0.0., 1 0p0,r 00,j1- tp+1._ 0001.0.0從而(2.25 )寫成向量形式:(2.26)(2.26)這個系統由p個方程組成,為了便于處理,將p階數量系統變成一階向量系統。0 期的& 值為:&o = Fg_1 + V0 口1 期的& 值為: E= F& + v

23、 = F(Fg + v ) + v = F2& + Fv + v10 110110 1t期的&值為:寫成&和v的形式為:& = Ft+1& + Ft期的&值為:寫成&和v的形式為:& = Ft+1& + Ftv + Ft-1v + Ft-2 v + Fv + vt1012t1t1 jt1jt2:=jj-11 j2j3:+F-000,+ FT-010,+F1-1100,+:10,j .t p + 1jp._ 0 _.0._ 0 _._ 0 _(2.27)Jt的值。令口口 口匕)表示Ft中第(1,1)f*) 口 口 表示Ft中第(1,2)個元素等等。于是j的值為:該系統中的第一個方程代表了個元素,

24、j = f (j+1) j + f (j+1) j+ f (j+1) j+ - + f (j+1) jt+j11t 112t213t31 ptp+ f(乃 + f(頂-劫+ - + f+11 t 11t+111t+j 1t+j(2.28)表示成初始值和輸入變量歷史值的函數,此時p階差分方程的動態乘子:8 t+h = f ( j )8w11t(2.29)是Fj的(1,1)口元素。因此對于任何一個p階差分方程,M式,土式2+81 812tt(2.30)對于更大j值,通過分析表達式(2.28)就非常有用。通過矩陣F的特征根進行求解。(2.31)矩陣F的特征根為滿足下式的力值:(2.31)F 人I p

25、對于一個p階系統,行列式(2.31)為特征根人的p階多項式,多項式的p個解是F的 p個特征根。定理2.4矩陣F的特征根由滿足下式的人值組成:人p 。人p1 。人p2。 人 一。=0(2.32)證明:考慮具有相異特征根的p階差分方程的通解,此時存在一個pxp階非奇異矩陣滿足:F = TM-1F 2 = TAT-1TAT-1 = TA2T-1(2.33)Fj = TA jT-1(2.33)其中A個口 px p矩陣,主對角線由F的特征根組成,其它元素為零。令勺表示T的第i行、第j列的元素,tj表示T-1的第i行、第j列的元素。則有:11121112t tF j = 2122L人 j 0 0 . 0

26、111 112t;0Xi00 II 121122tp000 xjtp1tp 2t1pt2p:t pp(2.34)因此Fj的第口(因此Fj的第口(1,1)個元素為:f (j) = c Xj + c Xj HF C Xj(2.35)其中C。尸。因為 C =曾=TT -1 = 1。將(2.35)代入(2M=1i=1得到p階差分方程的動態乘子:tHtHjt=f (j) = C Xj + C Xj FF C Xj(2.36)定理25如果矩陣F特征值是相異的,則(2.37)X p-1(2.37)七n(X-x )i kk =1k力i因此求出F的特征值X,就可以求出相應的烏,由此就可以根據(2.36)計算得到

27、動 態乘子。如果所有的特征值都是實根,且存在一個特征根的絕對值大于1,則系統是發散的。根 據(2.36),動態乘子最終由絕對值最大的特征根的指數函數決定。 2.4動態數據預處理具有動態隨機變化特征的數據序列通常稱為動態隨機數據。動態數據的統計特性可以用 概率分布密度來描述,但由于動態數據的隨機過程往往具有很復雜的多維概率分布特性,實 際上難以分析和應用。時間序列分析作為另外一種描述動態數據統計特性的理論和方法,具 有方便和實用的突出特點。在建立時間序列模型之前,必須先對動態數據進行必要的預處理,以便剔除那些不符合 統計規律的異常樣本,并對這些樣本數據的基本統計特性進行檢驗,以確保建立時間序列模

28、 型的可靠性和置信度,并滿足一定的精度要求。2.4.1平穩性檢驗時間序列的平穩性是時間序列建模的重要前提。在檢驗時間序列的平穩性時,必須考慮 兩點:序列的均值和方差是否為常數;序列的自相關函數是否僅與時間間隔有關,而與時間 間隔端點的位置無關。下面介紹平穩性檢驗的幾種常用方法。平穩性的參數檢驗法設樣本序列七,Xn足夠長,即N相當大。把樣本序列分成k個子序列,即取 N = kM,M是一個較大的正整數,k也是一個正整數。分段后的樣本序列為 x,.,i = 1,2, ,k; j = 1,2,.,M對于k個子序列,可以分別計算它們的樣本均值、樣本方差和樣本自相關函數。它們的 定義分別為:1 M(2.3

29、8)Mx(2.38)Mij=1(2.39)一,、1R (t )= 一羅(x - x.)(x- x ) (i =1,2,k;T = 1,2,m, m 1.96*2b|s -a 1.96t公2R (t) R (t) 1.96&b3(t)(i 豐 j, i, j = 1,2,,k;T = 1,2,,m)成立時,可拒絕為平穩序列的假設,即該序列不具有平穩性。但一般并不知道的 理論方差與自相關函數,因此無法得出b12,b 2,和b 2(T ),只能以它們的樣本估計值代 之。因此,這個方法還不夠理想,還須結合背景判斷在過程運行中周圍條件及相關參數是否 維持不變來確定是否是平穩的。平穩性的非參數檢驗法平穩性

30、的非參數檢驗中常使用游程檢驗法。由于該方法只涉及一組實測數據,不需要假 設數據的分布規律,所以實際中應用最多。在保持隨機序列原有順序的情況下,游程定義為具有相同符號的序列,這種符號將觀測 值分成兩個相互排斥的類。假如觀測序列的值是x,i = 1,2,N,其均值為X,用符號“+”表示土 x,而“-”表示土 x。按符號“+”和“-”出現的順序將原序列寫成如下形式+ + + - + + - + - - +觀察可知,“+”和“-”共14個,分為7個游程。游程過多或過少都被認為是存在非平 穩性趨勢。游程檢驗的原假設為:樣本數據出現的順序沒有明顯的趨勢,就是平穩的。樣本統計量有:吐表示一種符號出現的次數;

31、N2表示另一種符號出現的次數;尸表示 游程的總數。其中尸作為檢驗統計量。對于顯著水平a = 0.05的雙邊檢驗,由附表給出概 a率分布左右兩側為-=0.025時的上限七和下限七。如果r在界限以內,則接受原假設; 否則拒絕原假設。當N當N1或N-超過15時,可用正態分布來近似,利用附表來確定檢驗的接受域和否定域。式中:(式中:(2.47)(2.48)(2.49)此時用的統計量為_ 2 nn+1H rNb _ 2N N (2N N _ N)b r 1 NN2(N1-12)1/2(2.50)對于a _ 0.05的顯著性水平,如果Z J 1.96(按2b原則),則可接受原假設,否則就拒絕。下面兩種方法

32、是圖檢驗方法,利用時序圖和自相關圖顯示的特征來作出判斷檢驗時間序 列的。圖檢驗方法用于判斷檢驗時間序列平穩性操作簡便、運用廣泛,但也有主觀性較強的 缺點。時序圖檢驗法根據平穩時間序列均值、方差為常數的性質,平穩時間序列的時序圖應該顯示出該序列 始終在一個常數值附近隨機波動,而且波動的范圍有界的特點。如果觀察序列的時序圖顯示 出該序列有明顯的趨勢性或者周期性,則時間序列通常不是平穩時間序列。據此我們可以判 斷一些時間序列的平穩性。例2.5例26 19751980年夏威夷島莫那羅亞火山(Mauna Loa)每月釋放的二氧化碳的數 據(單位:ppm)。圖2.3由時序圖顯示。我們可以看到這些數據中存在

33、著某種季節趨勢和明顯的增長趨勢,因此可以 初步判定這一時間序列是非平穩的。2.4.2正態性檢驗通常,時間序列模型建立在具有正態分布特性的白噪聲基礎上,所以需要檢驗采集的數 據序列是否具有正態特性。正態分布的概率密度函數為式中R和。2分別為樣本總體的均值和方差。概率分布為F (x) = 一f x e -搭) dx = Q ( * 一 -)e 2 兀 -8b式中稱為概率積分。檢驗隨機數據正態性的有效方法是“ X2擬合優度檢驗”。該方法是利用X2統計量作為觀察到的概率密度函數和理論密度函數之間的偏差的度量,兩者是否相同可通過分析、2 的樣本分布來檢驗。如果數據是正態的,則應落入第j組區間中的數據個數

34、為F0=泌(丁)a + jc a + (j 1)c (2.51)F = N (-)Q(-)(2.51)F = N 1 Q (b -)k+ieb a式中a和6是兩個端點值,c =廠,k是數據分組數。Fj和觀察到的頻數Nj之間的偏差為(氣,由于(2.52)(2.53)E1 N =另 F = N(2.52)(2.53)因此總偏差為零。根據Pearson定理,樣本的X2統計量為,-F )2X 2 = E J JFJ=0j假定這個樣本X2統計量近似為X2分布,并將該統計量和理論X2分布作比較。此時, 自由度n = k + 2減去一些線性約束的數目,其中一個約束是當前k +1個組區間的頻數已知時,由于總頻

35、數為N,最后一個組區間的頻數也知道了。另外兩個約束是由于同理論正態 概率密度函數擬合觀察數據的頻數直方圖而引起的,統計量X 2是利用樣本均值和樣本方差計算F ,而不是用真正的均值和方差。因此,如果利用全部氣,則自由度為:n = (k + 2) - 3 = k -1實際n值可能比這還要小些,因為F 2的一些組可能和其他組合并。正態性假設檢驗規則是:假設隨機變量服從正態分布,在把觀察數據分組列入k + 2個 組區間后,利用樣本均值和方差計算F,再求X2。樣本分布函數對正態分布的任何偏差都 會使X 2增大。如果X 2 X2,則在顯著水平 n,aa上拒絕上述假設。經驗表明,總體樣本量和分組數目應滿足的

36、最優關系式為2k = 1.87( N -1)5此外,需要注意的是采用X2檢驗方法必須保證每個區間中的期望頻數至少為2。由于 范圍兩端的期望頻數最少,所以上述要求可以用來確定a和b,而參數a應滿足如下關系式 -、知,1、2 = N(2兀)2 J(aw)/。exp(- x2)dx82b 一 a據此求得a,又利用H=,得參數b為b = 2 h + a而分組區間數目為k = r - 2,其中r為最小區間數。以上三個參數確定之后就可以計算樣 本概率密度。2.4.3獨立性檢驗在時間序列分析和建模過程中,除了要求檢驗樣本數據的平穩性和正態性之外,還要求 檢驗其獨立性。本節介紹的獨立性方法是基于正態隨機變量自

37、相關函數的統計性質。設隨機變量XN(0,c 2),其自相關函數P (r)=1, r = 00, r 0P (r)=1, r = 00, r 0(2.55)當r 1時,p (r) = 0。實際中我們只能得到樣本自相關系數的估計值d(r),一般不等于0,從自相關系數的估計值判斷是否滿足獨立性條件,需要借助Bartlett公式。Bartlett公式:若P (r)在r M時趨于零,則在N足夠大的情況下其方差為1Dp(r)牝一羅 p2(m) (r M)Nm=-M并且,當r M時,p(r)近似于正態分布。(2.56)若P(r)是白噪聲的自相關系數,則M = 0DP (r)牝 1(r 0)N根據統計檢驗的2

38、。準則,當d(r) 典土 - 2 攔(2.57)(2.58)河P(r)| 0)這一估計,即數據是獨 立的。如果有個別d(r) (r 0)超出式(2.57)所約束的范圍,可以采用另一種檢驗該隨機變 量是否獨立的整體檢驗方法。考慮到r 1時,白噪聲序列的樣本自相關分布漸近于正態分 布,或是說當n較大時,5p(1),*Np(2), ,.:Np(k)這k個量近似為相互獨立的正態隨機變量N(0,1),因而它們的平方和符合x 2分布。構造統計量為Q = N d 2(尸)(2.60)r=1則檢驗七, ,XN是否為白噪聲樣本值的問題可轉化為檢驗統計量Q是否是自由度為k的X2分布問題。具體算法是:以“ x 為白

39、噪聲”做原假設,以a為顯著水平,則根據a和自由度k t由X2分布表查出相應的X 2(k)值,并與計算出的Q值比較。如果aQ X2(k)(2.62)則否定原假設。2.4.4離群點的檢驗與處理離群點是指一個時間序列中,遠離序列一般水平的極端大值和極端小值,也成為奇異值 或野值。形成離群點的原因是多種多樣的,例如由于數據傳輸過程、采樣及記錄過程中發生 信號失真或丟失等而產生,又如研究現象本身由于受各種偶然非正常的因素影響而形成離群 點等等。不論何種原因引起離群點,通常都會在之后的時間序列分析中帶來誤差,影響建立 時序模型的精度。在得到時間序列以后,首先要檢查是否存在離群點,下面介紹一種線性外 推的方

40、法來尋找和剔出離群點。該方法是將時間序列值與平滑值進行比較,認為正常的數據是“平滑的”,而離群點是 “突變的”。用X表示先對序列進行平滑、再平方得到的數值,X;表示先對序列取平方、 再做平滑而得到的數值,用S;表示方差,有S; = X X;,如果X H - X.| v kS(2.63)則認為X用是正常的,否則認為Xt+1是一個離群點。K是常數,一般取3-9的整數。如果Xt+1是離群點,則可用Xf H來代替,即人_X = 2X - X(2.64)t+1ii -1為避免出現無休止的外推計算,建議事先規定連續外推的次數,因為接連檢測到一些離 群點后,最終的外推結果可能偏離很遠,以致會排出本來是很正常

41、的數據點。習題二2.1EVIEWS軟件介紹(II)借助Eviews5.1,我們可以很方便的判斷一個時間序列是否平穩以及是否為純隨即性序 列。作出判斷的步驟如下:一、繪制時間序列圖時序圖可以大致看出序列的平穩性,平穩序列的時序圖應該顯示出序列始終圍繞一個 常數值波動,且波動的范圍不大。如果觀察序列的時序圖顯示出該序列有明顯的趨勢或周期, 那它通常不是平穩序列,現以例子來說明。例1、1964-1999年中國紗年產量序列(單位:萬噸)。按照第一章的方法建立工作文件和導入外部Excel文件,創建新序列SHA,如圖2.2。 點擊主菜單Quick/Graph就可作圖,見圖2.3,分別是折線圖(Line g

42、raph)條形圖(Bar graph) 散點圖(Scatter )等,也可雙擊序列名,出現顯示電子表格的序列觀測值,然后點擊工具欄 的View/Graph。如果選擇折線圖,出現圖2.4的對話框,在此對話框中鍵入要做圖的序列, 點擊OK則出現折線圖,橫軸表示時間,縱軸表示紗產量,見圖2.5,選擇圖2.5上工具欄 options可以對折線圖做相應修飾。點擊主菜單的Edit/Copy,然后粘貼到文檔就變成了如圖 2.6的折線圖。圖2.2圖2.3從圖1.5可以看出,紗產量呈現波動中上升的趨勢,顯然不平穩,所以不是一個平穩序 列。這一結論,還可以通過平穩性統計檢驗來進一步說明。二、平穩性判斷例1續.為了進一步的判斷序列SHA的平穩性,需要繪制出該序列的自相關圖。雙擊 序列名sha出現序列觀測值的電子表格工作文件,點擊View/Correlogram,出現圖1.6的相 關圖設定對話框,上面選項要求選擇對誰計算自相關系數:原始序列(Level)、一階差分(1st difference)和二階差分(2nd difference),默認是對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論