




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第四章 地理要素間的相關分析與回歸分析 地理要素間的相關分析地理要素間的回歸分析空間趨勢面分析 地理要素的時間序列分析地理要素的逐步回歸模型分析 第1節 相關分析 相關分析的任務,是揭示地理要素之間相互關系的密切程度。而地理要素之間相互關系密切程度的測定,主要是通過對相關系數的計算與檢驗來完成的。地理要素間的相關類型根據相關所涉及變量的多少,相關關系分為單相關與復相關。兩個變量之間的相關關系稱為單相關;多個變量之間的相關關系稱為復相關。根據相關的形式不同,相關關系分為線性相關與非線性相關。如果變量之間的關系近似地表現為一條直線,則稱為線性相關;如果變量之間的關系近似地表現為一條曲線,則稱為非線
2、性相關或曲線相關。根據變量相關方向的不同,相關關系分為正相關與負相關。正相關是指兩個變量之間的變化方向一致,都是增長或下降趨勢,如居民收入增加,居民消費額隨之增加,故它們是正相關;負相關是指兩個變量變化趨勢方向相反,如產品單位成本降低,利潤隨之增加,故它們是負相關。根據相關程度的不同,相關關系分為不相關、完全相關和不完全相關。如果兩個變量彼此的數量變化相互獨立,這種關系稱為不相關;如果一個變量的數量變化完全由另一個變量的數量變化所唯一確定,這種關系稱為完全相關;介于不相關與完全相關之間的關系,稱為不完全相關。本節主要內容:兩要素之間相關程度的測定多要素間相關程度的測定一、兩要素之間相關程度的測
3、定相關系數的計算與檢驗秩相關系數的計算與檢驗相關系數的計算相關系數的計算 定義: 和 為兩要素的平均值。 niiniiniiixyyyxxyyxxr12121)()()(yx(3.1.1)(一)相關系數的計算與檢驗(一)相關系數的計算與檢驗 說明 :- 1 = 0.432,所以在=0.01的置信水平上來看,中國大陸各省(直轄市、自治區)人口規模與GDP是等級相關的。 rr01. 0rxyr01. 0r二、多要素間相關程度的測定偏相關系數的計算與檢驗復相關系數的計算與檢驗 偏相關和復相關是兩個相對應的概念 (一)偏相關系數的計算與檢驗(一)偏相關系數的計算與檢驗 定義:在多要素所構成的地理系統中
4、,先不考慮其他要素的影響,而單獨研究兩個要素之間的相互關系的密切程度,這稱為偏相關。用以度量偏相關程度的統計量,稱為偏相關系數。n偏相關系數偏相關系數(partial correlation coefficient)624C2/ ) 1(2mmCm當研究2個相關變量x1、x2的關系時,用直線相關系數r12表示x1與x2線性相關的性質與程度。此時固定的變量個數為0,所以直線相關系數r12又叫做零級偏相關系數。當研究3個相關變量x1、x2、x3的相關時,我們把x3保持固定不變,x1與x2的相關系數稱為x1與x2的偏相關系數,記為r12.3,類似地,還有偏相關系數r13.2、 r23.1。這3個偏相
5、關系數固定的變量個數為1,所以都叫做一級偏相關系數。當研究4個相關變量x1、x2、x3、x4的相關時,須將其中的2個變量固定不變,研究另外兩個變量間的相關。即此時只有二級偏相關系數才真實地反映兩個相關變量間線性相關的性質與程度。二級偏相關系數共有個:r12.34,r13.24,r14.23,r23.14,r24.13,r34.12。一般,當研究m個相關變量x1、x2、xm的相關時,只有將其中的m-2個變量保持固定不變,研究另外兩個變量的相關才能真實地反映這兩個相關變量間的相關,即此時只有m-2級偏相關系數才真實地反映了這兩個相關變量間線性相關的性質與程度。m-2級偏相關系數共有個。xi與xj的
6、m-2級偏相關系數記為rij.(i,j=1,2,m,ij)。偏相關系數的取值范圍為-1,1,即:-1rij.1。 計算:3個要素的偏相關系數)1)(1(2232132313123.12rrrrrr(3.1.5) (3.1.6) )1)(1(2232122312132.13rrrrrr)1)(1(2132121312231.23rrrrrr(3.1.7) 4個要素的偏相關系數(3.1.8) )1)(1(23.2423.143.243.143.1234.12rrrrrr)1)(1(22.3422.142.342.142.1324.13rrrrrr(3.1.9) )1)(1(22.4322.132.
7、432.132.1423.14rrrrrr(3.1.10) )1)(1(21.3421.241.341.241.2314.23rrrrrr(3.1.11) 例如:對于某4個地理要素x1,x2,x3,x4的23個樣本數據,經過計算得到了如下的單相關系數矩陣: 1469.0950.0579.0469.01592.0346.0950.0592.01416.0579.0346.0416.0144434241343332312423222114131211rrrrrrrrrrrrrrrrR 利用公式計算一級偏向關系數,如表3.1.6所示:r1234r1324r1423r2314r2413r3412-0.
8、1700.8020.635-0.1870.821 -0.337r123r132r142r143r231r241r243r341r3420.8210.8080.6470.895-0.8630.9560.945-0.8750.371 利用公式計算二級偏相關系數,如表3.1.7所示: 4個要素的一級偏相關系數有12個,這里給出了9個;二級偏相關系數有6個,這里全部給出來了。 寫出其余3個一級偏相關系數表表3.1.6 3.1.6 一級偏相關系數一級偏相關系數 表表3.1.7 3.1.7 二級偏相關系數二級偏相關系數 n 偏相關系數的性質偏相關系數的性質 偏相關系數分布的范圍在-1到1之間; 偏相關系數
9、的絕對值越大,表示其偏相關程度越大; 偏相關系數的絕對值必小于或最多等于由同一系列資料所求得的復相關系數,即 R123|r123|。偏相關系數的顯著性檢驗偏相關系數的顯著性檢驗 偏相關系數的顯著性檢驗,一般采用t檢驗法。其統計量計算公式為 式中: 為偏相關系數;n為樣本數;m為自變量個數。 11341223412 mnrrtmm(3.1.14) mr312 查t分布表,在自由度為23-3-1=19時,t0.001=3.883,顯然 ,這表明在置信度水平 =0.001上,偏相關系數r2413是顯著的。268. 61323821. 01821. 02ttt 譬如,對于上例計算得到的偏相關系數 ,由
10、于n=23,m=3,故821. 01324r小結偏相關分析 ( Partial ) 是研究在多變量的情況下,變量之間的復雜相關關系。在多變量的情況下, 2 個變量間的簡單相關系數往往不能正確揭示這 2 個變量間的關系,只有在除去其他變量影響的情況下,計算它們之間的相關系數,才能更確切地揭示他們間的相關關系。簡單相關關系有時不能真實反映現象的關系, 如:在研究商品的需求量和價格、消費者收入之間的關系時會發現,需求量和價格之間的相關關系實際上還包含了消費者收入對商品需求量的影響。 所以,我們在進行相關分析時往往要控制第三個變量,而研究變量之間的相關關系。(二)復相關系數的計算與檢驗(二)復相關系數
11、的計算與檢驗 復相關系數(analysis of multiple correlation) :反映幾個要素與某一個要素之間的復相關程度 。復相關系數的計算復相關系數的計算 當有兩個自變量時 當有三個自變量時(3.1.15) )1)(1 (11 . 221212.yyyrrR)1)(1)(1 (112. 321 . 2212123.yyyyrrrR(3.1.16)當有k個自變量時)1 )1)(1 (1)1.(12.21 .2212.12. kykyykyrrrR(3.1.17) 復相關系數的性質 復相關系數介于0到1之間,即1012.kyR 復相關系數越大,則表明要素(變量)之間的相關程度越密
12、切。復相關系數為1,表示完全相關;復相關系數為0,表示完全無關。 復相關系數必大于或至少等于單相關系數的絕對值。復相關系數的顯著性檢驗復相關系數的顯著性檢驗 F檢驗法。其統計量計算公式為kknRRFkyky11212.212.(3.1.18)例題:在上例中,若以x4為因變量,x1,x2,x3為自變量,試計算x4與x1,x2,x3之間的復相關系數。 解:按照公式(3.1.16)計算 檢驗: ,故復相關達到了極顯著水平。974.0337.01)(956.01)(579.01 (1)1)(1)(1 (1222212.4321 .42241123.4)rrrR3010. 57190.12001. 0F
13、F第2節 回歸分析一元線性回歸模型多元線性回歸模型非線性回歸模型一、一元線性回歸模型 定義:假設有兩個地理要素(變量)x 和y,x為自變量,y為因變量。則一元線性回歸模型的基本結構形式為 式中:a和b為待定參數; 為各組觀測數據的下標; 為隨機變量。bxay(3.2.1) n,1,2,a 記 和 分別為參數a與b的擬合值,則一元線性回歸模型為 (3.2.2)式代表x與y之間相關關系的擬合直線,稱為回歸直線; 是y的估計值,亦稱回歸值。a bxbay(3.2.2) y 參數a與b的最小二乘擬合原則要求yi與 的誤差ei的平方和達到最小,即 根據取極值的必要條件,有 niiininiiiibxay
14、yyeQ121122min)()(niiiiniiixbxaybxay110)(0)((3.2.4) iy (一)參數(一)參數a、b的最小二乘估計的最小二乘估計 (3.2.3) niiniiixxxyxxyyxxLLb121)()(xbya2112111)(1)(1niiniininiiniiiixnxyxnyx(3.2.5) (3.2.6) 解上述正規方程組(3.2.4)式,得到參數a與b的擬合值 (二)一元線性回歸模型的顯著性檢驗(二)一元線性回歸模型的顯著性檢驗 方法:F 檢驗法。 總的離差平方和:在回歸分析中,表示y的n次觀測值之間的差異,記為 可以證明(3.2.9)niiyyyyL
15、S12)(總niiyyyyLS12)(總niniiiiUQyyyy1122)()((3.2.8) 在式(3.2.9)中,Q稱為誤差平方和,或剩余平方和 而 稱為回歸平方和。niiiyyQ12)(xyxxniiniiniiibLLbxxbxbabxayyU21221212)()()( 統計量F F越大,模型的效果越佳。統計量FF(1,n-2)。在顯著水平下,若FF,則認為回歸方程效果在此水平下顯著。一般地,當FF0.10(1,n-2)時,則認為方程效果不明顯。 2nQUF(3.2.10) (三)舉例如何正確的分析和判斷兩個變量之間的關系是線性關系還是非線性關系?方法有多種:作散點圖法、差分法、曲
16、度法以及計算器法等。主要介紹作散點圖法。 從散點圖可以看出:兩個變量間關系的性質(是正相關還是負相關)和程度(是相關密切還是不密切);兩個變量間關系的類型,是直線型還是曲線型(如果數據接近一條直線,則認為變量間存在線性關系;如果數據接近一條光滑的曲線,則稱之為非線性關系);是否有異常觀測值的干擾。 年份年份工業總產值工業總產值貨運總量貨運總量200020005 52 2200120016 64 42002200213135 52003200314149 92004200423231111二、多元線性回歸模型回歸模型的建立回歸模型的建立 多元線性回歸模型的結構形式為 aakaaaxxxyk221
17、10(3.2.11) 式中: 為待定參數; 為隨機變量。 k,10a 回歸方程: 如果 分別為式(3.2.11)中 的擬和值,則回歸方程為 在(3.2.12)式中,b0為常數,b1,b2,bk稱為偏回歸系數。偏回歸系數的意義是,當其他自變量都固定時,自變量 每變化一個單位而使因變量平均改變的數值。kkxbxbxbby22110(3.2.12) kbbb,10k,210ix 偏回歸系數的推導過程:根據最小二乘法原理, 的估計值 應該使 由求極值的必要條件得 方程組(3.2.14)式經展開整理后得 min)()(122211012nakakaaanaaaxbxbxbbyyyQ(3.2.13) ),
18、 2, 1(0)(20)(2110kjxyybQyybQnajaaajnaaa), 2 , 1 , 0(kii)(k,1,2, 0iib(3.2.14) 方程組(3.2.15)式稱為正規方程組。 引入矩陣nanaakanakkanakaakaanakananaaanakkaanaaaanaananaaanakkaanaaanaananaanakkanaaayxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxnb11122121101112122122121012111112121121011111212110)(.)()()()()()()()()()()()
19、()()( (3.2.15) knnnkkxxxxxxxxxxxxX2132313222121k211111.11knnnkkkknkkknnTxxxxxxxxxxxxxxxxxxxxxxxxXXA213231322212121113212232221113121111111111nakanakaanakaanakanakaanaanaaanaanakaanaaananaanakanaanaaxxxxxxxxxxxxxxxxxxxxxn12121111212212112111211211111211nyyyY21nbbbbb210 則正規方程組(3.2.15)式可以進一步寫成矩陣形式BAb n
20、aakanaaanaaanaanknkkknnTyyyxyxyyyyyxxxxxxxxxxxxYXB112111321321223222111312111111求解得引入記號 YXXXBAbTT11)(najjiiajiijxxxxLL1)(naaiiaiyyyxxL1)((3.2.16) ),2, 1,(kji),2,1(ki正規方程組也可以寫成kkkykkkkkykkykkxbxbxbybLbLbLbLLbLbLbLLbLbLbL2211022112222212111212111)51 . 2 . 3( n回歸模型的顯著性檢驗回歸模型的顯著性檢驗 回歸平方和U與剩余平方和Q: 回歸平方和
21、剩余平方和為 F統計量為 計算出來F之后,可以查F分布表對模型進行顯著性檢驗。k21x,x,xQULSyy總nanaiyiLbyyU112)(nayyaaULyyQ12)()1/(/knQkUF非線性關系線性化的幾種情況非線性關系線性化的幾種情況對于指數曲線 ,令 , 可以將其轉化為直線形式: , 其中, ; 對于對數曲線 ,令 , ,可以將其轉化為直線形式: ;對于冪函數曲線 ,令 , ,可以將其轉化為直線形式: 其中, ; 三、非線性回歸模型 bxdyexbayxbaylnxbaybdxy xbayyylnxx dalnyy xxlnyylnxxlndaln對于雙曲線 令 ,轉化為直線形式
22、: ; 對于S型曲線 ,可 轉化為直線形式: ; 對于冪乘積 ,只要令 ,就可以將其轉化為線性形式 其中, ;xbay1xbayxxxyybaye,1,e1令xbaykkxxdxy2121kkxxxy22110 xxyy1,1kkxxxxxxyyln,ln,ln,ln2211dln0對數模型雙曲線模型對于對數函數和 只要令 ,就可以將其化為線性形式 例例: :表3.2.1給出了某地區林地景觀斑塊面積(area)與周長(perimeter)的數據。下面我們建立林地景觀斑塊面積A與周長P之間的非線性回歸模型 。 kkxxxylnlnln22110kkxxxy22110kkxxxxxxyyln,ln
23、,ln,2211 序號面積A周長P序號面積A周長P110 447.370625.39242232 844.3004 282.043215 974.730612.286434 054.660289.307330 976.770775.7124430 833.840895.98049 442.902530.202451 823.355205.131510 858.9201 906.1034626 270.300968.060621 532.9101 297.9624713 573.9601 045.07276 891.680417.0584865 590.0802 250.43583 695.19
24、5243.90749157 270.4002 407.54992 260.180197.239502 086.426266.54110334.33299.729513 109.070261.8181111 749.080558.921522 038.617320.396122 372.105199.667533 432.137253.335138 390.633592.893541 600.391230.030146 003.719459.467553 867.586419.406表3.2.1 某地區各個林地景觀斑塊面積(m2)與周長(m) 15527 620.2006 545.291561
25、946.184198.66116179 686.2002 960.4755777.30556.9021714 196.460597.993587 977.719715.7521822 809.1801 103.0705919 271.8201 011.1271971 195.9401 154.118608 263.480680.710203 064.242245.049 6114 697.1301 234.1142146 9416.7008 226.009624 519.867326.317225 738.953498.6566313 157.6601 172.916238 359.46541
26、5.151646 617.270609.801246 205.016414.790 654 064.137437.355256 0619.0201 549.871665 645.820432.355261 4517.740791.943676 993.355503.7842731 020.1001 700.965684 304.281267.9512826 447.1601 246.977696 336.383347.136297 985.926918.312702 651.414292.235303 638.766399.725712 656.824298.4733158 5425.1001
27、1 474.770721 846.988179.8663235 220.6401 877.476731 616.684172.8083310 067.820497.394741 730.563172.1433427 422.5701 934.5967511 303.970881.0423543 071.5501 171.4137614 019.790638.1763657 585.9402 275.389779 277.172862.0883728 254.1301 322.7957813 684.750712.78738497 261.0009 581.298791 949.164228.4
28、033924 255.030994.906804 846.016324.481401 837.699229.40181521 457.4007 393.938411 608.625225.84282564 370.80012 212.410 解解:(1)作變量替換,令: , ,將表3.2.1中的原始數據進行對數變換,變換后得到的各新變量對應的觀測數據如表3.2.2所示。 AylnPxln序號y=lnAx=LnP序號y=lnAx=LnP1 9.254 1066.438 3794212.358 138.362 1862 9.678 7636.417 243 8.307 6225.667 48731
29、0.340 996.653 7824410.336 376.797 9184 9.153 0196.273 258457.508 4335.323 655 9.292 7427.552 8164610.176 196.875 2946 9.977 3387.168 551479.515 9096.951 8417 8.838 076.033 2264811.091 187.718 8798 8.214 7895.496 7894911.965 727.786 3649 7.723 25.284 414507.643 2085.585 52810 5.812 1354.602 457518.04
30、2 0795.567 65111 9.371 536.326 008527.620 0275.7695 58表3.2.2 經對數變換后的數據127.771 5335.296 653538.140 9385.534 711139.034 8716.385 013547.378 0035.438 211148.700 1346.130 066558.260 3866.038 8391513.176 138.786 501567.573 6265.291 5971612.098 977.993 105574.347 7554.041 328179.560 7486.393 579588.984 40
31、86.573 3341810.034 927.005 852599.866 3996.918 8211911.173 197.051 092609.019 6016.523 136208.027 5565.501 457619.595 4087.118 1092113.059 259.0150 56628.416 2385.787 871228.655 0326.211 917639.484 7597.067 248239.031 156.028 643648.797 4386.413 133248.733 1136.027 773658.309 9576.080 7442511.012 36
32、7.345 927668.638 6716.069 247269.583 1276.674 49678.852 7166.222 1472710.342 397.438 951688.367 3655.590 8062810.182 97.128 478698.754 0635.849 717298.985 4366.822 537707.882 8485.677 56308.199 45.990 776717.884 8875.698 6783113.280 099.347 906727.521 3115.192 2133210.469 397.537 684737.388 1325.152
33、 181339.217 0996.209 381747.456 2025.148 3263410.219 127.567 654759.332 9096.781 1053510.670 627.065 966769.548 2256.458 6143610.961 037.729 906779.135 3126.759 3583710.248 997.187 502789.524 0376.569 1823813.116 879.167 568797.575 1565.431 1123910.096 386.902 648808.485 9125.782 227407.516 275.435
34、4718113.164 388.908 416417.383 1355.419 8378213.243 479.410 208 (2) 以x為橫坐標、y為縱坐標,在平面直角坐標系中作出散點圖。很明顯,y與x呈線性關系。圖3.2.2 林地景觀斑塊面積(A)與周長(P)之間的雙對數關系 (3)根據所得表中的數據,運用建立線性回歸模型的方法,建立y與x之間的線性回歸模型,得到 對應于(3.2.19)式,x與y的相關系數高 達 =0.966 5。 (4)將(3.2.19)還原成雙對數曲線,即 7505.0505.1xy(3.2.19)7505.0ln505.1lnPA (3.2.20)xyr第3節趨勢
35、面分析(Trend-Surface Analysis )一、概念 趨勢面分析是用數學曲面來擬合地理系統要素在空間的分布及變化趨勢的一種數學方法。它實質上是通過回歸分析原理,模擬地理要素在空間上的分布規律,展示地理要素在地域空間上的變化趨勢。趨勢面分析常常被用來模擬資源、環境、人口及經濟要素在空間上的分布規律,它在空間分析方面具有重要的應用價值。 二、空間趨勢面分析的一般原理 空間趨勢面并不是地理要素的實際分布面,而是模擬地理要素空間分布的近似曲面。因此,通常把實際的地理曲面分解為趨勢面趨勢面和剩余面剩余面兩部分 。前者反映地理要素的宏觀分布宏觀分布規律,屬于確定性因素作用的結果;而后者則對應于
36、微觀局域,是隨機因素的結果。趨勢面分析的一個基本要求就是所選擇的趨勢面模型應該是剩余值最小,而趨勢值最大,這樣擬合精度才能達到足夠的精確性。 1.趨勢面模型的建立 設 某 地 理 要 素 的 實 際 觀 測 數 據 為zi(xi,yi)(i=1,2,n),趨勢面擬合值為,則有式中,i為剩余值(殘差值) 采用回歸分析方法 在最小二乘法意義下的趨勢面擬合。 用來計算趨勢面的數學方程式有多項式和傅立葉級數,其中最常用的是多項式函數形式。 多項式趨勢面的形式為:一次趨勢面模型:二次趨勢面模型: First-order (linear) trend surfaceSecond-order (quadra
37、tic) trend surfaceAn isoline map of a third-order trend surface created from 105 points with annual precipitation values (105個年降水量點)zx,y = b0 + b1x + b2y + b3x2 + b4xy + b5y2 + b6x3 + b7x2y + b8xy2 + b9y3 需要注意在實際應用中,往往用次數低的趨勢面逼近變化比較小的地理要素數據,用次數高的趨勢面逼近起伏變化復雜的地理要素數據。次數低的趨勢面使用起來比較方便,但是具體到某點擬合較差;次數較高的趨勢
38、面只在觀測點附近效果較好,而在外推和內插時則效果較差。 2.趨勢面模型的參數估計 將多項式回歸(非線性模型)模型轉化為多元線性回歸模型。 若要偏差平方和Q達到最小,求偏差平方和Q對a0,a1,a2ap的偏導數,并令其等于0。經化簡后得到正規方程組。用矩陣形式表示正規方程組則正規方程組為nnPPnnnzzzzaaaAXpnXXXXXXXXXXXX101021321123121111322211ZXXXAZXXAXTTTT1)(那么,三、趨勢面模型的適度檢驗 1擬合度R2檢驗2.趨勢面模型的顯著性F檢驗 n為觀測值的個數 p為自變量的個數關于自由度模型中樣本值可以自由變動的個數,稱為自由度自由度=
39、樣本個數- 樣本數據受約束條件(方程)的個數例如,樣本數據個數=n,它們受k+1個方程的約束(這n個數必須滿足這k+1個方程)那么,自由度df = n-k-13.趨勢面適度的逐次檢驗四、應用舉例課本例題:1建立趨勢面模型Z=18.44-1.38x-1.54y(R2=0.915,F=119.74) Z=18.27-1.16143*x-1.49286y+0.07 xy -0.07143*x2-0.04286 y2(R2=0.92,F=43.73)2.模型檢驗(1)根據R2檢驗方法計算(2)顯著性F檢驗。在顯著性水平0.01下,二次趨勢面的F值,大于臨界值4.17;一次趨勢面模型的F值大于臨界值 5
40、.72。說明二者的整體顯著性均很高 。(3)一次和二次趨勢面回歸模型的逐次檢驗方差分析表 離差來源平方和自由度均方差F檢驗2次回歸214.77543.95543.722次剩余18.6625-5-10.9821次回歸213.82106.9119.741次剩余19.6425-2-10.893由1次增高到2次的回歸0.9730.3230.329結論:二次趨勢面,F值不顯著,則二次多項式對于回歸并無新貢獻。因此選取一次趨勢面比較合適。 第4節 時間序列分析時間序列分析的基本原理 趨勢擬合方法季節變動預測 自回歸模型時間序列:時間序列:各種社會、經濟、自然現象的數量指標按照時間次序排列起來的統計數據時間
41、序列分析模型:時間序列分析模型:解釋時間序列自身的變化規律和相互聯系的數學表達式一、時間序列分析的基本原理 (一)時間序列的組合成份(一)時間序列的組合成份 長期趨勢(長期趨勢(T, Trend T, Trend ) 是指時間序列隨時間的變化而逐漸增加或減少的長期變化的趨勢。季節變動(季節變動(S,SeasonalS,Seasonal) 是指時間序列在一年中或固定時間內,呈現出的固定規則的變動。 循環變動循環變動(C,CyclicalC,Cyclical) 是指沿著趨勢線如鐘擺般地循環變動,又稱景氣循環變動(business cycle movement) 。不規則變動(不規則變動(I,Irr
42、egularI,Irregular) 是指在時間序列中由于隨機因素影響所引起的變動。 405060708090100110120130123456789 10 11 12月銷量無趨勢60657075808590951001051357911 13 15 17 19 21 23月銷量線性趨勢9010011012013014015016017013579 11 13 15 17 19 21 23月銷量非線性趨勢02040608010012345678910 11 12月銷售額第一年第二年季節成分DateSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999
43、SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990SALES12010080604020某企業從某企業從19901990年年1 1月到月到20022002年年1212月的銷售數據月的銷售數據(單位:百萬元)(單位:百萬元) (二)時間序列的組合模型(二)時間序列的組合模型 加法模型 假定時間序列是基于4種成份相加而成的。長期趨勢并不影響季節變動。若以Y表示時間序列,則加法模型為Y=T+S+C+I乘法模型 假定時間序列是基于
44、4種成份相乘而成的。假定季節變動與循環變動為長期趨勢的函數。該模型的方程式為ICSTY (3.3.1) (3.3.2) ttYYY=T + S + C + IY=TS C I二、趨勢擬合方法 時間序列分析的平滑法主要有三類 :移動平均法 設某一時間序列為 y1,y2,yt,則t+1時刻的預測值為 式中: 為t點的移動平均值; n稱為移動時距。作用:消除干擾,顯示序列的趨勢性變化,并用于預測消除干擾,顯示序列的趨勢性變化,并用于預測趨勢趨勢)(1111101ntttntttnjjttyynynyyyynyty (一)平滑法(一)平滑法 (3.3.3) 滑動平均法滑動平均法 其計算公式為 式中:
45、為t點的滑動平均值;l為單側平滑時距。 若l=1,則(3.3.4)式稱為三點滑動平均,其計算公式為 若l=2,則(3.3.4)式稱為五點滑動平均, 其計算公式為)(12111) 1(lttttltlttyyyyyylyty 3/)(11ttttyyyy5/ )(2112ttttttyyyyyy (3.3.4) (3.3.5) (3.3.6) 指數平滑法指數平滑法 一次指數平滑 為平滑系數。一般時間序列較平穩,取值可小一些,一般?。?.05,0.3);若時間序列數據起伏波動比較大,則應取較大的值,一般?。?.7,0.95)。本期預測值是前期實際值和預測值的加權和本期預測值是前期實際值和預測值的加
46、權和ttnjjtjtyyyy)1()1(101 (3.3.7) 高次指數平滑法 二次指數平滑法的預測公式為 三次指數平滑法的預測公式 為 2kckbaytttktkbayttkt (3.3.8) (3.3.9) 三種最常用的趨勢線 直線型趨勢線直線型趨勢線指數型趨勢線指數型趨勢線 拋物線型趨勢線拋物線型趨勢線 btaytttaby2ctbtayt(二)趨勢線法(二)趨勢線法05010015020019811985198919931997汽車產量趨勢值 汽車產量直線趨勢汽車產量直線趨勢(年份)汽車產量(萬輛)二次趨勢模型二次趨勢模型描述拋物線型趨勢變化的描述拋物線型趨勢變化的數學模型數學模型Y
47、Yt t = b = b0 0 + b+ b1 1t + bt + b2 2t t2 2 + + t tYtt* tYt = b0 + b1t + b2t2二次曲線二次曲線048121619781980198219841986198819901992零售量趨勢值零售量(億件)針織內衣零售量二次曲線趨勢針織內衣零售量二次曲線趨勢(年份)指數增長趨勢變化指數增長趨勢變化時間序列模型時間序列模型Y Yt t = ab = abt t t t或或 Y Yt t = K + ab = K + abt t t tY Yt t = ae = aebtbt t tYtt*指數曲線指數曲線05010015020
48、025019811985198919931997汽車產量趨勢值汽車產量指數曲線趨勢汽車產量指數曲線趨勢(年份)汽車產量(萬輛)自相關性判斷自相關性判斷 時間序列的自相關,是指序列前后期數值之間的相關關系,對這種相關關系程度的測定便是自相關系數。 測度:設y1,y2,yt,yn,共有n個觀察值。把前后相鄰兩期的觀察值一一成對,便有(n1)對數據,即(y1,y2),(y2,y3),(yt,yt+1),(yn-1,yn)。(三)自回歸模型其一階自相關系數r1為1111211211111)()()(ntntttttntttttyyyyyyyyr二階自相關系數r2為2121222221222)()()(
49、ntntttttntttttyyyyyyyyrk階自相關系數為 kntkntktktktkntktktttkyyyyyyyyr11221)()()(自回歸模型的建立自回歸模型的建立 常見的線性自回歸模型: 一階線性自回歸預測模型為 二階線性自回歸預測模型為 一般地,p階線性自回歸模型為 在以上各式中, 為待估計的參數值,它們可以通過最小二乘法估計獲得。tttyy110ttttyyy22110tptpttyyy110), 2 , 1 , 0(pii基本步驟基本步驟 (1)對原時間序列求移動平均,以消除季節變動和不規則變動,保留長期趨勢; (2)將原序列y除以其對應的趨勢方程值(或平滑值),分離出
50、季節變動(含不規則變動),即 三、季節性預測法季節系數= TSCI/趨勢方程值(TC或平滑值)=SI (3)將月度(或季度)的季節指標加總,以由計算誤差導致的值去除理論加總值,得到一個校正系數,并以該校正系數乘以季節性指標從而獲得調整后季節性指標。 (4)求預測模型,若求下一年度的預測值,延長趨勢線即可;若求各月(季)的預測值,需以趨勢值乘以各月份(季度)的季節性指標。 求季節變動預測的數學模型(以直線為例)為 式中: 是t+k時的預測值; at、bt為方程系數; 為季節性指標。kttktkbay)(ktyk 例題:如表3.3.3所示,下面我們用上述步驟,預測該旅游景點2005年各季度的客流量。 表3.3.3 某旅游景點20022004年各季度客流量 解題步驟: (1)求時間序列的三次滑動平均值,見表3.3.3第5列。 (2)求季節性指標:將表3.3.3中第4列數據分別除以第5列各對應元素,得相應的季節系數。然后再把各季度的季節系數平均得到季節性指標,見表3.3.4。 季節性指標之和理論上應等于4。現等于 3.951 5,需要進行校正。校正方法是: 先求校正系數:=4/3.951 5=1.012 3。 然后將表中的第5行,分別乘以,即得校正后的季節性指標(見表3.3.4第6行)。表3.3.4 季節性指標及其校正值 (3)用二次指數平滑法,求預測模型系數:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農村牧場畜群托管及護理協議
- 配送勞務分包合同協議
- 退休合同聘用合同協議
- 配套幼兒園合同協議
- 車牌照租賃合同協議
- 車輛指定贈予合同協議
- 跟組演員簽約合同協議
- 校園文化協議書
- 淺談就業協議書
- 轉讓手表合同協議書范本
- 部門加班調休管理制度
- 2025-2030中國工業物聯網行業市場深度調研及發展前景與趨勢預測研究報告
- 考勤制度操作指南
- 人力核心指標 行業報告系列 2025年Q1精細化工行業薪酬報告
- 垃圾焚燒發電廠應急預案
- 動柱龍門合格證書
- 超星爾雅學習通《歷史的三峽:近代中國的思潮與政治(華東師范大學)》2025章節測試答案
- 村莊灣塘承包協議書8篇
- 打車安全意識教育
- 腎內科疾病臨床路徑
- 船舶修造知識培訓課件
評論
0/150
提交評論