《統(tǒng)計學-基于R》(第4版)課件:時間序列預測_第1頁
《統(tǒng)計學-基于R》(第4版)課件:時間序列預測_第2頁
《統(tǒng)計學-基于R》(第4版)課件:時間序列預測_第3頁
《統(tǒng)計學-基于R》(第4版)課件:時間序列預測_第4頁
《統(tǒng)計學-基于R》(第4版)課件:時間序列預測_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

賈俊平2024/1/30StatisticswithR統(tǒng)計學R語言賈俊平2024/1/3011.1時間序列的成分和預測方法11.2指數(shù)平滑預測11.3趨勢外推預測11.4分解預測11.5時間序列平滑

時間序列預測

思維導圖

11.1

時間序列的成分和預測方法什么是時間序列

11.1

時間序列的成分和預測方法時間序列的成分趨勢(trend)持續(xù)向上或持續(xù)向下的變動季節(jié)變動(seasonalfluctuation)在一年內(nèi)重復出現(xiàn)的周期性波動循環(huán)波動(Cyclicalfluctuation)非固定長度的周期性變動不規(guī)則波動(irregularvariations)除去趨勢、季節(jié)變動和周期波動之后的隨機波動稱為不規(guī)則波動只含有隨機波動而不存在趨勢的序列也稱為平穩(wěn)序列(stationaryseries)四種成分與序列的關(guān)系

11.1

時間序列的成分和預測方法時間序列的成分——例題分析【例11-1】(數(shù)據(jù):example11_1.csv)表11-1是2000—2018年我國發(fā)電量、居民消費水平、原煤產(chǎn)量和CPI(居民消費價格指數(shù))的時間序列數(shù)據(jù)。繪制圖形觀察其所包含的成分年份發(fā)電量居民消費水平原煤產(chǎn)量CPI(億千瓦小時)(元)(億噸)(上年=100)200013556369813.84100.4200114808.02395414.72100.7200216540425615.599.2200319105.75454218.35101.2200422033.09505621.23103.9200525002.6567123.65101.8200628657.26630225.7101.5200732815.53743427.6104.8200834668.82848329.03105.9200937146.51922631.1599.3201042071.61055034.28103.3201147130.191264637.64105.4201249875.531407539.45102.6201354316.351561539.74102.6201457944.571727138.74102201558145.731892937.47101.4201661331.62087734.11102201766044.472307035.24101.6201871117.732537836.83102.1

11.1

時間序列的成分和預測方法預測方法的選擇與評估一種預測方法的好壞取決于預測誤差的大小預測誤差是預測值與實際值的差距度量方法有平均誤差(meanerror)、平均絕對誤差(meanabsolutedeviation)、均方誤差(meansquareerror)、平均百分比誤差(meanpercentageerror)和平均絕對百分比誤差(meanabsolutepercentageerror)較為常用的是均方誤差(MSE)預測方法適合的數(shù)據(jù)模式對數(shù)據(jù)的要求預測期簡單指數(shù)平滑隨機波動5個以上短期Holt指數(shù)平滑線性趨勢5個以上短期至中期一元線性回歸線性趨勢10個以上短期至中期指數(shù)模型非線性趨勢10個以上短期至中期多項式函數(shù)非線性趨勢10個以上短期至中期Winter指數(shù)平滑趨勢和季節(jié)成分至少有四個周期的季度或月份數(shù)據(jù)短期至中期分解預測趨勢、季節(jié)和循環(huán)成分至少有四個周期的季度或月份數(shù)據(jù)短期、中期、長期

11.2

指數(shù)平滑預測指數(shù)平滑模型的一般表達——加法模型

11.2

指數(shù)平滑預測簡單指數(shù)平滑預測——例題分析

【例11-2】(數(shù)據(jù):example11_1.csv)沿用例11-1。采用簡單指數(shù)平滑模型預測2019年的CPI,并將實際值和預測值繪制成圖形進行比較#確定模型參數(shù)alpha和系數(shù)aexample11_1<-read.csv("C:/example/chap11/example11_1.csv")example11_1<-ts(example11_1,start=2000)cpiforecast<-HoltWinters(example11_1[,5],beta=FALSE,gamma=FALSE)cpiforecast

#歷史數(shù)據(jù)的擬合值cpiforecast$fitted#繪制觀測值和擬合值圖(圖11-3)par(mai=c(0.6,0.6,0.1,0.1),cex=0.7,lab=c(19,5,1))plot(example11_1[,5],type='o',xlab="時間",ylab="CPI")lines(example11_1[,1][-1],cpiforecast$fitted[,1],type='o',lty=2,col="blue")legend(x="topleft",legend=c("觀測值","擬合值"),lty=1:2,col=c(1,4),fill=c(1,4),box.col="grey80",inset=0.01,cex=0.8)#獲得樣本外的預測值(2019年)library(forecast)cpiforecast1<-forecast(cpiforecast,h=1)cpiforecast1

#實際值和預測值(2019年)圖(圖11-4)plot(cpiforecast1,type='o',xlab="時間",ylab="CPI",main="")

11.2

指數(shù)平滑預測

Holt指數(shù)平滑預測——例題分析在簡單指數(shù)平滑中,實際上是用期的平滑值作為期的預測值,它適合于較平穩(wěn)的序列。當時間序列存在趨勢時,簡單指數(shù)平滑的預測結(jié)果總是滯后于實際值Holt指數(shù)平滑預測模型,一般簡稱為Holt模型(Holt’smodel),適合于含有趨勢成分(或有一定的周期成分)序列的預測Holt模型使用兩個參數(shù)(平滑系數(shù))

(取值均在0和1之間)和三個方程【例11-3】(數(shù)據(jù):example11_1.csv)沿用例11-1。用Holt指數(shù)平滑模型預測2019年的發(fā)電量,并將實際值和預測值繪制成圖形進行比較#確定模型參數(shù)alpha和系數(shù)a#確定模型參數(shù)alpha和beta以及模型系數(shù)a和bexample11_1<-read.csv("C:/example/chap11/example11_1.csv")example11_1<-ts(example11_1,start=2000)powerforecast<-HoltWinters(example11_1[,2],gamma=FALSE)powerforecast #擬合圖(圖11-5)par(mai=c(0.6,0.6,0.1,0.1),cex=0.7,lab=c(19,5,1))plot(example11_1[,2],type='o',xlab="時間",ylab="發(fā)電量")lines(example11_1[,1][c(-1,-2)],powerforecast$fitted[,1],type='o',lty=2,col="blue")legend(x="topleft",legend=c("觀測值","擬合值"),lty=1:2,col=c(1,4),fill=c(1,4),cex=0.8)#2019年發(fā)電量的預測library(forecast)powerforecast<-forecast(powerforecast,h=1)powerforecast

#實際值和預測值圖(圖11-6)par(mai=c(0.6,0.6,0.2,0.1),cex=0.7,lab=c(19,5,1))plot(powerforecast,type='o',xlab="時間",ylab="發(fā)電量",main="")csv("C

11.2

指數(shù)平滑預測

Winter指數(shù)平滑預測——例題分析簡單指數(shù)平滑模型適合于對平穩(wěn)序列(沒有趨勢和季節(jié)成分)的預測;Holt指數(shù)平滑模型適合于含有趨勢成分但不含季節(jié)成分序列的預測如果時間序列中既含有趨勢成分又含有季節(jié)成分,則可以使用Winter指數(shù)平滑模型進行預測要求數(shù)據(jù)是按季度或月份收集的,而且至少需要4年(4個季節(jié)周期長度)以上的數(shù)據(jù)Winter指數(shù)平滑模型包含三個平滑參數(shù)即、和

(取值均在0和1之間)和四個方程【例11-4】(數(shù)據(jù):example11_4.csv)表11-3是一家飲料生產(chǎn)企業(yè)2016—2020年各季度的銷售量數(shù)據(jù)。采用Winter模型預測2021年的銷售量,并將實際值和預測值繪制成圖形進行比較月份2016年2017年2018年2019年2020年1月116.2136.3151.2163.2172.82月111.8133.0144.5152.6164.23月128.2152.2170.9173.8194.94月129.1150.2167.0167.0190.15月129.6152.6170.4174.2201.66月151.2179.5202.6208.8226.67月174.7198.2223.2235.7263.08月166.6194.4224.2242.4268.39月149.8170.4193.9193.9222.210月131.5146.9166.6172.3195.411月113.8130.1146.4148.8173.812月133.4146.9161.3161.8194.4

11.2

指數(shù)平滑預測

Winter指數(shù)平滑預測——例題分析#確定模型參數(shù)系數(shù)a、b和slibrary(reshape2);library(forecast)example11_4<-read.csv("C:/example/chap11/example11_4.csv",s=FALSE)df<-melt(example11_4,="年份",="銷售量")#融合數(shù)據(jù)df.ts<-ts(df[,3],start=2016,frequency=12)#定義為時間序列對象saleforecast<-HoltWinters(df.ts)saleforecast#Winter模型的擬合圖(圖11-8)par(mai=c(0.6,0.6,0.1,0.1),las=1,mgp=c(3,1,0),lab=c(6,6,1),cex=0.7,cex.lab=1)plot(df.ts,type='o',pch=19,xlab="時間",ylab="銷售量")lines(saleforecast$fitted[,1],type='o',lty=5,col=4)legend(x="topleft",legend=c("觀測值","擬合值"),lty=c(1,5),col=c(1,4),fill=c(1,4))#Winter模型2021年的預測library(forecast)saleforecast1<-forecast(saleforecast,h=12)saleforecast1#Winter模型的預測圖(圖11-9)plot(saleforecast1,type='o',xlab="時間",ylab="銷售量",main="")abline(v=2021,lty=6,col="red")

11.3

趨勢外推預測線性趨勢——例題分析線性趨勢:是時間序列按一個固定的常數(shù)(不變的斜率)增長或下降擬合一條線性趨勢方程進行預測【例11-5】(數(shù)據(jù):example11_1.csv)沿用例11-1。用一元線性回歸方程預測預測2019年的發(fā)電量,將實際值和預測值繪制成圖形進行比較,同時將預測的殘差與Holt模型預測的殘差繪制成圖形進行比較

#擬合一元線性回歸模型example11_1<-read.csv("C:/example/chap11/example11_1.csv")fit<-lm(發(fā)電量~年份,data=example11_1)summary(fit)#各年預測值predata<-predict(fit,data.frame(年份=2000:2019));predata

#各年預測殘差res<-fit$res;res

#各年觀測值和預測值圖(圖11-10)par(mai=c(0.6,0.6,0.1,0.1),lab=c(7,6,1),cex=0.7,cex.lab=1)plot(2000:2019,predata,type='o',lty=2,col="blue",xlab="時間",ylab="發(fā)電量")lines(example11_1[,1],example11_1[,2],type='o',pch=19)legend(x="topleft",legend=c("觀測值","預測值"),lty=1:2,cex=0.8,col=c(1,4),fill=c(1,4))abline(v=2018,lty=6,col=2)

11.3

趨勢外推預測非線性趨勢——指數(shù)曲線——例題分析時間序列以幾何級數(shù)遞增或遞減一般形式為【例11-6】(數(shù)據(jù):example11_1.csv)沿用例11-1。用指數(shù)曲線預測2019年的居民消費水平

#指數(shù)曲線擬合example11_1<-read.csv("C:/example/chap11/example11_1.csv")example11_1<-ts(example11_1,start=2000)y<-log(example11_1[,3])x<-1:19fit<-lm(y~x)fitexp(8.008)#歷史數(shù)據(jù)及2019年居民消費水平的預測predata<-exp(predict(fit,data.frame(x=1:20)))predata#各年預測殘差predata<-exp(predict(fit,data.frame(x=1:19)))predata<-ts(predata,start=2000)residuals<-example11_1[,3]-predataresiduals#預測圖(圖11-12)par(mai=c(0.6,0.6,0.1,0.1),lab=c(19,6,1),cex=0.7,cex.main=1,font.main=1)predata<-exp(predict(fit,data.frame(x=1:20)))plot(2000:2019,predata,type='o',lty=2,col=4,xlab="時間",ylab="居民消費水平")points(example11_1[,1],example11_1[,3],type='o',pch=19)legend(x="topleft",legend=c("觀測值","預測值"),lty=1:2,col=c(1,4),fill=c(1,4),cex=0.8)abline(v=2018,lty=6,col=2)#殘差圖(圖11-13)plot(2000:2018,residuals,type='o',lty=2,xlab="時間",ylab="residuals")abline(h=0,lty=2,col=2)residuals

11.3

趨勢外推預測非線性趨勢——多階曲線有些現(xiàn)象的變化形態(tài)比較復雜,它們不是按照某種固定的形態(tài)變化,而是有升有降,在變化過程中可能有幾個拐點。這時就需要擬合多項式函數(shù)當只有一個拐點時,可以擬合二階曲線,即拋物線;當有兩個拐點時,需要擬合三階曲線;當有k-1個拐點時,需要擬合k階曲線k階曲線函數(shù)的一般形式為可線性化后,根據(jù)最小二乘法求

11.3

趨勢外推預測非線性趨勢——多階曲線——例題分析【例11-7】(數(shù)據(jù):example11_1.csv)沿用例11-1。分別擬合二階曲線和三階曲線預測2019年的原煤產(chǎn)量,并將實際值和預測值繪制成圖形進行比較,同時將二階曲線的預測殘差與三階曲線的預測殘差繪成圖形進行比較#擬合二階曲線模型example11_1<-read.csv("C:/example/chap11/example11_1.csv")y<-example11_1[,4]x<-1:19fit1<-lm(y~x+I(x^2));fit1#二階曲線預測值(predata1)predata1<-predict(fit1,data.frame(x=1:20));predata1

#二階曲線預測值的殘差(residual1)residual1<-fit1$residuals;residual1#三階曲線預測模型fit2<-lm(y~x+I(x^2)+I(x^3));fit2#三階曲線預測值(predata2)predata2<-predict(fit2,data.frame(x=1:20));predata2#三階曲線預測值殘差(residual2)residual2<-fit2$residuals;residual2

11.4

分解預測分解預測——步驟分解(decomposition)預測是適合于含有趨勢、季節(jié)、循環(huán)多種成分序列預測的一種古典方法,仍得到廣泛應用,因為該方法相對來說容易理解,結(jié)果易于解釋,在很多情況下能給出很好的預測結(jié)果預測步驟確定并分離季節(jié)成分計算季節(jié)指數(shù),以確定時間序列中的季節(jié)成分將季節(jié)成分從時間序列中分離出去,即用每一個觀測值除以相應的季節(jié)指數(shù),以消除季節(jié)性對消除季節(jié)成分的序列建立線性預測模型進行預測計算出最后的預測值用預測值乘以相應的季節(jié)指數(shù),得到最終的預測值季節(jié)指數(shù)計算步驟計算移動平均值(季度數(shù)據(jù)采用4項移動平均,月份數(shù)據(jù)采用12項移動平均),并將結(jié)果進行“中心化”計算移動平均的比值,也稱為季節(jié)比率將序列的各觀測值除以相應的中心化移動平均值,然后再計算出各比值的季度(或月份)平均值,即季節(jié)指數(shù)季節(jié)指數(shù)調(diào)整各季節(jié)指數(shù)的平均數(shù)應等于1或100%,若根據(jù)第2步計算的季節(jié)比率的平均值不等于1時,則需要進行調(diào)整具體方法是:將第2步計算的每個季節(jié)比率的平均值除以它們的總平均值

11.4

分解預測分解預測——例題分析【例11-8】(數(shù)據(jù):example11_4.csv)表11-3是一家飲料生產(chǎn)企業(yè)2016—2020年各季度的銷售量數(shù)據(jù)。采用分解法預測2021年各季度的飲料銷售量,并將實際值和預測值繪制成圖形進行比較月份2016年2017年2018年2019年2020年1月116.2136.3151.2163.2172.82月111.8133.0144.5152.6164.23月128.2152.2170.9173.8194.94月129.1150.2167.0167.0190.15月129.6152.6170.4174.2201.66月151.2179.5202.6208.8226.67月174.7198.2223.2235.7263.08月166.6194.4224.2242.4268.39月149.8170.4193.9193.9222.210月131.5146.9166.6172.3195.411月113.8130.1146.4148.8173.812月133.4146.9161.3161.8194.4#計算季節(jié)指數(shù)example11_4<-read.csv("C:/example/chap11/example11_4.csv",s=FALSE)df<-reshape2::melt(example11_4,="年份",="銷售量")df.ts<-ts(df[,3],start=2016,frequency=12)#把數(shù)據(jù)定義為時間序列對象salecompose<-decompose(df.ts,type="multiplicative")#分解序列成分names(salecompose)#顯示成分的名稱salecompose$seasonal#輸出季節(jié)成分#繪制成分分解圖(圖11-16)par(mai=c(0.5,0.7,0.1,0.1),cex=0.7,cex.lab=0.8,cex.main=0.8,font.main=1)plot(salecompose,type='o',col="red4")#季節(jié)調(diào)整后的序列圖(圖11-17)par(mai=c(0.6,0.6,0.1,0.1),lab=c(5,6,2),cex=0.7,cex.main=1,font.main=1)seasonaladjust<-df.ts/salecompose$seasonalplot(df.ts,xlab="時間",ylab="銷售量",type='o',pch=19,main="")lines(seasonaladjust,type='l',lty=6,lwd=1,col="blue")legend(x="topleft",legend=c("銷售量","銷售量的季節(jié)調(diào)整"),lty=1:2,fill=c(1,4))

11.4

分解預測分解預測——例題分析#擬合季節(jié)調(diào)整后序列的線性模型x<-1:60fit<-lm(seasonaladjust~x);fit#最終預測值(以季節(jié)周期格式輸出)predata<-predict(fit,data.frame(x=1:72))*rep(salecompose$seasonal[1:12],6)predata<-ts(predata,start=2016,frequency=12);predata

#計算預測的殘差residuals1<-df.ts-predict(fit,data.frame(x=1:60))*salecompose$seasonalresiduals1<-ts(residuals1,start=2016,frequency=12);round(residuals1,4)

11.4

ARIMA模型預測分解預測——步驟【例】2002—2017年,社會消費品零售總額——ARIMA預測##圖形分析:自相關(guān)和偏自相關(guān)圖retail<-read.csv("C:/example/chap11/retail.csv")retail<-ts(retail[,3],start=2002,frequency=12)par(mai=c(.8,.8,.2,.2),mfrow=c(1,2),cex=0.8)acf(retai

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論