




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、成都空氣污染指數API的建模與預測20085728 劉童超【目錄】1.數據來源與數據預處理11.1數據來源11.2離群點和缺失值的檢驗22.直觀分析和相關分析32.1直觀分析和特征分析32.2相關分析52.3平穩性檢驗63.liu(t)序列的零均值處理73.1數據的零均值化73.2零均值過程的檢驗74.模型的識別和初步定階85.模型的參數估計106.模型的檢驗106.1參數的顯著性檢驗106.2模型的適用性檢驗117.模型的預測137.1對序列liu1(t)的預測137.2對序列liu(t)的預測13【附錄及參考文獻】14附錄1.零均值化處理后的數據14參考文獻:151.數據來源與數據預處理1
2、.1數據來源原始數據見附件,我們需要的數據見下表:表1-1模型所需的數據時間160159158157156155154153152151API68608476718155453635時間150149148147146145144143142141API5387889711399821009583時間140139138137136135134133132131API787363444463116726962時間130129128127126125124123122121API89856737425145564853時間120119118117116115114113112111API465445
3、34769685646596時間110109108107106105104103102101API94869763996247646248時間100999897969594939291API44876368556575856659時間90898887868584838281API48354450605443455485時間80797877767574737271API72494060608383917566時間70696867666564636261API74735571815667879081時間60595857565554535251API76582845528393696081時間504
4、94847464544434241API46525781766258654872時間40393837363534333231API64638062646555797756時間30292827262524232221API304274666264811005863時間20191817161514131211API94868383634343465561時間10987654321API65506159796240286592此處一共160個數據,其中1150用來建立模型,我們稱為樣本,151160用來檢驗預測值與真實值的誤差,我們成為檢驗值。其中的時間的意義是:t=1代表日期2010-5-30,t
5、=2代表日期2010-5-31,t=3代表日期2010-6-1,以此類推,t=160代表日期2010-11-4。數據中的API為空氣污染指數,我國目前采用的空氣污染指數(API)分為五個等級,API50,說明空氣質量為優,相當于國家空氣質量一級標小準;50<API100,表明空氣質量良好,相當于達到國家質量二級標準;100<API200,表明空氣質量為輕度污染,相當于國家空氣質量三級標準;200<API300表明空氣質量差,稱之為中度污染,為國家空氣質量四級標準;API>300表明空氣質量極差,已嚴重污染。由SPSS分析出來的結果見表1-2表1-2描述統計量N全距極小值
6、極大值均值標準差方差污染指數150882811666.4118.069326.485有效的 N (列表狀態)150由表1-2可以看出,數據個數為150個,沒有缺失值。=66.41,=18.07數值與平均值的距離見圖1-1圖1- 1由圖1-1可以看出,對任意時間t,都在-與之間,所以我們可以得出結論,該數據沒有離群點。綜上所述,需要建模的數據正常既沒有離群點,也沒有缺失值。2.直觀分析和相關分析2.1直觀分析和特征分析在eviews軟件中,我們將該數據命名為liu(t)。用eviews畫出的折線圖如圖2-1圖2- 1由圖可以看出,該數據圍繞60上下波動,但有較明顯的周期性。通過eviews畫出的
7、柱狀統計圖見圖2-2圖2- 2由以上圖表可以看出:樣本liu(t)的均值=66.4,中位數為64,最大值為116,最小值為28,樣本標準差=18.69,偏度為0.24,峰度為2.54,由于相伴概率為0.256,大于0.05,所以我們接受數據服從正態分布的假設,故認為原數據是正態分布數據。檢驗樣本是否服從正態分布也可以用用P-P圖和Q-Q圖來檢驗,SPSS做出的PP圖見圖2-3圖2- 3P-P圖基本是一條直線,說明它的分布對稱,服從正態分布,進一步驗證了以上的結論。2.2相關分析在eviews中作出自相關系數和偏相關系數圖,結果見圖2-4圖2- 4自相關系數圖和偏相關系數圖兩側的虛線之心水平=0
8、.05的置信帶,稱為barlett線,意思是如果系數落在barlett線內,我們可以認為該系數等于零。由圖2-4可以看出,兩階以后的自相關系數和偏相關系數基本都落在barlett線內,所以我們可以認為該數據平穩,為了進一步說明這個問題,我們在進行一次單位根檢驗以驗證該數據的平穩性。2.3平穩性檢驗在eviews中執行viewUnite root test.檢驗結果如圖2-5圖2- 5由上圖可以得知,t統計量的值時-6.95,小于顯著性水平下的臨界值,拒絕原假設,也就是說序列liu(t)不存在單位根,該系統是平穩的,進一步驗證了2.2的結果,也證明由圖2-1推斷出來的季節性是不存在的。由上圖知,
9、其中的檢驗式為: (2-1)3.liu(t)序列的零均值處理3.1數據的零均值化對于均值非零的數據,一般有兩種處理方法,一是建立非中心化的ARMA模型,將序列的均值作為一個參數估計,但是需要估計的參數要比中心化的ARMA模型多一個,于是在這里我們采用另一種方法,用樣本均值作為樣本均值u的估計,即零均值處理,下面是具體過過程。新序列liu1(t)=liu(t)-=liu(t)-66.4。零均值化后的序列數據見附錄1.3.2零均值過程的檢驗在對liu(1)序列執行命令“viewDescriptive StatisticsHistogram and Stats”得到柱狀統計圖,結果見圖3-1圖3-
10、1因為時間序列liu(1)的均值為-0.165,標準差為18,樣本均值落在02當中,所以我們接受均值為0的原假設,表明序列liu(1)已經是一個零均值序列。4.模型的識別和初步定階時間序列liu1(t)的自相關系數和偏相關系數見圖4-1圖4- 1由上圖可以看到,樣本的自相關系數較大,而其余的自相關系數都落在barlett線以內,而且當k>1時,自相關函數都落在該范圍內,所以時間序列liu1(t)在1步后是截尾的,因此可以用MA(1)模型進行擬合。對于偏相關系數,我們也可以看出,只有較大,其余都很小,且大于一階的樣本偏相關系數幾乎都滿足,雖然為-0.166,其絕對值略大于0.1633,但由
11、于簡約性原則,我們仍然認為其偏相關系數在一步之后截尾的,因此可以用AR(1)來對數據擬合。根據Box-Jenkins建模方法,一般初步設定的模型是ARMA(n,n-1),即自回歸的階數比移動平均的階數高一階,于是這里我們將初步模型定為ARMA(2,1)。5.模型的參數估計參數的估計一般有三種方法:矩估計;最小二乘估計;極大似然估計。但是由于矩估計太簡單,精度低,只實用于做初估計,而極大似然估計計算量非常大,特別是對于ARMA模型,似然函數公式十分復雜,所以我們這里采用最小二乘估計。利用eviews軟件可以得到各個模型中的參數的最小二乘估計和剩余平方和和AIC值,ARMA(2,1)模型結果如表5
12、-1表5- 1模型結構參數最小二乘估計AIC值剩余平方和AR(1)8.32205335167.39AR(2)8.28444633182.94MA(1)8.33327035807.65ARMA(1,1)8.31463534438.95ARMA(2,1)8.29803233182.29由于AIC值和剩余平方和越小,模型越恰當,所以,從上表可以看到,選用AR(2)模型最恰當。6.模型的檢驗6.1參數的顯著性檢驗該模型參數檢驗的目的是看是否有系數顯著為零。在eviews命令窗口中輸入“ls liu1 ar(1) ar(2)”便得到參數檢驗的結果,詳細結果見圖6-1圖6- 1由的相伴概率可以看出,我們應
13、該接受=0的原假設,令=0,繼續用AR(1)擬合數據,參數檢驗的結果如圖6-2圖6- 2由相伴概率和單位根可以看到,利用AR(1)模型對序列liu1(t)進行擬合比較恰當。6.2模型的適用性檢驗對AR(1)進行適用性檢驗,殘差序列的樣本自相關系數如圖6-3圖6- 3從自相關系數值可以看出,幾乎所有 (6-1)但=-0.167,=0.25不滿足式子6-1,這說明序列liu1(t)中還有少量的自相關信息沒有被提出出來,這也是該模型的不足。由圖6-2所得到的系數可知,時間序列liu1(t)的模型為:liu1(t)=+0.517850liu1(t-1) (6-2) 原序列liu(t)的模型為:liu(
14、t)=liu1(t) +66.41 (6-3)7.模型的預測7.1對序列liu1(t)的預測對于t=151到160的數據,利用差分形式進行預測時間序列liu1(t),即:liu1(t)=0.517850liu1(t-1) (t=151,152160)其預測值見表7-1表7- 1t151152153154155156157158159160Liu1(t)-6.93-3.59-1.86-0.96-0.50-0.25-0.13-0.07-0.04-0.027.2對序列liu(t)的預測對原始時間序列liu(t)的預測采用公式6-3即:liu(t)=liu1(t) +66.41其詳細值見表7-2表7-
15、 2t151152153154155156157158159160forecast59636565666666666666real35364555817176846068殘差圖如下:圖7- 1由殘差圖可見,該模型不是非常的擬合原數據,其實,這種結果其實在8.2進行使用性檢驗時就應該預料到,還有,在四步預測之后,預測數據就趨于一個定值,這與實際情況已經矛盾了,所以該模型不能用來做長期預測。不過由于API的劃分是0,50為一級空氣的標準,(50,100為二級空氣的標準,所以預測的空氣質量等級并沒有改變,這也是該模型的可取之處。【附錄及參考文獻】附錄1.零均值化處理后的數據表 附錄- 1t12345
16、678910liu1(t)25.6-1.4-38.4-26.4-4.412.6-7.4-5.4-16.4-1.4t11121314151617181920liu1(t)-5.4-11.4-20.4-23.4-23.4-3.416.616.619.627.6t21222324252627282930liu1(t)-3.4-8.433.614.6-2.4-4.4-0.47.6-24.4-36.4t31323334353637383940liu1(t)-10.410.612.6-11.4-1.4-2.4-4.413.6-3.4-2.4t41424344454647484950liu1(t)5.6-1
17、8.4-1.4-8.4-4.49.614.6-9.4-14.4-20.4t51525354555657585960liu1(t)14.6-6.42.626.616.6-14.4-21.4-38.4-8.49.6t61626364656667686970liu1(t)14.623.620.60.6-10.414.64.6-11.46.67.6t71727374757677787980liu1(t)-0.48.624.616.616.6-6.4-6.4-26.4-17.45.6t81828384858687888990liu1(t)18.6-12.4-21.4-23.4-12.4-6.4-16.4-22.4-31.4-18.4t919293949596979899100liu1(t)-7.4-0.418.68.6-1.4-11.41.6-3.420.6-22.4t101102103104105106107108109110liu1(t)-18.4-4.4-2.4-19.4-4.432.6-3.430.619.627.6t111112113114115116117118119120liu1(t)29.6-1.4-2.418.629.69.6-32.4-21.4-12.4-20.4t121122123124125126127128129130liu1(t)-13.4-18.4-10
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030中國五谷酒行業發展趨勢分析與未來投資戰略咨詢研究報告
- 2025至2030中國PaaS服務行業市場發展分析及應用前景報告
- 2025至2030中國IFS食品認證行業發展趨勢分析與未來投資戰略咨詢研究報告
- 2025-2030年特種物流行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年棉業行業市場深度調研及前景趨勢與投資研究報告
- 車輛質押典當與新能源汽車租賃服務合同
- 醫療衛生機構財稅代理與醫療服務稅合同
- 餐飲行業食品安全教育培訓合作協議
- 彩鋼屋頂防水保溫施工合同范本下載
- XX國際貿易代理合同范本
- 總復習(教案)2023-2024學年數學 四年級下冊 北師大版
- 工程量計算書(全部)
- 經偵總論試題
- 陜西省安康市教育聯盟2023-2024學年高一下學期期末考試數學試卷
- 2023-2024學年景德鎮市珠山區數學五年級第二學期期末監測試題含解析
- 小鎮文旅康養項目可研報告【健康養老】【旅游康養】
- 2024廣西公需課高質量共建“一帶一路”譜寫人類命運共同體新篇章答案
- EHS專項施工EHS管理組織機構
- 2024年南安市國有資本投資運營有限責任公司招聘筆試沖刺題(帶答案解析)
- T/CEC 143-2017 超高性能混凝土電桿完整
- MOOC 工程電磁場與波-浙江大學 中國大學慕課答案
評論
0/150
提交評論