




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PAGE8南昌市空氣質量預測實證分析案例目錄TOC\o"1-3"\h\u18506南昌市空氣質量預測實證分析案例 1310991.1基于BP神經網絡的等級預測 1169771.1.1設計思路 186391.1.2數據集處理和劃分 2102561.1.3神經網絡結構設定 2286691.1.4空氣質量等級分類預測結果分析 3280371.2 基于GRA-WOA的BP神經網絡預測模型 58191.2.1算法流程 5114621.2.2模型建立與結果分析 6286491.2.3不同模型實驗對比 8102061.3首要污染物PM10濃度的預測 8309971.3.1自回歸XGBoost時序預測模型設計 8252411.3.2數據來源與平穩性檢驗 9300171.3.3模型預測結果分析 101.1基于BP神經網絡的等級預測1.1.1設計思路空氣質量指數(AQI)可以用來分析空氣質量的狀況,通過相關性分析可知,空氣質量指數與六項污染物的濃度大小密切相關;同時,大量研究表明,空氣質量與氣象因素具有一定的相關性,并且它們的相關性之間存在一定的非線性的特性。綜合以上信息,本文的研究利用了BP神經網絡能夠很好地解決非線性問題這個特點,應用于空氣質量等級預測的分析。由于社會經濟影響因素的可獲得性和其數據大部分是年度或月度數據,在實際的空氣質量等級預測過程中,社會經濟因素的逐日變化較小,對等級預測準確度影響較小。因此,本文模型的設計思路大致為選擇南昌市空氣污染物的歷史數據及與之對應的氣象數據作為原始數據集,并且利用相關方法對此數據進行預處理,預處理好的數據作為模型的輸入數據集,接著對輸入數據集按照一定比例劃分訓練集和測試集;通過MATLAB軟件中所存在的BP神經網絡工具箱來實現模型的創建,并設定好相關的參數,最終建立基于BP神經網絡的空氣質量等級預測模型。然后把劃分好的訓練集數據在模型中不斷訓練,用測試集數據來驗證訓練好的模型的性能,得到最終測試結果,用相關模型評估指標對其進行評價,以確定模型的可靠程度。1.1.2數據集處理和劃分BP神經網絡的訓練數據集中的樣本數對整個模型的預測準確度具有很大的影響。若訓練樣本過少,會導致模型訓練不夠充分,難以達到較好的訓練效果;若訓練樣本過多,可能導致網絡過度擬合,對模型的預測精度會產生一定影響。本文研究所選城市為江西省南昌市,在模型中使用的數據可以分為2類:①空氣質量實時監測的逐日數據,每日數據包含了8個數據指標的數據,來源于真氣網;②氣象基站數據,數據的選取來自中國氣象局的官方網站,包括8個方面的監測信息。數據監測時間是從2016年1月1日至2019年5月31日,時間跨度為41個月,一共1247條原始數據,將這些原始數據按照第三章所介紹的數據預處理步驟進行相關處理,按照季節劃分為四個數據集。在進行訓練集和測試集的劃分時,統一以7:3的比例進行劃分,用于模型的訓練和結果預測。1.1.3神經網絡結構設定BP神經網絡算法,它包含了輸入層、隱含層和輸出層。影響BP神經網絡性能的重要參數為輸入輸出層神經元個數、隱含層的神經元個數、訓練函數和傳遞函數等。因此,在進行模型創建過程中,我們需要對相關參數的設定進行謹慎考慮。(1)網絡層數。BP神經網絡一般是由1個輸入層、1個或者多個隱含層以及1個輸出層共同構成。其中,隱含層的層數對模型的訓練效率與預測結果具有很大的影響,太多的隱含層會讓模型的訓練變得更加復雜,大大增加訓練的時間,因此,選取合適的隱含層數目十分重要。如果隱含層中的節點數很多的時候,即使隱含層只有一個,同樣能夠實現對所以非線性函數的逼近。綜上所述,考慮到模型訓練用時與數據的實際情況,本文只是對空氣質量等級進行分類預測,而非預測各項污染物的濃度,故最終選擇只包含一個隱含層的BP神經網絡進行訓練與預測。(2)輸入輸出層神經元個數。BP神經網絡的輸入層節點數與訓練樣本的維數密切相關。若訓練樣本維數過高,則會導致網絡訓練計算量過大、訓練時間過長,整個訓練過程效率低下。本文基于空氣質量和氣象數據的研究,BP模型輸入數據為原始空氣質量數據和氣象指標數據,輸入層的神經元數量為25個。如果按照季節劃分數據集,則它的個數為24個。對于輸出層,因為本文要對空氣質量等級進行分類預測,輸出目標為空氣質量的等級,所以輸出數據節點數為1。(3)傳遞函數。BP神經網絡模型常用的函數包括了Sigmoid函數、tanh函數、Purelin函數。隱含層大都會使用到Sigmoid函數,但其輸出層則通常會選擇Purelin函數。經過不斷重復測試,本文BP神經網絡預測模型的隱含層最終采取logsig函數,輸出層選用Purelin函數。(4)隱含層節點數。目前,還沒有一個完整、可靠的理論能夠對BP隱含層節點數的選取提供指導。對于一個擁有三層結構的神經網絡,隱含層節點的數目體現著其非線性的程度,如果隱含層節點數過少時,網絡的泛化性能及容錯性就會較差;但神經網絡的隱含層節點數過多時,其訓練時間則會大大增加,并且訓練效果不一定好。因此,要找到合適的節點數需要根據經驗進行多次的試驗。常用的選取隱含層節點數的經驗公式為:(1.1)如公式(1.1)所示。m是隱含層的節點數;a是輸入層節點數;b是輸出層節點數;c為常數,在1到10中選擇。經過大量測試,最終BP神經網絡的隱藏層節點是11個。1.1.4空氣質量等級分類預測結果分析在上小節中對數據集中的各項數據進行了相關的處理后,獲得了原始數據集。為了研究BP神經網絡的空氣質量等級預測模型的訓練和預測準確度,由于各季節的污染物濃度和氣象情況相差較為懸殊,首先,將得到的原始數據集按照季節劃分為四個數據集,把它們與完整的數據集作為輸入數據分別輸入到預測模型中,用于模型的訓練。把劃分好的測試集放入到訓練好的模型中去,然后進行檢驗,其測試結果如表1.1所示。表1.1各季節BP神經網絡預測準確率時間分類準確率錯誤率春季63.4490%36.551%夏季56.3265%42.6735%秋季62.3213%37.6787%冬季69.5253%30.4747%整個四季71.8081%24.1909%(a)春季分類結果(b)夏季分類結果(c)秋季分類結果(d)冬季分類結果(e)整個四季BP神經網絡分類結果圖1.1各季節BP神經網絡分類預測結果對比圖如圖1.1所示。不同季節的空氣質量等級分類結果圖相對比,可以發現,BP神經網絡在這時間維度的預測結果相差不是很大,具體的分類結果差異都表現在“差”這個第三等級上,如圖所示,冬季在第三等級分類預測效果比其他季節分類預測較好。具體的分類預測效果需要根據模型的最終預測準確率來看。由表1.1可以得知,BP神經網絡在不同時間分類預測精度存在差異,不同時間的分類預測準確度分別為63.4490%、56.3265%、62.3213%、69.5253%、71.8081%,從它們的分類預測準確度來看,BP神經網絡模型對南昌市空氣質量等級的分類精度在不同時間的預測效果較差,仍有提高的空間,所以為了提高這個模型預測的準確率,需要利用好智能算法,用其來對預測模型進行相關的優化。1.2 基于GRA-WOA的BP神經網絡預測模型1.2.1算法流程鯨魚優化算法在參數的調整、避免出現局部最優以及相關的操作等方面存在明顯的優勢,并且灰色關聯分析能快速地篩選出關聯度高的影響因素。由此提出了基于鯨魚智能算法和灰色關聯分析改進BP神經網絡的GRA-WOA-BP模型。其主要的算法流程如下:(1)爬取南昌市的空氣質量與氣象相關數據,并且利用第三章中數據的預處理方法進行相關處理;(2)將預處理完的數據進行灰色關聯分析,作為輸入數據,并且按照一定比例劃分訓練集和測試集;(3)參數初始化。確定最大迭代次數T、權值與閾值的上下邊界、鯨魚的數量,把訓練的誤差當成適應度函數;(4)確定單個鯨魚自身的適應度值,保留最佳鯨魚與其所在的位置;(5)當n<T時,更新參數A、C、l、p和b;(6)當p的值小于0.5時,如果A的絕對值也小于1,則根據公式(3-8)來對鯨魚的位置進行更新;若A的絕對值大于等于1,就需要按照公式(2-13)來任意尋找一個鯨魚,并且更新其位置;(7)當p≥0.5時,根據公式(3-11)來更新鯨魚位置;(8)計算當前群體中最優個體,并保存個體位置。判斷是n>T,是則進入下一步;否則令n=n+1,重復執行(5)~(7)步;(9)輸出最優鯨魚位置,記錄最優權值和閾值;(10)將得到的最優權值和閾值用于BP神經網絡訓練模型的訓練,得到精確高的訓練模型;(11)將測試數據用于優化的BP神經網絡進行空氣質量分類預測,得出的結果進行反標準化處理,獲得最終預測精確率。1.2.2模型建立與結果分析在1.1節中,將數據集化為四個不同季節的數據集,經過模型測試,可以發現模型的預測效果不是那么好,還有待提高預測準確率,因此,在這次模型訓練中,以完整的數據集為例,仍然使用南昌市2016年1月1日至2019年5月31日的1247條空氣質量數據和同期的氣象數據作為數據集,通過第3章的數據預處理環節對數據進行預處理,再對預處理好的數據進行灰色關聯分析,選取關聯程度高的指標,形成新的數據集,作為實驗所需的新數據集,并按照7:3的比例進行劃分,將數據劃分為訓練集與測試集之后,按照1.2.1節的算法流程,在MATLAB軟件中進行模型的建立,可以得到一個模型預測分類結果;在該模型基礎上引入了鯨魚優化算法,鯨魚算法它的參數a是由2線性下降到0,其中最大迭代數是100,通過對鯨魚數量的多次測試,最終鯨魚數量確定為20。BP神經網絡的各個參數如1.1.3節所示,根據輸入數據的維度對BP模型的各參數進行輕微調整。運用該算法對BP神經網絡模型進行最佳參數的查找,以提高預測準確度。將基于灰色關聯分析改進的GRA-BP模型與本節的GRA-WOA-BP模型進行比較,它們的分類預測結果如圖1.2、圖1.3所示。圖1.2GRA-BP模型等級分類預測圖圖1.3GRA-WOA-BP模型等級分類預測圖在圖1.2、圖1.3中,可以看到GRA-BP預測模型和GRA-WOA-BP預測模型的分類結果,改進后的預測模型分類效果比較好;但分類預測圖只能直觀地查看分類效果,具體的模型分類預測的精度如表1.2所示。表1.2各模型分類預測準確率方法GRA-WOA-BPGRA-BPBP分類精度91.1969%83.8007%71.8081%425/447385/447339/447實驗結果表明,GRA-BP模型、GRA-WOA-BP模型分類預測精度分別為83.8007%,91.1969%,基于灰色關聯分析的BP神經網絡模型比基礎模型預測準確度提高了7.9%。在這基礎上引入鯨魚算法形成的GRA-WOA-BP模型分類預測誤差減小幅度更加明顯,換言之,GRA-WOA-BP模型預測準確率有了大幅度的提升。因此,對于空氣質量等級分類預測問題,GRA-WOA-BP預測模型在分類預測方面擁有很高的準確度,并且讓BP神經網絡模型更好地避開局部最優。1.2.3不同模型實驗對比從上面的分類預測模型可知,GRA-WOA-BP模型對空氣質量等級預測的準確度為91.1969%,比經過灰色關聯分析的BP神經網絡模型預測準確率提高了11.39%。并且與其他算法進行比較。在本小節,為了模型之間可以比較,各個模型都使用經過灰色關聯分析后的數據,按照第三章數據預處理的流程對數據進行預處理,把處理好的數據集按照訓練數據集和測試數據集7:3的比例劃分。各個模型的最終預測準確度如圖1.4所示。圖1.4多種模型預測準確度對比由圖1.4可知,樸素貝葉斯分類器、支持向量機、決策樹、KNN的空氣質量等級分類預測準確度分別為77.1%、81.8%、82.70%、70%,與這些算法相比較,基于GRA-WOA-BP模型的準確度相對較高,驗證了本文空氣質量等級預測的準確度及所采用的算法的優越性。1.3首要污染物PM10濃度的預測1.3.1自回歸XGBoost時序預測模型設計自回歸模型是統計領域用來處理時間序列的一種方法,可用同一變量前期的數據來預測本期的結果,所需數據較?。籜GBoost是一種基于梯度提升決策樹并且把正則化項加入到目標函數中的簡單算法,有速度快、能容錯誤的優點。高金敏(2021)結合這二種方法的優點,提出了的一種基于自回歸XGBoost時序預測模型,用于國內生產總值的擬合預測,預測的準確度高。這個模型對時間序列數據的規律進行了相關分析,發現數據有自回歸這個特性,而且這個模型很方便實現。本文將該模型引入到空氣污染濃度預測中來。自回歸XGBoost時序預測模型預測分為4個步驟:步驟1檢查預測變量PM10的平穩性,依照預測變量PM10的時序圖和ADF單位根對預測變量進行平穩性檢測;步驟2如果預測變量PM10為平穩的時間序列,則跳過這個步驟,否則運用方法對非平穩時間序列進行平穩化相關處理;步驟3對模型進行相關識別和進行有關參數的設定;步驟4進行模型預測,并且對結果進行分析。1.3.2數據來源與平穩性檢驗在上文中,已經對空氣質量等級進行了分類預測,然而,在生活中,人們往往更加關心各項污染物的情況,在上一章節中,我們分析得出PM10對空氣質量影響最大,故本文基于自回歸XGBoost時序預測模型對首要污染物PM10濃度進行預測。選取2019年4月1日到2019年5月31日61個PM10逐日數據,其數據來源于真氣網,將選擇的數據劃分為兩個部分:前51個數據用來擬合模型,后面10個用于計算擬合預測精度,建立自回歸XGBoost時序預測模型,利用選取的數據進行模型擬合。首先在R軟件分析相關數據的平穩性,2019年4月1日到2019年5月31日主要污染物PM10的時序圖,如圖1.5所示。圖1.5PM10時序圖從圖1.5中可以看出南昌市PM10歷史數據時序圖其值始終在某個數值上下浮動,初步可以判定南昌市2019年4月1日到2019年5月31日的PM10歷史數據為平穩的時間序列。為了進一步驗證其平穩性,對南昌市2019年4月1日到2019年5月31日的PM10歷史數據進行ADF檢驗。檢驗結果:統計量約為6.546,其P值為0.008832,小于在1%的統計量,拒絕存在單位根的假設,表明南昌市2019年4月1日到2019年5月31日的PM10歷史數據是平穩的。1.3.3模型預測結果分析本文依
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學生海邊活動策劃方案
- 小學生介紹班級活動方案
- 少先隊巡講活動方案
- 小學航天項目活動方案
- 帶貨公司大掃除活動方案
- 小學生創意小組活動方案
- 工會最美驛站活動方案
- 小水雀巢活動方案
- 干預公司正常經營活動方案
- 小學藝術字比賽活動方案
- 電梯維護保養規則(TSG T5002-2017)
- 初中物理-摩擦力課件-市公開課一等獎省賽課獲獎課件
- 醫院殯葬管理制度
- (高清版)TDT 1057-2020 國土調查數據庫標準
- 上半年學校安全穩定工作總結
- 出行前的車輛安全檢查指南手冊分享交流座談
- 《吉他基礎知識介紹》課件
- 醫院科室設置醫院不同科室的設置和規劃
- 國外刑偵技術現狀研究報告
- 《生理學》課程標準
- 大麻制品項目建議書
評論
0/150
提交評論