數字化礦山構建過程中的數據挖掘模型研究_第1頁
數字化礦山構建過程中的數據挖掘模型研究_第2頁
數字化礦山構建過程中的數據挖掘模型研究_第3頁
數字化礦山構建過程中的數據挖掘模型研究_第4頁
數字化礦山構建過程中的數據挖掘模型研究_第5頁
已閱讀5頁,還剩1頁未讀, 繼續免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數字化礦山構建過程中的數據挖掘模型研究摘要:礦山數字化集礦山管理、生產、設計、地質勘察、測繪、開采、調度于一體。 實現礦山數字化可以充分合理地開采資源, 高效組織礦山生產, 降低工人勞動強度, 提高礦山企業經濟、社會效益。而構建數字化礦山模型過程中, 涉及到大量數據的合理組織和有效利用。針對數字化礦山過程中產生積累的大量數據,以新的視角分析了應用數據挖掘的基礎和數據特點。 討論了數據挖掘的基本思想,提出了集成數據挖掘的模型結構, 為數字化礦山及礦山管理決策提出了一條新的途徑。關鍵詞 :數據 數據挖掘 數字化礦山 模型數字化礦山不僅是信息社會的主要組成部分, 而且也是數字地球技術系統的集中表現,

2、 是數字地球理論在地學領域的應用。數字化礦山是綜合運用 GIS(地理信息系統 )、遙感、遙測、網絡、多媒體及虛擬仿真等技術系統對礦山資源的開發利用、信息采集、動態監測管理和輔助決策服務的技術系統。它是地理、資源、生態環境等復雜系統的數字化、網絡化、虛擬仿真, 具有優化決策支持和可視化表現等強大功能。數字化礦山是隨數字技術、信息技術的飛速發展和計算機技術的廣泛應用而發展起來的。 在數字化過程中產生積累了大量的數據。面對如此龐大的數據, 一方面, 可以通過數據庫管理系統結合統計分析方法, 實現查詢、檢索及表報功能, 也可以進行聯機分析處理 LAP(或 OLTP聯機事務處理 )得出可供決策參考的統計

3、分析數據, 但數據中隱藏的內在有用知識無法得到, 我們處在數據豐富而知識貧乏的矛盾之中。另一方面, 就人工智能中的知識獲取而言, 它主要依靠用戶或者領域專家手工將知識輸入到知識庫中,耗時費力, 且因主觀性易于出錯。因此迫切需要能夠自動發現獲取知識的新技術, 這便是數據挖掘產生的直接推動力。數據挖掘技術涉及人工智能、數據庫技術、模式識別、數據可視化、統計學等多門交叉學科。本文針對數據挖掘在數字化礦山構建過程的應用問題進行討論。數據挖掘是指從大量數據中提取或 ? 采掘 ?知識, 進而形成了廣義的 DM 定義。數據挖掘是從存在于大量數據的數據庫、數據倉庫或信息儲存體中發現有價值知識的過程。DM 的對

4、象不僅是數據庫, 也可以據集合。知識發現是指識別出存在于數據庫中可信的、新穎的、具有潛在應用價值和最終可理解模式的非平凡過程。而數據挖掘是此過程的一個特定關鍵步驟。數據挖掘和知識發現的最終目標都是從大量數據集合中挖掘出各種有價值、被人理解的可用于指導實踐的知識。KDD的定義完整準確但表面上僅局限于數據庫, 而 DM 對其進行了擴充, 指組織在一起的數據集合。但這里的數據集合應該是來源于實踐中有用系統的, 而不是雜亂無章的數據堆積。DM 的過程可歸納為: 數據準備 (數據選擇、清洗、變換 )、數據采掘 (各種挖掘算法的運用 )和知識的表達、解釋與驗證 3個階段, 是一個循環往復的過程。主要任務有

5、分類、回歸分析、聚類、預測、關聯性、變化和偏差分析、模式發現和路徑發現等。1 數字化礦山構建過程中 DM 的基礎與現狀數字化礦山集地理、資源、生態環境等因素于一體, 又面臨資源開發利用、經濟效益、環境保護、安全等多方面的挑戰, 因此它是一個十分復雜的大系統。在構造礦山數字模型過程中, 以計算機為核心的各種控制系統能夠采集、存儲大量礦山生產過程的過去 (歷史 )和當前運行狀態 (動態 )的豐富有價值的數據 (包括, 礦產品保有儲量、開采品位、礦巖性質、設備狀態等 ); 以往人們往往過分重視控制算法的開發, 而忽視了對礦山生產過程中有關生產人員的行為特征、經驗, 設備運行狀態及開采過程、環境狀態、

6、資源、開采條件等大量數據的全面分析利用, 更難從中發現知識。部分原因由于系統的復雜性、處理數據量的龐大和缺乏相應的技術手段, 而DM 的產生為解決這些問題提供了強有力的工具。它可以充分利用積累的歷史數據和當前數據, 提取潛在的模式、規則, 以新的視角為數字化礦山構建開辟新的途徑。這使得在數字化礦山構建過程中展開數據挖掘應用研究有了堅實的基礎。DM 理論與技術的研究已經較為廣泛, 國外已廣泛應用于商業、金融、電信和企業管理中。英國已應用 DM 于化工過程的監控中, 取得了顯著的效益。美國鋼鐵公司和神戶鋼鐵公司運用 DM 技術研究分析產品性能規律進行質量控制。CASSIOPEE故障發現系統被歐洲三

7、大航空公司用來診斷和預測波音 737客機的故障, 其應用獲得了 ? 歐洲創新應用 的一等獎。國內有關數字化礦山方面 DM 的理論和應用研究才開始, 報道很少。2 數字化礦山構建過程中數據的特點要進行數字化礦山構建過程中的數據挖掘, 在遵循 DM 一般方法的基礎上, 必須認真分析其數據特點并結合具體生產工藝上的要求進行。其數據特點可概括如下:(1)數據量巨大、高維且有較強的耦合性。在礦山生產過程中, 不論是計算機模擬還是計算機輔助決策的工藝過程, 都要隨生產過程定時采集、更新數據及生產狀態, 以供顯示、控制之用, 另外還有重復測量和冗余測量的數據, 日積月累這些數據量是非常巨大的; 同時由于礦山

8、生產過程的行為狀態是許多變量因素共同作用的結果, 它們之間有較強的耦合及非線性關系。( 2)生產過程中的不確定性。礦山生產工作環境復雜, 電、磁、粉塵、噪聲干擾較強, 系統本身存在不確定性, 因而數據易受污染。( 3)動態性與數據類型的多樣性。各種變量的值是不斷變化的, 這反映了系統的動平衡過程, 是系統本質的反映。在生產過程的監控中通過辨識、觀察諸變量的數值, 預測系統的狀態及變化趨勢。其數據的類型也是多樣的, 如數值型 (整型、實型 )、非數值型、邏輯型等。( 4)多時標性與不完整性。因系統的復雜性,眾多變量的變化快慢各異, 所以采集信號的頻率不同, 導致時間上的不同步。在數據的記錄上也可

9、能丟失數據, 造成數據的不完整。( 5) 多模態性。數據是系統狀態變化的反應。既有正常工作狀態, 又有各種異常狀態 (包括未知狀態、不確定狀態 )和故障態的數據。前者是主體, 后者的數據量相對較少。但它們都是 DM中所不可缺少的。3 數字化礦山構建過程中數據挖掘的基本思想由于礦山生產過程的復雜性及特點, 其數據挖掘必須將傳統數據挖掘方法與現代以計算智能 CI( Computational Intelligence)為核心的眾多理論方法融合集成起來。以礦山生產過程積累的大量數據為研究對象, 發揮現行監控平臺的作用, 結合生產工藝要求, 研究適用于數字化礦山構建系統數據特點的魯棒、有效的新挖掘方法

10、, 解決數據豐富、知識貧乏的問題。并運用新方法獲取知識, 補充、完善和更新知識系統和監控手段。指導生產操作, 優化生產工藝, 提高礦石產品質量。3. 1 融合集成各種 DM 方法結合數據先驗知識、工程背景知識, 將基于統計學的傳統 DM 方法、機器學習方法及計算智能方法融合集成起來, 研究能從大量數據中提取反映系統狀態的模式、規則的算法與策略。該方法對數據的不確定性、不完整性, 噪聲有較強的魯棒性。3. 2 建立系統的狀態監控與故障診斷模型基于數據挖掘的新方法, 對數字化礦山構建過程的歷史數據包括正常狀態、異常狀態及各種故障狀態數據 (系統中各種變量在故障發生后, 它們中的一部分或全部其數據或

11、狀態變化都會與正常情況下有所不同, 其中包含了豐富的故障信息 )進行聚類、分類分析, 建立系統狀態評估和故障預測模型。在此基礎上, 對系統過程, 系統狀態的當前數據進行在線挖掘分析。對已建立的模型進行檢驗和修正,形成系統動態分析模型。并進行可視化處理, 提供操作指導與分析, 使操作員得到充分的信息, 進行生產過程監視和操作, 從而實現更高水平的監控, 防止事故隱患發生, 保證礦山安全生產。3. 3 構建礦石產品質量控制模型所謂礦山生產過程最優化可以概括為: 在滿足必要的約束條件下, 改變礦山生產過程的工藝參數,使某種與經濟效益有關的目標函數達到極值。在生產優化實施中, 對大量生產數據進行挖掘找

12、到產品質量與工藝參數的模型關系。分析諸多變量作用下的產品質量規律, 幫助質檢人員、工藝人員弄清影響礦石產品質量的主次因素, 提出相應的對策, 進一步調整工藝參數, 進行質量控制, 為實現生產過程操作最優化提供指導。3. 4 豐富知識庫和決策支持系統礦山生產過程對象已變為一個十分復雜的系統, 產生了更為困難的過程控制問題以及對高性能控制器的要求。經典的控制方法難以勝任, 以計算機為工具的智能控制方法已經應用于這些系統中。但結構復雜, 計算量大。通常必須有知識庫作為支持, 而知識的獲取是關鍵。數據挖掘技術可以將提取的潛在模式、規則評估檢驗后歸入知識庫, 使得智能控制充分發揮作用, 提高生產過程的控

13、制水平。4 數字化礦山構建過程中的數據挖掘模型在分析數字化礦山構建過程中數據挖掘的基礎、數據特點及討論基本思想的基礎上, 可以把計算機技術、控制技術和信號處理技術結合起來, 建立起智能代理 (Agent)和面向對象的遞階式、分布式礦山生產過程的集成數據挖掘模型結構, 如圖 1所示。該模型可以發揮現行 DCS/FCS/CIPS系統的作用, 是數據挖掘系統與經典 CIPS系統的融合圖 1 集成數據挖掘模型以 DCS/FCS/CIPS中采集積累的數據、人工記錄日志及實驗仿真數據為數據源, 進行數據挖掘的前端處理, 以解決數據的不完整性、噪聲及重復、冗余等問題, 提高數據質量; 通過集成的 DM 系統

14、運用各種 DM 新算法進行知識、規則提取, 狀態辨識及模式的建立; 并以領域操作、監督人員熟悉的方式可視化, 對所獲取的知識、規則及模式進行評估檢驗, 確定其可信度; 應用發掘的有用知識、規則及模式對礦山生產系統實施監控、診斷或豐富知識庫。數據挖掘的過程并非一次就能成功或結束, 而是一個不斷的、反復的過程, 從而逐漸獲得有用的新知識。5 結 語數據挖掘應用于數字化礦山構建過程系統中是一個嶄新的領域, 有許多問題有待進一步探索。數據挖掘技術是一個新的交叉學科領域。本文以新的視角, 在分析數字化礦山構建過程中數據挖掘的基礎、數據特點的基礎上, 討論了工業過程中數據挖掘的思想, 提出了集成的 DM 系統模型。為進一步實現數字化礦山構建過程的監控、優化與故障診斷開辟了新的途徑。參 考 文 獻 1 高志武, 秦德先. 數字礦床概述 J. 金屬礦山, 2005( 2): 54-56. 2 王衛星, 崔? 冰, 趙? 芳. 金屬礦山數字化 J. 金屬礦山, 2005( 11): 1-3. 3 吳少敏,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論