基于粗糙集的特征選擇算法研究_第1頁
基于粗糙集的特征選擇算法研究_第2頁
基于粗糙集的特征選擇算法研究_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于粗糙集的特征選擇算法研究【摘要】:粗糙集理論(RoughSetTheory)是波蘭數學家 Z.Pawlak 于1982 年提出的一種處理模糊、不確定數據的軟計算方法,是目前國際上人工智能理論及其應用領域中的重要研究熱點之一。由于粗糙集理 論方法獨特、思想新穎,在提出的三十余年里面,吸引了大量研究人員 對其進行研究,并成功的衍生出模糊粗糙集、優勢關系粗糙集、決策 理論粗糙集、變精度粗糙集等多種適用于處理復雜類型數據的粗糙計 算模型。這些模型已成功應用于機器學習、模式識別、決策支持、過 程控制、數據庫知識發現、專家系統等研究領域。基于粗糙集的特征 選擇(屬性約簡)是粗糙集理論研究的核心內容之一

2、,主要是在保持原 始數據的屬性區分能力不變的前提下,選擇具有最小特征(屬性)數的特征子集,達到消除無關和冗余特征,提高知識發現效率,改善分類器 性能的目的。隨著目前大量高維海量復雜數據的出現,這種解決問題的思路對于處理具有高價值總量、低價值密度、含有大量冗余屬性的 大數據研究具有重要的意義。本文跟蹤國際學術前沿,對基于粗糙集理論的屬性約簡進行整理分析,在借鑒 PageRank 算法思路的基礎上,提出了通過對屬性進行 全局性”重要度排序,進而構造一種新的屬性 約簡算法。另外,總結已有粗糙集特征選擇的部分方法及數據集的預 處理方法,設計了包含粗糙集特征選擇與數據集預處理方法的 RSLibrary

3、類庫,在類庫的基礎上設計了粗糙集特征選擇系統。本文主 要工作如下:(1)啟發式屬性約簡算法的分析與比較。對經典的啟發yiT論女第表&彖式屬性約簡算法、啟發式約簡加速算法、啟發式約簡雙向約簡加速算 法分別進行了具體的分析和比較。(2)提出一種基于 全局性”屬性重要 度排序的特征選擇算法。將粗糙集理論與 PageRank 算法結合,借鑒其 投票機制,提出了屬性排序算法(AttributeRank),進而設計了基于屬性 排序的特征選擇算法。在處理海量數據時,該算法的并行版本能夠在 可接受時間內得出結果。(3)設計了基于粗糙集的特征選擇系統。針 對在粗糙集學習中,做實驗時,需要編寫大量重復性代碼、檢驗

4、編碼正 確性、對比實驗結果、對書局集進行大量預處理等工作,設計了包含常見粗糙集屬性方法與數據集預處理的粗糙集類庫。在此類庫的基礎上開發了基于粗糙集的特征選擇系統。最后,將本文內容進行總結,說 明了針對該類問題可以深入研究的方向。這些研究內容,探索了將屬性約簡并行化的方法,為大數據的數據挖掘提供有價值的參考。同時,進一步豐富了基于粗糙集的數據挖掘算法,為發展高效的數據挖掘方 法提供一定的借鑒和指導,借此進一步推動并促進該領域的發展。【關 鍵詞】 :粗糙集特征選擇屬性排序粗糙集類庫屬性相異系數【學位授予單位】:山西大學【學位級別】:碩士【學位授予年份】:2013【分類號】:TP18C 易發表用yi

5、T論女第表匸家【目錄】:中文摘要 8-10Abstract10-12 第一章緒論 12-181.1 研究的背景與意義 12-131.2 粗糙集理論及特征選擇國內外研究現狀13-151.3粗糙集理論基本知識 15-161.3.1信息系統和決策表 151.3.2不可區分 關系與上下近似 15-161.3.3 基于粗糙集的特征選擇 161.4 論文的研究 內容與組織結構 16-18 第二章基于粗糙集的啟發式特征選擇算法分析 與比較18-242.1 啟發式屬性約簡方法 18-202.2 啟發式屬性約簡加速 算法20-212.3 啟發式屬性約簡雙向加速算法 21-222.4 算法分析與比 較 222.5

6、本章小結 22-24 第三章基于屬性排序的特征選擇算法 24-383.1PageRank算法簡介 24-253.2 屬性排序算法 25-323.2.1 屬性關 系矩陣 25-273.2.2 屬性權重的確定 27-283.2.3 基于相似度的屬性排序 算法 28-323.3 基于屬性排序的特征選擇算法32-353.3.1 算法流程323.3.2實驗結果與分析 32-353.4本章小結 35-38第四章基于粗糙集 的特征選擇系統設計與實現38-444.1 粗糙集類庫的設計與開發38-404.1.1 粗糙集類庫概述 384.1.2 粗糙集類庫應用場景舉例 38-394.1.3粗糙集類庫設計與功能 39-404.2 系統功能 404

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論