




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、江西理工大學(xué)紹了數(shù)據(jù)挖掘的神經(jīng)網(wǎng)絡(luò)法、決策樹法、遺傳算 聯(lián)規(guī)則法等概念及其各自的優(yōu)缺點(diǎn);詳細(xì)總結(jié)了國內(nèi)外數(shù) ; Abstract :From the definition of data mining ,the paper introduced concepts and and pointed out the development trend of data mining. 積累 檢索機(jī)制和統(tǒng)計學(xué)方法很難獲得這些信息,迫切需要能自動 轉(zhuǎn)化為有價值的信息,從而達(dá)到為決策服務(wù)的目的。在這種 術(shù)的研究成果,其應(yīng)用非常廣泛。只要是有分析價值的數(shù) 研究、工程診斷等。本文主要介紹數(shù)據(jù)挖掘的主要算法及 的
2、研究現(xiàn)狀及研究熱點(diǎn)進(jìn)行了詳細(xì)的總結(jié),最后指出其發(fā) 12 數(shù)據(jù)挖掘算法完全的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提 的、甚至是異構(gòu)型的。發(fā)現(xiàn)知識的方法可以是數(shù) 。據(jù) 據(jù)處理數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)據(jù) 據(jù)處理數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)模式 2.1 神經(jīng)網(wǎng)絡(luò)法 測模型,可完成分類、聚類、特征挖掘等多種數(shù)據(jù)挖掘任務(wù)。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法主要 表現(xiàn)在權(quán)值的修改上。其優(yōu)點(diǎn)是具有抗干擾、非線性學(xué)習(xí)、聯(lián)想記憶功能,對復(fù)雜情況 能得到精確的預(yù)測結(jié)果;缺點(diǎn)是不適合處理高維變量,不能觀察中間的學(xué)習(xí)過程,具有 “黑箱”性,輸出結(jié)果也難以解釋;其次是需較長的學(xué)習(xí)時間。神經(jīng)網(wǎng)絡(luò)法主要應(yīng)用于數(shù) 據(jù)挖據(jù)的聚類技術(shù)中。2.2 決策樹法 述簡單,易于理解,分類速
3、度快;缺點(diǎn)是很難基于多 長處理非數(shù)值型數(shù)據(jù),而且特別適合大規(guī)模的數(shù)據(jù)處22.3 遺傳算法 原理,具有隱含并行性、易 性;缺點(diǎn)是需要的參數(shù)太多,編碼困難,一般計算量 。2.4 粗糙集法 現(xiàn)、數(shù)據(jù)意義的評估等問題。其優(yōu)點(diǎn)是算法簡單,不 的信息;缺點(diǎn)是難以直接處理連續(xù)的屬性,須先進(jìn)行 。2.5 模糊集法問題進(jìn)行模糊評判、模糊決策、模糊模式識別和模糊 2.6 關(guān)聯(lián)規(guī)則法 等人提出的 Apriori 算法。最小支持度和最小可信度是為了發(fā)現(xiàn)有意義的關(guān)聯(lián)規(guī)則給定 33 數(shù)據(jù)挖掘研究現(xiàn)狀 g KDD主要體現(xiàn)在 KDD 商業(yè)軟 轉(zhuǎn)向建立解決問題的整體系統(tǒng),主要用戶有保險公司、大 到目前已開發(fā)了一系列技術(shù)成熟、應(yīng)
4、用價值前最主要的數(shù)據(jù)挖掘軟件:(1)Knowledge Studio:由 Angoss 軟件公司開發(fā)的能夠靈活地導(dǎo)入外部模型和產(chǎn)生規(guī) 的用戶圖形界面與多種分析技術(shù)如神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián) 軟件首次引入了數(shù)據(jù)挖掘流概念,用戶可以在同一4。 Simon Fraser 大學(xué)開發(fā)的 DBMiner 、HNC 公司開發(fā)的用于信用卡詐騙分析的 Database 成熟,目前正處于發(fā)展階段。最 構(gòu)造模糊系統(tǒng)辨識方法與模糊系統(tǒng)知識模型;構(gòu)造智 理論模型與實(shí)現(xiàn)技術(shù);利用概念進(jìn)行文本挖掘。我國MSMiner算技術(shù)研究所智能信息處理重點(diǎn)實(shí)驗(yàn)室開發(fā)的多策略通用 DMiner開發(fā)的具有自主知識產(chǎn)權(quán)的數(shù)據(jù)挖掘系統(tǒng)。該 來展示分析結(jié)
5、果,實(shí)現(xiàn)了數(shù)據(jù)查詢結(jié)果可視化、數(shù)據(jù) iDMiner知識產(chǎn)權(quán)的數(shù)據(jù)挖掘平臺。該平臺大膽 業(yè)界標(biāo)準(zhǔn),對該軟件今后的發(fā)展有很大的促進(jìn)作用,同時也為國內(nèi)同類 且大多數(shù)研究項(xiàng)目都是由政府資助,主要的研究方向 方面以及實(shí)際應(yīng)用。研究的產(chǎn)品尚未得到國際市場的 54 數(shù)據(jù)挖掘的研究熱點(diǎn)及發(fā)展趨勢就目前來看,數(shù)據(jù)挖掘的幾個研究熱點(diǎn)主要包括網(wǎng)站的數(shù)據(jù)挖掘 (Web Site Data Mining)、生物信息或基因 (Bioinformatics/Genomics)的數(shù)據(jù)挖掘及其文本的數(shù)據(jù)挖掘 別不大,但是其數(shù)據(jù)格式很大一部分來自于點(diǎn)擊率,與傳統(tǒng)的數(shù)據(jù)庫格 基因的不同之處,進(jìn)而對其加以改變,這就需要 困難,目前還
6、沒有真正的具備分析功能的文本挖掘 均有不少成功的應(yīng)用案例。為了提高系統(tǒng)的 6掘在處理特定應(yīng)用問題時存在局限性,因此,目前的 。(6)數(shù)據(jù)挖掘與數(shù)據(jù)庫系統(tǒng)和 Web 數(shù)據(jù)庫系統(tǒng)的集成:數(shù)據(jù)庫系統(tǒng)和 Web 數(shù)據(jù)庫已 5 結(jié)語各自的優(yōu)缺點(diǎn)及其所適用的領(lǐng)域,并根據(jù)目前國 挖 的數(shù)據(jù)分析,在國外像金融業(yè)、零售業(yè)等這樣一些對數(shù)據(jù) 功地采用了數(shù)據(jù)挖掘技術(shù)來輔助決策。盡管如此,數(shù)據(jù)挖 挑戰(zhàn),如超大規(guī)模數(shù)據(jù)集中的數(shù)據(jù)挖掘效率有待提高,開 挖掘方法,網(wǎng)絡(luò)與分布式環(huán)境下的數(shù)據(jù)挖掘,動態(tài)數(shù)據(jù)和 深刻了解期望解決問題的領(lǐng)域,理解數(shù)據(jù),了解其 的結(jié)果,從而促使挖掘模型的不斷完善和提高,使 7參考文獻(xiàn) 6 QULINLAN J R. C4. 5: Programs for MachineLearningM.San Mateo , Calif:Morgan 21(4):82-84.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山西省運(yùn)城市夏縣2024-2025學(xué)年化學(xué)九上期末監(jiān)測模擬試題含解析
- 河南職業(yè)技術(shù)學(xué)院《世界現(xiàn)代設(shè)計史》2023-2024學(xué)年第一學(xué)期期末試卷
- 公共衛(wèi)生應(yīng)急響應(yīng)2025年資金申請與公共衛(wèi)生輿情監(jiān)控報告
- 陜西省西安市78中學(xué)2025屆九年級化學(xué)第一學(xué)期期末達(dá)標(biāo)檢測模擬試題含解析
- 2024-2025學(xué)年湖南省長沙市長郡濱江中學(xué)七年級數(shù)學(xué)第一學(xué)期期末質(zhì)量跟蹤監(jiān)視試題含解析
- 公路貨運(yùn)行業(yè)數(shù)字化轉(zhuǎn)型效率提升的物流行業(yè)物流智能化技術(shù)應(yīng)用報告
- 共享出行市場技術(shù)創(chuàng)新對行業(yè)格局的影響:2025年商業(yè)模式創(chuàng)新報告
- 能源設(shè)備環(huán)境監(jiān)測技術(shù)培訓(xùn)與應(yīng)用解析
- 西安美術(shù)學(xué)院《影視動畫作品賞析》2023-2024學(xué)年第一學(xué)期期末試卷
- 油料運(yùn)輸使用管理辦法
- 養(yǎng)豬場建設(shè)項(xiàng)目可行性研究報告(模板范文)
- 夜間作業(yè)安全培訓(xùn)培訓(xùn)資料
- 中藥知識講解課件
- 施工資源需求計劃與調(diào)配策略
- 預(yù)制箱梁首件工程施工總結(jié)
- 2024-2025學(xué)年人教版高二化學(xué)選擇性必修3配套課件 基礎(chǔ)課時4 有機(jī)物分子式和分子結(jié)構(gòu)的確定
- 湖南省岳陽市2024-2025學(xué)年小升初模擬數(shù)學(xué)測試卷含解析
- 寵物店店員的工作職責(zé)與服務(wù)理念
- 2025浙江衢州市柯城區(qū)國企業(yè)招聘31人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 中國平面設(shè)計行業(yè)發(fā)展運(yùn)行現(xiàn)狀及投資潛力預(yù)測報告
- 2015-2024年十年高考化學(xué)真題分類匯編專題34 反應(yīng)熱計算-蓋斯定律(原卷版)
評論
0/150
提交評論