



全文預(yù)覽已結(jié)束
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)【摘要】隨著大數(shù)據(jù)時代的到來,在大數(shù)據(jù)觀念不斷提出的今天,加強數(shù)據(jù)大數(shù)據(jù)挖掘及時的應(yīng)用已成為大勢所趨。那么在這一過程中,我們必須掌握大數(shù)據(jù)與數(shù)據(jù)挖掘的內(nèi)涵,并對數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,從而明確大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域,促進(jìn)各項數(shù)據(jù)的處理,提高大數(shù)據(jù)處理能力。【關(guān)鍵詞】大數(shù)據(jù)時代;數(shù)據(jù)挖掘技術(shù);應(yīng)用大數(shù)據(jù)時代下的數(shù)據(jù)處理技術(shù)要求更高,所以要想確保數(shù)據(jù)處理成效得到提升,就必須切實加強數(shù)據(jù)挖掘技術(shù)的應(yīng)用,才能更好地促進(jìn)數(shù)據(jù)處理職能的轉(zhuǎn)變,提高數(shù)據(jù)處理效率,以下就大數(shù)據(jù)時代下的數(shù)據(jù)挖掘技術(shù)做出如下分析。1.大數(shù)據(jù)與數(shù)據(jù)挖掘的內(nèi)涵分析近年來,隨著云計算和物聯(lián)網(wǎng)概念的提出,信息技術(shù)得到了前所未有的發(fā)展,而大數(shù)據(jù)則是在此基礎(chǔ)上對現(xiàn)代信息技術(shù)革命的又一次顛覆,所以大數(shù)據(jù)技術(shù)主要是從多種巨量的數(shù)據(jù)中快速的挖掘和獲取有價值的信息技術(shù),因而在云時代的今天,大數(shù)據(jù)技術(shù)已經(jīng)被我們所關(guān)注,所以數(shù)據(jù)挖掘技術(shù)成為最為關(guān)鍵的技術(shù)。尤其是在當(dāng)前在日常信息關(guān)聯(lián)和處理中越來越離不開數(shù)據(jù)挖掘技術(shù)和信息技術(shù)的支持。大數(shù)據(jù),而主要是對全球的數(shù)據(jù)量較大的一個概括,且每年的數(shù)據(jù)增長速度較快。而數(shù)據(jù)挖掘,主要是從多種模糊而又隨機、大量而又復(fù)雜且不規(guī)則的數(shù)據(jù)中,獲得有用的信息知識,從數(shù)據(jù)庫中抽絲剝繭、轉(zhuǎn)換分析,從而掌握其潛在價值與規(guī)律1。2.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的核心-分析方法數(shù)據(jù)挖掘的過程實際就是對數(shù)據(jù)進(jìn)行分析和處理,所以其核心就在于數(shù)據(jù)的分析方法。要想確保分析方法的科學(xué)性,就必須確保所采用算法的科學(xué)性和可靠性,獲取數(shù)據(jù)潛在規(guī)律,并采取多元化的分析方法促進(jìn)問題的解決和優(yōu)化。以下就幾種常見的數(shù)據(jù)分析方法做出簡要的說明。一是歸類法,主要是將沒有指向和不確定且抽象的數(shù)據(jù)信息予以集中,并對集中后的數(shù)據(jù)實施分類整理和編輯處理,從而確保所形成的數(shù)據(jù)源具有特征一致、表現(xiàn)相同的特點,從而為加強對其的研究提供便利。所以這一分析方法能有效的滿足各種數(shù)據(jù)信息處理。二是關(guān)聯(lián)法,由于不同數(shù)據(jù)間存在的關(guān)聯(lián)性較為隱蔽,采取人力往往難以找出其信息特征,所以需要預(yù)先結(jié)合信息關(guān)聯(lián)的表現(xiàn),對數(shù)據(jù)關(guān)聯(lián)管理方案進(jìn)行制定,從而完成基于某種目的的前提下對信息進(jìn)行處理,所以其主要是在一些信息處理要求高和任務(wù)較為復(fù)雜的信息處理工作之中。三是特征法,由于數(shù)據(jù)資源的應(yīng)用范圍較廣,所以需要對其特征進(jìn)行挖掘。也就是采用某一種技術(shù),將具有相同特征的數(shù)據(jù)進(jìn)行集中。例如采用人工神經(jīng)網(wǎng)絡(luò)技術(shù)時,主要是對大批量復(fù)雜的數(shù)據(jù)分析,對非常復(fù)雜的模式進(jìn)行抽取或者對其趨勢進(jìn)行分析。而采取遺傳算法,則主要是對其他評估算法的適合度進(jìn)行評估,并結(jié)合生物進(jìn)化的原理,對信息數(shù)據(jù)的成長過程進(jìn)行虛擬和假設(shè),從而組建出半虛擬、半真實的信息資源。再如可視化技術(shù)則是為數(shù)據(jù)挖掘提供輔助,采取多種方式對數(shù)據(jù)的挖掘進(jìn)行指導(dǎo)和表達(dá)3。3.大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)要點的分析3.1數(shù)據(jù)挖掘技術(shù)流程分析在數(shù)據(jù)挖掘過程中,其技術(shù)流程主要是以下幾點:首先做好數(shù)據(jù)準(zhǔn)備工作,主要是在挖掘數(shù)據(jù)之前,就需要對目標(biāo)數(shù)據(jù)進(jìn)行準(zhǔn)確的定位,在尋找和挖掘數(shù)據(jù)之前,必須知道自身所需的數(shù)據(jù)類型,才能避免數(shù)據(jù)挖掘的盲目性,在數(shù)據(jù)準(zhǔn)備時,應(yīng)根據(jù)系統(tǒng)的提示進(jìn)行操作,在數(shù)據(jù)庫中輸入檢索條件和目標(biāo),對數(shù)據(jù)信息資源進(jìn)行分類和清理,以及編輯和預(yù)處理。其次是在數(shù)據(jù)挖掘過程中,由于目標(biāo)數(shù)據(jù)信息已經(jīng)被預(yù)處理,所以就需要在挖掘處理過程中將其高效正確的應(yīng)用到管理機制之中,因而數(shù)據(jù)挖掘的過程十分重要,所以必須加強對其的處理。例如在數(shù)據(jù)挖掘中,我們可以結(jié)合數(shù)據(jù)挖掘目標(biāo)要求,針對性的選取科學(xué)而又合適的計算和分析方法,對數(shù)據(jù)信息特征與應(yīng)用價值等進(jìn)行尋找和歸納。當(dāng)然,也可以結(jié)合程序應(yīng)用的需要,對數(shù)據(jù)區(qū)域進(jìn)行固定,并在固定的數(shù)據(jù)區(qū)域內(nèi)分類的挖掘數(shù)據(jù),從而得到更具深度和內(nèi)涵以及價值的數(shù)據(jù)信息資源,并就挖掘到的數(shù)據(jù)結(jié)果進(jìn)行分析和解釋,從結(jié)果中將具有使用價值和意義的規(guī)律進(jìn)行提取,并還原成便于理解的數(shù)據(jù)語言。最后是切實加強管理和計算等專業(yè)知識的應(yīng)用,將數(shù)據(jù)挖掘技術(shù)實施中進(jìn)行的總結(jié)和提取所獲得的數(shù)據(jù)信息與評估結(jié)果在現(xiàn)實之中應(yīng)用,從而對某個思想、決策是否正確和科學(xué)進(jìn)行判斷,最終體現(xiàn)出數(shù)據(jù)挖掘及時的應(yīng)用價值。3.2挖掘后的數(shù)據(jù)信息資源分析若僅僅是通過環(huán)境和背景實現(xiàn)數(shù)據(jù)挖掘技術(shù)的升級轉(zhuǎn)型,那么其在合理性和科學(xué)性方面勢必會存在一定的欠缺,所以在形成網(wǎng)絡(luò)信息化的環(huán)境時,我們應(yīng)綜合考慮社會經(jīng)濟的發(fā)展以及科技和文化因素帶來的影響,以及其在未來發(fā)展中的變化趨勢,這樣才能更好地促進(jìn)數(shù)據(jù)挖掘技術(shù)職能的轉(zhuǎn)變,促進(jìn)其最大化的滿足其應(yīng)用成效的發(fā)揮,也能有效的促進(jìn)其職能作用的發(fā)揮。這主要是因為數(shù)據(jù)信息資源在挖掘后,其自身的職能作用將變得更加豐富,所以在信息技術(shù)環(huán)節(jié)下的數(shù)據(jù)挖掘技術(shù)隨著限定條件的變化,而將數(shù)據(jù)挖掘信息應(yīng)用于技術(shù)管理和決策管理之中,從而更好地彰顯企業(yè)在經(jīng)濟活動中的物質(zhì)性質(zhì)與價值變化趨勢,并結(jié)合數(shù)據(jù)變化特點和具體的表現(xiàn)規(guī)律,從而將數(shù)據(jù)信息的基本要素、質(zhì)量特點、管理要求等展示出來,所以其表現(xiàn)的形式十分豐富。因而在數(shù)據(jù)挖掘之后的信息在職能范圍和表現(xiàn)形式方式均得到了豐富和拓展,而這也在一定程度上體現(xiàn)了網(wǎng)絡(luò)擬定目標(biāo)服務(wù)具有較強的完整性,且屬于特殊的個體物品,同時也是對傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的創(chuàng)新和發(fā)展,從而更好地滿足當(dāng)前大數(shù)據(jù)時代對信息進(jìn)行數(shù)據(jù)化的處理,并對不同種類業(yè)務(wù)進(jìn)行整合和優(yōu)化,從而促進(jìn)數(shù)據(jù)挖掘技術(shù)服務(wù)的一體化水平。3.3大數(shù)據(jù)背景下的數(shù)據(jù)挖掘技術(shù)應(yīng)注重信息失真的控制數(shù)據(jù)挖掘技術(shù)的信息主要是源于大數(shù)據(jù)和社會,所以在當(dāng)前數(shù)據(jù)挖掘技術(shù)需求不斷加大的今天,為了更好地促進(jìn)所挖掘數(shù)據(jù)信息的真實性,促進(jìn)其個性化職能的發(fā)揮,必須在大數(shù)據(jù)背景下注重信息失真的控制,切實做好數(shù)據(jù)挖掘技術(shù)管理的各項工作。這就需要考慮如何確保數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)背景下的職能得到有效的發(fā)揮,盡可能地促進(jìn)數(shù)據(jù)挖掘技術(shù)信息資源的升級和轉(zhuǎn)型,以大數(shù)據(jù)背景為載體,促進(jìn)整個業(yè)務(wù)和技術(shù)操作流程的一體化,從而更好地將所有數(shù)據(jù)資源的消耗和變化以及管理的科學(xué)性和有效性,這樣我們就能及時的找到資源的消耗源頭,從而更好地對數(shù)據(jù)資源的消耗效益進(jìn)行評價,最終促進(jìn)業(yè)務(wù)流程的優(yōu)化,并結(jié)合大數(shù)據(jù)背景對數(shù)據(jù)挖掘技術(shù)的職能進(jìn)行拓展,促進(jìn)其外部信息與內(nèi)部信息的合作,對數(shù)據(jù)挖掘技術(shù)信息的職能進(jìn)行有效的控制,才能更好地促進(jìn)信息失真的控制。4.數(shù)據(jù)挖掘技術(shù)在不同行業(yè)中的應(yīng)用4.1市場營銷行業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用在數(shù)據(jù)挖掘技術(shù)方面應(yīng)用最多的行業(yè)就屬于市場營銷行業(yè)了,這主要是因為數(shù)據(jù)挖掘能有效的解析消費者的消費行為和消費習(xí)慣,從而利用其將銷售方式改進(jìn)和優(yōu)化,最終促進(jìn)產(chǎn)品銷量的提升。與此同時,通過對購物消費行為的分析,掌握客戶的忠誠度和消費意識等,從而針對性的改變營銷策略,同時還能找到更多潛在的客戶。4.2制造業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用在制造業(yè)中加強數(shù)據(jù)挖掘技術(shù)的應(yīng)用,其目的就在于對產(chǎn)品質(zhì)量進(jìn)行檢驗。具體的做法就是對所制造產(chǎn)品的數(shù)據(jù)進(jìn)行研究,從而找出其存在的規(guī)則,并對其生產(chǎn)流程進(jìn)行分析之后,對其生產(chǎn)的過程進(jìn)行分析,從而更好地對生產(chǎn)質(zhì)量的影響因素進(jìn)行分析,并促進(jìn)其效率的提升,最終提高企業(yè)的經(jīng)濟效益。具體而言,主要就是對各種生產(chǎn)數(shù)據(jù)進(jìn)行篩選,從而得出有用的數(shù)據(jù)和知識,再采取決策樹算法進(jìn)行統(tǒng)計決策,并從中選取正確決策,從而更好地對產(chǎn)品在市場中的流行程度,決定企業(yè)生產(chǎn)和轉(zhuǎn)型的方向。4.3教育行業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用教育行業(yè)中加強數(shù)據(jù)挖掘技術(shù)的應(yīng)用,主要是為了更好地對學(xué)習(xí)情況、教學(xué)評估和心里動向等數(shù)據(jù)進(jìn)行分類和篩選,從而為學(xué)校的教學(xué)改革提供參考和支持。比如為了更好地對教學(xué)質(zhì)量進(jìn)行評估,就需要對教學(xué)質(zhì)量有關(guān)項目進(jìn)行整合與存儲,從而更好地促進(jìn)其對教學(xué)質(zhì)量的評估,而這一過程中,就需要采取數(shù)據(jù)挖掘技術(shù)對有關(guān)教學(xué)項目中的數(shù)據(jù)進(jìn)行挖掘和處理,促進(jìn)其應(yīng)用成效的提升3。5.結(jié)語綜上所述,在大數(shù)據(jù)背景下,數(shù)據(jù)挖掘技術(shù)已經(jīng)在各行各業(yè)中得到了廣泛的應(yīng)用,所以為了更好地滿足應(yīng)用的需要,我們必須切實加強對其特點的分析,并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 影視創(chuàng)作部管理制度
- 心電圖使用管理制度
- 快遞柜客戶管理制度
- 總店與分店管理制度
- 總降站運行管理制度
- 成品不良品管理制度
- 成本無發(fā)票管理制度
- 房地產(chǎn)商業(yè)管理制度
- 排練廳手機管理制度
- 推拿科感染管理制度
- DB13T 2700-2018 水工柔性生態(tài)防護(hù)結(jié)構(gòu)設(shè)計規(guī)范
- 2025天津中考:語文必背知識點
- 2025汾西礦業(yè)井下操作技能人員招聘300人(山西)筆試參考題庫附帶答案詳解
- 《骨關(guān)節(jié)炎與藥物治療》課件
- 珠海醫(yī)保考試試題及答案
- 醫(yī)療機構(gòu)重大事故隱患判定清單解讀課件
- 初中地理核心考點速記(中國地理一)-2025年中考地理復(fù)習(xí)知識清單(題綱)
- 2025年全國中小學(xué)生科普知識競賽題庫附答案(共280題)
- 2024年四川省成都市中考生物試卷(含答案與解析)
- 2025抖音財經(jīng)內(nèi)容生態(tài)報告
- 2025重慶理工職業(yè)學(xué)院輔導(dǎo)員考試題庫
評論
0/150
提交評論