云計算環境下大數據分析_第1頁
云計算環境下大數據分析_第2頁
云計算環境下大數據分析_第3頁
云計算環境下大數據分析_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、云計算環境下大數據分析1 大數據處理流程 端。1.1 數據采集大數據的采集是整個流程的根底,隨著互聯網技術和應用的開展以及各種終端設備的普及, 使得數據的生產者范圍越來越大,數據的產量也越來越多,數據之間的關聯也越來越復雜, 這也是大數據中“大的表達,所以需要提高數據采集速度和精度要求。1.2 數據處理與集成 以及進一步集成存儲。因為數據采集步驟采集到的數據各種各樣,其數據結構也并不統一, 1.3 數據分析 據所需數據的應用需求和價值表達方向對這些原始樣本數據進一步地處理和分析。現有的數 據分析通常指采用數據倉庫和數據挖掘工具對集中存儲的數據進行分析,數據分析效勞與傳 統數據分析的差異在于其面

2、向的對象不是數據,而是數據效勞。1.4 數據解釋 輸出的需求,因此,數據分析企業會引入“數據可視化技術作為數據解釋方式。通過可視 化結果分析,可以形象地向用戶展示數據分析結果。2 云計算與大數據分析的關系 效勞,這些資源能夠被快速提供,只需投入很少的管理工作,或與效勞供給商進行很少的 常表現為對已獲取的海量數據的分析,其數據來源可能是企業數據也可能是企業數據與互聯 網數據的融合。從目前的趨勢來看,云計算是大數據的IT 根底,是大數據分析的支撐平臺, 以為 大數據分析提供更為靈活、迅速的部署方案,使得大數據分析的結果更加精確。另一方面, 中小企業也可以通過云計算來實現屬于自己的大數據分析產品。大

3、數據技術本身也是云計算 寬的提高和云資源的建設,需要確保原始數據能遷移到云環境以及資源池可以隨需彈性擴 p為了給大數據處理分析提供一個性能更高、可靠性更好的平臺,研究者基于 MapReduce 開 發了一個基于云計算環境的開源平臺 Hadoop 。Hadoop 是一個以 MapReduce 算法為分布式 在內的完整生態系統,已經成為當前最流行的大數據處理平臺,并被廣泛認可和開發應用。 基于 Hadoop,用戶可編寫處理海量數據的分布式并行程序,并將其運行于由成百上千個節 點組成的大規模計算機集群上。4 實例分析 的價值。當前傳統語音和短信業務量下滑,智能終端快速增長,移動互聯網業務開展迅速, 大數據分析可以為運營商帶來新的時機,幫助運營商更好地轉型。本文數據分析樣本通過 Hadoop2.6.0 在 Ubuntu12.04 系統中模擬了一個大數據分析平臺來處理獲得的樣本。希望通 的大數據分析可以在數據分析上表達出良好的性能,為企業帶來更豐富更有效率的信息提取、分類,并從中獲益。5 結束語基于云計算的大數據分析已經成為解決大數據

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論