大數據入門普及資料課件_第1頁
大數據入門普及資料課件_第2頁
大數據入門普及資料課件_第3頁
大數據入門普及資料課件_第4頁
大數據入門普及資料課件_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數據入門普及資料大數據入門普及資料不知道BIGDATA?你out了!反對派認為,我們現在處在一個盲目的大數據崇拜時代不知道BIGDATA?你out了!反對派認為,我們現在處大數據的定義理解大數據相關技術與應用目錄大數據的定義理解大數據相關技術與應用目錄facebook社交網絡淘寶、ebuy電子商務微博、Apps移動互聯21世紀是數據信息大發展的時代,移動互聯、社交網絡、電子商務等極大拓展了互聯網的邊界和應用范圍,各種數據正在迅速膨脹并變大。互聯網(社交、搜索、電商)、移動互聯網(微博)、物聯網(傳感器,智慧地球)、車聯網、GPS、醫學影像、安全監控、金融(銀行、股市、保險)、電信(通話、短信)都在瘋狂產生著數據。“大數據”的誕生:半個世紀以來,隨著計算機技術全面融入社會生活,信息爆炸已經積累到了一個開始引發變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息爆炸的學科如天文學和基因學,創造出了“大數據”這個概念*。如今,這個概念幾乎應用到了所有人類智力與發展的領域中。大數據時代的背景facebook社交網絡淘寶、ebuy電子商務微博、AppsGBTBPBEBZB想駕馭這龐大的數據,我們必須了解大數據的特征。地球上至今總共的數據量:在2006年,個人用戶才剛剛邁進TB時代,全球一共新產生了約180EB的數據;在2011年,這個數字達到了1.8ZB。而有市場研究機構預測:到2020年,整個世界的數據總量將會增長44倍,達到35.2ZB(1ZB=10億TB)!1PB

=2^50字節1EB

=2^60字節1ZB=2^70字節大數據時代的爆炸增長GBTBPBEBZB想駕馭這龐大的數據,我們必須了解大數據的“大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值密度低(Value)”就是“大數據”的顯著特征,或者說,只有具備這些特點的數據,才是大數據。VolumeVelocityValueVariety大數據的4V特征“大量化(Volume)、多樣化(Variety)、快速化(大數據=海量數據+復雜類型的數據海量交易數據:企業內部的經營交易信息主要包括聯機交易數據和聯機分析數據,是結構化的、通過關系數據庫進行管理和訪問的靜態、歷史數據。通過這些數據,我們能了解過去發生了什么。大數據包括:交易數據和交互數據集在內的所有數據集海量交互數據:源于Facebook、Twitter、LinkedIn及其他來源的社交媒體數據構成。它包括了呼叫詳細記錄CDR、設備和傳感器信息、GPS和地理定位映射數據、通過管理文件傳輸ManageFileTransfer協議傳送的海量圖像文件、Web文本和點擊流數據、科學信息、電子郵件等等。可以告訴我們未來會發生什么。海量數據處理:大數據的涌現已經催生出了設計用于數據密集型處理的架構。例如具有開放源碼、在商品硬件群中運行的ApacheHadoop。大數據的構成大數據=海量數據+復雜類型的數據海量交易數據:大數據大數據的定義理解大數據相關技術與應用目錄大數據的定義理解大數據相關技術與應用目錄1、密不可分的大數據與云計算商業模式驅動應用需求驅動云計算本身也是大數據的一種業務模式大數據是落地的云云計算的模式是業務模式,本質是數據處理技術。數據是資產,云為數據資產提供存儲、訪問和計算。當前云計算更偏重海量存儲和計算,以及提供的云服務,運行云應用,但是缺乏盤活數據資產的能力,挖掘價值性信息和預測性分析,為國家、企業、個人提供決策和服務,是大數據核心議題,也是云計算的最終方向。1、密不可分的大數據與云計算商業模式驅動應用需求驅動云計算本2、大數據不僅僅是“大”多大?至少PB級比大更重要的是數據的復雜性,有時甚至大數據中的小數據如一條微博就具有顛覆性的價值2、大數據不僅僅是“大”多大?比大更重要的是數據的復雜性,有3、軟件是大數據的引擎和數據中心(DataCenter)

一樣,軟件是大數據的驅動力,軟件改變世界3、軟件是大數據的引擎和數據中心(DataCenter)大數據生態:軟件是引擎大數據生態:軟件是引擎4、大數據的應用不僅僅是精準營銷通過用戶行為分析實現精準營銷是大數據的典型應用,但是大數據在各行各業特別是公共服務領域具有廣闊的應用前景消費行業金融服務食品安全醫療衛生軍事交通環保電子商務氣象4、大數據的應用不僅僅是精準營銷通過用戶行為分析實現精準營銷5、管理大數據“易”理解大數據“難”雖然大數據是一個重大問題,真正的問題是讓大數據更有意義目前大數據管理多從架構和并行等方面考慮,解決高并發數據存取的性能要求及數據存儲的橫向擴展,但對非結構化數據的內容理解仍缺乏實質性的突破和進展,這是實現大數據資源化、知識化、普適化的核心非結構化海量信息的智能化處理:自然語言理解、多媒體內容理解、機器學習等5、管理大數據“易”理解大數據“難”雖然大數據是一個重大問題大數據的定義理解大數據相關技術與應用目錄大數據的定義理解大數據相關技術與應用目錄分析技術:數據處理:自然語言處理技術統計和分析:A/Btest;topN排行榜;地域占比;文本情感分析數據挖掘:關聯規則分析;分類;聚類模型預測:預測模型;機器學習;建模仿真大數據技術:數據采集:ETL工具數據存取:關系數據庫;NoSQL;SQL等基礎架構支持:云存儲;分布式文件系統等計算結果展現:云計算;標簽云;關系圖等存儲結構化數據:海量數據的查詢、統計、更新等操作效率低非結構化數據圖片、視頻、word、pdf、ppt等文件存儲不利于檢索、查詢和存儲半結構化數據轉換為結構化存儲按照非結構化存儲解決方案:Hadoop(MapReduce技術)流計算(twitter的storm和yahoo!的S4)數據采集數據儲存數據管理數據分析與挖掘一些相關技術分析技術:存儲解決方案:數據采集數據儲存數據管理數據分析與挖行業拓展者,打造大數據行業基石:IBM:IBM大數據提供的服務包括數據分析,文本分析,藍色云杉(混搭供電合作的網絡平臺);業務事件處理;IBMMashupCenter的計量,監測,和商業化服務(MMMS)IBM的大數據產品組合中的最新系列產品的InfoSpherebigInsights,基于ApacheHadoop。該產品組合包括:打包的ApacheHadoop的軟件和服務,代號是bigInsights核心,用于開始大數據分析軟件被稱為bigsheet,軟件目的是幫助從大量數據中輕松、簡單、直觀的提取、批注相關信息為金融,風險管理,媒體和娛樂等行業量身定做的行業解決方案微軟:2011年1月與惠普(具體而言是HP數據庫綜合應用部門)合作目標是開發了一系列能夠提升生產力和提高決策速度的設備。

EMC:EMC斬獲了紐交所和Nasdaq;大數據解決方案已包括40多個產品。Oracle:Oracle大數據機與OracleExalogic中間件云服務器、OracleExadata數據庫云服務器以及OracleExalytics商務智能云服務器一起組成了甲骨文最廣泛、高度集成化系統產品組合。大數據的應用

——企業在投入行業拓展者,打造大數據行業基石:IBM:大數據的應用

政府職能變革重視應用大數據技術,盤活各地云計算中心資產:把原來大規模投資產業園、物聯網產業園從政績工程,改造成智慧工程;在安防領域,應用大數據技術,提高應急處置能力和安全防范能力;在民生領域,應用大數據技術,提升服務能力和運作效率,以及個性化的服務,比如醫療、衛生、教育等部門;解決在金融,電信領域等中數據分析的問題:一直得到得極大的重視,但受困于存儲能力和計算能力的限制,只局限在交易數型數據的統計分析;政府投入將形成示范效應,大大推動大數據的發展。大數據的應用

——政府政府職能變革大數據的應用

“智慧大腦”智能感知互聯互通智能運營協同共享美國奧巴馬政府在白宮網站發布《大數據研究和發展倡議》,提出“通過收集、處理龐大而復雜的數據信息,從中獲得知識和洞見,提升能力,加快科學、工程領域的創新步伐,強化美國國土安全,轉變教育和學習模式”;中國工程院院士鄔賀銓說道,“智慧城市是使用智能計算技術使得城市的關鍵基礎設施的組成和服務更智能、互聯和有效,隨著智慧城市的建設,社會將步入“大數據”時代。”難點:1、在最初就合理規劃智慧城市(深度思考哪些領域能夠運用);2、在城市發展基礎設施和“云產業”的同時,更多重視“數據”的價值;3、在大數據處理領域的核心技術不足,需要政府更大的投入。大數據的應用

——熱點:智慧城市“智慧大腦”智能感知互聯互通智能運營協同共享美國奧巴馬政府在政府、金融、電信等行業投資建立大數據的處理分析手段,實現綜合治理、業務開拓等目標;應用到制造等更多行業。更多行業的應用政府、金融、電信等行業投資建立大數據的處理分析手段,實現綜合數據的再利用:由于在信息價值鏈中的特殊位置,有些公司可能會收集到大量的數據,但他們并不急需使用也不擅長再次利用這些數據。例如,移動電話運營商手機用戶的位置信息來傳輸電話信號,這對以他們來說,數據只有狹窄的技術用途。但當它被一些發布個性化位置廣告服務和促銷活動的公司再次利用時,則變得更有價值。大數據價值鏈的3大構成:數據本身、技能與思維其中三者兼具的又谷歌公司,谷歌在剛開始收集數據的時候就已經有多次使用數據的想法。比方說,它的街景采集車手機全球定位系統數據不光是為了創建谷歌地圖,也是為了制成全自動汽車以及谷歌眼鏡等與實景交匯的產品。未來,企業會依靠洞悉數據中的信息更加了解自己,也更加了解客戶。《大數據時代》傳統行業最終都會轉變為大數據行業,無論是金融服務也、醫藥還是制造業。大數據的應用

——未來,改變一切數據的再利用:大數據價值鏈的3大構成:數據本身、技能與思維未大數據賦予我們洞察未來的能力馬云成功預測2008年經濟危機“2008年初,阿里巴巴平臺上整個買家詢盤數急劇下滑,歐美對中國采購在下滑。海關是賣了貨,出去以后再獲得數據;我們提前半年時間從詢盤上推斷出世界貿易發生變化了。”通常而言,買家在采購商品前,會比較多家供應商的產品,反映到阿里巴巴網站統計數據中,就是查詢點擊的數量和購買點擊的數量會保持一個相對的數值,綜合各個維度的數據可建立用戶行為模型。因為數據樣本巨大,保證用戶行為模型的準確性。因此在這個案例中,詢盤數據的下降,自然導致買盤的下降。人類從依靠自身判斷做決定到依靠數據做決定的轉變,也是大數據作出的最大貢獻之一。——《大數據時代》大數據帶來的機遇大數據賦予我們洞察未來的能力馬云成功預測2008年經濟危機結構化數據向非結構化數據演進,使得未來IT投資重點不再是建系統為核心,而是圍繞大數據為核心;海量數據可以在各個部門創造重大的財物價值,未來投資傾斜。未來IT投資重心轉移結構化數據向非結構化數據演進,使得未來IT投資重點不再是建系大數據入門普及資料大數據入門普及資料不知道BIGDATA?你out了!反對派認為,我們現在處在一個盲目的大數據崇拜時代不知道BIGDATA?你out了!反對派認為,我們現在處大數據的定義理解大數據相關技術與應用目錄大數據的定義理解大數據相關技術與應用目錄facebook社交網絡淘寶、ebuy電子商務微博、Apps移動互聯21世紀是數據信息大發展的時代,移動互聯、社交網絡、電子商務等極大拓展了互聯網的邊界和應用范圍,各種數據正在迅速膨脹并變大。互聯網(社交、搜索、電商)、移動互聯網(微博)、物聯網(傳感器,智慧地球)、車聯網、GPS、醫學影像、安全監控、金融(銀行、股市、保險)、電信(通話、短信)都在瘋狂產生著數據。“大數據”的誕生:半個世紀以來,隨著計算機技術全面融入社會生活,信息爆炸已經積累到了一個開始引發變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息爆炸的學科如天文學和基因學,創造出了“大數據”這個概念*。如今,這個概念幾乎應用到了所有人類智力與發展的領域中。大數據時代的背景facebook社交網絡淘寶、ebuy電子商務微博、AppsGBTBPBEBZB想駕馭這龐大的數據,我們必須了解大數據的特征。地球上至今總共的數據量:在2006年,個人用戶才剛剛邁進TB時代,全球一共新產生了約180EB的數據;在2011年,這個數字達到了1.8ZB。而有市場研究機構預測:到2020年,整個世界的數據總量將會增長44倍,達到35.2ZB(1ZB=10億TB)!1PB

=2^50字節1EB

=2^60字節1ZB=2^70字節大數據時代的爆炸增長GBTBPBEBZB想駕馭這龐大的數據,我們必須了解大數據的“大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值密度低(Value)”就是“大數據”的顯著特征,或者說,只有具備這些特點的數據,才是大數據。VolumeVelocityValueVariety大數據的4V特征“大量化(Volume)、多樣化(Variety)、快速化(大數據=海量數據+復雜類型的數據海量交易數據:企業內部的經營交易信息主要包括聯機交易數據和聯機分析數據,是結構化的、通過關系數據庫進行管理和訪問的靜態、歷史數據。通過這些數據,我們能了解過去發生了什么。大數據包括:交易數據和交互數據集在內的所有數據集海量交互數據:源于Facebook、Twitter、LinkedIn及其他來源的社交媒體數據構成。它包括了呼叫詳細記錄CDR、設備和傳感器信息、GPS和地理定位映射數據、通過管理文件傳輸ManageFileTransfer協議傳送的海量圖像文件、Web文本和點擊流數據、科學信息、電子郵件等等。可以告訴我們未來會發生什么。海量數據處理:大數據的涌現已經催生出了設計用于數據密集型處理的架構。例如具有開放源碼、在商品硬件群中運行的ApacheHadoop。大數據的構成大數據=海量數據+復雜類型的數據海量交易數據:大數據大數據的定義理解大數據相關技術與應用目錄大數據的定義理解大數據相關技術與應用目錄1、密不可分的大數據與云計算商業模式驅動應用需求驅動云計算本身也是大數據的一種業務模式大數據是落地的云云計算的模式是業務模式,本質是數據處理技術。數據是資產,云為數據資產提供存儲、訪問和計算。當前云計算更偏重海量存儲和計算,以及提供的云服務,運行云應用,但是缺乏盤活數據資產的能力,挖掘價值性信息和預測性分析,為國家、企業、個人提供決策和服務,是大數據核心議題,也是云計算的最終方向。1、密不可分的大數據與云計算商業模式驅動應用需求驅動云計算本2、大數據不僅僅是“大”多大?至少PB級比大更重要的是數據的復雜性,有時甚至大數據中的小數據如一條微博就具有顛覆性的價值2、大數據不僅僅是“大”多大?比大更重要的是數據的復雜性,有3、軟件是大數據的引擎和數據中心(DataCenter)

一樣,軟件是大數據的驅動力,軟件改變世界3、軟件是大數據的引擎和數據中心(DataCenter)大數據生態:軟件是引擎大數據生態:軟件是引擎4、大數據的應用不僅僅是精準營銷通過用戶行為分析實現精準營銷是大數據的典型應用,但是大數據在各行各業特別是公共服務領域具有廣闊的應用前景消費行業金融服務食品安全醫療衛生軍事交通環保電子商務氣象4、大數據的應用不僅僅是精準營銷通過用戶行為分析實現精準營銷5、管理大數據“易”理解大數據“難”雖然大數據是一個重大問題,真正的問題是讓大數據更有意義目前大數據管理多從架構和并行等方面考慮,解決高并發數據存取的性能要求及數據存儲的橫向擴展,但對非結構化數據的內容理解仍缺乏實質性的突破和進展,這是實現大數據資源化、知識化、普適化的核心非結構化海量信息的智能化處理:自然語言理解、多媒體內容理解、機器學習等5、管理大數據“易”理解大數據“難”雖然大數據是一個重大問題大數據的定義理解大數據相關技術與應用目錄大數據的定義理解大數據相關技術與應用目錄分析技術:數據處理:自然語言處理技術統計和分析:A/Btest;topN排行榜;地域占比;文本情感分析數據挖掘:關聯規則分析;分類;聚類模型預測:預測模型;機器學習;建模仿真大數據技術:數據采集:ETL工具數據存取:關系數據庫;NoSQL;SQL等基礎架構支持:云存儲;分布式文件系統等計算結果展現:云計算;標簽云;關系圖等存儲結構化數據:海量數據的查詢、統計、更新等操作效率低非結構化數據圖片、視頻、word、pdf、ppt等文件存儲不利于檢索、查詢和存儲半結構化數據轉換為結構化存儲按照非結構化存儲解決方案:Hadoop(MapReduce技術)流計算(twitter的storm和yahoo!的S4)數據采集數據儲存數據管理數據分析與挖掘一些相關技術分析技術:存儲解決方案:數據采集數據儲存數據管理數據分析與挖行業拓展者,打造大數據行業基石:IBM:IBM大數據提供的服務包括數據分析,文本分析,藍色云杉(混搭供電合作的網絡平臺);業務事件處理;IBMMashupCenter的計量,監測,和商業化服務(MMMS)IBM的大數據產品組合中的最新系列產品的InfoSpherebigInsights,基于ApacheHadoop。該產品組合包括:打包的ApacheHadoop的軟件和服務,代號是bigInsights核心,用于開始大數據分析軟件被稱為bigsheet,軟件目的是幫助從大量數據中輕松、簡單、直觀的提取、批注相關信息為金融,風險管理,媒體和娛樂等行業量身定做的行業解決方案微軟:2011年1月與惠普(具體而言是HP數據庫綜合應用部門)合作目標是開發了一系列能夠提升生產力和提高決策速度的設備。

EMC:EMC斬獲了紐交所和Nasdaq;大數據解決方案已包括40多個產品。Oracle:Oracle大數據機與OracleExalogic中間件云服務器、OracleExadata數據庫云服務器以及OracleExalytics商務智能云服務器一起組成了甲骨文最廣泛、高度集成化系統產品組合。大數據的應用

——企業在投入行業拓展者,打造大數據行業基石:IBM:大數據的應用

政府職能變革重視應用大數據技術,盤活各地云計算中心資產:把原來大規模投資產業園、物聯網產業園從政績工程,改造成智慧工程;在安防領域,應用大數據技術,提高應急處置能力和安全防范能力;在民生領域,應用大數據技術,提升服務能力和運作效率,以及個性化的服務,比如醫療、衛生、教育等部門;解決在金融,電信領域等中數據分析的問題:一直得到得極大的重視,但受困于存儲能力和計算能力的限制,只局限在交易數型數據的統計分析;政府投入將形成示范效應,大大推動大數據的發展。大數據的應用

——政府政府職能變革大數據的應用

“智慧大腦”智能感知互聯互通智能運營協同共享美國奧巴馬政府在白宮網站發布《大數據研究和發展倡議》,提出“通過收集、處理龐大而復雜的數據信息,從中獲得知識和洞見,提升能力,加快科學、工程領域的創新步伐,強化美國國土安全,轉變教育和學習模式”;中國工程院院士鄔賀銓說道,“智慧城市是使用智能計算技術使得城市的關鍵基礎設施的組成和服務更智能、互聯和有效,隨著智慧城市的建設,社會將步入“大數據”時代。”難點:1、在最初就合理規劃智慧城市(深度思考哪些領域能夠運用);2、在城市發展基礎設施和“云產業”的同時,更多重視“數據”的價值;3、在大數據處理領域的核心技術不足,需要政府更大的投入。大數據的應用

——熱點:智慧城市“智慧大腦”智能感知互聯互通智能運營協同共享美國奧巴馬政府在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論