




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
企業(yè)的大數(shù)據(jù)戰(zhàn)略目錄\h01每個(gè)人都身處一個(gè)大數(shù)據(jù)時(shí)代\h20世紀(jì),大數(shù)據(jù)的序幕\h21世紀(jì),數(shù)據(jù)大爆發(fā)\h02你必須知道的大數(shù)據(jù)7大特征和8大事實(shí)\h大數(shù)據(jù)的“7V”特征\h你早該知道的大數(shù)據(jù)的8個(gè)事實(shí)\h大數(shù)據(jù)對(duì)社會(huì)的影響\h03大數(shù)據(jù)的7大發(fā)展趨勢(shì)\h趨勢(shì)1,移動(dòng)大數(shù)據(jù)\h趨勢(shì)2,實(shí)時(shí)大數(shù)據(jù)\h趨勢(shì)3,物聯(lián)網(wǎng)\h趨勢(shì)4,量化自我\h趨勢(shì)5,社交大數(shù)據(jù)\h趨勢(shì)6,公共大數(shù)據(jù)\h趨勢(shì)7,游戲化\h04你應(yīng)該了解的大數(shù)據(jù)技術(shù)\hHadoopHDFS和MapReduce\h開源工具\(yùn)h大數(shù)據(jù)工具和分析類型\h05如何布局企業(yè)大數(shù)據(jù)戰(zhàn)略\h以信息為中心的企業(yè)的主要特征\h大數(shù)據(jù)的8大用途\h大數(shù)據(jù)和投資回報(bào)\h資產(chǎn)負(fù)債表中的大數(shù)據(jù)\h企業(yè)內(nèi)部大數(shù)據(jù)的3大影響力\h大數(shù)據(jù)企業(yè)落地路線圖\h7種最重要的大數(shù)據(jù)員工\h中小型企業(yè)的大數(shù)據(jù)機(jī)會(huì)\h管理大數(shù)據(jù)\h06大數(shù)據(jù)落地的18個(gè)行業(yè)\h農(nóng)業(yè)\h汽車業(yè)\h消費(fèi)品業(yè)\h教育\h能源\h金融服務(wù)業(yè)\h游戲業(yè)\h醫(yī)療\h法律\h制造業(yè)\h非營(yíng)利組織\h傳媒和娛樂(lè)產(chǎn)業(yè)\h石油和天然氣產(chǎn)業(yè)\h公共部門\h零售業(yè)\h電信業(yè)\h交通運(yùn)輸業(yè)\h旅游與休閑業(yè)\h07大數(shù)據(jù)的隱私、道德和安全\h大數(shù)據(jù)隱私\h大數(shù)據(jù)道德\h大數(shù)據(jù)安全\h08大數(shù)據(jù)的未來(lái)\h商業(yè)分析的未來(lái)\h邁入波字節(jié)時(shí)代01每個(gè)人都身處一個(gè)大數(shù)據(jù)時(shí)代在人類史冊(cè)記載的所有數(shù)據(jù)中,90%是在近兩年創(chuàng)造的。然而,利用和解析大數(shù)據(jù)的需求卻由來(lái)已久。事實(shí)上,早在7000年前就曾出現(xiàn)過(guò)利用數(shù)據(jù)追蹤和控制生產(chǎn)的情況——這也是最早的相關(guān)案例。當(dāng)時(shí),美索不達(dá)米亞人利用基礎(chǔ)的會(huì)計(jì)準(zhǔn)則記錄農(nóng)作物的生長(zhǎng)情況。之后,會(huì)計(jì)準(zhǔn)則被不斷完善。1663年,約翰·格朗特(JohnGraunt)記錄并觀察了有關(guān)倫敦地區(qū)居民死亡情況的所有信息,并為了研究肆虐歐洲的黑死病,建立了警示系統(tǒng)。在首次有記載的統(tǒng)計(jì)學(xué)數(shù)據(jù)分析案例中,他將自己的研究成果匯集到了《關(guān)于死亡表的自然觀察與政治觀察》(NaturalandPoliticalObservationsMadeupontheBillsofMortality)一書中。此書對(duì)揭示17世紀(jì)人們的死因有巨大的啟示作用,格朗特因此被譽(yù)為“人口統(tǒng)計(jì)學(xué)之父”。19世紀(jì)見(jiàn)證了信息時(shí)代的開端。1887年,現(xiàn)代數(shù)據(jù)首次被采集。當(dāng)時(shí),赫爾曼·霍爾瑞斯(HermanHollerith)發(fā)明了一種計(jì)算機(jī),可以通過(guò)穿孔卡片來(lái)管理人口普查數(shù)據(jù)。20世紀(jì),大數(shù)據(jù)的序幕1937年,富蘭克林·羅斯福當(dāng)政期間,美國(guó)推行了第一個(gè)大型數(shù)據(jù)項(xiàng)目——在新頒布的《社會(huì)保障法》(SocialSecurityAct)的規(guī)定下,政府要記錄300多萬(wàn)個(gè)用人單位和2600多萬(wàn)員工的財(cái)政貢獻(xiàn)。IBM有幸得到了這個(gè)項(xiàng)目,為這個(gè)龐大的統(tǒng)計(jì)工程開發(fā)穿孔卡片讀卡機(jī)。1943年,英國(guó)人開發(fā)出了首臺(tái)數(shù)據(jù)處理機(jī)器“巨人”(Colossus)計(jì)算機(jī),用以在第二次世界大戰(zhàn)期間破譯納粹密碼。它能以每秒5000字的速度破解截獲情報(bào)中暗含的信息,極大地縮短了破譯納粹密碼所需的時(shí)間,是一個(gè)巨大的進(jìn)步。1952年,美國(guó)國(guó)家安全局成立。短短10年間,它就簽下了12000多名密碼專家。“冷戰(zhàn)”期間,這些專家開始采用自動(dòng)收集和處理情報(bào)信號(hào)的方式,信息超載的難題擺在了他們面前。1965年,美國(guó)政府決定設(shè)立首個(gè)數(shù)據(jù)中心,來(lái)存儲(chǔ)收集到的超過(guò)7.42億張納稅申報(bào)單和1.75億枚指紋。數(shù)據(jù)中心的員工將這些記錄全部轉(zhuǎn)移到計(jì)算機(jī)磁帶上,集中存放在一個(gè)地方。不過(guò)后來(lái),迫于他國(guó)反對(duì),該項(xiàng)目沒(méi)有繼續(xù)推進(jìn),但是它揭開了電子數(shù)據(jù)存儲(chǔ)時(shí)代的序幕。1989年,英國(guó)計(jì)算機(jī)科學(xué)家蒂姆·伯納斯-李(TimBerners-Lee)發(fā)明了萬(wàn)維網(wǎng)(WorldWideWeb),希望借助一個(gè)“超文本”環(huán)境促進(jìn)信息共享。當(dāng)時(shí),他肯定沒(méi)有料到,這項(xiàng)發(fā)明會(huì)對(duì)全人類產(chǎn)生這么重大的影響。從20世紀(jì)90年代開始,隨著越來(lái)越多的設(shè)備連上互聯(lián)網(wǎng),數(shù)據(jù)以一種前所未有的速度被創(chuàng)造出來(lái)。1995年,第一臺(tái)超級(jí)計(jì)算機(jī)誕生。過(guò)去,一個(gè)人用計(jì)算器需要花費(fèi)3萬(wàn)年才能完成的工作,現(xiàn)在,計(jì)算機(jī)能在1秒鐘之內(nèi)解決。21世紀(jì),數(shù)據(jù)大爆發(fā)2005年,奧萊利出版社(O’ReillyMedia)的羅格·馬古拉斯(RogerMougalas)創(chuàng)造了“大數(shù)據(jù)”一詞(此前一年,該出版公司曾提出“Web2.0”一詞),用來(lái)指代使用傳統(tǒng)商業(yè)智能工具難以實(shí)現(xiàn)分析、管理的大量數(shù)據(jù)的集合。同年,雅虎在谷歌MapReduce的基礎(chǔ)上創(chuàng)造了Hadoop,目的在于為整個(gè)萬(wàn)維網(wǎng)編寫索引。如今,世界上許多企業(yè)都在使用Hadoop這個(gè)開源大數(shù)據(jù)平臺(tái)來(lái)處理大規(guī)模數(shù)據(jù)集。隨著越來(lái)越多的社交媒體的涌現(xiàn)以及Web2.0的蓬勃發(fā)展,每天都有越來(lái)越多的數(shù)據(jù)誕生。創(chuàng)新型企業(yè)開始慢慢地挖掘這些海量數(shù)據(jù),政府也開始推進(jìn)大數(shù)據(jù)項(xiàng)目。2009年,印度政府開始對(duì)全國(guó)12億人口進(jìn)行虹膜掃描以及指紋、照片采集,然后將這些數(shù)據(jù)存儲(chǔ)在一個(gè)全球最大的生物識(shí)別數(shù)據(jù)庫(kù)中。2010年,谷歌CEO埃里克·施密特(EricSchmidt)在加利福尼亞州太浩湖(LakeTahoe)舉行的科技經(jīng)濟(jì)論壇上這樣描述信息革命:“現(xiàn)在,我們每?jī)商靹?chuàng)造出來(lái)的數(shù)據(jù)量,相當(dāng)于從文明伊始到2003年創(chuàng)造的所有數(shù)據(jù)量的總和……差不多有5艾字節(jié)(ExaByte)\h[1]……”2011年,麥肯錫發(fā)布了一篇備受好評(píng)的報(bào)告,題為《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》(BigData:TheNextFrontierforInnovation,Competition,andProductivity)。該報(bào)告得出結(jié)論稱,到2018年為止,美國(guó)將面臨14萬(wàn)名數(shù)據(jù)科學(xué)家和150萬(wàn)名數(shù)據(jù)管理員的巨大缺口,數(shù)據(jù)科學(xué)家也被認(rèn)為是21世紀(jì)最令人向往的職業(yè)。在過(guò)去幾年間,大數(shù)據(jù)初創(chuàng)公司如雨后春筍般涌現(xiàn),都在試圖幫助企業(yè)理解和利用此次大數(shù)據(jù)爆炸。就像1993年人們開始慢慢接受互聯(lián)網(wǎng)一樣,如今越來(lái)越多的公司開始采用大數(shù)據(jù),未來(lái)我們勢(shì)必會(huì)見(jiàn)證更多改變。事實(shí)上,數(shù)據(jù)量爆炸式地增長(zhǎng)讓我們跨過(guò)了十進(jìn)制系統(tǒng)時(shí)代。如今,美國(guó)的國(guó)家安全局和聯(lián)邦調(diào)查局在計(jì)算其數(shù)據(jù)存儲(chǔ)量的時(shí)候,使用的單位是堯字節(jié)(YottaByte)\h[2]。在不久的將來(lái),我們將采用波字節(jié)(BrontoByte)\h[3]作為傳感器數(shù)據(jù)的單位。因此,人們已經(jīng)創(chuàng)造了新術(shù)語(yǔ)來(lái)形容在未來(lái)幾年內(nèi)有望被創(chuàng)造出的數(shù)據(jù)量(詳見(jiàn)圖1-1)。圖1-1波字節(jié)資訊圖大數(shù)據(jù)將徹底改變?nèi)蚱髽I(yè)和人類社會(huì),而當(dāng)前可用的全球數(shù)據(jù)量有望每?jī)赡陮?shí)現(xiàn)翻番。那么,大數(shù)據(jù)到底是什么?接下來(lái),讓我們走進(jìn)大數(shù)據(jù),一探究竟。02你必須知道的大數(shù)據(jù)7大特征和8大事實(shí)眾所周知,數(shù)字化的一切皆為數(shù)據(jù)。如今,現(xiàn)有的軟硬件設(shè)備已經(jīng)不能滿足高速增長(zhǎng)的各種各樣海量數(shù)據(jù)的處理需求了。大數(shù)據(jù)太復(fù)雜且太多樣,使用傳統(tǒng)工具已經(jīng)不能再對(duì)它進(jìn)行處理、存儲(chǔ)、分析和管理了。而且,大數(shù)據(jù)的量也非常大,以至于我們無(wú)法找出癥結(jié)來(lái)對(duì)癥下藥。幸運(yùn)的是,依靠現(xiàn)在開發(fā)的硬件、工具和算法,所有的數(shù)據(jù)都能夠轉(zhuǎn)換為有價(jià)值的信息,而且,這些信息所揭示的洞見(jiàn)可用于完善企業(yè)決策、提升企業(yè)效率、降低企業(yè)成本和增加企業(yè)收入。大數(shù)據(jù)革命意蘊(yùn)豐富,勢(shì)必會(huì)影響到各行各業(yè)的所有企業(yè)。大數(shù)據(jù)的“7V”特征人們通常用3個(gè)“V”來(lái)解讀大數(shù)據(jù),即高速度(Velocity)、多樣性(Variety)和大體量(Volume)。然而,我想再補(bǔ)充4個(gè)“V”,以便更好地體現(xiàn)經(jīng)過(guò)周密思考而擬定的大數(shù)據(jù)戰(zhàn)略所帶來(lái)的影響和啟示:真實(shí)性(Veracity)、可變性(Variability)、可視化(Visualization)和高價(jià)值(Value)。高速度高速度是指創(chuàng)造、存儲(chǔ)、分析和可視化數(shù)據(jù)的速度。過(guò)去,在人們還習(xí)慣對(duì)數(shù)據(jù)進(jìn)行批處理的時(shí)候,通常每周或者每晚都會(huì)更新數(shù)據(jù)庫(kù)。如此一來(lái),計(jì)算機(jī)和服務(wù)器就需要花費(fèi)大量的時(shí)間進(jìn)行數(shù)據(jù)處理和數(shù)據(jù)庫(kù)更新。然而,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)是被實(shí)時(shí)或者說(shuō)幾乎是實(shí)時(shí)創(chuàng)造出來(lái)的。隨著無(wú)線或者有線等網(wǎng)絡(luò)連接設(shè)備的普及,機(jī)器可以實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)傳輸。當(dāng)前,數(shù)據(jù)產(chǎn)生的速度幾乎讓人不敢置信。人們每分鐘會(huì)上傳100個(gè)小時(shí)的視頻到Y(jié)ouTube上;每分鐘會(huì)發(fā)送超過(guò)2億條短信;每分鐘在Flickr上查看差不多2000萬(wàn)張照片,并有3萬(wàn)張新照片被上傳到網(wǎng)站上;每分鐘會(huì)發(fā)布30萬(wàn)條推文;另外,每分鐘會(huì)進(jìn)行差不多250萬(wàn)次谷歌搜索。因此,企業(yè)需要應(yīng)對(duì)的挑戰(zhàn)就是數(shù)據(jù)產(chǎn)生的高速度,以及對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)利用的需求。在本書第3章中,我們將詳解實(shí)時(shí)大數(shù)據(jù)。多樣性過(guò)去,所有的數(shù)據(jù)都是以行列的形式進(jìn)行整齊排列的結(jié)構(gòu)化數(shù)據(jù),不過(guò),這已經(jīng)成為歷史。如今,90%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù)。現(xiàn)在,數(shù)據(jù)的形式多種多樣,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),甚至還有復(fù)雜結(jié)構(gòu)化數(shù)據(jù)。每種數(shù)據(jù)對(duì)數(shù)據(jù)分析方式和闡釋工具的需求也有所不同。像Facebook和Twitter這樣的社交媒體網(wǎng)站提供的數(shù)據(jù),有助于揭示消費(fèi)者對(duì)你的企業(yè)品牌、服務(wù)和產(chǎn)品的看法,而傳感器數(shù)據(jù)提供的則是你的產(chǎn)品或設(shè)備如何被利用等信息,以及你該如何完善產(chǎn)品等洞見(jiàn)。本書第4章闡釋了針對(duì)不同的數(shù)據(jù)類型可采用的多種分析方法和工具。結(jié)構(gòu)化數(shù)據(jù)·記錄形式的平面文件(Flatfilesinrecordformat)平面文件是一個(gè)簡(jiǎn)單的文本文件,通常一行表示一條記錄。不過(guò),單個(gè)字段可以由逗號(hào)隔開。比如,A.CSV文件就是一種平面文件。·地理定位數(shù)據(jù)(GEOlocationdata)地理定位數(shù)據(jù)指的是物體在現(xiàn)實(shí)世界中的地理位置。·HTML5微數(shù)據(jù)(HTML5microdata)微數(shù)據(jù)可以對(duì)現(xiàn)有內(nèi)容添加新的語(yǔ)義,以實(shí)現(xiàn)更豐富的瀏覽體驗(yàn)。該數(shù)據(jù)可以通過(guò)搜索引擎、網(wǎng)絡(luò)爬蟲和瀏覽器提取。·遺留數(shù)據(jù)(Legacydata)遺留數(shù)據(jù)是指以陳舊或過(guò)時(shí)的格式存儲(chǔ)的信息,或存儲(chǔ)在計(jì)算機(jī)系統(tǒng)中的信息。訪問(wèn)或處理該信息時(shí)難度較大。·日志文件(Logfiles)日志文件記錄標(biāo)準(zhǔn)格式操作。它能夠很好地提示用戶當(dāng)前進(jìn)行的操作。·微格式(Microformats)微格式可以重新使用HTML/XHTML標(biāo)簽傳遞元數(shù)據(jù)和其他屬性。·傳感器數(shù)據(jù)(Sensordata)傳感器數(shù)據(jù)是由傳感器監(jiān)視設(shè)備或產(chǎn)品收集到的數(shù)據(jù)。傳感器可包括存儲(chǔ)和發(fā)送信息的無(wú)線射頻識(shí)別(RFID)標(biāo)簽。·電子表格(Spreadsheets)電子表格包括表格格式中的數(shù)據(jù),表示表和標(biāo)題。半結(jié)構(gòu)化數(shù)據(jù)·包含元數(shù)據(jù)標(biāo)簽的文檔(Documentscontainingmetadatatags)元數(shù)據(jù)包括作者和創(chuàng)作時(shí)間之類的信息,可以被輕松存入關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(RelationalDatabaseManagementSystem,簡(jiǎn)稱RDBMS)中。·電子數(shù)據(jù)交換文檔(ElectronicDataInterchangedocuments)電子數(shù)據(jù)交換(EDI)文檔指的是計(jì)算機(jī)系統(tǒng)之間的一系列信息的傳遞與交換,信息采用預(yù)定義格式。·豐富站點(diǎn)摘要訂閱(RichSiteSummaryfeeds)豐富站點(diǎn)摘要(RSS)訂閱為完整或匯總文檔,包含元數(shù)據(jù),用于頻繁發(fā)布、更新作品,比如博客。它采用標(biāo)準(zhǔn)化XML文件格式,信息只需發(fā)布一次,用戶可通過(guò)許多不同的程序查看。·可擴(kuò)展標(biāo)記語(yǔ)言對(duì)象(ExtendedMarkupLanguageobjects)可擴(kuò)展標(biāo)記語(yǔ)言(XML)對(duì)象由一套規(guī)則定義而成,這套規(guī)則使人類和機(jī)器都能更容易地閱讀文檔。非結(jié)構(gòu)化數(shù)據(jù)·二進(jìn)制大對(duì)象(BinaryLargeObjects)二進(jìn)制大對(duì)象(BLOB)包括以單個(gè)文件形式存儲(chǔ)在數(shù)據(jù)庫(kù)管理系統(tǒng)中的二進(jìn)制數(shù)據(jù)。它可以是圖片、音頻材料或其他任何多媒體對(duì)象。·需要控制的業(yè)務(wù)記錄(Businessrecordsrequiringcontrol)需要控制的業(yè)務(wù)記錄指的是與業(yè)務(wù)相關(guān)的文檔、書面文件或電子文件,根據(jù)法律法規(guī)或行業(yè)要求,或出于支持訴訟和證據(jù)開示需求,決定存儲(chǔ)、保留、處理或刪除。·內(nèi)容管理數(shù)據(jù)(Contentmanagementdata)內(nèi)容管理數(shù)據(jù)是指與在線平臺(tái)的內(nèi)容管理系統(tǒng)相關(guān)的數(shù)據(jù)。Wordpress和Joombla都是內(nèi)容管理系統(tǒng)。·數(shù)字資產(chǎn)(Digitalassets)數(shù)字資產(chǎn)是指需要專門存儲(chǔ)和傳輸以保證合同履行的文檔,因?yàn)閿?shù)字資產(chǎn)包含了大型和/或特殊編碼文件。·動(dòng)態(tài)內(nèi)容(多用戶)[Dynamiccontent(multipleusers)]動(dòng)態(tài)內(nèi)容是指可能由多人或多個(gè)群體創(chuàng)建、編輯、評(píng)審和認(rèn)可的內(nèi)容。谷歌文檔就是不錯(cuò)的例子,它允許多位用戶同時(shí)編輯相同的文檔。·電子郵件、短信、聊天信息(Email,textmessages,chat)它們表示個(gè)人之間、企業(yè)和個(gè)人之間、機(jī)器和個(gè)人之間的通信或其他溝通過(guò)程的數(shù)據(jù)。·知識(shí)產(chǎn)權(quán)數(shù)據(jù)(Intellectualpropertydata)知識(shí)產(chǎn)權(quán)數(shù)據(jù)是指與知識(shí)產(chǎn)權(quán)相關(guān)的數(shù)據(jù)。我們必須嚴(yán)格控制知識(shí)產(chǎn)權(quán)數(shù)據(jù)的獲取,而且必須對(duì)知識(shí)產(chǎn)權(quán)進(jìn)行管理,以避免違反材料使用相關(guān)的合同或授權(quán)條款。·社交數(shù)據(jù)(Socialdata)社交數(shù)據(jù)是指在Facebook、Twitter、YouTube、LinkedIn等社交媒體上共享的所有數(shù)據(jù)。·專門化內(nèi)容(Web數(shù)據(jù))(Specializedcontent[Webdata])專門化內(nèi)容需要特殊的訪問(wèn)、控制、內(nèi)容項(xiàng)、呈現(xiàn)以及其他功能,而在線平臺(tái)就是一個(gè)非常典型的例子。·靜態(tài)文檔(Staticdocuments)一次只能由一個(gè)用戶進(jìn)行編輯的Word、PowerPoint或Excel文檔。·分類方法/本體模型(Taxonomies/ontologies)本體模型將知識(shí)表現(xiàn)為不同的概念(事物、關(guān)系或事件),并呈現(xiàn)出概念間的關(guān)系。·語(yǔ)音識(shí)別數(shù)據(jù)(Voicerecognitiondata)語(yǔ)音識(shí)別數(shù)據(jù)就是由語(yǔ)音轉(zhuǎn)換成的計(jì)算機(jī)可識(shí)別的文本或數(shù)據(jù)。語(yǔ)音識(shí)別數(shù)據(jù)包括語(yǔ)音助手(Siri)、播客(Podcast)、語(yǔ)音到文本處理,以及語(yǔ)音控制系統(tǒng)上的數(shù)據(jù)。復(fù)雜結(jié)構(gòu)化數(shù)據(jù)·層次結(jié)構(gòu)數(shù)據(jù)(基于XML的MISMO)XML數(shù)據(jù)集與復(fù)雜的金融產(chǎn)品相關(guān)。大體量按照現(xiàn)有的數(shù)據(jù)產(chǎn)生速度,每?jī)赡陻?shù)據(jù)量就會(huì)翻番。2011年,我們創(chuàng)造了1.8澤字節(jié)的數(shù)據(jù),簡(jiǎn)直令人瞠目結(jié)舌。互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)在2011年發(fā)布的一項(xiàng)研究表明,到2020年,全球數(shù)據(jù)量將是目前的50倍。這無(wú)疑是一個(gè)巨大的體量,當(dāng)然,這很大程度上要?dú)w功于“物聯(lián)網(wǎng)”給這個(gè)持續(xù)膨脹的數(shù)字世界所做的貢獻(xiàn),因?yàn)槲锫?lián)網(wǎng)讓搭載在各種各樣設(shè)備上的傳感器遍布全球,時(shí)時(shí)刻刻都在生成數(shù)據(jù)。接下來(lái),讓我們來(lái)看一些實(shí)例。安裝在飛機(jī)引擎上的傳感器每年約產(chǎn)生25億太字節(jié)的數(shù)據(jù)。農(nóng)業(yè)產(chǎn)業(yè)通過(guò)安裝在拖拉機(jī)上的傳感器產(chǎn)生和收集了大量數(shù)據(jù)。約翰迪爾(JohnDeere)農(nóng)業(yè)機(jī)械有限公司使用傳感器上的數(shù)據(jù)來(lái)監(jiān)控機(jī)械,控制耕機(jī)數(shù)量,并幫助農(nóng)民更好地制定決策。殼牌(Shell)石油公司采用超靈敏傳感器來(lái)發(fā)現(xiàn)油井中更多的石油。如果該公司在1萬(wàn)個(gè)油井里全部安裝上這些傳感器,那么,每年將會(huì)收集約10艾字節(jié)的數(shù)據(jù)。不過(guò),與平方公里陣列望遠(yuǎn)鏡項(xiàng)目(SquareKilometerArrayTelescope)相比,這些都是小巫見(jiàn)大巫,該項(xiàng)目每天都會(huì)生成1艾字節(jié)的數(shù)據(jù)。過(guò)去,如此巨量的數(shù)據(jù)會(huì)帶來(lái)嚴(yán)重的問(wèn)題。而如今,伴隨著存儲(chǔ)成本的大幅下降、更好的存儲(chǔ)方案(如Hadoop),以及挖掘數(shù)據(jù)價(jià)值的算法的出現(xiàn),數(shù)據(jù)存儲(chǔ)不再是什么大不了的問(wèn)題了。真實(shí)性如果數(shù)據(jù)是錯(cuò)誤的,那么,高速生成和收集海量數(shù)據(jù)也就毫無(wú)意義可言。錯(cuò)誤的數(shù)據(jù)會(huì)給企業(yè)和客戶帶來(lái)不小的麻煩。倘若你想讓企業(yè)實(shí)現(xiàn)以信息為中心,你就需要確保你的數(shù)據(jù)和所進(jìn)行的數(shù)據(jù)分析沒(méi)有錯(cuò)誤。對(duì)自動(dòng)決策而言,這一點(diǎn)尤其重要,因?yàn)樽詣?dòng)決策不再涉及人類意志。但是,令人震驚的是,有1/3的企業(yè)領(lǐng)導(dǎo)者都不信任他們?cè)跊Q策制定過(guò)程中所采用的數(shù)據(jù)。因此,如果你想制定大數(shù)據(jù)戰(zhàn)略,就必須高度重視數(shù)據(jù)的正確性以及分析的精確度。我將在本書第5章深度剖析這一重要內(nèi)容。可變性大數(shù)據(jù)變化無(wú)常。弗雷斯特(Forrester)研究公司首席分析師布賴恩·霍普金斯(BrianHopkins)將大數(shù)據(jù)可變性定義為“意義的變換”。他提到了在益智問(wèn)答節(jié)目《危險(xiǎn)邊緣》(Jeopardy)中打敗人腦的超級(jí)計(jì)算機(jī)沃森(Watson)。沃森需要“仔細(xì)分析答案的意義,然后……找出正確答案”。這是非常困難的,因?yàn)樵~語(yǔ)在不同的語(yǔ)境下表達(dá)的意思可能千差萬(wàn)別。因此,要找出正確答案,沃森需要理解語(yǔ)境。事實(shí)上,可變性和多樣性經(jīng)常被混淆。舉個(gè)簡(jiǎn)單的例子,如果一個(gè)面包店供應(yīng)十種不同的面包,那是多樣性;而同一種面包的香味和口感每天都不一樣,那就是可變性。因此,可變性對(duì)進(jìn)行情感分析具有重要意義。可變性意味著定義在不斷(快速)地變化中。即使是在相似的推文中,同一個(gè)詞也可能有截然相反的意思。要進(jìn)行正確的情感分析,算法需要根據(jù)詞匯所處的語(yǔ)境,對(duì)它的意義進(jìn)行精確分析。同樣,這極具挑戰(zhàn)性。可視化這是大數(shù)據(jù)的難點(diǎn)。可視化就是將大量可理解的數(shù)據(jù)用易讀和易理解的方式呈現(xiàn)。有了正確的可視化之后,原始數(shù)據(jù)就能投入使用了。當(dāng)然,可視化采用的不是普通的曲線圖或餅圖。它采用的是既能表現(xiàn)數(shù)據(jù)變化,又能保證易讀性和易理解性的復(fù)雜圖表。可視化也許不是最大的技術(shù)難題,但肯定是最具挑戰(zhàn)性的技術(shù)難題。用一個(gè)圖表來(lái)述說(shuō)復(fù)雜的故事異常困難,但也至關(guān)重要。幸運(yùn)的是,越來(lái)越多的大數(shù)據(jù)初創(chuàng)公司開始著力應(yīng)對(duì)這一挑戰(zhàn)了。總之,可視化意義重大。高價(jià)值現(xiàn)有的所有數(shù)據(jù)將會(huì)為企業(yè)、社會(huì)和消費(fèi)者創(chuàng)造出巨大價(jià)值。大數(shù)據(jù)意味著大生意,各行各業(yè)都將從中獲利。麥肯錫宣稱,對(duì)美國(guó)醫(yī)療行業(yè)而言,大數(shù)據(jù)具有3000億美元的潛在年產(chǎn)值,相當(dāng)于西班牙每年醫(yī)療支出費(fèi)用總和的兩倍多。該報(bào)告還指出,對(duì)歐洲的公共部門管理而言,大數(shù)據(jù)具有2500億歐元的潛在年產(chǎn)值。另外,麥肯錫在其2011年那份備受推崇的大數(shù)據(jù)報(bào)告中還指出,2020年,全球使用個(gè)人位置信息的潛在消費(fèi)過(guò)剩可能高達(dá)6000億美元。顯然,大數(shù)據(jù)價(jià)值連城。當(dāng)然,數(shù)據(jù)自身并不具有價(jià)值。真正有價(jià)值的是在數(shù)據(jù)基礎(chǔ)上所做的分析,以及數(shù)據(jù)被轉(zhuǎn)換成的信息,甚至是知識(shí)和智慧。數(shù)據(jù)的價(jià)值在于企業(yè)如何利用數(shù)據(jù)打造一個(gè)以信息為中心的企業(yè),并將企業(yè)的決策制定立足于數(shù)據(jù)分析所釋放的洞見(jiàn)的基礎(chǔ)之上。你早該知道的大數(shù)據(jù)的8個(gè)事實(shí)既然我們已經(jīng)定義了大數(shù)據(jù),接下來(lái)就需要了解一下企業(yè)發(fā)展大數(shù)據(jù)戰(zhàn)略時(shí)應(yīng)該知道的有關(guān)大數(shù)據(jù)的最重要的知識(shí)。使用大數(shù)據(jù)確實(shí)需要轉(zhuǎn)變思維模式,清楚這些事實(shí)將有助于你的公司向前推進(jìn)。因?yàn)樗鼈兎浅V匾韵仍诖诉M(jìn)行簡(jiǎn)單的介紹,在后面的章節(jié)中還會(huì)有更為詳細(xì)的討論。大數(shù)據(jù)需要以信息為中心的企業(yè)文化為了真正利用大數(shù)據(jù),你的公司需要轉(zhuǎn)變?yōu)橐患乙孕畔橹行牡墓尽_@種文化變革將會(huì)催生出更多數(shù)據(jù)驅(qū)動(dòng)型決策,也將會(huì)為你的員工提供機(jī)會(huì),讓他們能夠基于真實(shí)的數(shù)據(jù)(而非計(jì)算估值)制訂新的業(yè)務(wù)、戰(zhàn)術(shù)和戰(zhàn)略計(jì)劃。大數(shù)據(jù)文化鼓勵(lì)員工在和顧客的每次接觸中都要收集數(shù)據(jù)。他們需要提出恰當(dāng)?shù)膯?wèn)題,并用準(zhǔn)確的數(shù)據(jù)加以解答。當(dāng)然,轉(zhuǎn)變公司的文化困難重重,不過(guò)本書將提供一個(gè)指導(dǎo)路線圖,幫助企業(yè)創(chuàng)建以信息為中心的文化。大數(shù)據(jù)背后的真正推手是公司內(nèi)部人員盡管文化變革對(duì)于充分利用大數(shù)據(jù)的潛力有重要意義,但是大數(shù)據(jù)戰(zhàn)略的發(fā)展卻取決于公司內(nèi)部人員。尤其是管理人員應(yīng)該清楚大數(shù)據(jù)是什么,以及如何將它運(yùn)用到公司中去。明白大數(shù)據(jù)對(duì)公司的好處的決策者越多,發(fā)展和實(shí)施成功的大數(shù)據(jù)戰(zhàn)略的可能性就越大。需要記住的最重要的一點(diǎn)是,IT部門不應(yīng)負(fù)責(zé)大數(shù)據(jù)戰(zhàn)略。IT部門只是實(shí)現(xiàn)大數(shù)據(jù)戰(zhàn)略的一種手段,不應(yīng)該由它來(lái)負(fù)責(zé)整體的戰(zhàn)略規(guī)劃。這里不妨和早年的社交媒介比較一下。幾年前,人們都認(rèn)為社交媒介是營(yíng)銷的圣杯,如今,實(shí)事求是地說(shuō),它只是一種實(shí)現(xiàn)公司營(yíng)銷和戰(zhàn)略目標(biāo)的手段。這也應(yīng)該是我們看待大數(shù)據(jù)的方式,即將它看作是董事會(huì)或管理層所制定的整體戰(zhàn)略中的一個(gè)重要組成部分。要成功開始發(fā)展大數(shù)據(jù),首先要在公司內(nèi)部找到合適的發(fā)起人,尤其是在前期回報(bào)不能確定,而成本又可能較高時(shí)。最好選擇一名高管或董事,因?yàn)檫@些人有能力支持這個(gè)項(xiàng)目,即使初期產(chǎn)生的是消極結(jié)果。大數(shù)據(jù)無(wú)處不在任何數(shù)字化的事物皆為數(shù)據(jù)。越來(lái)越多的事物被數(shù)字化,并與互聯(lián)網(wǎng)產(chǎn)生聯(lián)系,這意味著你的公司正在接收全新領(lǐng)域的數(shù)據(jù)。物聯(lián)網(wǎng)運(yùn)動(dòng)表明,任何產(chǎn)品或設(shè)備都能與互聯(lián)網(wǎng)相連,因此都能提供數(shù)據(jù)。公司應(yīng)該利用這種信息,并敢于將產(chǎn)品數(shù)字化。大數(shù)據(jù)見(jiàn)者有份——你只需拓寬視野去發(fā)現(xiàn)在哪里能找到它,以及如何分析和使用它。物聯(lián)網(wǎng)甚至能讓一杯咖啡轉(zhuǎn)化成數(shù)據(jù)。只要在杯子上安裝一些傳感器,你就能分析某人喝咖啡的時(shí)間、速度、地點(diǎn)、持續(xù)時(shí)間、啜飲次數(shù)、咖啡溫度,以及咖啡粉和水的用量等。如果你能夠收集員工喝咖啡的數(shù)據(jù)并加以適當(dāng)分析,就能將它轉(zhuǎn)化為信息,用來(lái)了解員工喝咖啡的習(xí)慣。當(dāng)然,這只是一個(gè)玩笑,我懷疑是否有管理者會(huì)對(duì)這樣的信息感興趣,但是它表明,要想將大數(shù)據(jù)真正地融入你的公司,你應(yīng)該打破常規(guī)思維。除此之外,你也應(yīng)該開始關(guān)注一下公開數(shù)據(jù)市場(chǎng),它們正大量涌現(xiàn)。這些數(shù)據(jù)市場(chǎng)同時(shí)收集全世界免費(fèi)和付費(fèi)的公開數(shù)據(jù)集。如果將你自己的數(shù)據(jù)和這些新數(shù)據(jù)集結(jié)合起來(lái),你就能獲得全新的見(jiàn)解和信息。大數(shù)據(jù)工程師將是稀缺資源麥肯錫發(fā)布的一份報(bào)告預(yù)計(jì),2018年,僅美國(guó)的大數(shù)據(jù)工程師缺額就約為14萬(wàn)到19萬(wàn)人。該報(bào)告還預(yù)測(cè),負(fù)責(zé)管理大數(shù)據(jù)工程師,并將大數(shù)據(jù)的IT方面和戰(zhàn)略方面聯(lián)系在一起的大數(shù)據(jù)經(jīng)理缺額為150萬(wàn)人。因此,未來(lái)大數(shù)據(jù)員工需求將出現(xiàn)巨大的缺口。然而,你招聘的人員并不應(yīng)僅限于大數(shù)據(jù)工程師和經(jīng)理,還應(yīng)包括大數(shù)據(jù)分析師、大數(shù)據(jù)解決方案架構(gòu)師。當(dāng)然,大數(shù)據(jù)科學(xué)家也應(yīng)包含在內(nèi)。特別是大數(shù)據(jù)科學(xué)家很難找到,因此要價(jià)也高,經(jīng)常被稱為“21世紀(jì)最令人心動(dòng)的職業(yè)”。現(xiàn)在,全世界只有少數(shù)幾個(gè)人能真正稱得上是大數(shù)據(jù)科學(xué)家。如果公司不想錯(cuò)過(guò)未來(lái)的發(fā)展,那就應(yīng)該開始為IT人員培訓(xùn)大數(shù)據(jù)技術(shù),尤其是想要自行開發(fā)大數(shù)據(jù)解決方案的公司。很多大學(xué)也已經(jīng)在開設(shè)大數(shù)據(jù)工程課程,為接收未來(lái)的學(xué)生做準(zhǔn)備。實(shí)際上,越來(lái)越多的大學(xué)已經(jīng)在提供大數(shù)據(jù)學(xué)習(xí)項(xiàng)目,以及在在線平臺(tái)上開設(shè)課程,比如Coursera。大數(shù)據(jù)需要重大安保措施收集有巨大價(jià)值的數(shù)據(jù)集的公司需要保護(hù)這些信息,避免犯罪分子盜竊和利用這些數(shù)據(jù)。近年來(lái),許多互聯(lián)網(wǎng)企業(yè)和政府機(jī)構(gòu)都遭受過(guò)黑客入侵,包括LinkedIn、印象筆記(Evernote),甚至Bitcoin。因此,保護(hù)搜集到的所有數(shù)據(jù),意義非常重大。保護(hù)數(shù)據(jù)的方式有多種,最常見(jiàn)的是對(duì)信息進(jìn)行適當(dāng)?shù)募用芴幚怼.?dāng)然,還有很多方法可以保護(hù)數(shù)據(jù),所以,安保應(yīng)該始終是你大數(shù)據(jù)團(tuán)隊(duì)工作內(nèi)容的一部分。然而,每個(gè)公司也應(yīng)該設(shè)定一個(gè)危機(jī)預(yù)案,以防萬(wàn)一。令人驚訝的是,許多公司在面對(duì)與計(jì)算機(jī)有關(guān)的安全漏洞時(shí),仍然不知所措。這樣一個(gè)漏洞可能會(huì)帶來(lái)災(zāi)難性的后果。更為糟糕的是,有些公司甚至缺乏發(fā)現(xiàn)黑客入侵的安保機(jī)制。因此,公司應(yīng)該為可能的入侵早作打算,要么制訂內(nèi)部方案,要么使用相關(guān)專業(yè)機(jī)構(gòu)的服務(wù)。無(wú)法保護(hù)你的公司和顧客的數(shù)據(jù)安全,很可能意味著你的公司將走到盡頭。關(guān)于隱私的公開討論將不可避免伴隨大數(shù)據(jù)而來(lái)的是重大隱私問(wèn)題。在大數(shù)據(jù)時(shí)代,無(wú)論是線上還是線下,“老大哥”將會(huì)監(jiān)視每一個(gè)人。2013年,愛(ài)德華·斯諾登(EdwardSnowden)曝光的“棱鏡門”事件表明,個(gè)人隱私能并且會(huì)在這個(gè)數(shù)字時(shí)代受到影響。另外,如果不對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)哪涿幚恚蜁?huì)存在被重新識(shí)別的風(fēng)險(xiǎn)。盡管重新識(shí)別難以實(shí)現(xiàn)且代價(jià)高昂,但是并非不可能。確保數(shù)據(jù)來(lái)源可靠,從而保證數(shù)據(jù)的所有權(quán)不受侵害,這一點(diǎn)也非常重要。你需要正確對(duì)待數(shù)據(jù)。互聯(lián)網(wǎng)上有大量展示大數(shù)據(jù)負(fù)面的電影。隨著越來(lái)越多的消費(fèi)者覺(jué)察到大數(shù)據(jù)對(duì)他們隱私的影響,關(guān)于企業(yè)收集個(gè)人信息的限度的公開討論將不斷升級(jí)。所有企業(yè)需要為此建立明確的指導(dǎo)原則。消費(fèi)者們逐漸意識(shí)到了企業(yè)每天都在收集他們的各種數(shù)據(jù)。他們發(fā)現(xiàn),這些企業(yè)通常會(huì)將這些數(shù)據(jù)保存很長(zhǎng)時(shí)間,一般是兩年或更久,而且如果它們?cè)敢猓€可以出售這些數(shù)據(jù)。而且,企業(yè)都會(huì)盡可能地讓這些數(shù)據(jù)的用途最大化。例如,2013年支付服務(wù)提供商Equens就曾試圖將交易數(shù)據(jù)出售給荷蘭的零售商,這立即引發(fā)了荷蘭民眾和議會(huì)的轟動(dòng)。幾天后,這家公司不得不取消這個(gè)計(jì)劃。各國(guó)政府正在大力發(fā)展大數(shù)據(jù)戰(zhàn)略和企業(yè)一樣,政府產(chǎn)生的數(shù)據(jù)也在不斷增加。許多政府都正在變得越來(lái)越數(shù)字化。例如,荷蘭政府希望到2017年年底徹底實(shí)現(xiàn)數(shù)字化辦公,不再使用紙質(zhì)產(chǎn)品。想象一下,這個(gè)有1700萬(wàn)公民的國(guó)家將會(huì)產(chǎn)生多少數(shù)據(jù)!其他政府也在發(fā)展國(guó)家大數(shù)據(jù)戰(zhàn)略。2012年,美國(guó)政府為大數(shù)據(jù)領(lǐng)域的研發(fā)工作提供了2億美元。為了存儲(chǔ)未來(lái)產(chǎn)生的所有數(shù)據(jù),美國(guó)國(guó)家安全局正在猶他州建立一個(gè)大型大數(shù)據(jù)倉(cāng)庫(kù),據(jù)說(shuō)能夠存儲(chǔ)12艾字節(jié)的數(shù)據(jù)。歐盟競(jìng)爭(zhēng)事務(wù)專員尼莉·克羅斯(NeelieKroes)是大數(shù)據(jù)的支持者,她希望歐洲能走在這個(gè)領(lǐng)域的前沿。她看到了這個(gè)機(jī)會(huì),竭力主張歐盟各國(guó)能與公眾分享它們的數(shù)據(jù)集,以開發(fā)解決問(wèn)題的應(yīng)用程序。在這些措施的作用下,公開數(shù)據(jù)集已為越來(lái)越多的企業(yè)使用,這不僅推動(dòng)了創(chuàng)新,也為世界性問(wèn)題找到了新的解決方案。越來(lái)越多的私人機(jī)構(gòu)也發(fā)展起來(lái),為企業(yè)收集公開和私人數(shù)據(jù)集。訪客可以購(gòu)買或免費(fèi)下載這些數(shù)據(jù)集。在一些網(wǎng)站上,企業(yè)也可以出售它們的數(shù)據(jù)集。另外,谷歌和亞馬遜都在發(fā)展大數(shù)據(jù)市場(chǎng),不過(guò)規(guī)模仍然相對(duì)較小。前面還有很長(zhǎng)一段路要走,不過(guò)顯然,政府也能從大數(shù)據(jù)提供的機(jī)會(huì)中獲得很多好處。大數(shù)據(jù)并不只體現(xiàn)在數(shù)據(jù)量上人們一般認(rèn)為,“大數(shù)據(jù)”一詞表示大量數(shù)據(jù)。所以,很多人覺(jué)得只有在擁有幾個(gè)拍字節(jié)或艾字節(jié)數(shù)據(jù)時(shí),才可能實(shí)現(xiàn)大數(shù)據(jù)戰(zhàn)略。這種觀點(diǎn)是錯(cuò)誤的。大數(shù)據(jù)并不僅僅體現(xiàn)在所收集的數(shù)據(jù)量上,也不僅僅是指在不同時(shí)刻將不同來(lái)源、不同類型的數(shù)據(jù)集合并,而是特指將不同數(shù)據(jù)集合并,并進(jìn)行后續(xù)的分析,由此產(chǎn)生新的、有價(jià)值的見(jiàn)解。這意味著大數(shù)據(jù)戰(zhàn)略對(duì)于中小型企業(yè)也是有可能實(shí)現(xiàn)的。即使你的公司沒(méi)有拍字節(jié)的數(shù)據(jù),當(dāng)它和公開數(shù)據(jù)集或社交數(shù)據(jù)結(jié)合時(shí),也能獲得更多的見(jiàn)解。另外,大數(shù)據(jù)也指實(shí)時(shí)分析可用數(shù)據(jù)和使用算法去預(yù)測(cè)行為。實(shí)時(shí)解析對(duì)企業(yè)來(lái)說(shuō)非常有價(jià)值,因?yàn)閺闹锌梢灾獣灶櫩图磳⒆龅氖虑椤_@就是大數(shù)據(jù)的一部分。即使數(shù)據(jù)量沒(méi)有達(dá)到艾字節(jié),也可以做這樣的分析。切勿被擁有大量數(shù)據(jù)的公司嚇倒。盡管更多的數(shù)據(jù)意味著更多的見(jiàn)解,但不一定表示能從中得出更好的見(jiàn)解。迪士尼,邂逅大數(shù)據(jù),打造更為魔幻的用戶體驗(yàn)\h[4]迪士尼是世界上最為人仰慕的公司之一。每年,迪士尼樂(lè)園會(huì)接待全世界大約1億名游客。這些游客產(chǎn)生了大量數(shù)據(jù),那正是迪士尼想要收集的。2013年,這家公司聲稱發(fā)明了無(wú)線跟蹤器“MagicBand”,即一個(gè)手環(huán),能讓游客的奧蘭多迪士尼世界之旅增添更多的魔幻氣息。作為回報(bào),它能記錄下游客完整的數(shù)據(jù)鏈。MagicBand與一張信用卡相關(guān)聯(lián),其作用相當(dāng)于樂(lè)園的通行證。這些功能是新型MyMagic+系統(tǒng)的一部分。其中,會(huì)員擁有許多優(yōu)勢(shì),比如不用排隊(duì),可進(jìn)行游樂(lè)設(shè)施預(yù)約,并可通過(guò)智能手機(jī)變更預(yù)約,等等。同時(shí),MyMagic+系統(tǒng)能讓迪士尼公司收集顧客大量的敏感數(shù)據(jù)和有價(jià)值的數(shù)據(jù),包括實(shí)時(shí)位置、購(gòu)買歷史、游玩模式,等等。同樣,迪士尼也圍繞游客在樂(lè)園中的一舉一動(dòng)建立了一個(gè)巨大的數(shù)據(jù)庫(kù)。所有這些數(shù)據(jù)都在等待迪士尼去分析和使用,由此做出更好的決策,從而提升服務(wù)水平,調(diào)整營(yíng)銷信息。盡管迪士尼正在收集海量數(shù)據(jù),但也尊重游客的隱私。這家公司讓游客完全掌控被收集、存儲(chǔ)、分享或完全不能接觸的數(shù)據(jù)的類型和數(shù)量。游客可通過(guò)一個(gè)特殊的菜單,選擇迪士尼是否可以在他們待在樂(lè)園的時(shí)段或回家期間向他們發(fā)送個(gè)性化的服務(wù)。必須等到游客做出選擇之后,樂(lè)園才能使用MagicBand中存儲(chǔ)的個(gè)人信息。然而,即使經(jīng)過(guò)最嚴(yán)格的選擇,MagicBand依然記錄了游客在樂(lè)園中的普遍活動(dòng)信息。為了發(fā)揮MyMagic+系統(tǒng)的最大功效,迪士尼使盡渾身解數(shù):培訓(xùn)了6萬(wàn)名員工使用該系統(tǒng);在奧蘭多124平方千米的樂(lè)園中安裝免費(fèi)Wi-Fi。免費(fèi)Wi-Fi能讓游客在園內(nèi)更頻繁地使用智能手機(jī),從而增加收集到的數(shù)據(jù)量。分析人員預(yù)計(jì),建設(shè)整個(gè)項(xiàng)目的花費(fèi)將近8億美元。為了存儲(chǔ)、處理、分析和可視化處理MyMagic+系統(tǒng)生成的所有數(shù)據(jù),迪士尼創(chuàng)建了基于Hadoop、Cassandra和MongoDB的大數(shù)據(jù)平臺(tái)。平臺(tái)由一整套具有特定用途的其他工具來(lái)實(shí)施。早在2009年,迪士尼就從關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)升級(jí)到了擁有第一個(gè)Hadoop集群,此后不久就能建成一個(gè)數(shù)據(jù)管理平臺(tái)。然而,迪士尼并未急于求成,而是從小處著手,像創(chuàng)業(yè)團(tuán)隊(duì)建立公司一樣打造大數(shù)據(jù)平臺(tái)。它從小型靈活的團(tuán)隊(duì)入手,及早發(fā)現(xiàn)錯(cuò)誤,及早處理,并一直在不斷改進(jìn)。一開始,迪士尼使用了開源工具以節(jié)省成本,但是隨著數(shù)據(jù)量的增長(zhǎng),開源工具不再管用。因此,它又選擇了付費(fèi)工具,這些工具在處理迪士尼的大量數(shù)據(jù)方面更可靠。現(xiàn)在,迪士尼通過(guò)分析收集到的所有數(shù)據(jù)來(lái)獲得有價(jià)值的見(jiàn)解。它用到的分析技術(shù)有多種,包括但不限于受眾分析、分類分析、推薦分析以及園內(nèi)交通流量分析。迪士尼利用大數(shù)據(jù)的機(jī)會(huì)有很多。這家公司已經(jīng)體驗(yàn)到了MyMagic+系統(tǒng)給奧蘭多市迪士尼樂(lè)園帶來(lái)的巨大成果,因此,預(yù)計(jì)會(huì)向世界上其他迪士尼樂(lè)園推廣該系統(tǒng)。由此收集到的巨量數(shù)據(jù)將為迪士尼提供富有價(jià)值的見(jiàn)解,從而打造更為魔幻的用戶體驗(yàn)。大數(shù)據(jù)對(duì)社會(huì)的影響自從麥肯錫著名的2011年報(bào)告發(fā)布以來(lái),發(fā)生了許多事情。雖然在該報(bào)告中,大數(shù)據(jù)被稱為創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿,但是前面仍然有很長(zhǎng)一段路要走。2013年,塔塔咨詢服務(wù)公司(TataConsultancyServices)的研究顯示,2012年接受調(diào)查的643家公司中,47%的公司沒(méi)有使用大數(shù)據(jù)。另外,賽仕軟件研究所(SASInstituteInc.)同一年發(fā)布的大數(shù)據(jù)研究報(bào)告顯示,2012年接受調(diào)查的339家公司中,21%對(duì)大數(shù)據(jù)了解不足,15%不知道大數(shù)據(jù)能給自己帶來(lái)何種好處。所以,雖然有越來(lái)越多的公司在實(shí)施大數(shù)據(jù)戰(zhàn)略,但是仍有許多公司不了解其重要性。既然有一些公司不了解大數(shù)據(jù),大量消費(fèi)者也就可能同樣不清楚它的影響。這不禁讓人感到驚悚,因?yàn)榇髷?shù)據(jù)將會(huì)對(duì)社會(huì)和企業(yè)的管理和運(yùn)作方式以及政府的組織方式產(chǎn)生巨大影響,最終還會(huì)波及全球經(jīng)濟(jì)運(yùn)行的方式。高德納(Gartner)公司預(yù)測(cè),大數(shù)據(jù)的發(fā)展將會(huì)推動(dòng)IT開支上漲,到2016年年底將達(dá)到2320億美元。大數(shù)據(jù)擁有提供巨額收益的潛力,但是這只有等到所有企業(yè)和政府都開始全面使用大數(shù)據(jù)并從中獲益的時(shí)候才會(huì)顯現(xiàn)出來(lái)。顯然,影響經(jīng)濟(jì),就會(huì)影響社會(huì)。大數(shù)據(jù)將會(huì)為消費(fèi)者帶來(lái)許多好處,比如更優(yōu)質(zhì)且更個(gè)性化的產(chǎn)品和服務(wù)、更少的能源費(fèi)用,以及更高的透明度。由于量化自我(Quantified-self)運(yùn)動(dòng)的出現(xiàn),消費(fèi)者能夠跟蹤和監(jiān)視自己的一舉一動(dòng),從而更加了解自己的生活(見(jiàn)第3章)。但是,大數(shù)據(jù)也會(huì)影響消費(fèi)者的隱私。隨著社會(huì)越來(lái)越公開和透明,消費(fèi)者也會(huì)感覺(jué)好像有人在不斷監(jiān)視自己。企業(yè)不尊重消費(fèi)者的隱私權(quán)或不清楚如何處理收集到的數(shù)據(jù)的例子比比皆是。例如,2012年,Path承認(rèn)未經(jīng)人們?cè)S可收集數(shù)據(jù);Twitter向大數(shù)據(jù)經(jīng)紀(jì)人出售了價(jià)值幾十億美元的信息檔案;WhatsApp遭遇加拿大和荷蘭數(shù)據(jù)保護(hù)部門的聯(lián)合調(diào)查。未來(lái),如果再發(fā)生這種事情,這些企業(yè)可能不僅會(huì)受到政府和法律的懲罰,更重要的是,也會(huì)受到消費(fèi)者抵制。如果有更好的選擇,消費(fèi)者可能會(huì)拋棄這些公司。漸漸地,消費(fèi)者意識(shí)到新技術(shù)的出現(xiàn)會(huì)讓他們的隱私遭受侵犯,這可能導(dǎo)致新法規(guī)的建立,進(jìn)而改變這一技術(shù)產(chǎn)業(yè)。如果政府不推進(jìn)這些改革,消費(fèi)者可能會(huì)要求企業(yè)改變政策、產(chǎn)品和它們使用的技術(shù)。因此,本書第7章提出了四項(xiàng)道德準(zhǔn)則,幫助企業(yè)妥善處理數(shù)據(jù)。值得慶幸的是,社會(huì)也可能成為新技術(shù)背后的推手。這里有一個(gè)很好的例子,就是社交媒體分析的崛起,因?yàn)橄M(fèi)者已經(jīng)開始使用社交網(wǎng)絡(luò)來(lái)聯(lián)系彼此。所以,和其他所有具有顛覆性的技術(shù)一樣,大數(shù)據(jù)將會(huì)影響企業(yè)的發(fā)展。創(chuàng)新者和早期采用者已經(jīng)投身于發(fā)展大數(shù)據(jù)戰(zhàn)略,大數(shù)據(jù)戰(zhàn)略將改變企業(yè)管理和運(yùn)作的方式。實(shí)施大數(shù)據(jù)戰(zhàn)略的企業(yè)已經(jīng)在財(cái)務(wù)上超出同行20%。這些企業(yè)享受到了大數(shù)據(jù)帶來(lái)的好處,并對(duì)全球經(jīng)濟(jì)產(chǎn)生了影響。因此,大數(shù)據(jù)影響著社會(huì)的許多方面;反過(guò)來(lái),社會(huì)也能影響技術(shù)。這種“技術(shù)影響循環(huán)”是持續(xù)進(jìn)行的(見(jiàn)圖2-1)。除了對(duì)大數(shù)據(jù)的影響外,它也能用于討論其他新技術(shù)對(duì)企業(yè)、經(jīng)濟(jì)和社會(huì)的影響。一般來(lái)說(shuō),技術(shù)影響循環(huán)完成一次需要幾年時(shí)間。所以,雖然奧萊利出版社早在2005年就首度提出了“大數(shù)據(jù)”這個(gè)術(shù)語(yǔ),但我們直到現(xiàn)在才開始理解它對(duì)全世界的巨大影響。然而,社會(huì)將如何影響大數(shù)據(jù)仍有待明確。圖2-1技術(shù)影響循環(huán)本章小結(jié)大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。企業(yè)需要了解大數(shù)據(jù)是什么,以及如何使用大數(shù)據(jù)。其優(yōu)勢(shì)和好處非同小可,不容企業(yè)忽視。人們通常使用3個(gè)“V”來(lái)說(shuō)明大數(shù)據(jù):高速度(Velocity)、多樣性(Variety)和大體量(Volume)。然而,為了更加完整,還需要加上另外4個(gè)“V”:真實(shí)性(Veracity)、可變性(Variability)、可視化(Visualization)、高價(jià)值(Value)。大數(shù)據(jù)包含不同數(shù)據(jù)集中的各種數(shù)據(jù),這些數(shù)據(jù)集結(jié)合起來(lái)可提供有價(jià)值的見(jiàn)解,其中包括更好的顧客細(xì)分、效率更高的供應(yīng)鏈,或降低風(fēng)險(xiǎn)的手段。不同數(shù)據(jù)集結(jié)合在一起,比如企業(yè)數(shù)據(jù)、公開數(shù)據(jù)和社交數(shù)據(jù),將會(huì)提供更多的見(jiàn)解。03大數(shù)據(jù)的7大發(fā)展趨勢(shì)大數(shù)據(jù)的許多方面都影響著企業(yè)的大數(shù)據(jù)戰(zhàn)略及實(shí)施該戰(zhàn)略的方式。正如第2章所討論的,每種類型的數(shù)據(jù)都會(huì)對(duì)你進(jìn)行的分析和使用的工具產(chǎn)生影響。這些因素大多涉及大數(shù)據(jù)的技術(shù)方面,但是,有些趨勢(shì)也會(huì)對(duì)你的戰(zhàn)略,甚至整個(gè)公司都將產(chǎn)生影響。因此,密切關(guān)注這些趨勢(shì)非常重要。第一,我們將看到移動(dòng)革命將會(huì)對(duì)大數(shù)據(jù)產(chǎn)生重大影響。隨著移動(dòng)設(shè)備使用得越來(lái)越頻繁,智能手機(jī)的銷量也在不斷上升。Canalys研究機(jī)構(gòu)預(yù)測(cè),2017年售出的15億部手機(jī)將全部是智能手機(jī)。另外,平板電腦銷量也在猛增。移動(dòng)設(shè)備處理大數(shù)據(jù)時(shí),將需要使用一種不同的方法。第二,我們將發(fā)現(xiàn)實(shí)時(shí)大數(shù)據(jù)能讓公司產(chǎn)生最大的價(jià)值。分析多個(gè)來(lái)源的數(shù)以億兆的數(shù)據(jù)不僅有趣,還能得到很多洞見(jiàn),而在這些數(shù)據(jù)產(chǎn)生之初即對(duì)其加以分析,能獲得更大的可能性。將數(shù)據(jù)實(shí)時(shí)處理、存儲(chǔ)、分析和可視化,能讓一個(gè)公司隨時(shí)了解它在世界各個(gè)地方的流程、產(chǎn)品、機(jī)器、員工和客戶的狀況。如果你能夠?qū)Τ霈F(xiàn)的事件實(shí)時(shí)做出反應(yīng),得到積極結(jié)果的可能性就更大。第三,物聯(lián)網(wǎng)可能是大數(shù)據(jù)潮流中最為顯著的趨勢(shì)。在未來(lái)幾年里,裝有傳感器的設(shè)備的數(shù)量可能會(huì)超過(guò)1萬(wàn)億臺(tái)。當(dāng)我們連接上過(guò)去未聯(lián)通的事物,就會(huì)出現(xiàn)前所未有的全新的可能。在這樣一個(gè)互聯(lián)的世界里,即使最微小的事物也將產(chǎn)生巨大影響。有關(guān)物聯(lián)網(wǎng)的一個(gè)很好的例子是松島新城。該城市里有很多智能創(chuàng)新,比如可自動(dòng)根據(jù)行人流量調(diào)整的街燈;所有房屋都配備傳感器,這也被稱為住宅自動(dòng)化(Domotics)。智慧城市將會(huì)給日常產(chǎn)生的數(shù)據(jù)量帶來(lái)重大影響。物聯(lián)網(wǎng)將會(huì)創(chuàng)造出一個(gè)完全互聯(lián)的社會(huì)。到21世紀(jì)20年代,數(shù)萬(wàn)億臺(tái)設(shè)備與互聯(lián)網(wǎng)連接,將會(huì)產(chǎn)生數(shù)波字節(jié)數(shù)據(jù)。所有這些數(shù)據(jù)都需要處理、存儲(chǔ)、分析和可視化,以幫助制定更明智的決策。這將會(huì)改變我們的社會(huì)以及企業(yè)的運(yùn)作和管理方式。第四,量化自我運(yùn)動(dòng)的興起,也是一個(gè)主要趨勢(shì)。量化自我運(yùn)動(dòng)之于消費(fèi)者,正如大數(shù)據(jù)之于企業(yè)。不僅企業(yè)想知道正在發(fā)生什么,消費(fèi)者也想知道自己在做什么,以及如何改善自己的行為。答案是:首先要記錄和了解你現(xiàn)在的行為方式。量化自我已經(jīng)催生出一些應(yīng)用,幫助消費(fèi)者衡量他們生活中的一切——從睡眠質(zhì)量到食物攝入量,再到卡路里的消耗量。所有這些數(shù)據(jù)都存儲(chǔ)在云中,給予公司有價(jià)值的見(jiàn)解,讓它們知道如何提升自己的產(chǎn)品。耐克就是一個(gè)充分理解量化自我潛力的公司,它能夠?qū)⒑?jiǎn)單的個(gè)人運(yùn)動(dòng)轉(zhuǎn)變?yōu)樯缃贿\(yùn)動(dòng),借此產(chǎn)生大量數(shù)據(jù)。第五,我們也將鉆研社交大數(shù)據(jù),也就是社交網(wǎng)絡(luò)產(chǎn)生的大量數(shù)據(jù)。目前已有數(shù)百家社交網(wǎng)站,它們的注冊(cè)用戶在不斷增長(zhǎng)。所有用戶共同產(chǎn)生了海量數(shù)據(jù),這些數(shù)據(jù)經(jīng)過(guò)分析后,能為企業(yè)提供更多的見(jiàn)解。顯然,最大的幾家社交網(wǎng)絡(luò)平臺(tái)正處于大數(shù)據(jù)技術(shù)的前沿,它們發(fā)明了一些能獲得有價(jià)值的見(jiàn)解的算法。比如,當(dāng)某上市公司所有高管突然更新他們的資料時(shí),LinkedIn就會(huì)看出發(fā)生了一些事情。當(dāng)然,這種敏感性數(shù)據(jù)可以說(shuō)非常有價(jià)值。第六,公開數(shù)據(jù)的利用是一個(gè)不能低估的趨勢(shì)。各國(guó)政府看到了大數(shù)據(jù)的優(yōu)勢(shì),它們正在開放利用公共資金收集的數(shù)據(jù)集。有時(shí),它們會(huì)免費(fèi)或以成本價(jià)提供收集到的數(shù)據(jù)集。企業(yè)可以利用這些數(shù)據(jù)集獲得更多的洞見(jiàn),并發(fā)現(xiàn)新市場(chǎng)或目標(biāo)群體。如果企業(yè)要找免費(fèi)或便宜的數(shù)據(jù)集,可以去即將面世的在線數(shù)據(jù)市場(chǎng)或數(shù)據(jù)超市。第七,我們將研究游戲化的潛力,看看它能如何幫助企業(yè)在方便用戶且令人愉快的環(huán)境中產(chǎn)生大量數(shù)據(jù)。通常來(lái)說(shuō),小趨勢(shì)只能持續(xù)幾年,而大數(shù)據(jù)是大趨勢(shì),這七個(gè)趨勢(shì)也構(gòu)成了企業(yè)應(yīng)對(duì)大數(shù)據(jù)挑戰(zhàn)的重要戰(zhàn)略組成部分。在接下來(lái)的十年里,它們將繼續(xù)存在,企業(yè)在制定任何大數(shù)據(jù)戰(zhàn)略時(shí)應(yīng)加以重點(diǎn)考慮。趨勢(shì)1,移動(dòng)大數(shù)據(jù)移動(dòng)設(shè)備在近幾年內(nèi)迅速崛起,將對(duì)大數(shù)據(jù)產(chǎn)生重大影響,尤其是在可視化方面。2013年,超過(guò)20%的網(wǎng)站訪問(wèn)來(lái)自移動(dòng)設(shè)備端。移動(dòng)設(shè)備不僅指手機(jī),還包括平板電腦。盡管仍然有很大一部分手機(jī)不是智能手機(jī),但人們預(yù)計(jì)這一局面將在接下來(lái)的幾年里發(fā)生改變。2013年年底,全球正在使用中的智能手機(jī)已達(dá)到14億臺(tái)。高德納公司預(yù)測(cè),2017年,平板電腦的銷量將達(dá)到個(gè)人電腦的1.75倍。智能手機(jī)市場(chǎng)增長(zhǎng)的主陣地已不再是西方國(guó)家,75%的新型手機(jī)銷量將集中在非洲和亞洲市場(chǎng)。移動(dòng)大數(shù)據(jù)可能會(huì)對(duì)一些產(chǎn)業(yè)產(chǎn)生開拓性的影響,比如醫(yī)療保健。如果醫(yī)生的智能手機(jī)或平板電腦中攜帶有患者所有重要的大數(shù)據(jù)信息,他就能在患者病床旁或手術(shù)室中利用這些信息。無(wú)疑,這將改變醫(yī)療保健產(chǎn)業(yè)的運(yùn)作方式。移動(dòng)時(shí)代已經(jīng)來(lái)臨,這需要公司改變運(yùn)作方式。它會(huì)對(duì)大數(shù)據(jù)產(chǎn)生什么影響?移動(dòng)大數(shù)據(jù)又如何能讓你的公司提升價(jià)值呢?移動(dòng)革命隨著移動(dòng)設(shè)備上網(wǎng)速度越來(lái)越快,消費(fèi)者對(duì)等待網(wǎng)絡(luò)連接也變得越來(lái)越不耐煩。現(xiàn)在,人們希望的網(wǎng)絡(luò)連接時(shí)間僅為3秒,而且最多愿意等待5秒,如果超過(guò)5秒,74%的消費(fèi)者會(huì)選擇斷開連接。更具挑戰(zhàn)性的是,71%的消費(fèi)者甚至希望移動(dòng)瀏覽器加載網(wǎng)頁(yè)的速度能和臺(tái)式電腦一樣快,甚至更快。無(wú)論用戶使用3G還是Wi-Fi,情形都相同。幸運(yùn)的是,電信網(wǎng)絡(luò)在不斷升級(jí),在少數(shù)國(guó)家,4G/LTE網(wǎng)絡(luò)已經(jīng)建成。然而,要像3G網(wǎng)絡(luò)那樣普及,尚需時(shí)日。另外,5G時(shí)代也即將到來(lái)。2013年,歐盟競(jìng)爭(zhēng)事務(wù)專員尼莉·克羅斯為歐洲在2020年步入5G時(shí)代爭(zhēng)取到了5000萬(wàn)歐元。然而,4G/LTE網(wǎng)絡(luò)的資費(fèi)還是比較昂貴,再加上5G為時(shí)尚早,消費(fèi)者仍不得不忍受較慢的3G。不過(guò),有一點(diǎn)十分清楚:未來(lái)移動(dòng)設(shè)備上的數(shù)據(jù)使用量將不斷增長(zhǎng)。愛(ài)立信預(yù)測(cè),2018年,每部智能手機(jī)平均每月的數(shù)據(jù)使用量將增至1.9GB,而2012年僅為450MB。\h[5]每臺(tái)平板電腦的數(shù)據(jù)使用量將由2012年的600MB增至2.7GB。到2017年,我們將擁有15億部新智能手機(jī)和11億臺(tái)新平板電腦,這大約會(huì)產(chǎn)生6艾字節(jié)的新移動(dòng)數(shù)據(jù)使用量。移動(dòng)大數(shù)據(jù)是什么那么,移動(dòng)大數(shù)據(jù)到底是什么呢?從根本上說(shuō),就是在移動(dòng)設(shè)備上提供大數(shù)據(jù)分析的結(jié)果。分析本身不能在移動(dòng)設(shè)備上完成,所以移動(dòng)大數(shù)據(jù)只能為消費(fèi)者或企業(yè)提供在移動(dòng)設(shè)備上訪問(wèn)可視化分析結(jié)果的路徑。雖然這聽起來(lái)簡(jiǎn)單,但是其中涉及很多挑戰(zhàn)。移動(dòng)大數(shù)據(jù)的挑戰(zhàn)第一,即將到來(lái)的“自帶設(shè)備”趨勢(shì)對(duì)IT部門將是一個(gè)挑戰(zhàn)。這意味著員工上班需攜帶自己的移動(dòng)設(shè)備,而不再是使用公司提供的設(shè)備。越來(lái)越多的公司不再為員工提供手機(jī)、平板電腦和筆記本電腦,而是讓員工自帶設(shè)備。這樣,公司將需要仔細(xì)審視自己的信息安全規(guī)定。在“金磚四國(guó)”中的巴西、印度和俄羅斯,約有75%的公司職員上班自帶設(shè)備。雖然IT部門不愿意為不受它們管理和控制的設(shè)備提供支持,但是,由于這樣做不僅降低了公司成本,還方便了員工,所以這一趨勢(shì)不可阻擋。不過(guò),相比公司的個(gè)人計(jì)算機(jī)、筆記本電腦或智能手機(jī),私人移動(dòng)設(shè)備通常安全性和約束性更差。微軟、IBM等多個(gè)公司正通過(guò)開發(fā)公司平臺(tái)來(lái)提供幫助,公司職員可以使用這些平臺(tái)安全下載必要的應(yīng)用,并確保這些個(gè)人設(shè)備所傳輸?shù)臄?shù)據(jù)安全。2012年,IBM宣布推出“基于風(fēng)險(xiǎn)的移動(dòng)用戶身份識(shí)別控制,將訪問(wèn)管理集成到移動(dòng)應(yīng)用的開發(fā)、部署以及移動(dòng)設(shè)備的強(qiáng)化控制中”。如果公司想要從員工個(gè)人的移動(dòng)設(shè)備所提供的大數(shù)據(jù)分析中得出公司層面的決策,就必須確保高度安全性。為了實(shí)現(xiàn)這一點(diǎn),公司必須迅速開展工作,因?yàn)橛泻芏嗍虑橐觥K鼈儜?yīng)該:◎確定哪些員工擁有通過(guò)個(gè)人移動(dòng)設(shè)備訪問(wèn)公司數(shù)據(jù)的權(quán)限。特別是,公司的敏感數(shù)據(jù)不應(yīng)向所有員工開放訪問(wèn)。◎規(guī)定哪些數(shù)據(jù)能通過(guò)3G/4G網(wǎng)絡(luò)瀏覽,哪些數(shù)據(jù)只能通過(guò)安全的Wi-Fi瀏覽。歸根到底,公用的3G/4G網(wǎng)絡(luò)始終比公司內(nèi)部的Wi-Fi風(fēng)險(xiǎn)更大。◎培訓(xùn)員工如何確保個(gè)人移動(dòng)設(shè)備上的數(shù)據(jù)安全。正如公司應(yīng)該培訓(xùn)員工如何對(duì)待公司設(shè)備上的數(shù)據(jù)一樣,它們也應(yīng)該培訓(xùn)員工如何對(duì)待私人設(shè)備中公司的敏感數(shù)據(jù)。◎就如何處理個(gè)人設(shè)備上的敏感數(shù)據(jù)和如何應(yīng)對(duì)危機(jī),制定策略,記錄下來(lái),并開展溝通。◎讓IT部門為與各種設(shè)備相關(guān)的許多問(wèn)題做準(zhǔn)備。第二,屏幕尺寸變小需要調(diào)整可視化水平。移動(dòng)設(shè)備可能會(huì)采用視網(wǎng)膜顯示屏或全高清顯示屏,但它仍然是并將永遠(yuǎn)是小屏幕(當(dāng)然,平板電腦除外),這樣才能隨時(shí)隨地使用。而對(duì)于智能手表(屏幕規(guī)格為128×128像素)和谷歌眼鏡(顯示分辨率為640×360像素)來(lái)說(shuō),這個(gè)挑戰(zhàn)甚至更為艱巨。不過(guò),這不是大問(wèn)題,只要換一種方式就行了。畢竟,小屏幕每次只能顯示少量信息,所以程序員將必須掙脫臺(tái)式電腦框架的束縛。大數(shù)據(jù)創(chuàng)業(yè)公司Zoomdata非常清楚這一點(diǎn),認(rèn)為移動(dòng)設(shè)備是更為理想的選擇,因?yàn)樗鼡碛兄庇^的觸摸屏。Zoomdata支持用戶在平板電腦上瀏覽它的互動(dòng)圖,同時(shí)也融合利用了平板電腦所有的優(yōu)點(diǎn)。第三,移動(dòng)設(shè)備都帶有鍵盤(智能手表和谷歌眼鏡除外),但是上面的按鍵對(duì)于許多人來(lái)說(shuō)都是一個(gè)麻煩。在移動(dòng)大數(shù)據(jù)控制面板上輸入查詢,既麻煩又費(fèi)時(shí),而且還容易出錯(cuò),最終會(huì)導(dǎo)致不必要的查詢和數(shù)據(jù)傳輸。移動(dòng)大數(shù)據(jù)的優(yōu)勢(shì)雖然面對(duì)著如此多的挑戰(zhàn),但是移動(dòng)大數(shù)據(jù)的優(yōu)勢(shì)證明了投入大量時(shí)間和金錢去克服這些挑戰(zhàn)是值得的。那么,它的優(yōu)勢(shì)是什么呢?第一,大量傳感器為收集數(shù)據(jù)創(chuàng)造了許多機(jī)會(huì)。例如,iPhone就擁有以下各種傳感器,在未來(lái),傳感器的數(shù)量只可能上升:◎近距離傳感器,測(cè)定iPhone和人臉的距離。◎運(yùn)動(dòng)傳感器/加速計(jì),能讓iPhone在橫屏模式和豎屏模式之間自動(dòng)轉(zhuǎn)換。◎環(huán)境光傳感器,測(cè)定空間內(nèi)可用光的量。◎濕度傳感器,監(jiān)測(cè)iPhone是否進(jìn)水。◎三軸陀螺儀,提升對(duì)iPhone移動(dòng)狀態(tài)的感應(yīng)能力。◎磁力計(jì),測(cè)量iPhone附近的磁場(chǎng)強(qiáng)度和/或方向。◎GPS傳感器,確定地理位置。這些傳感器能夠提升移動(dòng)設(shè)備可視化的效果。它們所提供的工具和產(chǎn)生的影響都與臺(tái)式計(jì)算機(jī)不同,因此可以增強(qiáng)我們對(duì)大數(shù)據(jù)的洞見(jiàn)。無(wú)論是創(chuàng)立大數(shù)據(jù)企業(yè)還是發(fā)展大數(shù)據(jù)戰(zhàn)略,將移動(dòng)大數(shù)據(jù)考慮在內(nèi),以及充分利用當(dāng)前移動(dòng)設(shè)備中的傳感器都是明智的選擇。這樣,企業(yè)就能提供更好的用戶體驗(yàn),反過(guò)來(lái)也會(huì)提升應(yīng)用程序的用戶量。第二,移動(dòng)設(shè)備讓隨時(shí)隨地訪問(wèn)你的所有數(shù)據(jù)成為可能。這將提高員工的生產(chǎn)力。例如,數(shù)據(jù)倉(cāng)庫(kù)的員工在他的平板電腦中有了所有必要的數(shù)據(jù),就不必為獲得必要信息而到處找臺(tái)式電腦了。第三,推送消息的利用能讓實(shí)時(shí)數(shù)據(jù)分析產(chǎn)生的影響最大化。只要數(shù)據(jù)分析觸發(fā)了一個(gè)事件,無(wú)論何時(shí),都可以通過(guò)移動(dòng)設(shè)備向用戶推送。這能帶來(lái)及時(shí)響應(yīng),否則用戶就需要坐在臺(tái)式電腦面前才能獲得信息。如果移動(dòng)設(shè)備也允許用戶立即回應(yīng),效率以及顧客滿意度都將得到極大的提升。公司使用移動(dòng)大數(shù)據(jù)時(shí)應(yīng)遵守的四項(xiàng)準(zhǔn)則為了成功使用移動(dòng)大數(shù)據(jù),企業(yè)應(yīng)遵守以下準(zhǔn)則。這些準(zhǔn)則將幫助企業(yè)充分利用移動(dòng)大數(shù)據(jù)戰(zhàn)略。準(zhǔn)則1,使用簡(jiǎn)單、智能的可視化盡管移動(dòng)設(shè)備的小屏幕需要換一種可視化方式,但是大量傳感器都支持極其智能的可視化。企業(yè)應(yīng)該記住:小屏幕上應(yīng)該只顯示最重要的信息,因?yàn)樘嗟男畔?huì)讓用戶感到困惑。對(duì)于微小型屏幕,這一點(diǎn)尤其突出,比如智能手表或谷歌眼鏡。首先向用戶展示重要信息,然后如有需要,再提供深入了解的機(jī)會(huì)。記住,要簡(jiǎn)化用戶找到更多信息所需的步驟;使用小屏幕不適宜太多的操作。準(zhǔn)則2,支持聲音識(shí)別功能移動(dòng)大數(shù)據(jù)鍵盤應(yīng)能識(shí)別聲音輸入。谷歌眼鏡和智能手表就沒(méi)有鍵盤,它們幾乎完全依靠聲音或簡(jiǎn)單的觸摸手勢(shì)來(lái)感應(yīng)。即使是智能手機(jī)和平板電腦,使用鍵盤來(lái)輸入(長(zhǎng)串)查詢通常都不方便。準(zhǔn)則3,確保可視化快速加載用戶希望移動(dòng)設(shè)備的運(yùn)轉(zhuǎn)速度快如閃電。復(fù)雜的數(shù)據(jù)分析都是在云端完成的,而分析結(jié)果則被發(fā)回移動(dòng)設(shè)備。當(dāng)用戶通過(guò)3G/4G網(wǎng)絡(luò)在移動(dòng)設(shè)備上訪問(wèn)大數(shù)據(jù)可視化時(shí),就要考慮到這一點(diǎn)。數(shù)據(jù)密集型任務(wù)可能輕易就會(huì)耗完每月的數(shù)據(jù)流量包,而用戶則會(huì)為此懊惱不已。在3G/4G網(wǎng)絡(luò)下,要側(cè)重于用戶需要執(zhí)行的最重要的分析,僅當(dāng)用戶使用Wi-Fi時(shí),才允許加載其他的分析和可視化。準(zhǔn)則4,確保數(shù)據(jù)傳輸安全移動(dòng)大數(shù)據(jù)要求授予移動(dòng)設(shè)備訪問(wèn)(敏感)數(shù)據(jù)結(jié)果的權(quán)限,但是僅有4%的智能手機(jī)受到安全軟件的保護(hù)。因此,你需要確定哪些數(shù)據(jù)是敏感數(shù)據(jù),并確保僅當(dāng)特定用戶連接經(jīng)過(guò)安全認(rèn)可的Wi-Fi時(shí)才能訪問(wèn)該數(shù)據(jù)。特別是,醫(yī)療機(jī)構(gòu)不宜通過(guò)公共Wi-Fi或3G/4G網(wǎng)絡(luò)發(fā)送敏感數(shù)據(jù)。移動(dòng)大數(shù)據(jù)的未來(lái)我們正處在移動(dòng)革命的邊緣,因此無(wú)法看清移動(dòng)大數(shù)據(jù)的未來(lái)。PandoDaily網(wǎng)站的一位作者納撒尼爾·莫特(NathanielMott)曾宣稱,計(jì)算機(jī)的未來(lái)將圍繞頭腦和手腕之爭(zhēng),而不是臺(tái)式和移動(dòng)之爭(zhēng)。在不久的將來(lái),我們的周圍可能會(huì)充斥著未知的新型移動(dòng)設(shè)備,所有這些設(shè)備都需要一種應(yīng)用移動(dòng)大數(shù)據(jù)的不同方式。企業(yè)必須及時(shí)進(jìn)行調(diào)整,以滿足移動(dòng)未來(lái)的需求。趨勢(shì)2,實(shí)時(shí)大數(shù)據(jù)有了如此之多的可用數(shù)據(jù),你就會(huì)想要在數(shù)據(jù)生成之初即對(duì)其加以使用。未來(lái),實(shí)時(shí)分析將會(huì)獲得迅猛發(fā)展,因?yàn)樗哂性S多優(yōu)勢(shì)。分析網(wǎng)站訪客的特征,并能讓訪客在一毫秒內(nèi)返回一個(gè)個(gè)性化的主頁(yè),這種能力將會(huì)提升你的訪客轉(zhuǎn)化率。在高速信息時(shí)代,能否使用實(shí)時(shí)大數(shù)據(jù)分析將是你的公司和競(jìng)爭(zhēng)者之間的重要區(qū)別。因此,越來(lái)越多的公司將期待基于實(shí)時(shí)信息做出日常業(yè)務(wù)決策。所以,數(shù)據(jù)的積累是一回事;實(shí)時(shí)存儲(chǔ)、分析數(shù)據(jù),并將它可視化處理完全是另外一回事。實(shí)時(shí)見(jiàn)解能讓你完全了解公司內(nèi)部和外部正在發(fā)生的情況。問(wèn)題是:實(shí)時(shí)大數(shù)據(jù)的優(yōu)勢(shì)是什么,挑戰(zhàn)是什么,以及哪些工具可用于大數(shù)據(jù)的實(shí)時(shí)處理?實(shí)時(shí)大數(shù)據(jù)的優(yōu)勢(shì)1.立即發(fā)現(xiàn)公司內(nèi)部的錯(cuò)誤。實(shí)時(shí)故障分析能幫助公司迅速反應(yīng),減輕操作問(wèn)題造成的影響,這樣就能避免該操作拖后腿或?qū)е氯蝿?wù)完全失敗。它也能防止顧客因?yàn)楣收隙V故褂卯a(chǎn)品。有了實(shí)時(shí)的見(jiàn)解,問(wèn)題就能迅速得到解決。2.迅速了解競(jìng)爭(zhēng)中出現(xiàn)的新戰(zhàn)略。有了實(shí)時(shí)大數(shù)據(jù),你就能在競(jìng)爭(zhēng)中保持領(lǐng)先位置。另外,當(dāng)競(jìng)爭(zhēng)對(duì)手改變戰(zhàn)略或降低價(jià)格時(shí),你能立即獲知該消息。而在大數(shù)據(jù)時(shí)代之前,這可能需要大量的時(shí)間。3.服務(wù)得到大幅提升,也會(huì)帶來(lái)更高的顧客轉(zhuǎn)化率和額外的收入。如果企業(yè)對(duì)顧客所使用的產(chǎn)品進(jìn)行監(jiān)控,就能提前反應(yīng),避免發(fā)生故障。例如,配備實(shí)時(shí)傳感器的汽車能在意外發(fā)生之前,提醒駕駛員存在問(wèn)題。傳感器會(huì)通知駕駛員維修車輛,更理想的情況是,能夠預(yù)測(cè)出是哪個(gè)部件出了故障。傳感器實(shí)時(shí)識(shí)別問(wèn)題,判斷是否需要采取相應(yīng)的行動(dòng)。如果需要,則通過(guò)查看你的日程和識(shí)別你的位置,來(lái)搜索最近的汽車修理廠。修理人員到來(lái)之前就已經(jīng)接收到了鑒定該問(wèn)題所得出的數(shù)據(jù)分析,所以不必再花時(shí)間檢查,可以立即進(jìn)行修理。4.在詐騙發(fā)生之初即能偵查到,并且可以采取適當(dāng)措施控制損失。金融領(lǐng)域?qū)Ψ缸锓肿拥奈Ψ浅4蟆S辛藢?shí)時(shí)安全防護(hù)系統(tǒng),就能立即得知非法侵入公司的行為,IT安保部門就能迅速采取相應(yīng)行動(dòng)。在金融行業(yè)中,跟蹤大量信用卡交易早已成為慣例。只要出現(xiàn)了可疑交易,相應(yīng)銀行就會(huì)得到示警以采取行動(dòng)。當(dāng)前技術(shù)的缺陷是銀行也許要到詐騙行為完成之后才能得知。有了強(qiáng)大的實(shí)時(shí)大數(shù)據(jù)分析之后,就能在詐騙交易發(fā)生之前發(fā)覺(jué),而銀行就不會(huì)授權(quán)完成該交易。5.節(jié)約成本,提高收益。進(jìn)行實(shí)時(shí)大數(shù)據(jù)分析也許需要高昂的成本,但是,最終它將會(huì)為你節(jié)省一大筆錢。有了實(shí)時(shí)分析,企業(yè)領(lǐng)導(dǎo)者就能立即獲知企業(yè)的整體狀況。如有必要,能立即采取行動(dòng),從而節(jié)省開支或提高收益。股市尤其能從實(shí)時(shí)分析中獲益。在競(jìng)價(jià)前的一毫秒內(nèi)能夠分析和識(shí)別出一支有價(jià)值的股票,確實(shí)能大幅提高收益。6.能提供更優(yōu)秀的銷售見(jiàn)解,從而帶來(lái)額外收益。實(shí)時(shí)分析能讓你了解到當(dāng)前銷售的確切情況。如果一位互聯(lián)網(wǎng)零售商發(fā)現(xiàn)某產(chǎn)品的銷量非常好,它就能采取措施以防止錯(cuò)過(guò)商機(jī)或營(yíng)收下降,比如,根據(jù)特定地理位置的實(shí)時(shí)需要來(lái)調(diào)整庫(kù)存水平或價(jià)格。7.緊跟顧客趨勢(shì)。對(duì)競(jìng)爭(zhēng)性產(chǎn)品、促銷活動(dòng)和顧客行為進(jìn)行分析,能為了解顧客趨勢(shì)提供有價(jià)值的信息。實(shí)時(shí)分析能讓企業(yè)更快地制定出更符合當(dāng)前顧客要求的決策。實(shí)時(shí)大數(shù)據(jù)的挑戰(zhàn)當(dāng)然,實(shí)時(shí)分析所呈現(xiàn)的并不全是積極的方面,它也提出了一些挑戰(zhàn)。實(shí)時(shí)分析需要特殊的計(jì)算能力,當(dāng)前標(biāo)準(zhǔn)版本的Hadoop還不適用于實(shí)時(shí)分析,所以,需要購(gòu)買和使用新工具。不過(guò),有一些工具能勝任這一任務(wù)。使用實(shí)時(shí)見(jiàn)解需要你的公司換一種運(yùn)營(yíng)方式。如果你的公司通常一周僅接收一次見(jiàn)解(這在許多公司中很常見(jiàn)),那么要每秒都能接收,就需要運(yùn)用新的運(yùn)營(yíng)方式和方法。接收見(jiàn)解之后,就要采取行動(dòng)。需要實(shí)時(shí)做出反應(yīng),而不是每周一次。這將對(duì)公司文化產(chǎn)生重大影響,而你的目標(biāo)也應(yīng)該是讓公司實(shí)現(xiàn)以信息為中心的轉(zhuǎn)型。實(shí)時(shí)大數(shù)據(jù)工具越來(lái)越多的工具讓實(shí)時(shí)大數(shù)據(jù)處理成為可能。在Hadoop提供實(shí)時(shí)分析之前,可以使用以下產(chǎn)品:◎Storm現(xiàn)為Twitter所擁有,是一個(gè)實(shí)時(shí)分布式計(jì)算系統(tǒng)。它使用一套一般基元來(lái)執(zhí)行實(shí)時(shí)分析。Storm使用方便,適用于任意程序語(yǔ)言,而且具有很強(qiáng)的擴(kuò)展性和容錯(cuò)能力。◎ClouderaEnterpriseRTQ工具提供針對(duì)HBase或HDFS所存儲(chǔ)數(shù)據(jù)的實(shí)時(shí)、交互式分析查詢。它是Cloudera的開源工具ClouderaImpala的重要組成部分。有了ClouderaImpala,也可以在Hadoop上執(zhí)行實(shí)時(shí)特殊查詢。◎GridGain是一種使用Java的企業(yè)開源網(wǎng)格計(jì)算。它與HadoopDFS兼容,是Hadoop的MapReduce的替代品。GridGain提供了一個(gè)分布式、內(nèi)存、實(shí)時(shí)且可擴(kuò)展的數(shù)據(jù)網(wǎng)格,讓數(shù)據(jù)源和不同應(yīng)用聯(lián)系起來(lái)。◎SpaceCurve是正在開發(fā)的一款能夠發(fā)現(xiàn)多維地理數(shù)據(jù)基本模式的工具。地理數(shù)據(jù)與一般數(shù)據(jù)不同,因?yàn)橐苿?dòng)設(shè)備迅速生成新數(shù)據(jù),其方式與傳統(tǒng)數(shù)據(jù)庫(kù)相異。SpaceCurve提供一個(gè)大數(shù)據(jù)平臺(tái),2013年2月12日,它的工具每秒能運(yùn)行數(shù)億字節(jié)的復(fù)雜查詢,由此創(chuàng)造了一項(xiàng)新的世界紀(jì)錄。當(dāng)然,還有更多可用的實(shí)時(shí)工具,不便在此一一列舉。實(shí)際上,實(shí)時(shí)大數(shù)據(jù)是一種趨勢(shì),將在未來(lái)幾年內(nèi)發(fā)展壯大,從而對(duì)所有企業(yè)產(chǎn)生重大影響。實(shí)時(shí)大數(shù)據(jù)可能會(huì)是大數(shù)據(jù)的終極用途。阿提哈德航空公司,使用大數(shù)據(jù)實(shí)現(xiàn)目標(biāo)阿提哈德航空(EtihadAirways)公司是阿聯(lián)酋的國(guó)家航空公司,創(chuàng)立于2003年,至今不過(guò)11年,總部設(shè)在阿布扎比。它開設(shè)了通往全世界55個(gè)國(guó)家、89個(gè)目的地的航線,每周接待航班超過(guò)1200架次,每年輸送乘客達(dá)1000萬(wàn)人。該公司的目標(biāo)是成為一個(gè)真正的21世紀(jì)全球航空公司,挑戰(zhàn)和改變航空服務(wù)業(yè)的既定慣例。為了實(shí)現(xiàn)這一目標(biāo),阿提哈德航空公司求助于大數(shù)據(jù)。它將大數(shù)據(jù)用于多個(gè)方面,比如,通過(guò)優(yōu)化價(jià)格策略以最大限度地提高收入機(jī)會(huì),預(yù)測(cè)維護(hù),以及提升乘客機(jī)上體驗(yàn)。阿提哈德航空公司開發(fā)的最有趣的大數(shù)據(jù)應(yīng)用之一是連接工業(yè)互聯(lián)網(wǎng)。實(shí)際上,這是機(jī)器和工業(yè)設(shè)備(比如飛機(jī))的物聯(lián)網(wǎng)。它使用復(fù)雜的算法收集和分析每架飛機(jī)上的傳感器實(shí)時(shí)生成的大量數(shù)據(jù)。阿提哈德航空公司還使用了Taleris(通用電氣公司和埃森哲公司成立的合資公司)提供的工具,來(lái)對(duì)所有空客和波音飛機(jī)進(jìn)行實(shí)時(shí)控制。傳感器幫助阿提哈德航空公司實(shí)時(shí)監(jiān)控飛機(jī),并且在飛機(jī)飛行時(shí)管理和預(yù)測(cè)維修,提早發(fā)現(xiàn)問(wèn)題,降低油耗,以及縮短在機(jī)場(chǎng)的周轉(zhuǎn)時(shí)間。這樣一來(lái),阿提哈德航空公司的飛機(jī)就能把更多的時(shí)間花在飛行上,在地面上的時(shí)間則會(huì)減少,因此將能夠省下大量資金。傳感器提供的數(shù)據(jù)經(jīng)過(guò)分析后能夠轉(zhuǎn)化為有價(jià)值的信息。阿提哈德航空公司負(fù)責(zé)技術(shù)方面的高級(jí)副總裁沃納·羅騰貝歇爾(WernerRothenbaecher)在博客上表示,阿提哈德航空公司可以使用這些信息“迅速做出維修決策,同時(shí)在運(yùn)行狀況的判斷和預(yù)測(cè)方面獲得領(lǐng)先地位……能夠預(yù)測(cè)未來(lái)的故障,采取預(yù)防性措施來(lái)減少對(duì)公司全球業(yè)務(wù)的意外干擾”。2013年6月20日,阿提哈德航空公司總裁賀國(guó)健(JamesHogan)在國(guó)際航空電信協(xié)會(huì)(SocietyInternationalDeTelecommunicationsAeronautiques,簡(jiǎn)稱SITA)舉辦的航空運(yùn)輸峰會(huì)上說(shuō),這個(gè)應(yīng)用廣泛的工具將讓乘坐阿提哈德航班的旅客獲益,因?yàn)楹桨嘌诱`將會(huì)減少,可靠度將會(huì)提高。為了更進(jìn)一步提升乘客體驗(yàn),阿提哈德航空公司也采用了國(guó)際航空電信協(xié)會(huì)的CrewTablet工具,它能讓全體機(jī)組成員通過(guò)平板電腦訪問(wèn)任意工作數(shù)據(jù)或乘客數(shù)據(jù),也是移動(dòng)大數(shù)據(jù)的一個(gè)很好的實(shí)例。趨勢(shì)3,物聯(lián)網(wǎng)再過(guò)幾年,我們討論傳感器生成的數(shù)據(jù)時(shí),就要用到波字節(jié)去衡量了。物聯(lián)網(wǎng)是指可以通過(guò)一個(gè)IP地址進(jìn)行識(shí)別的物品,且它們都與互聯(lián)網(wǎng)連接。物品(可以是任何東西,一輛汽車、一把椅子或一瓶蘇打水)添加識(shí)別標(biāo)志后,就可以通過(guò)計(jì)算機(jī)和算法來(lái)管理和清點(diǎn)。這些物品都安裝著傳感器,這些傳感器收集的數(shù)據(jù)再與一個(gè)類似互聯(lián)網(wǎng)的結(jié)構(gòu)共享。物聯(lián)網(wǎng),或者說(shuō)機(jī)器到機(jī)器(Machine-to-Machine,簡(jiǎn)稱M2M)的通信將讓數(shù)十億或數(shù)萬(wàn)億臺(tái)設(shè)備相互連接在一起,由此產(chǎn)生難以估量的數(shù)據(jù)。到2020年,全世界40%的數(shù)據(jù)將是M2M數(shù)據(jù)。當(dāng)然,這種數(shù)據(jù)必須經(jīng)過(guò)處理、存儲(chǔ)、分析和可視化之后才會(huì)有意義,才能推動(dòng)你的事業(yè)發(fā)展。傳感器數(shù)據(jù),或者說(shuō)M2M數(shù)據(jù)是機(jī)器傳感器所得讀數(shù)轉(zhuǎn)化而來(lái)的數(shù)據(jù)。這些傳感器會(huì)定期或?qū)崟r(shí)測(cè)量各項(xiàng)條件,它們可能是無(wú)線射頻識(shí)別標(biāo)簽,或者是能使設(shè)備變得智能或者支持其他傳感器的軟件。收集到的數(shù)據(jù)包括日志數(shù)據(jù)(特別是電信公司的)、地理位置數(shù)據(jù)、故障診斷(在需要維修時(shí)向你發(fā)出警報(bào))、CPU利用率、溫度、規(guī)則,等等。這些數(shù)據(jù)可以與關(guān)鍵績(jī)效指標(biāo)(KeyPerformanceIndicator,簡(jiǎn)稱KPI)聯(lián)系起來(lái)。當(dāng)超過(guò)閾值和需要采取措施時(shí),KPI會(huì)發(fā)出警報(bào)。物聯(lián)網(wǎng)不僅能讓當(dāng)前的商業(yè)模式得到改進(jìn),也能開辟全新的商業(yè)模式。它早已遍布我們周圍,而且腳步不可阻擋。以下幾個(gè)產(chǎn)品示例顯示了這些可能性:◎Progressive公司在美國(guó)推出了根據(jù)車輛使用情況定價(jià)的保險(xiǎn)。該公司使用了一個(gè)叫Snapshot的小設(shè)備,用戶將這個(gè)設(shè)備與汽車相連,就可以記錄自己的行車記錄。你的駕駛情況越好,保險(xiǎn)費(fèi)用就越低。◎Glowcaps將處方藥瓶變?yōu)樽詣?dòng)提醒用戶吃藥的設(shè)備。當(dāng)藥瓶打開時(shí),瓶蓋中的一個(gè)芯片就會(huì)進(jìn)行監(jiān)控;而如果用戶忘記吃藥,芯片就會(huì)加以提醒。家庭成員可以在網(wǎng)上查看報(bào)告,從而跟蹤家中老人是否已吃藥。◎Beam科技公司發(fā)明的藍(lán)牙牙刷能追蹤用戶的刷牙情況,包括哪片區(qū)域刷到了,哪片區(qū)域遺漏了。物聯(lián)網(wǎng)追蹤地球狀況所有傳感器都將收集大量數(shù)據(jù)。只需看看飛機(jī)、各種機(jī)器和移動(dòng)設(shè)備產(chǎn)生的數(shù)據(jù)就知道了。有關(guān)物聯(lián)網(wǎng)的一個(gè)極端例子是惠普實(shí)驗(yàn)室和殼牌公司開發(fā)的“地球的中樞神經(jīng)系統(tǒng)”(CentralNervousSystemoftheEarth,簡(jiǎn)稱CeNSE),旨在讓地球上的生命更安全、更舒適。安裝在所有設(shè)備和機(jī)器上的數(shù)以億計(jì)的低成本自供電納米傳感器,將能夠監(jiān)測(cè)地球的狀況和人類對(duì)她的影響。惠普實(shí)驗(yàn)室預(yù)測(cè),到2020年將需要一萬(wàn)億個(gè)傳感器來(lái)執(zhí)行這一任務(wù),相當(dāng)于人均150個(gè)傳感器。當(dāng)然,如此多的可用數(shù)據(jù)既帶來(lái)了挑戰(zhàn),也有一些好處。例如,傳感器可以在機(jī)器真正損壞之前,提醒你機(jī)器需要維修,從而降低了維修成本。這不僅節(jié)省了維修費(fèi)用,還能將機(jī)器的停工時(shí)間降至最小,同時(shí)也提高了顧客的滿意度。傳感器數(shù)據(jù)也可以將符合特定標(biāo)準(zhǔn)的觀測(cè)與其他數(shù)據(jù)集聯(lián)系起來(lái),得到新的洞見(jiàn)。這種數(shù)據(jù)的結(jié)合能得出與特定情況相關(guān)的見(jiàn)解。SenSorGrid4Env公司就使用環(huán)境傳感器數(shù)據(jù)來(lái)管理和了解環(huán)境,它還將這些信息提供給應(yīng)急響應(yīng)工作隊(duì),以防災(zāi)難發(fā)生。越來(lái)越多的系統(tǒng)實(shí)現(xiàn)了互聯(lián),挑戰(zhàn)就在于將這許多的數(shù)據(jù)集處理、存儲(chǔ)、分析和可視化,最好是能實(shí)時(shí)操作。管理所有引入的數(shù)據(jù)確實(shí)需要不低的軟件和硬件成本,但是你能從中獲得更高的收益。好處之一就是,在許多情況下,傳感器都能提供大體量、高速度的數(shù)據(jù),這些數(shù)據(jù)結(jié)構(gòu)一致,易于管理。這樣,企業(yè)就能將不同傳感器數(shù)據(jù)與業(yè)務(wù)或公開數(shù)據(jù)相結(jié)合,從而發(fā)現(xiàn)新模式、趨勢(shì)或市場(chǎng)。啟動(dòng)傳感器數(shù)據(jù)應(yīng)從小處做起,因?yàn)樗p易就能發(fā)展壯大。先選擇一個(gè)藍(lán)本,然后在此基礎(chǔ)上逐步擴(kuò)大。項(xiàng)目范圍靈活且適度發(fā)展的企業(yè)最有可能取得成功。然而,規(guī)劃應(yīng)涵蓋從開始到最后能夠支持非常大的數(shù)據(jù)集的所有內(nèi)容,避免項(xiàng)目以后出現(xiàn)不愉快的意外。我將會(huì)在第5章介紹一個(gè)啟動(dòng)大數(shù)據(jù)和發(fā)展一個(gè)成功大數(shù)據(jù)戰(zhàn)略的路線圖。互聯(lián)網(wǎng)的興起帶來(lái)了無(wú)限的可能性。地球?qū)⒊蔀橹腔坌乔颍@里的一切事物都會(huì)實(shí)現(xiàn)隨時(shí)物聯(lián)化、智能化、互聯(lián)化、在線化。它的潛力巨大,潛在用途廣闊。為了在競(jìng)爭(zhēng)中領(lǐng)先,也為了讓顧客滿意,不妨仔細(xì)思考一下,物聯(lián)網(wǎng)和收集傳感器數(shù)據(jù)能為你的公司做什么,思考你所擁有的產(chǎn)品,以及怎樣才能將這些產(chǎn)品轉(zhuǎn)化為數(shù)據(jù)。正如第2章中所討論的,一杯咖啡或者一杯啤酒都能產(chǎn)生數(shù)據(jù)。喜力智能啤酒瓶,隨音樂(lè)閃爍起舞關(guān)于物聯(lián)網(wǎng)的一個(gè)極好的例子就是喜力(Heinenken)在2013年米蘭設(shè)計(jì)周上推出的智能啤酒瓶。喜力引入Ignite數(shù)據(jù)庫(kù)緩存系統(tǒng),使用LED燈和無(wú)線傳感器為顧客打造全新的體驗(yàn)。運(yùn)用現(xiàn)代技術(shù)開發(fā)的這種智能啤酒瓶,旨在提升喝啤酒的社交互動(dòng)效果。據(jù)喜力發(fā)布的一篇文章稱,它采用了8個(gè)LED燈、一個(gè)8-bit微處理器、一個(gè)加速器、一個(gè)陀螺儀,以及一個(gè)帶天線的無(wú)線網(wǎng)絡(luò)收發(fā)器。它還擁有50個(gè)共同協(xié)作的獨(dú)立電子元件,可以安裝在一個(gè)普通的啤酒瓶底部。當(dāng)眾人祝酒碰杯時(shí),每個(gè)啤酒瓶都會(huì)發(fā)光。當(dāng)你小口啜飲時(shí),LED燈光會(huì)快速閃爍,而如果把啤酒瓶放置在吧臺(tái)上不動(dòng),它就會(huì)進(jìn)入休眠模式,逐漸熄滅,直到再次被拿起。此外,這些傳感器也能接受遠(yuǎn)程控制,與音樂(lè)節(jié)拍保持同步,將派對(duì)引向一個(gè)全新的高潮。一些機(jī)構(gòu)預(yù)測(cè),傳感器的數(shù)量最終將會(huì)達(dá)到數(shù)萬(wàn)億,但是關(guān)于何時(shí)實(shí)現(xiàn)以及這些傳感器能夠收集多少數(shù)據(jù)量,這些機(jī)構(gòu)的意見(jiàn)不統(tǒng)一。無(wú)線世界研究組織(WirelessWorldResearchOrganization)預(yù)測(cè),到2017年,傳感器將達(dá)到7萬(wàn)億個(gè)。CeNSE則預(yù)測(cè),到2020年,將有1萬(wàn)億個(gè)傳感器,它們每年將催生50澤字節(jié)的數(shù)據(jù)。互聯(lián)網(wǎng)數(shù)據(jù)中心則稱,到2020年,這些傳感器將收集到40澤字節(jié)的數(shù)據(jù)。IBM預(yù)測(cè),2015年用于情境感知計(jì)算的傳感器將達(dá)到1萬(wàn)億個(gè)。盡管這些預(yù)測(cè)存在著差異,但是,顯然未來(lái)聯(lián)網(wǎng)設(shè)備的數(shù)量將非常巨大,這種增長(zhǎng)也將創(chuàng)造一個(gè)遍布全球、價(jià)值上萬(wàn)億美元的業(yè)務(wù)。思科公司認(rèn)為,到2020年,物聯(lián)網(wǎng)將會(huì)催生出一個(gè)價(jià)值14萬(wàn)億美元的全球業(yè)務(wù),而這個(gè)業(yè)務(wù)將對(duì)所有行業(yè)產(chǎn)生影響。如果我們考慮到當(dāng)前全球IT開銷約為3.5萬(wàn)億美元這一事實(shí),那么顯然我們正步入一個(gè)非常有趣的時(shí)代。計(jì)算機(jī)行業(yè)2012年,在第7屆“5in5”\h[6]會(huì)議期間,IBM展示了能改變?nèi)藗兾磥?lái)5年工作、生活和互動(dòng)的方式的5項(xiàng)創(chuàng)新,這些創(chuàng)新與人類的5種感官相對(duì)應(yīng),分別是:◎觸覺(jué):人們能夠通過(guò)觸摸屏操作手機(jī)◎視覺(jué):一像素將抵得上一千個(gè)文字◎聽覺(jué):計(jì)算機(jī)將能聽到重要事件◎味覺(jué):數(shù)字味蕾將幫助你更為智能地進(jìn)食◎嗅覺(jué):計(jì)算機(jī)將擁有嗅覺(jué)“5in5”是基于全世界的市場(chǎng)、技術(shù)和社會(huì)趨勢(shì)制定的,而這些趨勢(shì)能夠使這些變革成為可能。計(jì)算機(jī)設(shè)備中的傳感器將能夠模仿我們的各種感覺(jué),從而改變消費(fèi)者對(duì)待聯(lián)網(wǎng)設(shè)備的方式。醫(yī)療行業(yè)傳感器時(shí)代將對(duì)醫(yī)療行業(yè)產(chǎn)生意義深遠(yuǎn)的影響,其范圍將包括個(gè)性化醫(yī)藥、營(yíng)養(yǎng)、疾病預(yù)防,以及對(duì)患者進(jìn)行實(shí)時(shí)健康監(jiān)測(cè)。到2020年,人們到醫(yī)院就診的頻率將會(huì)減少,因?yàn)獒t(yī)生將可能從患者穿戴設(shè)備上的傳感器接收到所需的全部信息。而且,通過(guò)在患者的藥物中添加納米傳感器,醫(yī)生也能實(shí)時(shí)監(jiān)控藥效。一些公司正鼓勵(lì)開發(fā)能夠立即診斷疾病的傳感器。例如,2011年,美國(guó)高通公司(Qualcomm)懸賞1000萬(wàn)美元,希望獲得第一個(gè)能夠捕捉主要健康指標(biāo)和診斷15種疾病的三錄儀。報(bào)名開始后,2013年,16歲的杰克·安德拉達(dá)(JackAndrada)聲稱已經(jīng)制造出一個(gè)基本滿足這些要求的三錄儀。然而,他不是唯一一個(gè)想要獲得這次懸賞的人,躍躍欲試者還有很多。傳感器進(jìn)入醫(yī)療行業(yè)意義十分重大。如果設(shè)備能夠?qū)崟r(shí)測(cè)量與患者相關(guān)的各項(xiàng)數(shù)據(jù),那么消費(fèi)者的醫(yī)療保健水平將會(huì)得到大幅提升,而且支出也將會(huì)減少。松島新城,完全互聯(lián)的智慧城市智慧城市松島是世界上第一個(gè)“盒子里的城市”。它的最初設(shè)計(jì)開始于1996年,到2015年完工。松島選址在韓國(guó)一片607.5公頃的人造陸地上,可以說(shuō)是一場(chǎng)城市設(shè)計(jì)的革命。它距離首爾不到65公里,距離仁川國(guó)際機(jī)場(chǎng)10公里,擁有商業(yè)辦公區(qū)、零售店、住宅、酒店以及市政、文化設(shè)施。這坐城市由思科(Cisco)、3M、浦項(xiàng)建設(shè)(PoscoE&C)以及聯(lián)合技術(shù)公司(UnitedTechnology)合作共同開發(fā)。松島將成為一個(gè)完全互聯(lián)的城市,城市里幾乎所有的設(shè)備、建筑物和街道都將配備無(wú)線傳感器或微芯片。這將催生出一些智能發(fā)明,比如根據(jù)人行道上的行人數(shù)自動(dòng)調(diào)節(jié)的街燈。所有房屋都將配置傳感器(也被稱為住宅自動(dòng)化),這些傳感器能夠通過(guò)客廳中的大屏幕進(jìn)行控制。同樣,這些遠(yuǎn)程監(jiān)控屏幕也將應(yīng)用于所有辦公室、醫(yī)院、學(xué)校和購(gòu)物中心。松島項(xiàng)目開始于2000年,預(yù)計(jì)成本為350億美元,代價(jià)高昂。思科早前曾保證,這座智慧城市將實(shí)現(xiàn)光纖寬帶全覆蓋。當(dāng)時(shí)預(yù)計(jì)到2016年,將有65000人在這里定居,另外將有30萬(wàn)人每天往返于這座城市。這些人都將使用眾多聯(lián)網(wǎng)設(shè)備和服務(wù),因此會(huì)產(chǎn)生大量數(shù)據(jù),然后這些數(shù)據(jù)被發(fā)送給計(jì)算機(jī)處理器,以保持松島正常運(yùn)作。此外,交通狀況將通過(guò)汽車上的無(wú)線射頻識(shí)別標(biāo)簽來(lái)監(jiān)測(cè)。傳感器將向中央監(jiān)控單元發(fā)送地理位置數(shù)據(jù),然后中央監(jiān)控單元針對(duì)事故多發(fā)路段或擁擠地區(qū)發(fā)出提示。由于公共交通全部聯(lián)網(wǎng),所以隨時(shí)能掌握所有駕駛者的位置。傳感器甚至能追蹤到市民將垃圾扔入垃圾箱的行為,所以在松島,即使是垃圾也能產(chǎn)生數(shù)據(jù)。氣候、能源損耗、休閑活動(dòng)以及用水都是如此。松島還會(huì)設(shè)置特殊攝像機(jī)負(fù)責(zé)安保監(jiān)控,小孩也會(huì)佩戴裝有傳感器的手鏈,這樣他們就能隨時(shí)被定位。另外,智能能源網(wǎng)將確保能源適應(yīng)供需要求。中央監(jiān)控中心將實(shí)時(shí)收集、分析和監(jiān)控所有數(shù)據(jù)。有這么多的市民和工作者使用聯(lián)網(wǎng)設(shè)備和服務(wù),松島因此將會(huì)成為一個(gè)大數(shù)據(jù)的創(chuàng)造者,能把大數(shù)據(jù)引向一個(gè)新的水平。數(shù)據(jù)將會(huì)為人們?cè)谥腔鄢鞘兄泄ぷ鳌⑸詈退伎继峁┯袃r(jià)值的見(jiàn)解。這些信息也能用于改善這座城市。松島并非目前正在開發(fā)的唯一智慧城市,阿布扎比的馬斯達(dá)也是一個(gè)真正互聯(lián)的城市。雖然我們無(wú)法確定人們的行為是否會(huì)因?yàn)榫幼≡谥腔鄢鞘兄卸兴淖儯贿^(guò)有一點(diǎn)很明確,那就是智慧城市將對(duì)每天生成的數(shù)據(jù)量產(chǎn)生重大影響,也將改變城市運(yùn)作和管理的方式。家庭數(shù)據(jù)松島使用的住宅自動(dòng)化方案在全球許多家庭得到了廣泛應(yīng)用。家居自動(dòng)化也受到普遍支持,它將讓我們的生活變得更方便。想想家庭自動(dòng)化系統(tǒng):它整合了所有電氣設(shè)備,讓用戶能夠在任何地方通過(guò)智能手機(jī)或平板電腦訪問(wèn)這些設(shè)備。通過(guò)一個(gè)應(yīng)用程序就能打開和關(guān)閉電燈;起床鬧鈴一響,就自動(dòng)開始沖咖啡;冰箱能顯示庫(kù)存。當(dāng)你不在家時(shí),使用一個(gè)應(yīng)用程序就能給予其他人進(jìn)入你家的權(quán)限。過(guò)去數(shù)十年,這樣的“未來(lái)家庭”還是新奇事物,現(xiàn)在卻已經(jīng)得到了廣泛的普及。最終,傳感器將成為家庭中所有電氣設(shè)備的一部分,無(wú)論是廚房設(shè)備、浴室用具,還是家庭安保設(shè)備。零售市場(chǎng)在美國(guó),平均每家雜貨店擁有5萬(wàn)多種產(chǎn)品。無(wú)線射頻識(shí)別標(biāo)簽將改變超市的運(yùn)作方式,讓跟蹤產(chǎn)品變得更為便捷。RealFutureStore作為德國(guó)的一家概念店,正是這種新型傳感器方案的運(yùn)動(dòng)場(chǎng)。使用無(wú)線射頻識(shí)別標(biāo)簽,超市就能向顧客提供更多信息。無(wú)線射頻識(shí)別標(biāo)簽?zāi)軌虬a(chǎn)品制造商、規(guī)格和價(jià)格等信息。借助無(wú)線射頻識(shí)別標(biāo)簽,系統(tǒng)就能自動(dòng)為即將過(guò)期的產(chǎn)品打折。購(gòu)物者也無(wú)須將商品放在傳送帶上等待收銀員掃描,因?yàn)樗械臒o(wú)線射頻識(shí)別標(biāo)簽都將在顧客離開超市時(shí)直接被掃描。不過(guò),需要掃描的標(biāo)簽數(shù)量將十分巨大,僅美國(guó)就有超過(guò)35000家超市,每天需要掃描的無(wú)線射頻識(shí)別標(biāo)簽達(dá)17.5億個(gè)。企業(yè)應(yīng)該如何準(zhǔn)備傳感器時(shí)代生成的這數(shù)波字節(jié)的數(shù)據(jù)將影響到所有行業(yè)。你的公司應(yīng)該如何為大傳感器時(shí)代做準(zhǔn)備呢?首先,企業(yè)應(yīng)該識(shí)別那些能夠利用傳感器進(jìn)行改進(jìn)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業(yè)廢水處理與排放標(biāo)準(zhǔn)優(yōu)化
- 工業(yè)廢水處理技術(shù)與設(shè)施建設(shè)
- 工業(yè)廢水處理技術(shù)進(jìn)展及挑戰(zhàn)分析
- 工業(yè)機(jī)器人設(shè)計(jì)與制造技術(shù)探討
- 工業(yè)現(xiàn)場(chǎng)的環(huán)境保護(hù)措施與實(shí)踐
- 工業(yè)廢水處理的技術(shù)與運(yùn)營(yíng)模式
- 工業(yè)污染防治技術(shù)進(jìn)展
- 工業(yè)機(jī)器人的編程與調(diào)試技術(shù)
- 工業(yè)節(jié)能與綠色制造
- 工業(yè)環(huán)境下的能源效率提升策略以智能車間為例
- 稅收籌劃:理論、實(shí)務(wù)與案例(第4版)+蔡昌+課后習(xí)題及答案匯 第1-12章 稅收籌劃的基本理論 - 跨國(guó)經(jīng)營(yíng)的稅收籌劃
- 2024年中國(guó)南水北調(diào)集團(tuán)水網(wǎng)智慧科技限公司秋季公開招聘高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- ISO45001職業(yè)健康管理體系培訓(xùn)課件
- 化學(xué)物質(zhì)的性質(zhì)與變化考核試卷
- 02S515排水檢查井圖集
- 四川省南充市2024-2025學(xué)年高二數(shù)學(xué)下學(xué)期期末考試試題理
- 《工程勘察設(shè)計(jì)收費(fèi)標(biāo)準(zhǔn)》(2002年修訂本)-工程設(shè)計(jì)收費(fèi)標(biāo)準(zhǔn)2002修訂版
- 2024年河南商丘市公安局梁園分局招聘公共安全服務(wù)人員100人歷年(高頻重點(diǎn)復(fù)習(xí)提升訓(xùn)練)共500題附帶答案詳解
- JCT437-2010 自應(yīng)力鐵鋁酸鹽水泥
- 河南省洛陽(yáng)市澗西區(qū)2023-2024學(xué)年六年級(jí)下學(xué)期期末語(yǔ)文試題
- 新教科版三年級(jí)下冊(cè)科學(xué)期末測(cè)試卷附完整答案(網(wǎng)校專用)
評(píng)論
0/150
提交評(píng)論