大數據技術導論課件:大數據應用_第1頁
大數據技術導論課件:大數據應用_第2頁
大數據技術導論課件:大數據應用_第3頁
大數據技術導論課件:大數據應用_第4頁
大數據技術導論課件:大數據應用_第5頁
已閱讀5頁,還剩52頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數據技術導論大數據應用7.1

零售行業大數據7.2交通大數據7.3醫療大數據7.1零售行業大數據(1)沃爾瑪的購物籃分析應用領域

①商品配置分析:哪些商品可以一起購買,關聯商品如何陳列/促銷;?②客戶需求分析:顧客的購買習慣/顧客購買商品的時間/地點等;?③銷售趨勢分析:利用數據倉庫對品種和庫存的趨勢進行分析,選定需要補充的商品,研究顧客購買趨勢,分析季節性購買模式,確定降價商品;?④幫助供應商改進老產品及開發新品:通過購物籃分析,根據客戶的需求,開發新的產品/改進老產品及產品包裝。7.1.1沃爾瑪的購物籃分析7.1零售行業大數據(2)沃爾瑪對于關聯商品及二次陳列的管理

購物籃分析的結果會對商品在賣場中的陳列產生重大的影響。

7.1零售行業大數據(2)沃爾瑪對于關聯商品及二次陳列的管理

交叉陳列的作用:7.1零售行業大數據(3)沃爾瑪利用購物籃分析獲得豐厚收益的故事①嬰兒護膚品沃爾瑪的采購人員在對一種禮品包裝的嬰兒護膚品購物籃分析時發現,該禮品的購買者基本都是一些商務卡客戶,進一步了解才知道,商品都是作為禮品買來送人的,而不是原先預想的“母親”客戶買給自己的孩子。因此該商品的購買目的才得以明確,這樣的購買目的的信息對于商品的進一步改進提供極大的幫助。7.1零售行業大數據(3)沃爾瑪利用購物籃分析獲得豐厚收益的故事②沐浴用品主題商品通過對購物籃分析,沃爾瑪發現,在購買沐浴用品時,很多客戶都會同時購買沐浴露一類商品。這條信息提示,可以針對這種需求,將毛巾/沐浴球/洗澡用品與沐浴露等沐浴主題商品進行捆綁銷售或進行相關沐浴用品主題陳列。

7.1零售行業大數據(3)沃爾瑪利用購物籃分析獲得豐厚收益的故事③水杯和游泳圈在對PLAYTEX(倍得適:美國著名嬰兒用品品牌)商品進行購物籃分析時發現,一種帶吸管的不溢水杯與嬰兒用的套在肚子上的游泳圈商品之間具有關聯關系。這種商品關聯關系提示沃爾瑪的賣場可以將這兩件商品在夏季一起陳列,從中獲得了很好的商業機會。7.1零售行業大數據(3)沃爾瑪利用購物籃分析獲得豐厚收益的故事④小豬肉熏腸和脆餅沃爾瑪幫助美國著名飲料制造商Welch

s(中文名為淳果藍)通過購物籃分析發現,客戶在舉行聚會時,購買的購物籃中會同時出現大量小豬肉熏腸/奶油起司/脆餅等商品(當然也有Welch

s的果汁飲料),這樣的購物籃信息給了Welch

s的商品組合很大的啟發。7.1零售行業大數據(3)沃爾瑪利用購物籃分析獲得豐厚收益的故事⑤情人節專用飲料和巧克力。Welch

s專門為情人節訂制的果汁飲料,但是如何展示/陳列這種情人節專用飲料始終是個難題。通過購物籃分析,有關商品展示人員發現,這種商品與情人節專用的糖果(如巧克力)/賀卡具有商品關聯關系。因此這種飲料在情人節前與情人節專用季節性通道的糖果貨架/賀卡放在一起,并成為情人節商品整體規劃的一部分。7.1零售行業大數據(3)沃爾瑪利用購物籃分析獲得豐厚收益的故事⑥中國賣場中存在的商品交叉關聯關系洗衣粉-洗衣袋/毛巾-牙刷/兒童用品-溫度計/烤鴨-啤酒/尿布-啤酒/尿布-奶嘴/遙控玩具-電池/牙膏-旅行盒/面粉-搟面杖/床上用品-樟腦球/醬油-抹布/方便面-火腿腸/紅茶-領帶/保健品-健身球/白酒-袋裝花生/臉盆-毛巾/被子-晾衣繩/CD唱片-雪碧等。上述商品的關聯關系適用于沃爾瑪的賣場,并不一定適用其他賣場。其它零售企業應根據自己賣場的實際情況,研究及發現自己賣場中的關聯商品列表。7.1零售行業大數據7.1.2農夫山泉用海量照片提升銷量7.1零售行業大數據7.1.2農夫山泉用海量照片提升銷量SAP是一款大數據分析軟件,從2003年開始與農夫山泉在企業管理軟件ERP方面進行合作。彼時,農夫山泉僅僅是一個軟件采購和使用者,而SAP還是服務商的角色。而等到2011年6月,SAP和農夫山泉開始共同開發基于“飲用水”這個產業形態中,運輸環境的數據場景。

關于運輸的數據場景到底有多重要呢?將自己定位成“大自然搬運工”的農夫山泉,在全國有十多個水源地。農夫山泉把水灌裝、配送、上架,一瓶超市售價2元的550ml飲用水,其中3毛錢花在了運輸上。在農夫山泉內部,有著“搬上搬下,銀子嘩嘩”的說法。如何根據不同的變量因素來控制自己的物流成本,成為問題的核心。

7.1零售行業大數據7.1.2農夫山泉用海量照片提升銷量基于上述場景,SAP團隊和農夫山泉團隊開始了場景開發,他們將很多數據納入了進來:高速公路的收費、道路等級、天氣、配送中心輻射半徑、季節性變化、不同市場的售價、不同渠道的費用、各地的人力成本、甚至突發性的需求(比如某城市召開一次大型運動會)。在沒有數據實時支撐時,農夫山泉在物流領域花了很多冤枉錢。比如某個小品相的產品(350ml飲用水),在某個城市的銷量預測不到位時,公司以往通常的

做法是通過大區間的調運,來彌補終端貨源的不足?!叭A北往華南運,運到半道的時候,發現華東實際有富余,從華東調運更便宜。但很快發現對華南的預測有偏差,華北短缺更為嚴重,華東開始往華北運。此時如果太湖突發一次污染事件,很可能華東又出現短缺?!?/p>

7.1零售行業大數據7.1.2農夫山泉用海量照片提升銷量這種沒頭蒼蠅的狀況讓農夫山泉頭疼不已。在采購、倉儲、配送這條線上,農夫山泉特別希望利用大數據解決三個頑癥:首先是解決生產和銷售的不平衡,準確獲知該產多少,送多少;其次,讓400家辦事處、30個配送中心能夠納入到體系中來,形成一個動態網狀結構,而非簡單的樹狀結構;最后,讓退貨、殘次等問題與生產基地能夠實時連接起來。

也就是說,銷售的最前端成為一個個神經末梢,它的任何一個痛點,在大腦這里都能快速感知到。

7.1零售行業大數據7.1.2農夫山泉用海量照片提升銷量當農夫山泉的每月數據積累達到3TB時,只需0.67秒就可以預測未來的市場需求,實現精準的管控物流成本。董事長將手指放在一臺平板電腦顯示的中國地圖上,隨著手指的移動,建立一個物流配送中心的成本隨之顯示出來。數據在不斷飛快地變化,好像手指移動產生的數字漣漪。以往,農夫山泉的執行團隊要經過長期的考察、論證,再形成一份報告提交給董事長,給他幾個備選方案,到底設在哪座城市,還要憑借經驗來再做判斷。但現在,起碼從成本方面已經一覽無遺。剩下的可能是當地政府與農夫山泉的友好程度,這些無法測量的因素。

7.1零售行業大數據7.1.2農夫山泉用海量照片提升銷量有了強大的數據分析能力做支持后,農夫山泉近年以30%-40%的年增長率,在飲用水方面快速超越了原先的三甲:娃哈哈、樂百氏和可口可樂。根據國家統

計局公布的數據,飲用水領域的市場份額,農夫山泉、康師傅、娃哈哈、可口可樂的冰露,分別為34.8%、16.1%、14.3%、4.7%,農夫山泉幾乎是另外三家之和。大數據應用7.2

交通大數據7.1零售行業大數據7.3醫療大數據7.2.1交通擁堵大數據分析7.2交通大數據(1)交通大數據類型7.2.1交通擁堵大數據分析7.2交通大數據(2)嚴峻的擁堵問題7.2.1交通擁堵大數據分析7.2交通大數據(3)繪制擁堵地圖7.2.1交通擁堵大數據分析7.2交通大數據(4)城市擁堵模式分析7.2.1交通擁堵大數據分析7.2交通大數據(4)城市擁堵模式分析7.2.1交通擁堵大數據分析7.2交通大數據(4)城市擁堵模式分析7.2.1交通擁堵大數據分析7.2交通大數據(5)助理城市交通治理政策7.2.1交通擁堵大數據分析7.2交通大數據(5)助理城市交通治理政策7.2.2交通事故大數據分析7.2交通大數據(1)國內7.2.2交通事故大數據分析7.2交通大數據(2)國外天氣引起的交通事故分析7.2.2交通事故大數據分析7.2交通大數據(2)國外不同光照條件下交通事故分析7.2.2交通事故大數據分析7.2交通大數據(2)國外路面對交通事故發生的影響7.2.2交通事故大數據分析7.2交通大數據(2)國外引起交通事故的影響因素分析7.2.3預測起飛時間7.2交通大數據(1)無奈的“天路”之堵7.2.3預測起飛時間7.2交通大數據(2)航線圖7.2.3預測起飛時間7.2交通大數據(3)數據孤島打破之后

航班動態信息是飛常準的核心資源,而航班動態的數據分析,是“飛常準”的核心技能。坐擁海量基礎數據之后,“飛常準”長期積累出了一套算法,將各種復雜的數據信息轉換成易于理解的形式,并且轉化為航空服務。

首先,“飛常準”需要知道該次航班的飛機是否已經到達起飛機場。如果沒有到達,則需要根據這架飛機的關聯航班來判斷前序航班對后續航班的影響,還要考慮換飛機這樣的特殊情況。如果天氣和流控因素都正常,那么只需考慮機場當前的出港率(平均每架飛機的起飛時間)和排隊等候起飛的飛機數量。7.2.3預測起飛時間7.2交通大數據(4)機場協同決策系統給出的長水機場停機位大數據應用7.3醫療大數據7.1零售行業大數據7.2

交通大數據7.3.1移動醫療與個人健康7.3醫療大數據移動醫療基礎架構7.3.1移動醫療與個人健康7.3醫療大數據移動醫療服務場景7.3.1移動醫療與個人健康7.3醫療大數據一站式移動醫療體驗7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據基因序列概念圖7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據細胞治療領域分為兩大類,免疫細胞治療與干細胞治療。前者形象來說,免疫系統堪稱人體衛隊,抵御外來微生物,清除體內變異細胞貨組織;而免疫細胞又可分為效應細胞與樹突細胞,前者是免疫系統中的士兵,直接發生作用;樹突細胞則是系統的樞紐,指揮效應細胞發揮防御作用。以治療乙型肝炎為例,細胞治療的邏輯,是研究如何令樹突細胞能夠認知乙肝病毒,即檢測到病毒細胞表位,并且指揮效應細胞清除體內病毒;同樣,向樹突細胞提供白血病細胞表位,就可以用同樣原理清除并治療白血病。7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據(2)30億美金到免費就基因檢測技術而言,大致分為三個階段,分別以PCR(PolymeraseChainReaction,聚合酶鏈式反應)、基因芯片與基因測序的出現為節點。其中,基因測序完全精準分析基因序列,準確度最高,想象力最大;而芯片分析技術,現主要適用于分析某一個特定結果,比如診斷一個人體內有無乙肝病毒,就沒必要將其個人基因組提取出進行全測試,只要針對乙肝病毒,用PCR加芯片分析即可。7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據從基因診斷角度看,三種技術在各自適用領域均擁有巨大市場機會,現在人體上可查的3000多種指標中,很多常規指標運用傳統方法測試,準確性穩定、成本低且便捷,短期內不會被替代。以PCR平臺為例,諸多產品已完全國產化,成本正持續降低,最早期,實驗室一個人一天只能出幾個標本,就測幾個位點,效率極低,有了大數據,現在從擴增到檢測,都已實現全自動工作,芯片技術的成本也正趨于合理。唯有基因測序依然成本高企,同時最具想象力。7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據隨著第二代基因檢測技術的普及,測序效率已大幅度提高,測序費用明顯降低。1990年到2003年,全球第一例個人基因組數據測序,其成本超過30億美金;等到2006年第二代測序技術出現,成本降到約1億人民幣左右,華大完成了第一個中國人基因組測序計劃,當時在深圳耗資數千萬人民幣。到今天為止,一個人的全基因度測序試劑成本已降到1000美金以下,一旦降到100美元就能檢測全部22000個序列,將來讀取一個基因的成本可能才幾厘錢,幾乎已經免費了??梢哉f,“摩爾定律”已在生命技術領域重現。7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據(4)基因大數據隨著基因測序價格越來越低,越來越多的基因數據將積累起來,基因技術對健康的影響,正變成計算和分析的能力問題。基因測序技術的革新、生物醫學分析技術的進步以及大數據分析工具的出現,正成為推動精準醫療的核心力量。一滴血能查所有的基因,問題是哪個基因和哪個病配對,這是一個長期研究的過程,只要建立大量基因數據庫,未來不必非要個體全部具體的堿基都要測試出來,才能做分析,只要取其差異化的部分,跟已知的可以去進行對照即可。一旦實現自動化匹配對照,實現基因測序的大數據化,可能一滴眼淚、一點唾液就能進行分析。7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據大數據時代下的精準預防、精準診斷以及真正的個體化治療,基因測序是其基礎。所謂的精準預防,就是通過基因層級的切入,判斷先天患上哪一種疾病的風險比較高,肺或者胃哪部位出現問題,事先預防;再說診斷,癌癥完全是基因突變造成的,借助基因檢測,可以精準識別突變的細胞是什么,再采取相應的措施,才能事先個體化的治療。以現在測序的“超摩爾定律”、云計算的技術進展,2020年,完全可以在20小時甚至8小時內完成一個人全部基因組的檢測工作,如果我們測序,把一個人全基因序列可以在2個小時以內完成,通過1小時之內把數據全部用英特爾硬件系統生出一個數據,再傳達到阿里云上,阿里云可能再花點時間把這個報告所有的注釋做完,供醫生下載、給病人交互,精準醫療將再不是無本之木。7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據一旦基因測序能在幾分鐘內完成,整個醫藥產業將會發生顛覆影響,包括小分子藥物研發在內的醫藥領域將全面靶向化。以后患者去醫院看病,檢測的費用可能越來越低,醫生應該是越來越貴,因為提供給患者的信息會越來越多。目前華大基因的產品和服務圍繞“一生一死一感染”,生是“出生缺陷”,死是“腫瘤治療”,感染則是“未知病原的檢測”,檢測服務收入是主要的收入來源,比如其無創產前基因檢測等貢獻了大量的利潤。在未來,華大基因追求的主體巨額不是檢測,后續的整套關于精準醫療、精準防疫的解決服務方案將是其商業模式的核心。7.4.2基因測序——精準治癌正在成為現實7.3醫療大數據現實的瓶頸僅僅在于如何擴大樣本數據庫的容量。預計到2018年底,全球個人基因組數據可能將達到1萬-10萬人的級別,而基因數據庫數據越多越好,最基礎的門檻至少要有1萬例,尤其中國人南北方加起來10億人口,一定是需要百萬級別的數據,才可能接近我們所要求的精準。50

亞馬遜“預測式發貨”的新專利,可以通過對用戶數據的分析,在他們還沒有下單購物前,提前發出包裹。

這項技術可以縮短發貨時間,從而降低消費者前往實體店的沖動。從下單到收貨之間的時間延遲可能會降低人們的購物意愿,導致他們放棄網上購物。

所以,亞馬遜可能會根據之前的訂單和其他因素,預測用戶的購物習慣,從而在他們實際下單前便將包裹發出。根據該專利文件,雖然包裹會提前從亞馬遜發出,但在用戶正式下單前,這些包裹仍會暫存在快遞公司的轉運中心或卡車里。

亞馬遜為了決定要運送哪些貨物,亞馬遜可能會參考之前的訂單、商品搜索記錄、愿望清單、購物車,甚至包括用戶的鼠標在某件商品上懸停的時間。一、消費大數據附錄其它大數據51

在籌備過程中,奧巴馬背后的數據分析團隊一直在收集、存儲和分析選民數據。

在這次的大選中,奧巴馬競選陣營的高級助理們決定將參考這一團隊所得出的數據分析結果來制定下一步的競選方案。利用在競選中可獲得的選民行動、行為、支持偏向方面的大量數據。

比如,在東海岸找到一位對女性群體具備相同號召力的名人,從而復制“克魯尼效應”并為奧巴馬籌集競選資金。

“Twitter的政治指數”提供了一個衡量社會化媒體平臺的用戶如何評價候選人的方式。奧巴馬積極的情緒指數是59,而羅姆尼的只有53二、政治大數據52

回顧“老鼠倉”的查處過程,在馬樂一案中,“大數據”首次介入。深交所此前通過“大數據”查出的可疑賬戶高達300個。

實際上,早在2009年,上交所曾經有過利用“大數據”設置“捕鼠器”的設想。通過建立相關的模型,設定一定的指標預警,即相關指標達到某個預警點時監控系統會自動報警。

而此次在馬樂案中亮相的深交所的“大數據”監測系統,更是引起了廣泛關注。深交所有幾十人的監控室,設置了200多個指標用于監測估計,一旦出現股價偏離大盤走勢,深交所利用大數據查探異動背后是哪些人或機構在參與。三、證監會大數據53

量化交易,程序化交易,高頻交易是大數據應用比較多的領域。

全球2/3的股票交易量是由高頻交易所創造的,參與者總收益每年高達80億美元。

其中,大數據算法被用來作出交易決定?,F在,大多數股權交易都是通過大數據算法進行,這些算法越來越多地開始考慮社交媒體網絡和新聞網站的信息來在幾秒內做出買入和賣出的決定。

當一個產品可以在多個交易所交易時,會形成不同的定價,在這當中,誰能夠最快地捕捉到同一個產品在不同交易所之間的顯著價差,誰就能捕捉到瞬間套利機會,技術成為了重要因素四、金融大數據54

在摩托車生產廠商哈雷·戴維森公司位于賓尼法尼亞州約克市新翻新的摩托車制造廠,軟件不停的在記錄著微小的制造數據,如噴漆室風扇的速度等等。當軟件察覺風扇速度、溫度、濕度或其它變量脫離規定數值,它就會自動調節機械。哈雷·戴維森同時還使用軟件,還尋找制約公司每86秒完成一臺摩托車制造工作的瓶頸。最近,這家公司的管理者通過研究數據,認為安裝后擋泥板的時間過長。通過調整工廠配置,哈雷·戴維森提高了安裝該配件的速度。

美國一些紡織及化工生產商,根據從不同的百貨公司POS機上收集的產品銷售速度信息,將原來的18周送貨速度減少到3周,這對百貨公司分銷商來說,能以更快的速度拿到貨物,減少倉儲。對生產商來說,積攢的材料倉儲也能減少很多。五、制造業大數據55

國際大石油公司一直都非常重視數據管理。如雪佛龍公司將5萬臺桌面系統與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論