大數據的源起演進與贏利邏輯_第1頁
大數據的源起演進與贏利邏輯_第2頁
大數據的源起演進與贏利邏輯_第3頁
大數據的源起演進與贏利邏輯_第4頁
大數據的源起演進與贏利邏輯_第5頁
已閱讀5頁,還剩13頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中國工商銀行金融青年論壇論文

互聯網金融的健康發展與風險管理

大數據的源起演進與贏利邏輯

一基于金融和營銷業的部分實例

2014年7月

-1-

大數據的源起演進與贏利邏輯

——基于金融和營銷業的部分實例

蔡寧偉

摘要:2005年以后,針對大數據的研究層出不窮。但是,仍存在兩大亟需解決

的問題:一是對大數據本質的認識不足,忽視對其源起和演進的探索;二是對大

數據贏利的關鍵點展開不足,未能全面展示大數據贏利的邏輯內涵。本研究嘗試

彌補上述兩大認識不足。通過定義梳理對比,發掘大數據的本質特征、獲取特質、

優勢應用和現實意義,說明大數據的來龍去脈。通過列舉部分金融業和相關企業

的實例,詮釋大數據的贏利步驟、特征和目的,明確縱橫向大數據的優勢,并提

出未來大數據的五類價值發現和發展展望。

一、引言

2005年特別是2010年以后,社會對于“大數據”的研究呈井噴式的增長。

這種增長一方面源自理論研究的不斷推動,Nafwre和Science雜志于2008年、2011

年相繼推出專刊,專題介紹大數據;一方面源自實踐應用的提升,2012年美國

等發達國家對大數據的不斷重視,啟動“大數據研究與開發計劃"(BigData

ResearchandDevelopmentInitiative),引導多國將其提上國家戰略的議程;還有

一方面源自熱點新聞的持續聚焦,2013年“斯諾登事件”就安全部門秘密監控

的猛烈爆料與持續發酵,引發公眾對大數據隱私泄漏的警惕和好奇。由此,學界

和產業界都展開了對大數據的研究和探索,取得了一定成果;一些發達國家和先

進企業已經將大數據的分析應用到實際工作中,取得了一定成效。

但是,這一階段的研究和實踐還存在一些亟需解決的問題,對大數據本質及

其贏利關鍵的說明與解釋仍然不足。主要表現為兩個方面:一是對大數據本質的

認識不足,一些研究片面認識其是基于物聯網、社交網絡或“云計算”的時代產

物,而忽視對其源起和演進的探索;二是對大數據贏利的關鍵點展開不足,研究

未能全面展示大數據贏利的邏輯內涵,只看現象不看原因,對其價值取向和趨勢

缺乏系統梳理。因此,無論是學界和企業界抑或大眾對于大數據如何產生暨怎樣

-2-

發展、以什么方式贏利等關鍵問題的認識仍然模糊甚至存在分歧。

t1t

對比中外全面梳理初次提出首次嘗試

學者組織歸納認知地圖建構模型

圖1大數據獲取渠道與贏利邏輯之研究設計

本研究嘗試彌補上述兩大認識不足,通過列舉部分金融業和相關企業的實

例,說明大數據的前世今生,詮釋大數據的贏利邏輯,并提出大數據未來的價值

發現和發展展望。在此,我們進行了圖一中的研究設計,嘗試通過比較全面的對

比、梳理和歸納,來建構大數據的演進過程與贏利模型;其中上部是研究的主要

過程和結果,下部是對應采取的研究方法和意義。

二、大數據的定義與內涵

事實上,西方早在20世紀80年代,就已經有了大數據的提法(朱東華、張

嶷、汪雪鋒、李兵、黃穎、馬晶、許幸榮、楊超、朱福進,2013)。我國針對大

數據的研究相對起步相對較晚,在20世紀80和90年代已經出現了與大數據相

關的一些概念,如“樣本”(Sample)、“大樣本”、“全樣本”、“抽樣”、“大數據

流”、“大數據量”、“海量數據”、“數據庫”等等。雖然這些概念與大數據本身截

然不同,但至少可以作為技術層面了解和分析大數據的視角、手段與方法。目前,

學者對于大數據的概念眾說紛紜,在此本研究截取中外學者和組織具有代表性的

觀點,通過文本分析和梳理歸納,對比和解析大數據的定義與內涵。

表1大數據的代表性定義與特征

-3-

提出者國別定義特征

Manyika>Chui^Brown、意指一般數據庫軟件難以獲取、存儲、管理和非一般、大

Bughin、DobbsARoxburgh>美分析的大容量數據容量

Byers(2011)

Mayer-Schonberger>Cukier意指為人類的生活創造前所未有的可量化的可量化、轉

(2012)維度,開啟重大的時代轉型,其核心是預測'型、預測

Gartner意指在一個或多個維度上超出傳統信息技術超乎尋常

(2013)的處理能力的極端信息管理和處理問題2

維基百科(Wiki)意指無法在一定時間內用常規軟件工具對其處理時間

(2014)無內容進行抓取、管理和處理的數據集合3長、數據集

意指由科學儀器、傳感設備、互聯網交易、電來源多樣、

國家科學基金會(NSF)子郵件、音視頻軟件、網絡點擊流等多種數據規模大、復

(2013)源生成的大規模、多元化、復雜、長期的分布雜、長期、

式數據集4數據集合

意指用來描述數據規模巨大、數據類型復雜的規模巨大、

李瑞、賈鴻飛數據集,其規模已經超出普通的數據庫管理工類型復雜、

(2012)具在可容忍的運行時間內進行數據的捕獲、存處理難度

儲和處理的能力

意指無法在可容忍的時間內用傳統IT技術和處理時間

李國杰

中軟硬件工具對其進行感知、獲取、管理和服務長、數據集

(2012)

的數據集合合

意指為了更經濟更有效地從高頻率、大容量、高頻率、大

互聯網數據中心(IDC)不同結構和類型的數據中獲取價值而設計的容量、不同

(2013)新一代架構和技術,描述信息爆炸時代的海量結構類型、

數據,并命名與之相關的技術發展與創新$技術創新

1參見[英]維克托?邁爾-舍恩伯格、肯尼思?庫克耶.《大數據時代》M.杭州:浙江人民出版社,2012

年12月第一版,1-103。

"參見http:〃ww.gartner.com,2013年1月1日;它是一家知名的信息技術顧問咨詢公司。

3參見http:〃en.wikipedia.org,2014年3月8日。

4參見http:〃www.nsf.gov,2013年1月1日。

5參見鄭玲微.《大步跨入大數據時代》[J].杭州:《信息化建設》,2013(1):11-13。

-4-

香山會議意指數字化生存時代的新型戰略資源,是驅動戰略資源、

(2013)中創新的重要因素,正在改變人類的生產和生活驅動創新、

方式'改變現狀

就大數據本身而言,綜合表一中的定義,我們認為學者公認的大數據主要有

以下特征。一是容量特別巨大(Volume),不僅是TB(1000GB)、PB(1000TB)

或者EB(1OOOPB)量級,據相關研究論文或報告稱大數據總量基本以ZB(2

的70次方)計量(方方,2012)。二是數據來源多樣(Variety),數字、文字、

圖片、音頻、視頻、檔案文件、電子日志等都是其來源。三是處理要求迅速

(Velocity),既然是海量數據,從中要求提取的有用信息一定具有時效性;因此

我們認為這一特征的實質來源于大數據的大容量,且更準確的應該作為對大數據

處理的要求。四是具有一定價值(Value),但價值密度低、隱藏較深,需要深入

挖掘和不斷“提純”。以商業銀行ATM監控為例,一般監控視頻要求存儲時間

達3個月,但如果涉及某個客戶異常交易或者外部風險事件的可能僅有短短的

1-3分鐘。五是處理要求精準性(Veracity),類似于處理要求迅速,我們認為這

一特征的實質同樣源自大容量的特征,且應視為對大數據的處理要求;甘綺翠

(2013)認為這一特征是企業維度的特征,更適合于企業要求。我們認為:不僅

企業,就連政府、高校等機構同樣有此需要,2013年曝光的美國“楞鏡門”事

件從一定程度上驗證了政府等機構對大數據的這一特征需求。止匕外,對于戰略資

源、驅動創新和改變現狀而言,我們認為這并非單指大數據的特征,而是其價值

與意義的體現。在目前的實踐中,大數據已經起到了上述作用,并將進一步發揮

它們的特長。

就大數據的獲取而言,我們認為目前主要呈現如下三大特征:一是渠道越便

利,數據獲取越易。以常見的調研問卷為例,以前調研獲取信息一般通過面對面

問答或發放問卷及手寫錄入,后來發展到電話調研和計算機錄入回答,再后來開

始了網上或手機填答,目前微信等渠道也可以開展調研和投票,廣受被調查者喜

愛。二是溝通越豐富,數據信度越高。所謂數據的信度(Reliability),意指數據

的可信程度,即重復調研前后數據結果的一致程度。在問卷調查中,很容易因為

1參見石勇.《數據挖掘與大數據在金融與銀行領域的應用及前景》[R].北京:大數據專題報告,2014年2

月22日。

-5-

被調查者不理解題目的意思而引起回答的不一致,甚至前后矛盾,而問卷在設計

時也往往設置這樣具有內在邏輯的題目,以驗證回答的信度。在以往發放回收問

卷中,被調查者和調查者難以多次溝通,即便出現疑問被調查者也難以詢問;而

目前采用微信、電子郵件等方式調研則更容易促進雙方的溝通,即便出現問題交

流也比較及時、溝通成本較小,這是溝通方式或渠道豐富的益處。三是調研激勵

越大,數據效度越高。所謂數據效度(Validity),意指數據的有效程度,即“所

答即所問"。以往,國內的調研往往借助親朋好友的關系進行,沒有禮品、獎金

等激勵,結果發現存在部分被調查者敷衍了事、心不在焉的情況,如問及個人收

入選擇年收入為“0”等,即便其為某公司中層管理者。后來,逐步發展為給予

現金、購物網站禮券、獎品、書籍、手機話費作為報酬的方式,由于采取按勞所

得的原則,數據獲取愈加準確,有的調研長達30分鐘,多則給出高達100元的

獎勵。

三、大數據的源起與演進

綜合上述定義,不難看出,大數據研究的絕大多數內容與人們的生產生活休

戚相關,是人們工作生活的數字化集合。因此,相當比例的大數據研究針對的是

社會科學的研究。當然自然科學也需要大數據,不過自然科學一定比例的數據來

自更為穩定、具有一定限制條件的實驗室,而不一定需要通過大數據的形式或途

徑來獲取,有的數據可以直接通過觀測獲得。由于大數據具有上述針對性,因此

其源起在一定程度上打上了社會科學的烙印,從而具有一定社會科學的特征。事

實上,科學主要分為自然科學、社會科學和人文藝術三類。自然科學可以稱為科

學,具有其特有的研究體系和方法,強調精確探索世界萬物的客觀規律;人文藝

術則更多地偏向感性思考,并不追求準確,較少存在理性活動;社會科學主要研

究人與社會的關系,借鑒了自然科學的理性方法,但具有自身感性變化的一面,

兼故了自然科學與人文藝術的特征,是理性與感性的交集,被稱之為“準科學”。

比如,以社會科學中的管理學為例,就被譽為“科學與藝術的合體”。因此,圖

2中展示的三類科學之間也存在交叉和互補。

-6-

在大數據概念提出之前,人類已經對數據產生了濃厚的興趣。遠古時代,“結

繩記事”就是一種數據記載和記錄創新;近現代,借鑒了自然科學研究方法的社

會科學,其定量研究中的抽樣、取樣、樣本分析或者質性研究中的案例研究實際

都是從大數據、大集合中提取具有代表性、典型性的部分“小數據”,從而分析

和預測整體數據即大數據的全貌。因此,大數據的本質離不開數學、統計學、概

率論、計算機技術和信息科學的學科群支持,也離不開高等數學與數理統計、生

物學、社會學、經濟學、心理學和管理學等其他相關學科的理論補充。

值得一提的是,就大數據的潛在應用指數而言,盡管零售行業以“啤酒與尿

布”(Walmart)】,“少女懷孕”(Target)2等經典大數據分析的案例備受關注,金

融行業仍排名居首(Manyika、Chui、Brown>Bughin^Dobbs,RoxburghByers,

2011)o有學者預測,包括金融企業在內的企業正在放棄“以產品為中心”

1此營銷組合主要針對單身父親或去超市購物的父親,尿布與啤酒這兩種原本看似風馬牛不相及的商品擺

在一起,使尿布和啤酒的銷量大幅增加;此組合的奧妙在于不僅滿足了男性角色的需要,更同時滿足了同

一客戶作為父親角色即其幼小子女的需要。

2此事件源自一位憤怒的美國父親對超市經理的投訴,認為其17歲的女兒絕不可能懷孕,而超市卻將嬰兒

尿布和童車的優惠券寄到他們家里:事實上,超市的廣告促銷并非失誤,而是針對每一位客戶的購物清單

組合列出了下一步營銷的對象和舉措,而他的女兒在超市購買了某些測孕和備孕商品后被證實真的懷孕了。

-7-

(Good-dominantLogic)轉變為"以服務為中心"(Service-dominantLogic)(馮

芷艷、郭迅華、曾大軍、陳煜波、陳國青,2013),或者稱之為“以客戶為中心”

(Customer-dominantLogic)。

從其數據來源來看,大數據的制造者、擁有者和使用者都比較多元,個體、

群體、組織均參與其中,且個人信息與家庭、企業、政府等組織信息甚至國家信

息相互交匯融合,數據量不斷增大,這與其多樣性的特征相一致。我們認為:政

府、企業、非營利組織(科研機構、高校)、網絡與開放數據(個人、團隊)等

都可能是大數據的擁有者。例如,稅務部門擁有很多企業和員工的收入數據,住

建部門擁有很多個體的房屋居住和交易數據;商業銀行擁有所轄客戶的賬戶與交

易行為數據,快遞公司擁有大量客戶的信息和交易情況數據;高校擁有大量的學

生與畢業生信息數據,醫院擁有一定量的患者信息及疾病治療數據;咨詢機構和

顧問公司擁有多年積累的項目調查數據,還有一些個人建立了源于自身興趣和專

業的數據庫。但是上述數據之間,因為數據所有者的職能、定位和監管要求等,

難以實現共享,于是一些企業逐步嘗試多元化經營,以期獲得更廣范圍的數據。

例如:2012年建設銀行推出“善融商務”,從而終止與阿里巴巴的合作轉而獨立

獲取有關數據;2013年淘寶與天弘基金聯手推出“余額寶”,從而在一定程度上

彌補了自身金融交易信息不足的短板;2014年工商銀行推出在線商城“融易購”,

則在一定層面完善了社會數據缺失的弱勢;與之類似,2014年騰訊入股京東和

大眾點評,努力豐富生活服務電商品類,旨在強化社會數據和交易數據的獲取,

與此同時,百度收購糯米也是一例很好的佐證。

如圖2所示,大數據的源起比較全面的展示了大數據的信息源、支持學科群

和應用領域。其中,應用領域在此主要以科學類別概括說明,而從實踐上,大數

據的應用主體往往又回到了其來源,例如個人、企業、非盈利組織、政府等都可

能成為大數據的挖掘和使用主體。所以,在圖二中,來源還有一個箭頭從此出發,

直接與應用相聯系,這反映的是大數據的來源與應用主體可能同源。如是,通過

圖二可以直觀展示大數據的來龍去脈與前世今生。

四、大數據的優勢與創新

既然大數據與社會科學研究聯系比較緊密,又備受研究者和實踐者的關注,

-8-

那么大數據一定有其獨特的優勢和創新點。那么,大數據的獨特優勢到底是什

么?大數據的創新究竟如何體現?大家往往眾說紛紜、莫衷一是。我們認為:大

數據的獨特優勢正是在于其信息的全面,進而實現由局部數據向全面數據、由結

果數據向過程數據、由總量數據向明細數據、由過時數據向實時數據的應用轉變,

對應推動組織采取全面管理、流程管理、精益管理和敏捷管理的開展,從而可以

采取創新的方法從中挖掘出個人或組織希望得到的、準確的、可靠的信息,提升

分析、歸納與預測的信度和效度,進而有利于達成個體或組織目標。

圖3大數據的應用轉型與管理變革

如圖3所示,大數據獨特優勢是建立在其特征之上的,依據視角不同,可以

分為四大維度。從范圍維度上上看,大數據實現了從局部數據向全局數據的轉型,

擁有全量數據不再是空想,繼而有助于個體或組織實現全面管理和制定戰略規

劃;從導向維度上看,大數據實現了從結果數據向過程數據的轉型I過程導向

更有助于發現和解決問題,繼而有助于個體或組織提升過程管理和實施流程再

造;從層次維度上看,大數據實現了從總量數據向明細數據的轉型,各個粒度的

數據可以實現分類分層聚焦,繼而有助于個體或組織實現精益管理和采取質量控

制;從時間維度上看,大數據實現了從過時數據向實時數據的轉型,提供了基于

當前情境的數據獲取和未來數據預測,繼而有助于個體或組織實施敏捷管理和采

取風險規避。事實上,全面管理、過程管理、精益管理和敏捷管理等管理變革正

1參見陳新躍.《從大數據到價值挖掘》[R].北京:大數據報告,2014年2月14日。

-9-

是大量企業基于自身和外部數據的創新,在制造企業、組織運營、流程管理等領

域得到了廣泛的應用。止匕外,戰略規劃、流程再造、質量控制、風險規避等可能

成為個體或組織的主要目標愿景之一,這些目標本身也存在一定內在聯系,因此

不能說哪一項是所謂“終極目標”,在某一環境下都可能成為急待解決的重點,

只能依據大數據應用主體的情境和需要而定。

為更好的展示大數據的優勢與創新,我們首先需簡要回溯大數據的學科支

持,特別是有關社會科學研究本體、客體及方法論的現狀和局限。眾所周知,社

會科學研究一般包含研究主體即研究者、研究客體即研究對象兩大要素,研究和

研究方法科學性的必然要求就是合理控制研究誤差。目前,有關研究方法的論文

和論著一般都明確指出:研究誤差往往來源于樣本的抽樣I,即概率誤差和系統

誤差(也稱“操作誤差”)兩部分,但這兩類誤差僅僅來源于兩大要素之一的研

究主體。根據研究的兩要素分類并兼顧主客體之間的關系,除了抽樣誤差之外至

少還存在兩類誤差:一是來源于研究客體的誤差,即調查對象故意制造的誤差和

無意出現的誤差,這是一般定量研究所忽略或事后難以發現的;二是來源于研究

主客體溝通的誤差,即研究主客體交互的誤差(王興周,2006),這是一般定量

研究難以檢驗和根治的。

在此,我們以社會科學研究中最為常見的一種研究方法:調查研究(Survey

Research)為例,其研究目的在于對研究對象的特征和關系進行調查,并做統計

分析和描述,即取得和分析資料(邱澤奇,2003)o這種研究方式的一個重要特

征,是其在時間維度上的一次性,或者稱為單點性。因而,調查研究通常被稱作

是一種橫截面研究,其優勢在于針對性對性較強,便于實施,靈活性較大(何斌、

鄭弘、李思瑩、董振寧,2013)。正是由于調查研究的橫剖特征,使其在具有大

量優點的同時,也存在著一些內在的不足和局限。這種局限性的一個主要體現,

就是調查研究對現象之間因果關系的推斷相對軟弱無力。由于“從社會調查中所

獲得的這種抽掉時間框架的‘事實'中,人們往往比較容易發現不同現象相互之

間的‘共變'特征,而比較難發現它們之間的‘因果'特征”,因此在解釋社會

現象之間的因果關系方面,調查研究的方法存在著明顯的不足(風笑天,2006)o

1大數據樣本意味著“全樣本”,即便如此,為保證時效性和控制成本,實現大數據處理要求快(Velocity)

的要求,我們認為樣本的選擇即抽樣必不可少一一既要全面又要抽樣,從粗糙中尋求精確(石勇,2014)。

-10-

比如,其結果容易受到調查方案設計的缺陷或執行過程中的偏差影響,又如調查

者不配合或不如實作答等,所以用以保證問卷或量表信度和效度的工作需要一定

的投入,也需要耗費較長的時間。對此,也有學者提出量化研究可以借鑒質性研

究的優勢,反之亦行,以實現優勢互補(胡中鋒、黎雪瓊,2003),進而以順序、

平行和交錯三種方式進行融合(陳忠衛,2013),例如采取仿真實驗、案例推演、

沙盤模型、計算機決策等方法。

大數據的出現,恰恰可以在一定程度上解決上述問題,成為除了質性研究以

外彌補調查研究和定量研究缺陷的另一種思路與途徑。以我們熟悉的金融業務為

例,兩類誤差有如下典型案例。為避免第一類誤差,英國小額貸款公司Wonga利

用大數據挖掘算法開展某些貸款業務,他們通過對客戶以往各種碎片化信息進行

獲取和整理,用大量的數據還原客戶特征的全貌并建立貸款模型,同時根據不良

貸款等風險信息不斷完善模型,從而有效控制風險。如今Wonga年利潤逾5億美

金,其風險管理能力廣受業界好評(李瑞、賈鴻飛,2012)o與之類似,阿里公

司根據在淘寶網上中小企業的交易狀況篩選出財務健康和講究誠信的企業,向他

們發放無擔保貸款,目前已放貸300多億元,壞賬率僅為0.3%(郭賀鏗,2013)o

為避免第二類誤差,金融行業可以利用大數據開展如下創新。例如,某商業銀行

的一位信用卡客戶每月平均刷卡5次、刷卡金額1500元、打1次客服電話,且辦

卡一年來從未收到或受理任何投訴;按照傳統的單一數據分析,該客戶應該是一

位滿意度較高、風險流失較低的客戶。但如果通過大數據搜索到該客戶的微信,

通過“某銀行”、“投訴”、“抱怨”、“生氣”、“不滿意”、“不方便”、“打不通”等

相關“關鍵詞”的組合檢索,發現真實情況是:由于他的工資卡和信用卡不在同

一家銀行,導致還款極為不便,好幾次打客服電話沒有接通,已多次在微信上抱

怨,滿意度和忠誠度均較低,與傳統分析得出了截然不同的結論。

綜上所述,大數據的內涵不僅僅是某一時點的截面數據,更是一定時期積累

的縱向數據。因此,大數據不僅可以為社會科學研究中基于演繹邏輯的定量研究

廣泛使用,也可以為另一類研究方法即基于歸納邏輯的以案例研究(CaseStudy).

追蹤研究(PanelStudy)>扎根理論(GroundedTheory)、參與式觀察(Participant

Observation)實驗研究(ExperimentalStudy)>檔案研究(內容研究)(Archives

Study)等為代表的質性研究所引入和使用。本質上看,大數據因其來源多樣,

-11-

從而可以通過不同渠道、維度、時段的數據進行相互驗證,更容易發現單一來源

數據的不足和矛盾,從而實現多源交互檢驗。這一方式類似案例研究構建的“證

據三角形"(Triangulation)(Yin,20041)2,通過多種途徑提高數據的信度和效度。

五、大數據的贏利與邏輯

既然大數據存在上述優勢,那么大數據又是如何實現贏利的呢?大數據贏利

需要遵循怎樣的邏輯?我們接下來將對圖二中的應用部分作進一步闡釋,并嘗試

將大數據的贏利演進與其特征、目標相結合,以認知地圖(CognitiveMap)2的

方法構建大數據贏利的邏輯內涵。在圖四中,上層是大數據贏利的各階段性目標,

中層是大數據贏利的各個步驟,下層是大數據在贏利過程中的特征,我們將三者

結合在一起通過圖4來展示:

圖4大數據贏利的特征、目的與邏輯內涵

(一)大數據的贏利步驟

首先,從圖4大數據贏利演進的中間部分,即大數據贏利的邏輯內涵來看,

1參見[美]Yin,R.,K.《案例研究設計與方法》IM].重慶:重慶大學出版社,2004年11月第一版,1-59、

106-114?

2認知地圖也稱"心像圖"(MindMap)、"心智圖"(MentalM叩)等,由Tolman于1960年代提出,以普

通地圖的形式展示知識的有機結構;本研究采取廣義認知地圖的方法,是基于認知科學的人類對于事物及

其相互之間關系的關聯圖示,可用于表達隱性知識的圖形(張凌,2012).

-12-

組織若想實現大數據的價值基本需要采取以下五個步驟。一是從個體、組織、國

家等大數據的源頭獲取數據,一般而言,企業最初獲取或者日常獲取的這類數據

往往是一種橫截面的數據,即節點數據,主要反映某一時間點的信息。因此,即

便此時的數據涵蓋了方方面面,嚴格意義上講也只能稱為橫截面大數據。二是企

業等數據搜集主體通過長時間的積累和追蹤,不斷累積橫截面的數據,逐漸形成

某一時間段的大數據。在研究上,這類數據被稱為縱向數據,具有考量個體和組

織行為習慣、特征偏好等功用。三是大數據搜集的主體通過數據挖掘,尋找大數

據中隱含的內在聯系與因果關系,可以發現某些數據及其行為主體的規律。事實

上,只有橫截面與縱向共享的全量數據,才能稱為真正意義的大數據。四是即便

企業擁有了大數據,也不能直接通過它來實現贏利,需要在結合內在規律的同時

通過發現其中的個性化數據信息信息,進而采取精準營銷、流程優化、產品創新

等手段。這一系列手段,是企業實現內部改進、提升對外服務的必要條件。五是

即便企業不斷優化改善,實現了營銷等方法上的準確定位與創新,企業仍然存在

長期的發展挑戰。這時候,依托大數據進行中長期戰略預測、對顛覆性的小概率

事件進行風險管理,將事后和事中風險前移到事前管理,可以使企業在解決“近

憂”的同時兼故“遠慮”,保持企業的基業常青。

(二)大數據的贏利特征

從圖4大數據贏利演進的下部分,即大數據贏利的特征來看,前文提到的大

數據特征始終貫穿大數據贏利邏輯的全生命周期。一是橫截面的大數據獲取主要

體現了大數據獲取渠道的多樣性(Variety)、容量大等特征。二是縱向大數據的

積累主要體現了大數據容量大(Volume)、價值密度低等特征,橫縱向大數據的

集合更加復合展示了上述特征。三是正因大數據具有上述特征,因此在進行數據

挖掘、規律尋找的之時,處理要求快(Velocity)便成為其通用的要求。不難看

出,處理要求快實際并非大數據本身所具有,而是大數據處理主體的必然要求。

四是更進一步,從發掘個性化數據,實施精準營銷、優化創新起,精確性(Veracity)

也是處理大數據的必然要求。因此,類似處理要求快,精確性也并非大數據本身

獨有,海量數據匯聚一起,準確需要處理主體來實施。五是對于企業等主體關注

的有關戰略預測、風險管理的核心大數據,必然具有較高的價值(Value),事實

上,這一價值主要針對所需要的主體而言,即存在一種相對價值,并且這一價值

-13-

的賦予和附加恰恰是實施主體通過搜集積累、數據挖掘、創新優化等手段所累進

的。例如,工商銀行已經實現了由事后監督向基于操作風險監控事中管理的戰略

轉型,并創新地開展了事前預測,增強流程和系統的風險管控能力(易會滿,

2013)。這一創新正是基于大數據的上述特征并應用于實踐,不斷改善公司治理,

增強企業的核心競爭力,取得了良好的經營管理效益。

(三)大數據的贏利目的

從圖4大數據贏利演進的上部分,即大數據贏利的目標要求來看,源自大數

據實施主體的要求與大數據贏利的步驟和特征休戚相關、相輔相承,從而形成一

整套交互融合的邏輯體系。一是橫截面的大數據獲取主要解決信息不對稱的問

題,避免因某些數據的缺失導致企業決策失誤,實現某一時點數據的對稱共享。

二是僅僅有橫截面的大數據處理還遠遠不夠,需要企業通過自身、外包、外購、

開源、交換等多種途徑積累更長時間段內的縱向數據,最終建立縱橫向維度的大

數據集合,以擁有足夠的數據資源較少甚至消除概率誤差、系統誤差、研究客體

誤差和研究主客體溝通的“四大誤差”,為企業進一步挖掘數據價值提供基礎支

撐。三是個性化數據挖掘用以實現精準定位的目的,無論外部精準營銷,還是內

部流程診斷,個性化的數據必不可少,而通過大數據的不斷提煉和發掘,可以將

某些個體的信息片段或者斷點連接起來,形成展示個體信息和習慣的全貌,獲得

抽樣調查因果關系解釋不足的先天缺陷。四是進一步發掘企業關注的長期核心數

據、小概率異常數據等,提煉事關企業戰略發展、宏觀經濟形勢變遷、極端概率

風險事件的數據,保障企業實現持續穩健發展。五是無論上述哪一方面,實質都

是為了助力企業內外部挖潛,確保企業實現贏利,幫助企業持續提升績效。

六、大數據的價值與展望

社會科學研究的一個重要目標,就是要探索和解釋不同社會現象(研究變量)

之間的因果關系。而因果關系的基本條件之一,就是存在關系的兩種現象之間具

有時間上先后順序。作為原因的現象要發生在前,作為結果的現象要發生在后(風

笑天,2006)o正如Cook和Campbell(1986)以及Shadish、Cook和Campbell(2002)

等提出有效的因果推論必須滿足三條準則:一是假定的原因和結果之間具有共變

性,或者稱之為存在穩定的關系;二是原因暫時優先性,即原因必須發生在結果

-14-

之前;三是能夠控制和排除可能的因果關系之間存在其他解釋的可能性,即除此

原因之外沒有其他替代性的解釋。其中的準則之二,就是用以保證因果關系的時

間順序,即先后順序的必要條件。大數據的出現,為社會科學研究實現這一目標

奠定了更為堅實的資源和信息基礎,其建構、解釋和預測的精確性(Veracity)

甚至可以達到前所未有的高度。2014年,美國微軟紐約研究院的經濟學家

Rothschild通過綜合博彩公司賠率、投票排行等大數據分析,以概率的形式成功

預測了24項奧斯卡大獎中的21項,成功率高達87.5%'無獨有偶,美國印第安納

大學利用谷歌的心情分析工具,從海量網民的留言中歸納出六種心情,進而預測

道瓊斯工業指數,準確率高達87%(郭賀鏗,2013)。我們認為:通過一定規模

的大數據,更容易發現和解釋不同社會現象之間的因果關系,進而為個人、組織

特別是以贏利為目的的制造和金融等企業提供更為方便、準確的金融產品和信息

服務。具體來看,主要表現為以下五個方面:

(一)實現精準營銷

大數據有助于企業實現精準營銷。前面提到的經典案例“啤酒與尿布”、“少

女懷孕”等都是一定量級數據綜合分析的結果。盡管經過了大量客戶與實踐的檢

驗,但仍不排除存在一定數量的促銷和廣告推送失誤。例如,不排除美國有的已

婚女性也喜歡喝啤酒,也不排除已婚女性持有先生的信用卡幫助先生購買啤酒。

但是,在更為廣闊的大數據面前,這些例外都會迎刃而解。例如,除了“啤酒與

尿布”,鐘情啤酒的已婚女性可能還存在其他購物組合,如“啤酒與女士香水”、

“啤酒與護發素”等等,如果企業發現這類組合,便可以將客戶從的單身父親類

別中剔除,并建立新的客戶類別。在此基礎上,向客戶推送的營銷信息、金融產

品也可以不斷完善,實現個性化、差異化與定制化。事實上,所謂垃圾信息只是

用錯了地方、給錯了對象,一旦投送的客戶確實需要這些信息,便會“視為珍寶”,

決不置之不理。依靠大數據作為支撐,垃圾短信、垃圾郵件、垃圾廣告都可以變

廢為寶,延伸客戶關系管理(CRM)的范疇,建立企業與客戶更為緊密的聯系。

(二)發掘新型產品

大數據有助于企業發掘新型產品。在產品和服務的創新過程中,除了企業主

動發起之外,來自客戶的需求也不容忽視。無論是客戶的客觀需要、抱怨投訴和

意見建議,積少成多,便可以從中發現端倪。例如,一些客戶因持有不同銀行的

參見,2014年3月4日。

-15-

信用卡或者在不同銀行貸款,需要每月定期去多家銀行或者登陸各銀行網銀還

款,有銀行正是基于客戶“多頭還款”的問題開發了基于同一銀行卡的定期轉賬

還款產品,很受這類客戶的歡迎。再如,一旦有客戶在網銀退出某類金融產品或

者通過電話銀行、自助銀行放棄某項金融服務的使用,不妨在隨后的流程或界面

上多問一句:可否請您告知我們放棄此類產品的原因?并列舉若干選項:A、操

作不方便;B、未達預期收益;C、存在安全隱患;D、其他銀行有收益更好的產

品……以及您還需要補充的情況等等。日積月累,這些信息更有助于了解客戶和

競爭對手,進而不斷完善、豐富和改進金融產品與服務。

(三)優化內部流程

大數據有助于企業優化內部流程。除了外部客戶之外,企業員工這一內部客

戶的感受和體驗也不容忽視。基于大數據理念,可以協助企業尋找影響員工滿意

度的關鍵瓶頸,梳理導致內部抱怨的流程要點,從而幫助企業進一步優化流程,

提高運營效率和服務質量。例如,通過系統監控,可以發現員工在哪些環節操作

時間過長,在哪些步驟容易出現失誤,并進一步分析有沒有員工可以在計劃時間

內保質保量完成,為什么一些員工需要更多的時間,為什么一些員工會出現失誤。

進而通過改進操作流程、完善運營系統、進一步培訓監督等方式來共同提升員工

的操作水平。事實上,20世紀80年代后出現的“全面質量管理”(TQM)、“戴

明環”、“六希格瑪”(6。)等管理理念正是基于企業內部數據分析、匯總的結果。

而通過大數據,還可以結合員工個體的日常行為、企業的重大事件等來共同預測、

防范和控制一些小概率錯誤的影響,合理控制或降低事故的作用范圍和程度。

(四)創新商業模式

大數據有助于企業創新商業模式。相信在未來的若干時間,一批數據公司、

顧問公司、數據倉儲公司、數據挖掘公司、分析統計公司、數據營銷策劃公司會

應運而生,活躍在各個行業;而一批企業數據庫、行業數據庫、政府數據庫會逐

步建立,甚至有的數據庫會實現部分數據的開源共享,從而產生更大規模的數據

使用與融合。當然,無論上述哪種商業模式,或者精準營銷、創新產品、優化流

程的哪個方面,企業或者個人都將付出一定技術與人力成本。因此,我們在此提

示各類組織、個體,在選擇大數據挖掘處理之前,一定要先行了解和評估大數據

分析運營的成本,從而結合自身實際客觀考量是親歷親為還是業務外包,是全面

-16-

挖掘還是典型取樣,是自己自足還是開源共享。可與預見的是,在不久的將來,

一批基于大數據應用的企業整合、并購和外包浪潮會隨之到來,并深刻影響和改

變我們的工作與生活。這一時期,更需要公民、企業與政府聯手,制定有關大數

據應用與共享的系列法律和規則。

(五)加強風險管理

大數據還有助于提升風險管理水平。眾所周知,大數據是與互聯網相伴相生

的,在密切人與人聯系的同時,相關風險事件也層出不窮。其中,以電話欺詐、

信用卡欺詐、支付欺詐為代表的“三類欺詐”尤為突出,又與個人信息泄露和部

分數據共享有著緊

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論