AI驅動的應用開發平臺架構_第1頁
AI驅動的應用開發平臺架構_第2頁
AI驅動的應用開發平臺架構_第3頁
AI驅動的應用開發平臺架構_第4頁
AI驅動的應用開發平臺架構_第5頁
已閱讀5頁,還剩29頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、以機器學習為核心的數據驅動型應用開發平臺OVERVIEW1Retrospective and Looking Forward大數據與人工智能技術的回顧與展望錄AsiaInfo Machine Learning PlatformAura 數據驅動型應用開發平臺簡介Data-Driven Application Use Cases數據驅動型應用示例Discussion問題與討論Applications of Big DataExamine the pastDescriptive AnalyticsDiagnostic AnalyticsNow and futurePredictive Analyt

2、icsPrescriptive AnalyticsExamine the PastAd-hocData warehouse OLAPPre-computedBatch (1st gen)n Hadoop for batch processing and reportingLambda (2nd gen) dual pipelinen Hadoop for batch processing and reportingn Storm / Spark Streaming / Samza for real-time processing Kappa (3rd gen) single pipelinen

3、 Real-time computation and query / reporting n Fault-tolerant distributed real-time architecture n Re-playable, real-time event streamsPredictive AnalyticsWhat will happen?Predict the future outcome based on historical eventsPrescriptive AnalyticsActionable - actions to be performed due to the predi

4、ctions and showing the implications of each decision optionMachine learning and deep learningCustomer acquisition (telecom, banking, e-commerce, )Fraud detection (telecom, banking, healthcare, advertising, )Customer churn prevention (telecom, banking, )Object recognition, facial recognition, Now and

5、 FutureDening Ar,cial Intelligence定義人工智能What is AI ?Artificial intelligence (AI) is intelligence exhibited by machines.The theory and development of computer systems able to perform tasks that normally require human intelligence, such as visual perception, speech recognition, decision- making, and t

6、ranslation between languages.In computer science, the field of AI research defines itself as the study of intelligent agents: any device that perceives its environment and takes actions that maximize its chance of success at some goal.2016年3月15日,在人機大戰最終局結束后,李世石 獨自一人掩面坐在棋盤前。這場比賽主動挑戰執黑的 李世石沒有能再次展現出“神之

7、一手”,最終180手投子 不敵AlphaGo。而人類VS人工智能(AI,Artificial Intelligence)也最終以1比4落下大幕AlphaGo計算集群1920 個CPU280 個GPU耗時數月完成模型訓練Machine Learning is an important area of AI機器學習是人工智能的重要領域Tradional ProgrammingMachine LearningComputerData ProgramOutputComputerDataOutputProgramMachine Learning is about:Automating automatio

8、nGetting computers to program themselvesWriting software is the bottleneck, let the data do the work instead!Artificial neural network is the building blockMimic human brainHigh depth and widthHeterogeneous computing (CPU + GPU)Google “Brain” (2012)IBM “Waston” (2015)百度大腦(2015)NVIDIA DGX-1 (2016)His

9、tory Progress in Deep Learning深度學習的歷史進程大數據平臺參考架構數據軟件安全國際運營商 Telco銀行 Banking媒體 Media公安 Public Safety醫療 Healthcare行業及業務范疇智 能 營 銷流 失 預 警騙保預測算法 及模型知識庫智能推薦算法 及模型知識庫用戶畫像算法 及模型知識庫熱點業務算法 及模型知識庫業務咨詢能力自然語言 處理能力數據挖掘能力新技術研究及 業務轉化能力醫 療 控 費醫 療 經 驗 傳 播個 人 客 戶 智 能 投 顧支 付 欺 詐 檢 測內 容 智 能 推 薦收 費 會 員 畫 像公 證 業 務 預 測公 證

10、人 群 畫 像AI算法及模型知識庫團隊核心能力語音及圖像識 別能力流失預警算法 及模型知識庫Important Factors技術 Tech業務 Business數據 Data人員 Human ResourceOVERVIEW1Retrospective and Looking Forward大數據與人工智能技術的回顧與展望錄AsiaInfo Machine Learning PlatformAura 數據驅動型應用開發平臺簡介Data-Driven Application Use Cases數據驅動型應用示例Discussion問題與討論Aura Posi,oningAura是基于機器學習和

11、深度學習技術的數據驅動型應用的高效開發 平臺。用戶能夠:應用行業數據應用已有的最佳實踐采用圖形化或編輯器兩種模式開發沉淀企業私有的數據挖掘的探索成果System Reinforcement Loop訓練數據 收集/更新基準庫 更新模型更新上線測試行業數據標準積累,技術知識與業務知識的充分結合預測結果與業務數據積累在同一平臺形成閉環模型自優化,自動評價模型表征,學習新樣板數據中 的特征變化,更新模型,提升模型準確度;根據實際效果自優化,根據每一輪實際的效果評估數 據,自動調整模型,不斷提升準確度。Aura ArchitectureOrange Cloud + DataFoundry + ML/D

12、L FrameworksAura Learning Services4G新增用戶 識別TelecomData platformML platformData-driven applications4G潛在流失 用戶識別RT Fraud DetectionAura Visual Pipeline醫保控費人流監控SMS SPAMFilteringPredictive Policing電信反欺詐投訴智能預 警智能投顧手機應用智 能推薦量刑規范化Aura Advanced NotebookCommon Data ModelFinanceHealthcarePublic SafetyCustomer A

13、cquisitionData platforML platformData-driven applicationsAsiaInfoCommon Data Model(CDM)TelecomFinancHealthcarPublic洞察/營銷/風控eeSafety4G新增用戶識別4G潛在流失用 RT Fraud醫??刭M人流監控 戶識別Detection手機應用智能推投訴智能預警智能投顧量刑規范化 薦SMS SPAMCustomerPredictive電信反欺詐FilteringAcquisitionPolicingAura Visual PipelineAura Advanced Noteboo

14、kAura Learning ServicesmOrange Cloud + DataFoundary+ ML/DL FrameworksCommon Data ModelCommon Data Model行業數據模型的定義字段、類型、語義、關系定義不同數據模型之間的關聯關系提供上層數據調用的接口和輔助操作行業數據標準和數據質量的校驗不同底層數據源的導入和封裝多租戶、訪問控制Visual PipelineVisual Pipeline向導式、規范化的挖掘流程支持按算法框架的維度提供向導式、規范化 的挖掘流程可視化管理和監控模型訓練過程監控,進度、異常、錯誤挖掘結果/評估結果的標準化、可視化展現

15、支持與Advanced Notebook的交互可編輯/展示開發完的模型,定義新的算法 框架支持與Common Data Model的交互可查看、選擇以及另存為新的指標集。Aura Learning ServicesOrange Cloud + DataFoundary+ ML/DL FrameworksAura Visual PipelineAsiaInfoCommon Data Model(CDM)TelecomFinanceHealthcarePublic Safety洞察/營銷/風控4G新增用戶識別4G潛在流失用戶RT Fraud識別Detecon醫??刭M人流監控手機應用智能推投訴智能預

16、警智能投顧量刑規范化 薦SMS SPAMCustomerPredicve電信反欺詐FilteringAcquisionPolicingAdvanced NotebookData-drivenapplicaonsAura Advanced NotebookML plaEormData plaEormAdvanced Notebook整合開源Notebook,兼容40多種編程語 言預置豐富的計算引擎/框架及各類接口, 輔助開發開源包的版本配置即時開發、修改,即時展現結果 支持與Visual Pipeline的交互可編輯/展示Visual Pipeline中已開發完的模型可將Advanced Not

17、ebook中已開發完的 模型發布至Visual Pipeline支持與Common Data Model的交互提供可視化控件可查看、選擇以及另存為新的指標集Targeted Users滿足三類典型用戶及相關需求:用戶技術業務 能力要求能力要求潛在需求產品使用者 歸屬部門產品潛在使用人群2016年2017-2019年E入門級 用戶現成數據應用業務部門75%,60%,占比遞減趨勢基礎級 用戶借助簡易工具 及平臺實現業 務部門需求業務支撐部門現場團隊20%30%,占比遞增趨勢進階及精 通用戶功能強大的平 臺業務部門(未來)現場團隊(未來)5%數據科學家10%,占比遞增趨勢OVERVIEW1Retro

18、spective and Looking Forward大數據與人工智能技術的回顧與展望錄AsiaInfo Machine Learning PlatformAura 數據驅動型應用開發平臺簡介Data-Driven Application Use Cases數據驅動型應用示例Discussion問題與討論通過用戶歷史訪問行為, 給用戶打上用戶偏好標簽, 標簽顆粒度較粗且更新不 即時用戶數字 內容211、用戶個性化需求 如何滿足:無法得 知感興趣的地域性 實時事件?也不知 道去哪找合適的數 字內容(比如流量 消耗少、報道及分 析權威的新聞)2、用戶與數字內容 如何適配:向哪些 用戶推廣即時發生

19、 的熱點數字內容?現行做法做法及效果快速識別捕獲熱點內容:按地 域分為國際國內、省內、地市內容源多元化:自有基地、VGOP、定向爬?。ㄈ鐕H/國 內/地市的主流站點及APP)、 新建內容資源平臺業務痛點針對即時發生的熱點事件, 依據已沉淀的用戶偏好標簽 ,粗顆粒度選取目標用戶, 進行短信push新聞鏈接四種方案綜合運用:1) 基于數字內容分類標簽和 用戶相似度的協同算法模型;2)集團公司標簽;3) 本地流量標簽;4)基于業務經驗的用戶口徑界定AI in Telco Use Case I數字內容智慧推薦324用戶交互(用戶點擊 營銷短信中網址)【精彩內容推薦】天后王菲隔空示愛神 曲出爐啦!快來點

20、擊 http:/139/5fhxxj 免費欣賞神曲愛不可及。 中國移動含WAP鏈接的短信提示5時機匹配時間:大片上映前行為:曾在疑似影院基站區 域內逗留90分鐘以上的客戶策略匹配渠道:短信PUSH用戶:喜好看電影且非電影院區域 內常駐用戶和影院工作人員頻次:每用戶每月1次基于場景的數字內容運營16營銷評估評估指標:點擊比(點擊用 戶量占接觸營銷短信用戶 量之比),點擊量(點擊用 戶量),點擊帶來的流量進一步優化營銷策略推送適配(短信PUSH)場景描述:喜好看電影曾 在疑似影院基站區域內逗 留90分鐘以上的客戶,在 大片上映前,推送客戶關 注的電影相關內容營銷短 信。場景: 基用戶位置 及偏好的

21、數 字內容營銷AI in Telco Use Case I數字內容智慧推薦l 過往月份是否有超套行為l 上月指標簡單組合等于用戶次月消費特征l 業務經驗l 工單流程l 套餐飽和度l 全量指標對比,確保找到影響超套行l 上月指標預測用戶次月消費特征l 業務經驗+機器學習l 實時評估 為的關鍵因素00.20.4入網時長用戶重點APP流量GPRS連接次數熱點應用使用個數最不重要流量超套關鍵影響因素分析自動給出各檔套餐/流量加油包篩選規則建議升檔套餐 名稱40元手機上 網流量包50元手機上 網流量包100元手機上 網流量包商丘3213人312人42人10人鄭州11435人927人249人106人安陽3

22、906人226人52人15人新鄉4343人308人57人23人許昌2616人191人41人11人2583人299人39人24人自動給出各檔套餐/流量加油包目標用戶建議 模式傳統 模式AI in Telco Use Case II流量套餐/流量加油包智慧推薦現狀:根據套餐飽和度及過往月份是否有超套行為進行推薦,可推薦的用戶數少、準確率低。目標:基于全量指標對比和先進的特征選擇、決策樹等算法,找到影響超套行為的關鍵因素。即通過數據驅動,找出各檔套餐/ 流量加油包的目標用戶篩選規則,不再完全依靠業務經驗。指標選取用戶消費特征工具方法效果評估1推送適配(短信PUSH)324用戶訂購流量套餐尊敬的用戶您

23、好,您當 前使用流浪網頁消耗流 量過多,您本月剩余可 用流量不足,建議您訂 購X元流量套餐,現在 訂購還可參加“達量1G即贈1G”促銷短信提示5時機匹配時間:非工作時間行為:用戶通過手機終端 瀏覽器瀏覽網頁且該網頁 頁面產生流量超過用戶剩 余可用流量30%策略匹配渠道:短信PUSH月初生成流量套餐 潛在升檔用戶明細6營銷評估活動參與率;流量套餐訂 購率;模型預測準確率進一步優化營銷策略場景描述:月初個性 化實時推薦流量套餐 平臺已得到一批次月 潛在各檔流量套餐升 檔用戶明細。注:非工作時間:周一至周五(18點20點)、周六、周日(8點20點)場 景 : 基于模型+時機觸發AI in Telco

24、 Use Case II流量套餐/流量加油包智慧推薦背景說明終端引領一直是運營商很重要的用戶發展手段,終端合約可以幫助運營商吸引客戶、留住客戶。因 此通過增加對終端合約的用戶信用等級評估模型和潛在終端合約用戶精確識別模型,可以幫助運營商找到 正確的終端合約潛在訂購和續約用戶,并向其進行準實時的PUSH營銷,以此完成終端合約推薦,增加用 戶粘性,提升客戶保有和客戶價值。應用目標結合標簽體系的基礎上,分析用戶互聯網行為,預測用戶換機行為,挖掘終端類合約計劃潛在訂購和續 約用戶,并向其進行準精準營銷,增加用戶粘性,提升客戶保有和客戶價值。AI in Telco Use Case III終端合約智能推

25、薦基礎數據指標篩選預測識別模型匹配模型結果輸出客戶屬性。 入網時長。 客戶價值。近三個月用戶撥打10010咨詢合約信 息的次數。用戶緊密通話圈終 端合約的個數。產品品牌。近三個月套餐使用 情況。近三個月查詢終端 情況。近三個月用戶使用 搜索引擎搜索終端 相關的次數決策樹、邏輯回歸訓練潛在終端合約用戶識別模型模型預測結果時間序列、 Logistic回歸終端品牌價位匹配模型根據潛在更換 終端的用戶群 顯示用戶偏好 的品牌及價位提取樣本數據近三 個月的行為數據(基礎信息、上網 行為、通話行為、 資費行為)通過數據清洗、數 據探索,結合指標 的相關性和重要性 進行指標篩選使用樣本數據進行 終端合約識別

26、模型 的訓練結合預測模型的用 戶群進行終端品牌 及價位的偏好匹配AI in Telco Use Case III終端合約智能推薦分析思路:本次終端合約用戶挖掘模型是基于全網的訂購合約前的上網行為、通話行為等原子屬性的分析終端合約用戶 的關鍵特征,結合關鍵特征預測潛在更換終端的用戶群。再根據終端合約包含的原子屬性,將潛在更換終端用戶進行終端匹配,為用戶匹配用戶可能偏好的終端品牌。深度學習應用基于Aura平臺,我們實現視頻圖像大數據的智能分析和人臉識別,能快速發現、定位和識別特定目標,并進 一步與位置運營和智慧交通等大數據應用結合,可廣泛應用于安防監控、刑偵和反恐等領域;像采 集、 增強、 解 碼

27、、人臉識別車輛識別人物動作識別動作軌跡分析視頻結構化公安、司法 刑偵破案 反恐維穩重點場所控制 電子證件管理交通、城市車輛違章 套牌車輛識別人流、車流統計政企 門禁 考勤設施運營管理優化應用系統架構IPC視頻流分發 NVR/NN采集&摘要 調度器NNRTSPRTSPIPCIPC采集、摘要 DN采集、摘要 DN采集、摘要 DN實時畫面Mysql NNHDFS DNTomcat NN實況查詢點播結構化處理RTSP運動檢測人臉識別 車輛識別 電子圍欄 OCR行業應用智慧城市 智慧交通 智慧監獄 智慧安防Aura實時畫面RTSP場景應用身份數據人流數據消費行為數據網絡電子足跡客戶定位智能推送習慣數據熱門門店數據位置數據優化布局,運營設施使用情況數據擁堵數據人流數據個體行為數據位置數據交管數據智能交通人/車流疏導車流數據車型數據車輛數據駕駛員數據實時預警智能服務推送“大腦”訪客系統行政管理員工出入記錄姓名工號部門生日進門時間出門時間張三16789CIT-XXX-XXX1987-XX-XX2016/9/12 8:3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論