基于tipdm數據挖掘建模平臺實現餐飲企業綜合分析_第1頁
基于tipdm數據挖掘建模平臺實現餐飲企業綜合分析_第2頁
基于tipdm數據挖掘建模平臺實現餐飲企業綜合分析_第3頁
基于tipdm數據挖掘建模平臺實現餐飲企業綜合分析_第4頁
基于tipdm數據挖掘建模平臺實現餐飲企業綜合分析_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于TipDM數據挖掘建模平臺實現餐飲企業綜合分析1平臺簡介目錄背景2快速構建餐飲企業綜合分析工程3小結4本案例將介紹使用一種工具——TipDM數據挖掘建模平臺,通過該平臺實現餐飲企業綜合分析。相較于傳統Python解析器,TipDM數據挖掘建模平臺具有流程化、去編程化等特點,滿足不懂編程的用戶使用數據分析技術的需求。案例背景TipDM與Python1平臺簡介目錄背景2快速構建餐飲企業綜合分析工程3小結4TipDM數據挖掘建模平臺是由廣東泰迪智能科技股份有限公司自主研發、基于Python引擎、用于數據分析的開源平臺。平臺提供數量豐富的數據分析組件,用戶可在沒有編程基礎的情況下,通過拖曳的方式進行操作,將數據輸入輸出、數據預處理、挖掘建模、模型評估等環節通過流程化的方式進行連接,幫助用戶快速建立數據分析工程,提升數據處理的效能。TipDM數據挖掘建模平臺平臺的界面平臺的界面如下圖所示。組件:將建模過程涉及的輸入/輸出、數據探索及預處理、建模、模型評估等算法分別進行封裝,每一個封裝好的算法模塊稱為組件。工程:為實現某一數據分析目標,將各組件通過流程化的方式進行連接,整個數據分析流程稱為一個工程。模板:分享建好的數據分析工程,其他用戶可以直接創建并運行,這樣的工程稱之為模板。概念平臺算法基于Python引擎,用于數據分析。Python是目前最為流行的用于數據分析的語言之一,高度契合行業需求。平臺已對所有用戶實現開源,用戶可在本地部署平臺,或對平臺進行二次開發,滿足個人使用需求。用戶可在沒有Python編程基礎的情況下,使用直觀的拖曳式圖形界面構建數據分析流程,無須編程。特點提供公開可用的數據分析示例工程,一鍵創建,快速運行。支持挖掘流程每個節點的結果在線預覽。提供十大類數十種算法組件,包括數據預處理、統計分析、分類、聚類、關聯、推薦等常用數據分析算法,支持查看算法組件源代碼(需本地化部署)。同時提供Python腳本與SQL腳本,快速粘貼代碼即可運行。提供算法組件自定義功能(需本地化部署),用戶可將個人本地編寫的代碼配置到平臺中,成為算法組件。特點下面將對平臺【首頁】【數據源】【工程】和【系統組件】4個模塊進行介紹,并對平臺的本地化部署方式進行介紹。平臺簡介登錄平臺后,用戶即可看到【首頁】模塊系統提供的示例工程(模板)。首頁【模板】模塊主要用于常用數據分析與建模案例的快速創建和展示。通過【模板】模塊,用戶可以創建一個無須導入數據及配置參數就能夠快速運行的工程。同時,用戶可以將自己搭建的數據分析工程生成為模板,顯示在【首頁】模塊,供其他用戶一鍵創建。首頁【數據源】模塊主要用于數據分析工程的數據導入與管理,根據情況用戶可選擇【CSV文件】或者【SQL數據庫】。【CSV文件】支持從本地導入CSV類型的數據。數據源【SQL數據庫】支持從DB2、SQLServer、MySQL、Oracle、PostgreSQL等關系型數據庫導入數據。數據源數據上傳成功后,用戶可以使用數據分享功能,將搭建工程涉及到的數據分享給其他用戶。數據源其他用戶可在【共享數據源】選項卡內查看到分享給自己的數據,并使用該數據進行數據分析。數據源【工程】模塊主要用于數據分析流程化的創建與管理,通過【工程】模塊,用戶可以創建空白工程,進行數據分析工程的配置,將數據輸入輸出、數據預處理、挖掘建模、模型評估等環節通過流程化的方式進行連接,達到數據分析的目的。工程【系統組件】模塊主要用于數據分析常用算法組件的管理。組件包括輸入/輸出、腳本、數據預處理、統計分析、分類、回歸、聚類、時序模型、模型評估和模型預測,共十大類。系統組件【輸入/輸出】類提供配置數據分析工程的輸入和輸出組件,包括輸入源、輸出源?!灸_本】類提供一個代碼編輯框,用戶可以在代碼編輯框中粘貼已經寫好的程序代碼,直接運行,無須再額外配置成組件,包括Python腳本、SQL腳本?!緮祿A處理】類提供對數據進行清洗的組件,包括特征構造、表堆疊、記錄選擇、表連接、新增序列、數據集劃分、類型轉換、缺失值處理、記錄去重、異常值處理、數據標準化、數學類函數、排序、分組聚合、修改列名。系統組件【統計分析】類提供對數據整體情況進行統計的常用組件,包括數據探索、純隨機性檢驗、相關性分析、單樣本T檢驗、正態性檢驗、雙樣本T檢驗、主成分分析、頻數統計、全表統計、平穩性檢驗、因子分析、卡方檢驗。【分類】類提供常用的分類算法組件,包括CART分類樹、ID3分類樹、最近鄰分類、樸素貝葉斯、支持向量機、邏輯回歸、多層感知神經網絡?!净貧w】類提供常用的回歸算法組件,包括CART回歸樹、線性回歸、支持向量回歸、最近鄰回歸、LASSO回歸。系統組件【聚類】類提供常用的聚類算法組件,包括層次聚類、DBSCAN密度聚類、K-Means聚類?!緯r間模型】類提供常用的時間序列算法組件,包括ARIMA、GM(1,1)、差分?!灸P驮u估】類提供對通過分類算法或回歸算法訓練得到的模型進行評價的組件。【模型預測】類提供對通過分類算法或回歸算法訓練得到的模型進行預測的組系統組件通過開源TipDM數據挖掘建模平臺官網(),進入Github或碼云開源網站,同步平臺程序代碼到本地,按照說明文檔進行配置部署。平臺簡介平臺官網還提供了詳細的幫助資料,包含【操作文檔】【常見問題】【操作視頻】選項卡,用戶可以根據這些資料,輕松入門平臺的使用。TipDM數據挖掘建模平臺的本地化部署平臺官網提供了數量豐富的不同行業的解決方案,主要介紹使用平臺搭建數據分析工程的不同行業的案例,包含【電子商務】【智能設備】【金融保險】類等,用戶可以根據步驟提示,動手搭建數據分析工程。TipDM數據挖掘建模平臺的本地化部署1平臺簡介目錄背景2快速構建餐飲企業綜合分析工程3小結4在TipDM數據挖掘建模平臺上配置餐飲企業綜合分析案例的總體流程,主要包括以下4個步驟。導入餐飲企業綜合分析的數據到TipDM數據挖掘建模平臺。對數據進行日期提取、統計每日用餐人數與營業額和繪制用餐人數折線圖。對數據進行記錄選擇操作。對數據構建RFM關鍵特征,構建K-Means模型對餐飲客戶進行客戶分群。總體流程總體流程圖餐飲企業綜合分析建模工程配置總流程最終流程圖最終流程如圖所示本章的數據是CSV文件,使用TipDM數據挖掘建模平臺導入該數據,步驟如下。單擊【數據源】模塊,在【新建數據源】下拉項中選擇【CSV文件】。獲取數據單擊選擇文件,選擇案例的數據,在【新建目標表名】框中填入“meal_order_info”,【預覽設置】項選擇【分頁顯示】,然后單擊【下一步】按鈕。獲取數據在【預覽數據】框中,觀察每個字段的類型及精度,然后單擊【下一步】按鈕。將【use_start_time】字段和【lock_time】字段的類型選擇為【字符】,單擊【確定】按鈕,即可上傳。獲取數據數據上傳完成后,新建一個命名為【餐飲企業綜合分析】的空白工程,配置一個【輸入源】組件,步驟如下。在【工程】模塊左下方的【組件】欄中,找到【系統組件】類下的【輸入/輸出】類。拖曳【輸入/輸出】類中的【輸入源】組件至工程畫布中。獲取數據單擊畫布中的【輸入源】組件,然后單擊工程畫布右側【字段屬性】欄中的【數據表】框,輸入“meal_order_info”,在彈出的下拉框中選擇【meal_order_info】。獲取數據右鍵單擊【輸入源】組件,選擇【查看數據】。由圖可得,該數據共有945條記錄。獲取數據日期提取拖曳【數據預處理】類中的【日期提取】組件至工程畫布中,并與【選擇訂單狀態為1的數據】組件相連接。單擊畫布中的【日期提取】組件,在工程畫布右側【字段屬性】欄中,單擊【日期提取標簽】項下的圖標,選擇“use_start_time”字段。探索性分析右鍵單擊【日期提取】組件,選擇【運行該節點】。運行完成后,右鍵單擊【日期提取】組件,選擇【查看數據】。探索性分析統計每日用餐人數與營業額拖曳【數據預處理】類中的【分組聚合】組件至工程畫布中,并與【日期提取】組件相連接。單擊畫布中的【分組聚合】組件,在工程畫布右側【字段屬性】欄中,單擊【特征】項下的圖標,勾選“number_consumers”,“accounts_payable”字段。單擊【分組組件】項下的圖標,勾選“day”字段。探索性分析單擊工程畫布右下方的【參數設置】欄,在【聚合方法】項中選擇【sum】,【新列名】項中輸入“用餐時間,人數,銷量”。探索性分析右鍵單擊【分組聚合】組件,選擇【運行該節點】。運行完成后,右鍵單擊【缺失值處理】組件,選擇【查看數據】。數據已對每日用餐人數與營業額進行統計,其中字段“人數”為每日用餐人數,字段“銷量”為每日營業額。右鍵單擊【分組聚合】組件,選擇【重命名】項輸入“就餐日期分組聚合”進行組件名稱修改。探索性分析繪制用餐人數折線圖拖曳【繪圖】類中的【折線圖】組件至工程畫布中,并與【就餐日期分組聚合】組件相連接。單擊【繪制數據】項下的圖標,勾選“人數字段”字段,單擊【繪制標簽】項下的圖標,勾選“用餐時間”字段。探索性分析運行【折線圖】組件。運行完成后,右鍵單擊【折線圖】組件,選擇【查看報告】。探索性分析運行【折線圖】組件。運行完成后,右鍵單擊【折線圖】組件,選擇【查看報告】。右鍵單擊【折線圖】組件,選擇【重命名】項輸入“每日就餐人數折線圖”進行組件名稱修改。探索性分析訂單表中訂單狀態為1的記錄為完成訂單的記錄,所以本章數據預處理為選取訂單狀態為1的數據,步驟如下。拖曳【數據預處理】類中的【記錄選擇】組件至工程畫布中,并與【輸入源】組件相連接。單擊【特征】項下的圖標,勾選全部字段。數據預處理單擊工程畫布右下方的【參數設置】欄,然后單擊【條件】項下方的

圖標,添加1個篩選條件。單擊【條件】項下方的

圖標。在【條件】項第2列中,篩選條件的字段選擇【order_status】;在【條件】項第3列中,篩選條件選擇【=】;在【條件】項第4列中,篩選條件填入【1】。數據預處理運行【記錄選擇】組件。右鍵單擊【記錄選擇】組件,選擇【查看數據】。右鍵單擊【記錄選擇】組件,選擇【重命名】項輸入“選擇訂單狀態為1的數據”進行組件名稱修改。數據預處理本章利用RFM模型,構建餐飲企業客戶價值分析的關鍵特征,步驟如下。拖曳【數據預處理】類中的【表連接】組件至工程畫布中,并分別于與【表連接】組件、【構造R特征】組件相連接。單擊【左表特征】項下的圖標,勾選“emp_id”,“f”,“m”字段。單擊【右表特征】項下的圖標,勾選“emp_id”,“r”字段。分別單擊【左表主鍵】、【右主鍵】項下的圖標,選擇“emp_id”字段。構建模型構建關鍵特征單擊工程畫布右下方的【參數設置】欄,【連接方法】選擇【內連接】。構建模型運行【表連接】組件,運行完成后,右鍵單擊【表連接】組件,選擇【查看數據】查看組件數據。由圖所示,字段“r”“f”“m”為餐飲企業客戶價值分析的關鍵特征。構建模型特征構造完成后,使用K-Means聚類算法對餐飲客戶數據進行客戶分群,聚成3類,步驟如下。拖曳【聚類】類中的【K-Means】組件至工程畫布中,并與【數據標準化】組件相連接。單擊【特征】項下的

圖標,勾選全部字段。構建模型構建K-Means模型單擊工程畫布右下方的【基礎參數】欄,在【聚類數】項中填入【3】,【最大迭代次數】項中填入【100】。構建模型運行【K-Means】組件。右鍵單擊【K-Means】組件,選擇【查看數據】。構建模型運行【K-Means】組件。右鍵單擊【K-Means】組件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論