人口屬性畫像操作實例_第1頁
人口屬性畫像操作實例_第2頁
人口屬性畫像操作實例_第3頁
人口屬性畫像操作實例_第4頁
人口屬性畫像操作實例_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

客戶畫像分析人口屬性畫像操作實例確定目標維度01數據預處理02標簽建模03數據可視化04學習目標熟悉并掌握人口屬性畫像的制作流程數據源數據來源:數據集來源于阿里巴巴天池,數據來自淘寶和天貓上購買嬰兒用戶,本數據集包括2個excel文件(sample)sam_tianchi_mum_baby圖1數據源(sample)sam_tianchi_mum_baby_trade_history確定目標維度項目分析目標:根據嬰兒年齡、性別進行客戶畫像項目維度:嬰兒年齡、性別數據預處理重命名表名:表1(sample)sam_tianchi_mum_baby_trade_history.csv)

命名為:購買商品信息表表2((sample)sam_tianchi_mum_baby.csv)命名為:嬰兒信息表表數據預處理缺失值處理:表1購買商品中商品屬性列存在缺失值,但不屬于研究范圍,故可忽略。圖2缺失值處理數據預處理異常數據處理:將表2中對gender列進行篩選發現標識為2的數據,因為數據標識中,0標注為女性,1標注為男性,因此標識為2的數據為異常數據,執行刪除操作;同時刪除表2中出生日期為19840616的數據。圖3異常數據處理數據預處理一致化處理:將表1和表2中的日期設置成規范的日期格式;圖4一致化處理數據預處理將“嬰兒信息表”中的gender的0,1統一更換為女,男,方便統計圖5將0,1更換為女,男標簽建模由于性別、年齡兩個字段在表中均有明確顯示,且無缺失數據,故無需建立算法模型,只需做統計分析即可。標簽建模1、數據合并處理:由于需要了解產品各個年齡段銷量情況,通過購買日期和出生日期可以計算出嬰兒的年齡,為此嬰兒信息表表中在gender字段后面增加一個buy_date字段,用vlookup函數將購買商品信息表中的day字段匹配到該列,生成購買‘buy_date’如下.圖6數據合并處理標簽建模2、將“嬰兒信息表”中的age通過DATEDif函數求出。圖7求嬰兒的age數據預處理3、將“嬰兒信息表”中的age按照(0_1),(2_4),(5_7),(8歲以上)的年齡段對該表中的嬰兒年齡進行分段處理,得到fenzu字段。圖8年齡分段處理標簽建模4.將“嬰兒信息表”中的user_id進行統計,得出總人數。圖9總人數標簽建模5.將“嬰兒信息表”中的gender進行統計,得出男、女的各自人數及所占比例。圖10男女的人數及所占比例標簽建模6、將“嬰兒信息表”中的fenzu字段進行統計,得到各組的人數及相應比例。圖11各年齡段的人數及比例數據可視化利用柱狀圖和條形圖,對性別屬性及年齡屬性進行畫像分析。圖12性別、年齡畫像畫像分析根據可視化的結果,可知網站上嬰兒性別分布較為均勻,女寶寶用戶量比男寶寶用戶量要稍微多點。嬰兒在年齡段0-1歲之間的用戶為平臺的主要購買

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論