




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
電子商務數據分析(慕課版)項目二
采集與處理電子商務數據
任務一采集電子商務數據任務二處理采集的電子商務數據同步實訓活動一初識電子商務數據采集3橋梁上的壓力傳感器數據采集簡單來說就是收集和獲取數據的過程。電子商務數據的采集過程更加方便,只需通過各種渠道獲得相關的數據,然后將其整理到Excel、PowerBI等分析工具中即可。活動一初識電子商務數據采集4(1)電子商務數據采集的原則采集環節得到的數據能否為分析環節所用,關鍵在于采集數據時是否遵循以下原則。精確性及時性合法性(2)電子商務數據采集的渠道電子商務數據的采集渠道較多,為了便于學習,可以按照不同的數據來劃分。0102內部數據的采集渠道外部數據的采集渠道國家統計局、艾瑞咨詢、生意參謀活動二明確電子商務數據采集的方法與工具5(1)電子商務數據采集的方法對于內部數據而言,采集時只需從數據庫中復制或調用到數據分析工具中就可以使用;對于外部實地調查的數據而言,如果是紙質問卷調查表,則需要通過掃描或手工錄入的方式獲取數據,如果是電子問卷調查表,則可以復制其中的數據到分析工具中;對于外部網絡數據,主要的獲取方法則是復制、下載和爬取3種。通過下載的方式采集數據招聘信息頁面活動二明確電子商務數據采集的方法與工具6(2)電子商務數據采集的工具利用生意參謀采集數據利用京東商智采集數據利用店偵探采集數據利用八爪魚采集器采集數據利用火車采集器采集數據活動三手動采集電子商務數據7(2)企業與企業之間的電子商務手動采集電子商務數據是指通過復制、下載等方式獲取需要的數據。查看店鋪商品的類別分布情況導出數據活動三手動采集電子商務數據8(2)企業與企業之間的電子商務下載數據查看采集的數據活動四使用工具采集電子商務數據9在八爪魚采集器中對采集任務進行了適當設置,然后開始采集所需的數據。(1)采集設置設置并保存采集任務選擇采集方式活動四使用工具采集電子商務數據10開始自動識別網頁數據顯示采集的數據效果取消自動識別并獲取登錄信息活動四使用工具采集電子商務數據11(2)采集數據采用本地采集模式保存設置并開始采集停止采集正在采集數據活動四使用工具采集電子商務數據12去重數據導出數據設置保存名稱和位置設置導出類型任務一采集電子商務數據任務二處理采集的電子商務數據同步實訓活動一認識數據分類與處理14數據分類與處理在電子商務數據分析中起著承上啟下的作用,它可以提升并優化采集到的數據的價值,可以為數據分析提供更加精準的數據信息,可以簡化數據分析的工作內容。54321客觀性原則針對性原則便捷性原則完整性原則嚴謹性原則活動二分類統計數據15(1)分類匯總利用Excel的分類匯總功能匯總上周不同流量來源的支付總額,其具體操作如下。排列數據設置分類匯總數據分類統計是根據統計目的將采集到的原始數據進行統計歸類。查看匯總結果活動二分類統計數據16(2)合并計算使用合并計算功能按不同流量來源統計兩周各個指標的數據結果,其具體操作如下。添加數據區域引用數據區域設置標簽位置完成合并計算活動二分類統計數據17(3)函數的應用函數是Excel預先定義的特定計算公式,它通過使用指定格式的參數來完成數據計算。函數與公式都必須以等號“=”開始,后面緊跟函數名以及對應的用小括號包括的參數。函數與公式的結構在編輯欄中輸入函數選擇函數活動二分類統計數據18利用求和函數、條件求和函數、求平均值函數、計數函數、條件計數函數、求最大值函數和求最小值函數,來完成對店鋪數據的統計,其具體操作如下。統計交易總額選擇函數設置函數參數活動二分類統計數據19統計訂單交易數量為1件的交易總額統計平均交易額設置函數參數選擇參數統計訂單交易數量活動二分類統計數據20統計交易金額大于100元的訂單數統計訂單最小交易金額統計訂單最大交易金額活動二分類統計數據21(4)數據透視表的應用數據透視表可以對數據進行匯總、篩選和重組,快速生成簡潔清晰的匯總報表,并能隨時調整報表內容,可以幫助我們更好地理解和分析數據。其具體操作如下。創建數據透視表全年不同類目商品的銷售額統計活動二分類統計數據22篩選數據各類目上半年的銷量統計活動三清洗數據23定位空值(1)處理缺失值當采集的數據中存在缺失值時,應根據實際情況選擇不同的方式進行處理。修補缺失值刪除缺失值修補缺失的數據,其具體操作如下。補全空值活動三清洗數據24(2)修復錯誤值Excel會顯示錯誤信息,以提醒用戶及時修復錯誤值,通過這些信息就能知道錯誤產生的原因,以便解決錯誤。Excel常見錯誤信息匯總活動三清洗數據25輸入公式修復錯誤值活動三清洗數據26設置日期格式(3)統一數據格式統一數據格式可以有效提高所采集數據的質量。在Excel中,可以利用數據類型設置和查找與替換功能來統一數據格式,其具體操作如下。查找并替換數據1查找并替換數據2活動三清洗數據27(4)修復邏輯錯誤數據的邏輯錯誤主要是指違反了邏輯規律產生的錯誤,這需要數據分析人員具備認真細致的工作態度和可靠的專業知識,才能更容易地找到邏輯問題。總體而言,數據出現的邏輯錯誤主要有3種常見情況。01PRAT02PRAT03PRAT數據不合理數據自相矛盾數據不符合規則活動三清洗數據28設置規則設置標記格式標記出的邏輯錯誤數據以店鋪流量數據為例,通過標記店鋪來訪數據中的店內跳轉人數和跳出本店人數給小艾介紹條件格式功能的示意方法,其具體操作如下:活動三清洗數據29(5)清洗重復數據當采集的數據量較大時,可以利用Excel的刪除重復值功能,去掉數據中可能存在的重復記錄,其具體操作如下。設置檢查的字段檢查并刪除重復數據活動四轉化數據30(1)轉換數據行與列數據行列的轉換在Excel中稱為“轉置”,指的是將原來各條數據記錄的首列內容轉置為數據的各個項目,將原來的各個項目轉置為數據記錄的首列內容,從而實現將當前各列內容轉置為橫向的各條數據記錄。在Excel中可以直接使用選擇性粘貼功能來完成轉換,其具體操作如下。檢查并刪除重復數據數據需要進行一定的轉化,如行列數據互換、數據內容提取、數據分列顯示、數據重新排列等,這些情況同樣可以在Excel中加以解決。活動四轉化數據31刪除原有數據轉換行與列后的效果活動四轉化數據32(2)提取數據內容通過數據提取操作,可以將采集到的數據中有用的部分提取出來。在Excel中可以使用LEFT函數、MID函數和RIGHT函數來實現數據提取工作,其具體操作如下。完善數據提取數據活動四轉化數據33(3)分列數據在Excel中可以將指定的列按某種符號或特定的寬度進行分隔,將其分成若干列,這需要利用Excel的“分列”功能,并根據“文本分列向導”對話框的提示處理。現將“搜索值屬性”列分為“搜索指”列和“屬性”列,其具體操作如下。設置分列方式分列后的效果指定分列位置活動四轉化數據34(4)排列數據為了更好地分析采集到的數據,有時需要對數據重新排列,如查看銷量較好的商品數據,查看投訴較多的客服人員數據等。Excel提供有多種排列數據的方法,包括快速排序、關鍵字排序、自定義排序等,以便滿足實際工作中數據排列的需求。關鍵字排序的設置界面添加排序依據活動四轉化數據35設置排序主要關鍵字排序后的效果設置排序次要關鍵字活動五計算數據36(1)常規計算常規計算包括公式計算與函數計算,大多數的電子商務數據均可通過常規計算完成。Excel的公式結構如果公式中含有單元格引用,則移動、復制公式時會涉及單元格引用的問題。混合引用絕對引用相對引用活動五計算數據37將幾個門店上半年的銷售與投入數據采集下來,使用公式計算各門店上半年的銷售總額與投入產出比,其具體操作如下。輸入公式計算銷售總額活動五計算數據38輸入公式計算投入產出比活動五計算數據39(2)日期計算日期計算在電子商務數據處理中也較為常見,借助Excel中的日期函數解決該問題。DAYS函數DATEDIF函數TODAY函數在Excel中計算這些客戶下單的間隔天數和月數,其具體操作如下。輸入函數計算間隔天數輸入函數計算間隔月數活動五計算數據40(3)加權計算加權計算需要在數據的基礎上與權重(即系數)相乘,這也是電子商務數據計算中常見的操作。在Excel中可以借助SUMPRODUCT函數來進行加權計算,利用SUMPRODUCT函數對各渠道進行評分計算,其具體操作如下。輸入函數計算綜合得分活動五計算數據41轉化為絕對引用填充函數任務一采集電子商務數據任務二處理采集的電子商務數據同步實訓同步實訓一
采集男裝休閑褲數據43小宇想在京東商城開設一家專賣男裝休閑褲的店鋪,為更好地了解京東商城銷量較好的休閑褲及其價格,他準備使用八爪魚采集器采集京東商城上的一些相關商品數據。實訓描述同步實訓一
采集男裝休閑褲數據44操作指南復制網址生成采集設置保存并開始采集同步實訓一
采集男裝休閑褲數據45停止采集導出數據保存數據文件選擇導出類型同步實訓一采集男裝休閑褲數據46實訓評價同步實訓二
處理采集到的數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學語文二年級上冊班級管理計劃
- 醫院客服培訓教程課件
- 影視表演專業實習生的演出實踐總結
- 金融行業信息安全教育的心得體會
- 六年級項目式學習復習計劃
- 初中生物實驗教學創新計劃
- 2025年游藝用品及室內游藝器材項目安全調研評估報告
- 家具生產工藝流程中的技術革新
- 食品安全控制與保障措施
- 環保行業的18個可持續發展策略心得體會
- 2025年福建省福州市中考數學二檢試卷
- 藥房駐店藥師合同協議
- 2025年高考政治搶押秘籍(江蘇專用)時政熱點03發展民營經濟-(江蘇專用)(學生版+解析)
- 2025屆四川省成都市高三畢業班第三次診斷性考試英語試卷讀后續寫-笛子失而復得的故事+講義
- 安川機器人手動操縱及編程基礎
- 湖北省武漢市2025屆高中畢業生四月調研考試政治試題及答案(武漢四調)
- 行政案例分析-終結性考核-國開(SC)-參考資料
- 2024年四川省綿陽市中考英語試題卷(標準含答案)
- 2024年重慶高考化學試題卷(含答案解析)
- MOOC 電力電子學-華中科技大學 中國大學慕課答案
- 千斤頂詳細設計
評論
0/150
提交評論