




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
項目案例庫需求說明序號具體技術(shù)(參數(shù))要求1一、手機評論數(shù)據(jù)采集與分析【Requests】1、本案例通過爬蟲技術(shù)采集電商網(wǎng)站的手機評論數(shù)據(jù),基于爬取后的數(shù)據(jù)進行處理和可視化分析,了解用戶對該商品的主要評價和用戶的喜好。通過學習本案例,可掌握使用爬蟲技術(shù)采集數(shù)據(jù)的方法,熟悉數(shù)據(jù)類型轉(zhuǎn)換、文本分詞等數(shù)據(jù)處理方法,能夠挖掘數(shù)據(jù)中的潛在價值,并基于處理后的數(shù)據(jù)繪制可視化圖形進行分析。
2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于8學時,總計不少于12學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥3份、案例視頻數(shù)量≥17個、案例PPT數(shù)量≥1份、代碼數(shù)量≥3份、數(shù)據(jù)數(shù)量≥3份。4、案例內(nèi)容:包括但不限于背景與目標;數(shù)據(jù)采集流程介紹;獲取評論數(shù)據(jù)地URL;抓取第一個json文件;拆解網(wǎng)址及爬取函數(shù)封裝;將數(shù)據(jù)轉(zhuǎn)為字典格式;將數(shù)據(jù)轉(zhuǎn)為數(shù)據(jù)框并保存;翻頁爬取及數(shù)據(jù)保存;數(shù)據(jù)預(yù)處理介紹;數(shù)據(jù)讀取及類型轉(zhuǎn)換;對評論文本內(nèi)容分詞;去除停用詞及統(tǒng)計詞頻;繪制詞云圖及函數(shù)封裝;可視化分析主題介紹;好評中評及差評詞云圖繪制;其它可視化分析;小結(jié)。二、基于數(shù)據(jù)挖掘的上市公司高送轉(zhuǎn)預(yù)測【Lasso回歸/隨機森林】1、本案例基于已有的相關(guān)數(shù)據(jù)進行分析處理,建立相應(yīng)的模型對上市公司實施高送轉(zhuǎn)的情況進行預(yù)測。通過學習本案例,可掌握使用pandas模塊進行數(shù)據(jù)轉(zhuǎn)換、缺失值填充和數(shù)據(jù)合并等數(shù)據(jù)處理的主要技能和應(yīng)用,掌握模型構(gòu)建和模型分析的主要方法。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于8學時,總計不少于12學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥6個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥1份。4、案例內(nèi)容:包括但不限于案例背景;基礎(chǔ)數(shù)據(jù)和年數(shù)據(jù)的預(yù)處理;日數(shù)據(jù)的預(yù)處理;數(shù)據(jù)合并;特征選擇;模型的搭建及預(yù)測。三、基于決策樹的地質(zhì)災(zāi)害易發(fā)性預(yù)測模型【決策樹】1、本案例以我國西北某地區(qū)為數(shù)據(jù)源,通過對獲取的數(shù)據(jù)進行預(yù)處理,分析目標地區(qū)的自然地理狀況,剖析地質(zhì)災(zāi)害的影響因子,并構(gòu)建相應(yīng)的算法模型進行地質(zhì)災(zāi)害易發(fā)性預(yù)測。通過學習本案例,可掌握對獲取的原始數(shù)據(jù)進行預(yù)處理、構(gòu)建預(yù)測模型和模型可視化的主要方法和技能。2、課時設(shè)置:理論教學不少于2學時,實踐教學不少于6學時,總計不少于8學時。3、案例資源:包含案例視頻、案例PPT、實訓(xùn)指導(dǎo)書、代碼、數(shù)據(jù)。4、案例內(nèi)容:包括但不限于案例背景與挖掘目標;影響因子的選取;嫡的概念;信息增益的概念;蘋果與信息嫡;計算易發(fā)性數(shù)據(jù)集的嫡;計算信息增益;重復(fù)計算信息增益并構(gòu)建決策樹;建立決策樹模型;決策樹可視化。四、教育平臺的線上課程智能推薦【Apriori】1、本案例根據(jù)用戶在某教育平臺的登錄和學習情況,通過不同維度分析平臺用戶、課程的情況,為平臺管理決策提供建議,為教育平臺的線上推薦服務(wù)提供策略。通過學習本案例,可掌握數(shù)據(jù)預(yù)處理的主要方法和技能,熟悉數(shù)據(jù)統(tǒng)計和可視化分析的相關(guān)實現(xiàn),掌握智能推薦算法。2、課時設(shè)置:理論教學不少于2學時,實踐教學不少于6學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥2份、案例視頻數(shù)量≥13個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥3份。4、案例內(nèi)容:包括但不限于背景與挖掘目標;缺失值處理;重復(fù)和異常處理;各省份登錄學習情況分析;用戶活躍分析;流失用戶與未流失用戶的課程學習數(shù)量分析;課程受歡迎程度分析;課程收費與學習進度的關(guān)系;分析結(jié)果建議;Apriori算法;關(guān)聯(lián)規(guī)則數(shù)據(jù)整理;關(guān)聯(lián)規(guī)則實現(xiàn);小結(jié)。五、基于遙感的露天礦區(qū)土地復(fù)墾效益評價【GDAL】1、本案例根據(jù)露天礦區(qū)的特點選取多個評價指標,除了代表自然因素外,在某種程度上表征人為開采活動對礦區(qū)地形條件和水熱條件的影響,以期用于礦區(qū)土地復(fù)墾效益的評價參考。通過學習本案例,可掌握柵格數(shù)據(jù)處理的主要方法和技能,熟悉區(qū)域裁剪和輻射定標的相關(guān)實現(xiàn),掌握指標計算方法。2、課時設(shè)置:理論教學不少于2學時,實踐教學不少于6學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥3份、案例視頻數(shù)量≥6個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥5份。4、案例內(nèi)容:包括但不限于案例背景與挖掘目標;區(qū)域裁剪;輻射定標;植被指數(shù)和地表溫度指標;土壤濕度和地形高程指標;效益評價。六、上市公司財務(wù)數(shù)據(jù)分析【決策樹/隨機森林】1、本案例基于已有的相關(guān)數(shù)據(jù)進行分析處理,篩選數(shù)據(jù)指標進行跟蹤分析和研究,建立模型進行造假公司預(yù)測。通過學習本案例,可掌握使用pandas模塊進行數(shù)據(jù)合并、缺失值處理和異常值處理等數(shù)據(jù)處理的主要技能和應(yīng)用,掌握模型構(gòu)建和模型分析的主要方法。2、課時設(shè)置:理論教學不少于2學時,實踐教學不少于6學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥6個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥3份。4、案例內(nèi)容:包括但不限于背景與目標;數(shù)據(jù)合并與缺失值處理;異常值處理;數(shù)據(jù)不平衡處理與造假指標分析;制造業(yè)造假公司預(yù)測;除制造業(yè)外的其他行業(yè)預(yù)測及小結(jié)。七、網(wǎng)絡(luò)問政平臺數(shù)據(jù)爬蟲【Requests】1、本案例以某問政平臺為例,爬取群眾的留言數(shù)據(jù)。通過學習本案例,可掌握requests進行網(wǎng)頁數(shù)據(jù)的HTML代碼獲取、多線程爬取數(shù)據(jù)的主要技能和方法。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于8學時,總計不少于12學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥2份、案例視頻數(shù)量≥7個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份。4、案例內(nèi)容:包括但不限于背景與目標;網(wǎng)址分析;留言id獲?。涣粞栽斍楂@??;留言詳情回復(fù)獲取;函數(shù)整合;多線程爬取。八、智慧政務(wù)下的問政數(shù)據(jù)分析【SVM/TF-IDF】1、本案例以某市問政部門積極響應(yīng)打造“智慧服務(wù)”平臺的愿景,根據(jù)群眾留言數(shù)據(jù),構(gòu)建關(guān)于問政留言記錄的一級標簽分類模型。通過學習本案例,可掌握pandas進行數(shù)據(jù)預(yù)處理、TF-IDF詞向量的主要方法和技能,同時掌握模型的構(gòu)建和評估的方法。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于4學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥16個、案例PPT數(shù)量≥1份、代碼數(shù)量≥2份、數(shù)據(jù)數(shù)量≥3份。4、案例內(nèi)容:包括但不限于背景與目標分析;樣本量分析;重復(fù)數(shù)據(jù)處理;文本預(yù)處理;分詞和去停用詞;詞云圖分詞;詞向量獲??;SVM文本分類;模型應(yīng)用;熱點數(shù)據(jù)預(yù)處理;熱點數(shù)據(jù)轉(zhuǎn)化;密度聚類簡介;熱點聚類;超參數(shù)選擇;熱度排序;小結(jié)。九、基于樸素貝葉斯的新聞文本數(shù)據(jù)分類【樸素貝葉斯】1、本案例通過分析新聞文本數(shù)據(jù),使用樸素貝葉斯模型實現(xiàn)新聞文本數(shù)據(jù)分類。通過學習本案例,可掌握對獲取的文本數(shù)據(jù)進行預(yù)處理、構(gòu)建預(yù)測模型和模型可視化的主要方法和技能。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于4學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥3份、案例視頻數(shù)量≥6個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥1份。4、案例內(nèi)容:包括但不限于實驗背景與原理;文本處理;詞頻統(tǒng)計;互信息計算與特征選取;樸素貝葉斯模型搭建;模型評估與小結(jié)。十、基于大數(shù)據(jù)技術(shù)的產(chǎn)品良率分析【相關(guān)性分析】1、本案例以工業(yè)產(chǎn)品?產(chǎn)的設(shè)備記錄數(shù)據(jù)進?分析,主要針對工業(yè)生產(chǎn)產(chǎn)品進行分析,著重分析不同因素與產(chǎn)品合格率的相關(guān)性,基于人員操作設(shè)備和產(chǎn)品的記錄從設(shè)備、人員和產(chǎn)品多方面對產(chǎn)品良率進行影響分析。通過學習本案例,可掌握常規(guī)的數(shù)據(jù)探索方法,能夠基于原始數(shù)據(jù)處理得到有價值的信息,掌握特征構(gòu)造的方法,掌握可視化圖標的繪制和分析。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于8學時,總計不少于12學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥18個、案例PPT數(shù)量≥1份、代碼數(shù)量≥4份、數(shù)據(jù)數(shù)量≥2份。4、案例內(nèi)容:包括但不限于背景與挖掘目標;設(shè)備與數(shù)據(jù)說明;數(shù)據(jù)加載和探索;瓶蓋松緊、顆粒數(shù)、檢測數(shù)特征構(gòu)造;日期特征構(gòu)造;瓶蓋顏色特征構(gòu)造;特征數(shù)據(jù)整理;良品率計算;故障頻數(shù)指標構(gòu)造;瓶蓋松緊、顆粒數(shù)、瓶蓋顏色、分揀數(shù)指標構(gòu)造;溫度指標構(gòu)造;檢測合格占比可視化分析;瓶蓋松緊、顆粒數(shù)、瓶蓋顏色、分揀數(shù)指標可視化分析;每天的設(shè)備合格數(shù)和良品率變化可視化分析;故障頻數(shù)與良品率關(guān)系、溫度變化可視化分析;相關(guān)性分析;故障分析;結(jié)果分析與小結(jié)。十一、游客目的地印象分析【LDA/TF-IDF】1、本案例主要是挖掘景區(qū)及酒店目的地游客滿意度的影響因素,進一步建設(shè)方案促進提高游客滿意度、最終提升目的地美譽度。通過學習本案例,可掌握對獲取的文本數(shù)據(jù)進行預(yù)處理、文本分析、文本相似度計算以及可視化的主要方法和技能。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于4學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥9個、案例PPT數(shù)量≥1份、代碼數(shù)量≥4份、數(shù)據(jù)數(shù)量≥2份。4、案例內(nèi)容:包括但不限于背景與挖掘目標;景區(qū)的印象分析;酒店的印象分析;景區(qū)的綜合評價;酒店的綜合評價;景區(qū)網(wǎng)評文本有效性分析;酒店網(wǎng)評文本有效性分析;景區(qū)特色分析;酒店的特色分析。十二、產(chǎn)線工作行為數(shù)據(jù)分析與可視化【指標計算/K-Means聚類】1、本案例以大數(shù)據(jù)挖掘建模平臺為實現(xiàn)工具,主要基于工作人員在生產(chǎn)線中的行為進行分析,包括對產(chǎn)品良率、工作人員的工作情況等,基于記錄到的人員、設(shè)備和產(chǎn)品記錄進行探索分析,通過可視化界面將產(chǎn)線工作行為直觀呈現(xiàn),以便及時發(fā)現(xiàn)問題,及時做出相應(yīng)的調(diào)整策略。通過學習本案例,可掌握常規(guī)的數(shù)據(jù)探索方法,能夠基于原始數(shù)據(jù)處理得到有價值信息,了解可視化分析的常規(guī)圖表。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于8學時,總計不少于12學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥9個、案例PPT數(shù)量≥1份、代碼數(shù)量≥4份、數(shù)據(jù)數(shù)量≥5份。4、案例內(nèi)容:包括但不限于背景與挖掘目標;設(shè)備和數(shù)據(jù)介紹;員工的基本信息探索;工作行為指標構(gòu)建;員工操作指標分析;員工合格率影響因素分析;員工工作效率分析;產(chǎn)線運作情況分析;總結(jié)。十三、基于深度學習FastText的問政留言分類【自然語言處理】1、本案例基于某平臺的群眾留言進行分析,通過構(gòu)建相關(guān)模型實現(xiàn)群眾留言的自動分類。通過學習本案例,可掌握數(shù)據(jù)可視化探索分析和詞向量處理的方法,掌握模型搭建和評估方法。2、課時設(shè)置:理論教學不少于8學時,實踐教學不少于8學時,總計不少于16學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥7份、案例視頻數(shù)量≥11個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥2份。4、案例內(nèi)容:包括但不限于背景與挖掘目標;數(shù)據(jù)讀取與探索;數(shù)據(jù)預(yù)處理;中文分詞與去停用詞;繪制各類別詞云圖;詞向量提?。粯颖緲撕炥D(zhuǎn)換;模型構(gòu)建;模型評估;訓(xùn)練過程可視化;小結(jié)。十四、基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的MNIST數(shù)字識別【計算機視覺】1、本案例通過對手寫數(shù)字圖像數(shù)據(jù)進行處理,搭建相關(guān)模型進行訓(xùn)練并正確識別圖像中的具體數(shù)字。通過學習本案例,可掌握模型搭建、模型訓(xùn)練及評估的主要方法和技能。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于4學時,總計不少于8學時。3、案例資源:包含案例視頻、案例PPT、實訓(xùn)指導(dǎo)書、代碼、數(shù)據(jù)。4、案例內(nèi)容:包括但不限于背景與挖掘目標;模型簡介;數(shù)據(jù)介紹;模型搭建;小結(jié)。十五、基于卷積神經(jīng)網(wǎng)絡(luò)的分揀系統(tǒng)【計算機視覺】1、本案例基于工業(yè)相機采集到的零件圖片實現(xiàn)零部件識別。通過學習本案例,可熟悉圖像的歸一化方法,了解圖像特征提取方法,掌握模型構(gòu)建相關(guān)流程和評價指標。2、課時設(shè)置:理論教學不少于8學時,實踐教學不少于8學時,總計不少于16學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥10個、案例PPT數(shù)量≥1份、代碼數(shù)量≥3份、數(shù)據(jù)數(shù)量≥2份。4、案例內(nèi)容:包括但不限于案例背景與目標;HOG特征計算;SVM基本原理;CNN基本原理;DNN基本原理;評價指標;SVM代碼實現(xiàn);CNN代碼實現(xiàn);DNN代碼實現(xiàn);模型評價。十六、廣電大數(shù)據(jù)用戶畫像【Spark/SVM】1、本案例通過抽取用戶相關(guān)數(shù)據(jù),對數(shù)據(jù)整體情況進行探索、預(yù)處理,基于多項指標對用戶進行畫像構(gòu)建。通過學習本案例,可掌握通過SparkMLlib實現(xiàn)對數(shù)據(jù)的抽取、探索和預(yù)處理的主要方法和技能,并能夠基于實際需求構(gòu)建相關(guān)的數(shù)據(jù)特征和分析模型。2、課時設(shè)置:理論教學不少于8學時,實踐教學不少于8學時,總計不少于16學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥7份、案例視頻數(shù)量≥23個、案例PPT數(shù)量≥5份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥5份。4、案例內(nèi)容:包括但不限于背景介紹;目標分析;系統(tǒng)架構(gòu)介紹;數(shù)據(jù)介紹;數(shù)據(jù)存儲;開發(fā)環(huán)境搭建;數(shù)據(jù)探索;數(shù)據(jù)清洗;用戶畫像簡介;消費內(nèi)容;消費等級;產(chǎn)品名稱;入網(wǎng)成都&業(yè)務(wù)名稱;地區(qū)&語言偏好;SVM介紹;特征構(gòu)建;標簽構(gòu)建;模型構(gòu)建與評估。十七、招聘網(wǎng)站數(shù)據(jù)分析【Spark/LDA】1、本案例根據(jù)招聘信息內(nèi)容對目前網(wǎng)絡(luò)人才市場中職業(yè)類型進行正確劃分,并針對每個職業(yè)類型繪制詞云圖進行展示。2、課時設(shè)置:理論教學不少于20學時,實踐教學不少于20學時,總計不少于40學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥11份、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥1份。4、案例內(nèi)容:包括但不限于數(shù)據(jù)導(dǎo)入與轉(zhuǎn)換;數(shù)據(jù)探索;數(shù)據(jù)預(yù)處理與建模;制作詞云圖。十八、P2P信用貸款風險分析【Spark/GBTs】1、本案例以某P2P信貸企業(yè)給出的相關(guān)數(shù)據(jù)表為原始數(shù)據(jù),通過對數(shù)據(jù)進行分析和處理,最后構(gòu)建用戶逾期還款概率預(yù)測模型。通過學習本案例,可了解P2P信貸的概念,掌握數(shù)據(jù)抽取、數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理與分析建模的主要方法和技能。2、課時設(shè)置:理論教學不少于20學時,實踐教學不少于20學時,總計不少于40學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥6份、案例視頻數(shù)量≥14個、案例PPT數(shù)量≥1份、代碼數(shù)量≥10份、數(shù)據(jù)數(shù)量≥7份。4、案例內(nèi)容:包括但不限于案例背景與目標分析;數(shù)據(jù)存儲;數(shù)據(jù)探索分析介紹;分析用戶信息完善程度跟逾期率的關(guān)系;分析用戶信息修改天數(shù)跟逾期率的關(guān)系;分析借款月份與逾期率的關(guān)系;第三方平臺信息特征構(gòu)建實戰(zhàn);用戶信息缺失個數(shù)和借款月份特征構(gòu)建實戰(zhàn);信息更新表特征構(gòu)建實戰(zhàn);登錄信息表特征構(gòu)建實戰(zhàn);類別型特征清洗與編碼實戰(zhàn);啞變量處理實戰(zhàn);缺失值處理實戰(zhàn);模型構(gòu)建與評估。十九、構(gòu)建博客數(shù)據(jù)庫系統(tǒng)【HBase】1、本案例基于HBase開發(fā)環(huán)境對涉及系統(tǒng),進行業(yè)務(wù)功能的實現(xiàn)。通過學習本案例,可熟悉命名空間和表結(jié)構(gòu)設(shè)計,掌握業(yè)務(wù)功能的實現(xiàn)方法。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于8學時,總計不少于12學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥11個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥1份。4、案例內(nèi)容:包括但不限于背景與目標介紹;業(yè)務(wù)邏輯;表結(jié)構(gòu)細化講解;開發(fā)環(huán)境創(chuàng)建;測試配置連接;創(chuàng)建命名空間和表;插入用戶關(guān)系數(shù)據(jù);查看表數(shù)據(jù);業(yè)務(wù)場景1(用戶發(fā)布博客內(nèi)容);業(yè)務(wù)場景2(用戶查看關(guān)注人發(fā)布內(nèi)容);業(yè)務(wù)場景3(添加新的用戶)。二十、廣告日志數(shù)據(jù)采集系統(tǒng)【Flume】1、本案例通過腳本定時抽取數(shù)據(jù)并寫入指定的目錄,模擬日志文件產(chǎn)生的過程,通過Flume定時隨機抽取日志文件寫入MySQL表,進而通過腳本對數(shù)據(jù)進行保存。通過學習本案例,可掌握采集系統(tǒng)運行日志分析,掌握數(shù)據(jù)的采集與保存方法。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于8學時,總計不少于12學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥3份、案例視頻數(shù)量≥11個、案例PPT數(shù)量≥1份、代碼數(shù)量≥5份、數(shù)據(jù)數(shù)量≥1份。4、案例內(nèi)容:包括但不限于項目背景與目標分析;項目環(huán)境分析;采集系統(tǒng)運行日志方案分析;模擬廣告系統(tǒng)運行日志產(chǎn)生;采集廣告系統(tǒng)運行日志實戰(zhàn);廣告曝光日志數(shù)據(jù)采集方案分析;模擬廣告曝光日志產(chǎn)生;廣告曝光日志采集實戰(zhàn);用戶行為日志采集方案分析;用戶行為日志數(shù)據(jù)采集實戰(zhàn);案例總結(jié)。二十一、商品實時推薦系統(tǒng)【Flink】1、本案例通過采集用戶在網(wǎng)站的實時訪問數(shù)據(jù)進行緩存,然后對數(shù)據(jù)流進行實時數(shù)據(jù)處理,并分析用戶的商品購買情況。通過學習本案例,可掌握Flume數(shù)據(jù)的采集方法和技能,熟悉Flink數(shù)據(jù)處理開發(fā)等。2、課時設(shè)置:理論教學不少于12學時,實踐教學不少于12學時,總計不少于24學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥4份、案例視頻數(shù)量≥16個、案例PPT數(shù)量≥3份、代碼數(shù)量≥5份。4、案例內(nèi)容:包括但不限于商品實時推薦系統(tǒng)簡介;案例環(huán)境介紹;模擬日志數(shù)據(jù)產(chǎn)生;Flume采集配置文件分析;Flume數(shù)據(jù)采集實戰(zhàn);Kafka數(shù)據(jù)緩存實戰(zhàn);Flink數(shù)據(jù)處理開發(fā)環(huán)境介紹;Flink數(shù)據(jù)處理開發(fā)環(huán)境實戰(zhàn);Flink點擊流和銷售額計算-創(chuàng)建MYSQL存儲表;Flink點擊流和銷售額計算-自定義mysqlsink;Flink點擊流和銷售額計算-數(shù)據(jù)實時處理實戰(zhàn);Flink點擊流和銷售額計算-運行Flink任務(wù);在集群中運行任務(wù);每日門店銷售額實時統(tǒng)計;每日商品銷量實時統(tǒng)計;項目總結(jié)。二十二、圖書評分實時分析系統(tǒng)【Flume/Kafka/SparkStreaming】1、本案例通過模擬某一圖書銷售平臺的后臺銷售日志,對這些實時產(chǎn)生的日志進行采集和處理,計算圖書熱度,構(gòu)建用戶標簽。通過學習本案例,可以掌握在大數(shù)據(jù)環(huán)境中對海量無界數(shù)據(jù)的實時采集和實時處理技術(shù)的綜合知識點及如何對這兩大技術(shù)進行高效的結(jié)合使用。2、課時設(shè)置:理論教學不少于2學時,實踐教學不少于6學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥5份、案例視頻數(shù)量≥14個、案例PPT數(shù)量≥1份、代碼數(shù)量≥5份、數(shù)據(jù)數(shù)量≥1份。4、案例內(nèi)容:包括但不限于項目背景;需求說明;系統(tǒng)構(gòu)思;Flume知識點回顧;Kafka知識點回顧;SparkStreaming知識點回顧;Kafka同F(xiàn)lume比較;KafkaChannels知識點;SparkStreamingpoll數(shù)據(jù)流接收;日志實時產(chǎn)生;Flume采集Kafka消費;SparkStreaming拉取Flume數(shù)據(jù)流;foreachrdd使用;SparkStreaming編程。二十三、芝加哥交通違反記錄分析【Hadoop/MongoDB】1、本案例基于從美國網(wǎng)站獲取的芝加哥市從2014年至2021年2月份的十字路口闖紅燈的記錄數(shù)據(jù)進行違反紅燈記錄分析。通過學習本案例,可掌握MongoDB的基礎(chǔ)知識點、MongoDB的實際開發(fā)環(huán)境的部署、MongoDB和HDFS文件系統(tǒng)之間的數(shù)據(jù)遷移流程及MongoDBJavaAPI的使用。2、課時設(shè)置:理論教學不少于2學時,實踐教學不少于6學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥5份、案例視頻數(shù)量≥14個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥1份。4、案例內(nèi)容:包括但不限于引言;背景介紹;數(shù)據(jù)說明與需求說明;MongoDB知識點回顧;開發(fā)環(huán)境搭建;HDFS文件上傳;HDFS導(dǎo)入MongoDBpart1;HDFS導(dǎo)入MongoDBpart2;HDFS導(dǎo)入MongoDBpart3;可視化插件屬性說明;違規(guī)次數(shù)分布統(tǒng)計;違規(guī)地點分布統(tǒng)計;違規(guī)地點的違規(guī)均值統(tǒng)計;時間分布統(tǒng)計。二十四、Hadoop使用KNN實現(xiàn)鳶尾花分類【Hadoop】1、鳶尾花分類問題是分類算法領(lǐng)域中的一個重要問題,其解決方案可以應(yīng)用于各種分類問題。例如,在醫(yī)療診斷中,可以使用機器學習算法來分類患者的疾病類型;在金融領(lǐng)域中,可以使用機器學習算法來分類客戶的信用等級。通過Hadoop大數(shù)據(jù)技術(shù)成功解決鳶尾花分類問題,將突破數(shù)據(jù)處理規(guī)模的界限。當在大規(guī)模數(shù)據(jù)分類的場景下,使用Hadoop解決分類問題可以提高數(shù)據(jù)處理效率、數(shù)據(jù)處理能力和數(shù)據(jù)安全性,是一種高效、可靠的解決方案。通過學習本案例,可熟悉掌握HadoopMapReduce編程實現(xiàn)KNN分類算法,掌握MapReduce自定義輸入和輸出類型的操作方法,以及掌握MapReduce多文件讀取方法,熟悉MapReduce編程。2、課時設(shè)置:理論教學不少于4學時,實踐教學不少于4學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥1份、案例視頻數(shù)量≥3個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥2份。4、案例內(nèi)容:包括但不限于mapreduce實現(xiàn)knn的思路分析;MapReduce實現(xiàn)過程。二十五、廣電用戶標簽計算【Hadoop/Spark/Hive】1、本案例基于廣電積累的大量用戶數(shù)據(jù),劃分標簽條件,實現(xiàn)用戶標簽構(gòu)建。通過學習本案例,可熟悉SparkSQL下DataFrame的操作方法,掌握Spark與Hive數(shù)據(jù)倉庫交互,包括數(shù)據(jù)獲取、數(shù)據(jù)處理以及數(shù)據(jù)保存。掌握數(shù)據(jù)字段處理。2、課時設(shè)置:理論教學不少于2學時,實踐教學不少于6學時,總計不少于8學時。3、案例資源:包含實訓(xùn)指導(dǎo)書數(shù)量≥1份、案例視頻數(shù)量≥5個、案例PPT數(shù)量≥1份、代碼數(shù)量≥1份、數(shù)據(jù)數(shù)量≥5份。4、案例內(nèi)容:包括但不限于案例背景與需求分析;數(shù)據(jù)說明與存儲;需求與實現(xiàn)。二十六、網(wǎng)絡(luò)入侵用戶自動識別【Hadoop/Hive/Spark】1、本案例基于KDDCup99網(wǎng)絡(luò)入侵檢測數(shù)據(jù)集,對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國際產(chǎn)權(quán)交易法律協(xié)調(diào)機制構(gòu)建考核試卷
- 保健食品營養(yǎng)素攝入與慢性病預(yù)防考核試卷
- 區(qū)塊鏈在支付安全中的應(yīng)用考核試卷
- 紙張防偽技術(shù)考核試卷
- 五金店客戶關(guān)系管理的風險防范考核試卷
- 技術(shù)狀態(tài)管理的核心原理
- 產(chǎn)品合作協(xié)議書13篇
- 企業(yè)職員個人工作總結(jié)15篇
- 保安公司年度工作總結(jié)11篇
- 水果干活動策劃方案
- 港口裝卸作業(yè)培訓(xùn)
- 鉗工考試試題及答案
- 2025年廣東省佛山市順德區(qū)中考二模物理試題(含答案)
- 研發(fā)項目變更管理制度
- 2024-2025學年下學期小學數(shù)學人教版三年級期末必刷??碱}之復(fù)式統(tǒng)計表
- 2025至2030中國復(fù)印機行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 暑假安全家長會4
- 瑞幸大學題目及答案
- 消防監(jiān)督檢查員崗位技能考核題庫
- 2024年安徽省泗縣衛(wèi)生局公開招聘試題帶答案
- 2025年云南省中考生物試卷真題(含標準答案)
評論
0/150
提交評論