《大數據應用案例》課程教學大綱_第1頁
《大數據應用案例》課程教學大綱_第2頁
《大數據應用案例》課程教學大綱_第3頁
《大數據應用案例》課程教學大綱_第4頁
《大數據應用案例》課程教學大綱_第5頁
已閱讀5頁,還剩1頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《大數據應用案例》教學大綱課程編號:121312B課程類型:□通識教育必修課□通識教育選修課□學科基礎課□專業核心課?專業提升課□專業拓展課總學時:32講課學時:32實驗(上機)學時:0學分:2考試類型:□考試?考查適用對象:數據科學與大數據技術專業□是?否適合作為其他專業學生的個性化選修課先修課程:數據科學導論、大數據計算機基礎一、教學目標該課程是針對統計學(大數據分析)本科學生開設的,其主要目的是通過若干案例為學生展示大數據分析技術在社會經濟各領域的應用情況。本課程以實際工作中的案例進行實訓教學,達到的教學目標是:目標1:增強學生提出問題的能力目標2:增強學生分析問題的能力目標3:增強學生實際動手解決問題的能力目標4:培育有堅定理想信念、深厚愛國主義情懷、高尚道德情操,具有靈活處理數據能力,堅韌奮斗進取品格的社會主義新青年二、教學內容及其與畢業要求的對應關系重點講授R與python編程基礎、數據結構和數據預處理和常用統計分析方法的基本思路和軟件實現,R與python面向對象的編程是本課程的難點內容,課程擬結合實際工作中的案例數據對該部分內容進行舉一反三來強化學生的學習和訓練學生的數據分析思維。課程內容以多媒體的課件講授為主,同時上機應用R與python對統計分析的各常用方法進行實現,上機完成每種方法的練習。采用課堂練習和課后作業方式對學生掌握知識情況進行考核,建議采用開卷或論文方式進行課程考核,本課程平時成績占30%,期末考試成績占70%。三、各教學環節學時分配以表格方式表現各章節的學時分配,表格如下:教學課時分配序號章節內容講課實驗其他合計1案例1:北京市人口及就業結構40

042案例2:COVID-19疫情與氣象因素的關系40

043案例3:共享單車需求量預測40

044案例4:最低氣溫與最高氣溫預報40

045案例5:北京市房價影響因素40

046案例6:基于眼底數字圖像對糖尿病視網膜病變的診斷40047案例7:基于生成對抗網絡的圖像合成40048案例8:Google用戶對歐洲景點的評分關聯4004合計320032四、教學內容案例1:北京市人口及就業結構十四五中,國家再次提出“積極應對人口老齡化”命題。人口老齡化是社會發展的重要趨勢,是人類文明進步的體現,也是今后較長一段時期我國的基本國情。進入21世紀,隨著國家各項發展政策的開展落實,北京市人口發展的內在動力和外部條件也在發生變化,同時也面臨著人口結構上如就業不平等、就業困難、老齡化等問題。如何在國家人口趨于老齡化的同時,把握城市人口變化趨勢以及就業結構的特征,做好相應的應對措施,對維持北京市經濟社會穩定與發展開拓新興領域具有較大意義。本案例從《北京市統計年鑒》和《北京市1%人口抽樣調查數據》以及《北京市區域統計年鑒》入手,運用描述性統計分析方法對北京市常駐人口和就業人口進行分析;對不同職業的就業人口結構進行特征的分析。在綜合分析后得出北京市人口結構在就業結構上存在的問題,和未來在北京市規劃發展路上存在的問題。教學的重點和難點:本章的重點和難點都是數據的類型,講授清楚不同類型的數據如何區分。課程考核要求:要求掌握數據的概念,會區分數據的類型。課程思政切入點:數據質量的重要性,培養“求真務實”品德。案例2:COVID-19疫情與氣象因素的關系自2020年以來,COVID-19新型冠狀病毒在政府與民眾還未來得及反映的情況下席卷了全國乃至全世界,成為近幾十年內全球范圍內最嚴重的健康安全威脅。該案例采用描述性分析、相關性分析探討氣象因素與COVID-19新型冠狀疫情的相關關系。通過描述性分析結果來看結果顯示了因變量和自變量的基本分布情況,同時發現各自變量的數量級相差較多,因此對部分變量進行了特征縮放的預處理,使后續的分析更加準確。經過簡單的描述性分析后,采用計算協方差的方法進行了各變量間的相關關系的檢驗,認為長波輻射、相對濕度、每日最低溫度和海平面氣壓等氣象因素存在一定的相關關系,后續根據這些因素進行回歸預測也有一定的可信度。通過繪制的每日新增確診與氣象因素的散點圖、每日新增死亡與各氣象因素的散點圖,發現線性關系并不是很明顯,但是散點圖成一定的形狀,因此猜想存在較為復雜的相關關系。而且每日新增確診和每日新增死亡的時間序列圖可以看出明顯的波動,因此決定采用LSTM神經網絡進行回歸預測。經過進一步的回歸預測,回歸的效果比較好。教學的重點和難點:本章的重點和難點都是數據的可視化與探索性分析。課程考核要求:要求掌握數據探索性分析的概念以及如何實現。課程思政切入點:對比過內外疫情狀況,培養學生愛國情懷。案例3:共享單車需求量預測近年來,隨著移動互聯網時代的蓬勃發展,共享單車在城市交通中開始盛行,使得城市交通服務更加多元化、智能化。但是不合理的投放對單車資源、廠家的經濟利益以及城市市容都會造成很大的影響。因此,如何更加準確地預測一個區域內一段時間單車的需求量就成為了一個重要問題。本案例以華盛頓2011年到2012年的首都共享單車租用記錄的數據為研究對象,通過多種數據挖掘分析方法探究了季節、年份、節假日、天氣等相關因素對單車使用量的影響作用,構建了共享單車需求量的CART回歸樹、隨機森林、BP神經網絡回歸預測模型,通過預測單車的需求量進而指導單車的合理投放。結論表明,季節、年份、節假日、天氣等多種因素對單車需求量均有顯著影響。通過MSE與MAPE指標分析,結果表明三種預測模型中,隨機森林模型的預測精度最高,更為適合共享單車需求量的預測。該研究方法的應用可以提高共享單車調度的科學性和準確性。教學的重點和難點:本章的重點和難點是數據分類實現。課程考核要求:要求掌握數據分類建模的實現與模型評價。課程思政切入點:共享單車方便大家出行,培養學生綠色出行意識。案例4:最低氣溫與最高氣溫預報提高氣象預測的準確率對于減少氣象災害的影響有很大作用。本案例結合來自UCI數據庫的韓國25個氣象站2013年至2017年在氣溫預測方面的數據,通過數據預處理、探索性分析,利用多元線性回歸模型、決策樹模型、神經網絡模型以及隨機森林模型,分別建立預測次日最高溫及最低溫的預測模型,在對各個模型進行優化處理后,最終通過預測值與真實值的相關系數的比較,評價模型估計效果,為氣象預測研究提供了一種參考方法。教學的重點和難點:本章的重點和難點是回歸模型的實現。課程考核要求:要求掌握數據回歸建模的實現與模型評價。課程思政切入點:氣象災害對人類影響很大,引領學生增強環保意識。案例5:北京市房價影響因素本案例以北京市的房價數據為例,首先進行了數據預處理,將數據處理成可供后續分析的形式。由于房價的影響因素較為復雜,我們在這里需要考慮非線性模型擬合。首先進行投影尋蹤回歸分析,多次擬合后,選取擬合效果最好的一組模型得到回歸模型,進行北京市房價影響因素的研究,發現北京市房價是受到多方面影響的,房屋內各個功能房間的數量對房價的影響最大。接著進行預測分析,發現預測準確程度一般。最后建立神經網絡模型,多次調整模型參數,最后到預測結果。比較發現神經網絡預測的效果要比回歸模型的預測效果更好。教學的重點和難點:本章的重點和難點是分位數回歸模型等回歸模型的實現。課程考核要求:要求掌握數據分位數回歸模型等回歸模型的實現與模型評價。課程思政切入點:引領學生堅持國家關于住房不炒的政策。案例6:基于眼底數字圖像對糖尿病視網膜病變的診斷糖尿病是一種以高血糖為特征的代謝性疾病,糖尿病性視網膜病變(DR)是糖尿病的嚴重慢性并發證之一,是一種影響視力甚至致盲的慢性進行性疾病。據統計,全球DR患者約9300萬,嚴重影響糖尿病人的生活。目前針對糖尿病性視網膜病變的診斷主要是由有經驗的醫生通過觀察患者眼底圖來進行診斷,但效率較低。隨著大數據的發展,機器學習技術被廣泛應用于生活方方面面,其中將人工智能與醫療領域結合成為了研究人員的重點。本案例通過對來自MESSIDOR網站的眼底圖數字圖像進行描述性分析,了解患DR疾病和未患DR疾病人群的區別,再通過建立神經網絡模型和決策樹模型來檢測患者是否患DR疾病。最終選擇的決策樹模型相較于傳統的AM/FM分類方法來說復雜度較低,精確度更高,可有效降低醫生壓力,幫助患者盡早篩查、預防糖尿病性視網膜病變。教學的重點和難點:本章的重點和難點是深度學習模型的實現。課程考核要求:要求掌握深度學習的實現與模型評價。課程思政切入點:引領學生養成良好飲食習慣。案例7:基于生成對抗網絡的圖像合成圖像合成技術是目前人工智能領域的熱點研究方向之一。圖像生成算法是圖像合成技術的核心。2014年IanJ.Goodfellow等人提出了一種基于生成對抗網絡的圖像生成算法,它在很大程度上提高了圖片生成的質量。因此生成對抗網絡成為了圖像生成算法的研究中最為常見和應用廣泛的模型。近年來,生成對抗網絡的衍生模型層出不窮。其中深度卷積生成對抗網絡和基于梯度懲罰項的WGAN(簡稱WGAN-GP)極大地促進了生成對抗網絡的發展與應用。本文利用了花卉數據集,動漫數據集以及貓咪數據集作為數據源,通過Tensorflow的深度學習框架,對深度卷積生成對抗網絡和WGAN-GP進行了深入的研究。教學的重點和難點:本章的重點和難點是深度學習模型的實現。課程考核要求:要求掌握深度學習的實現與模型評價。課程思政切入點:增強學生對深度學習的熱情。案例8:Google用戶對歐洲景點的評分關聯在互聯網飛速發展、信息量激增的時代背景下,推薦系統得到了快速的發展,其應用范圍廣泛,旅游業便是其中之一。本文基于Google用戶對歐洲景點評分數據的分析,在協同過濾推薦算法的基礎上加入了聚類過程,還利用關聯規則的方法發現了各類別景點之間的隱含關系,最終挖掘出不同用戶對于歐洲不同類別景點的偏好并對具有未評分項目的用戶進行推薦。結果發現去往歐洲的旅行者們常會選擇前往當地的餐廳、購物中心、公園、酒吧、動物園、海灘、劇院、博物館等地,并且對公園、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論