




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、會計學1機器學習基礎概述機器學習基礎概述第1頁/共48頁研究方法概念學習資料第2頁/共48頁機器學習機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的算法。即從數據中自動分析獲得規律,并利用規律對未知數據進行預測的算法。定義定義:“機器學習是對能通過經驗自動改進的計算機算法的研究”。定義定義:“機器學習是一種讓計算機在沒有事先明確地編程的情況下做出正確反應的科學” 。機器學習:定義第3頁/共48頁機器學習已經有了十分廣泛的應用,例如:數據挖掘、計算機視覺、自然語言處理、生物特征識
2、別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略游戲和機器人運用。機器學習:應用第4頁/共48頁機器學習:應用第5頁/共48頁監督學習無監督學習機器學習算法統計分類回歸分析聚類關聯規則機器學習算法分類第6頁/共48頁監督學習算法:統計分類第7頁/共48頁監督學習算法:回歸分析第8頁/共48頁監督學習算法特征n目標訓練集特征n目標特征n目標特征1特征1特征1監督學習算法:訓練/學習身高發長抽煙性別1.881.4cm是男1.6615.3cm否女1.7822.6cm否女第9頁/共48頁監督學習算法特征n測試集特征n特征n特征1特征1特征1結果目標目標目標監督
3、學習算法:預測身高發長抽煙1.660cm是1.765.1cm否1.5514.4cm否性別男男女第10頁/共48頁統計分類特征n測試集特征1結果離散值監督學習算法:分類?回歸?回歸分析特征n特征1連續值離散值連續值第11頁/共48頁決策樹KNN邏輯回歸監督學習算法樸素貝葉斯第12頁/共48頁神經網絡監督學習算法隨機森林SVM第13頁/共48頁算法優化AdaBoost遺傳算法第14頁/共48頁監督學習無監督學習機器學習算法統計分類回歸分析聚類關聯規則機器學習算法分類第15頁/共48頁無監督學習算法:聚類第16頁/共48頁無監督學習算法:關聯規則刮風降溫降雨冰雹1110110010001010011
4、11100刮風降溫降雨冰雹111011001000101001111100-監督-統計分類-無監督-關聯規則第17頁/共48頁無監督學習算法特征n訓練集特征n特征n特征1特征1特征1無監督學習算法:訓練/學習第18頁/共48頁監督學習算法特征n測試集特征n特征n特征1特征1特征1結果目標目標目標無監督學習算法:預測第19頁/共48頁無監督學習算法K-meansBIRCHApriori第20頁/共48頁研究方法概念學習資料第21頁/共48頁優化算法(變體/高級)基本算法程序實踐(樣本優化)容易理解的算法邏輯核心的數學原理特色/優缺點主要應用方向學習內容講課要求學習內容和講課要求其他第22頁/共4
5、8頁特征提取特征1樣本數據樣本數據樣本數據n預處理特征樣本集原始樣本集機器學習算法訓練預測輸出驗證集評價目標特征1n目標特征1n目標特征1n訓練集目標特征1n目標特征1n目標特征1n驗證集目標特征1n目標特征1n目標預測目標預測目標預測目標機器學習實施過程改進第23頁/共48頁特征不顯著怎么辦?-人腦戰勝電腦,分析并提取出樣本的數據特征時間用戶ID商品ID操作1月1日001001點擊1月2日002002收藏1月3日001001購買1月3日001004點擊1月5日002005點擊1月6日002006購買第24頁/共48頁特征提取特征1樣本數據樣本數據樣本數據n特征樣本集原始樣本集目標特征1n目標
6、特征1n目標特征提取統計分析變換特征運算時間用戶ID商品ID操作1月1日001001點擊1月2日002002收藏1月3日001001購買1月3日001004點擊1月5日002005點擊1月6日002006購買用戶ID商品ID點擊次數操作日期購買日期00100123300100413NULL00200212NULL00200515NULL002006166第25頁/共48頁噪聲太多導致算法過擬合怎么辦?-預處理,過濾噪聲年齡肝臟大小體重肝硬化231060kg否78865kg否36555kg否341380kg否13743kg否461175kg是22863kg否29859kg否581071kg否第2
7、6頁/共48頁特征1n預處理特征樣本集目標特征1n目標特征1n目標特征1n訓練集目標特征1n目標特征1n目標特征1n驗證集目標特征1n目標預處理過濾采樣劃分集合特征1n目標特征1n目標特征1n目標特征1n目標特征1n目標第27頁/共48頁單一算法受局限怎么辦?-算法迭代、融合-重新考慮新特征第28頁/共48頁訓練特征1n訓練集1目標特征1n目標特征1n目標算法融合:訓練特征1n訓練集2目標特征1n目標特征1n目標機器學習算法A預測特征1n訓練集2預測目標特征1n預測目標特征1n預測目標目標目標目標輸出第29頁/共48頁算法融合:訓練機器學習算法B特征1n訓練集2預測目標特征1n預測目標特征1n
8、預測目標目標目標目標訓練第30頁/共48頁算法A訓練算法融合算法B算法C算法D特征1n驗證集目標特征1n目標特征1n目標特征1n訓練集1目標特征1n目標特征1n目標特征1n訓練集2目標特征1n目標特征1n目標預測第31頁/共48頁特征提取特征1樣本數據樣本數據樣本數據n預處理特征樣本集原始樣本集機器學習算法訓練預測輸出驗證集評價目標特征1n目標特征1n目標特征1n訓練集目標特征1n目標特征1n目標特征1n驗證集目標特征1n目標特征1n目標預測目標預測目標預測目標機器學習實施過程改進第32頁/共48頁統計分析特征提取算法原理融合方法樣本構造理論實踐算法選擇第33頁/共48頁第34頁/共48頁優化
9、算法(變體/高級)基本算法程序實踐(樣本優化)容易理解的算法邏輯核心的數學原理特色/優缺點主要應用方向學習內容講課要求學習內容和講課要求其他第35頁/共48頁研究方法概念學習資料第36頁/共48頁機器學習,Mitchell 著, 機械工業出版社;機器學習實戰,Peter Harrington著;人民郵電出版社統計學完全教程, (美)活塞曼 著; 科學出版社參考書Machine Learning by Andrew Ng線上課程第37頁/共48頁/ml/數據集下載第38頁/共48頁ODPS平臺海量工業數據真實業務邏輯阿里巴巴大數據競賽入圍阿里星百
10、萬獎勵雙11線上實戰第39頁/共48頁第40頁/共48頁第41頁/共48頁監督學習算法特征n目標訓練集特征n目標特征n目標特征1特征1特征1監督學習算法:訓練/學習身高發長抽煙性別1.881.4cm是男1.6615.3cm否女1.7822.6cm否女第42頁/共48頁統計分類特征n測試集特征1結果離散值監督學習算法:分類?回歸?回歸分析特征n特征1連續值離散值連續值第43頁/共48頁無監督學習算法:聚類第44頁/共48頁研究方法概念學習資料第45頁/共48頁特征提取特征1樣本數據樣本數據樣本數據n預處理特征樣本集原始樣本集機器學習算法訓練預測輸出驗證集評價目標特征1n目標特征1n目標特征1n訓練
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 ISO/IEC GUIDE 50:2014 RU Safety aspects - Guidelines for child safety in standards and other specifications
- 【正版授權】 ISO/IEC 23092-3:2025 EN Information technology - Genomic information representation - Part 3: Metadata and application programming interfaces (APIs)
- 生物技術制藥工藝知識考點解析
- 宜賓一診考試試題及答案
- 儀容儀表考試試題及答案
- 醫院培訓考試試題及答案
- 六一兒童節棧橋活動方案
- 六一公司參觀活動方案
- 六一創意過山車活動方案
- 六一商場活動方案
- 《供熱計量技術規程》JGJ173-2009
- 攝影攝像拍攝合同范本
- 人身損害三期評定規范
- 2024屆梧州市八年級物理第二學期期末聯考試題含解析
- 2024中考道法圖表題專項訓練
- 《紅樓夢》飲食文化研究
- 《機械制圖》期末考試題庫388題(含答案)
- 新媒體視頻節目制作 課件 學習領域1 新聞短視頻制作
- 福建省泉州市晉江第一中學高一物理摸底試卷含解析
- 肝硬化的中醫護理查房課件
- 音樂(人音全國版)四年級生日快樂變奏曲-2課件
評論
0/150
提交評論