




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
4-1分類器模塊?分門別類:幫你“分而治之”目錄CONTENTS什么是分類器01分類器如何工作02一.什么是分類器1.概念分類器:分類是人工智能的一種重要方法,是在已有數(shù)據(jù)的基礎(chǔ)上學習出一個分類函數(shù)或構(gòu)造出一個分類模型,該函數(shù)或者模型就是一個能完成分類任務的人工智能系統(tǒng),即人們通常所說的分類器。。數(shù)據(jù)集分類器給定的某個類型二.分類器如何工作1.一般工作過程三個關(guān)鍵要素:1樣本特征2正負樣本3分類器類型二.分類器如何工作2.三個概念(1)樣本特征。樣本特征提取是分類器工作的首要任務,如果待分類對象沒有提取特征,也就沒有分類的依據(jù),就無從辨別對象的種類。綜合考慮關(guān)聯(lián)對象的差異,提取出有效的特征,讓分類器準確工作。(2)正、負樣本。針對分類問題,正樣本是指想要正確分類出的類別所對應的樣本,負樣本是指不屬于這一類別的樣本。既要考慮正樣本,又要根據(jù)實際工作場景,合理選取足夠多的負樣本,保證模型訓練效果。(3)分類器。分類器通過學習得到一個目標函數(shù)或模型(以下統(tǒng)稱為模型),它能把樣本的特征集X映射到一個預先定義的類別號y。二.分類器如何工作2.三個概念那么,機器學習中,常見的分類器有哪些呢人工智能基礎(chǔ)與應用Thankyouverymuch!4-2幾種主要的分類器模塊?分門別類:幫你“分而治之”目錄CONTENTS決策樹01k近鄰分類器03貝葉斯分類器02神經(jīng)網(wǎng)絡(luò)05支持向量機04一.決策樹概念決策樹(decisiontree):用于決策的一棵“樹”,它從根節(jié)點出發(fā),通過決策節(jié)點對樣本的不同特征進行劃分,按照結(jié)果進入不同的選擇分支,最終到達某一葉子節(jié)點,獲得分類結(jié)果。垃圾郵件分類決策樹:二.貝葉斯分類器1.概念貝葉斯分類器(bayesclassifier):就是對于給定的分類項,利用貝葉斯定理,求解該分類項在預先給定條件下各類別中出現(xiàn)的概率,哪個概率最大,就將其劃分為哪個類別。貝葉斯定理公式:二.貝葉斯分類器2.舉例用貝葉斯分類器來判定垃圾郵件:
x=[1,0]分別表示正常郵件和垃圾郵件E:由n個關(guān)鍵詞組成的郵件三.k近鄰分類器概念k近鄰(k-NearestNeighbor,KNN)分類器:把每個具有n個特征的樣本看作n維空間的一個點,對于給定的新樣本,先計算該點與其他點的距離(相似度),然后將新樣本指派為周圍k個最近鄰的多數(shù)類。什么形狀的物體四.支持向量機1.概念支持向量機(SupportVectorMachine,SVM):基本思想是通過非線性映射,把樣本空間映射到一個高維的特征空間,將原本樣本空間線性不可分的問題,轉(zhuǎn)化成在高維空間通過線性超平面將樣本完全劃分開的問題。不可分:可分:四.支持向量機1.原理超平面離直線兩邊的數(shù)據(jù)的間隔越大,對訓練集的數(shù)據(jù)的局限性或噪聲有最大的容忍能力,也就是所謂的魯棒性。支持向量機就是要找到使這個間隔最大的決策超平面。五.神經(jīng)網(wǎng)絡(luò)1.概念?神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)?是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征進行分布式并行信息處理的算法數(shù)學模型。權(quán)重值w激活函數(shù)φ加權(quán)求和及函數(shù)sgn處理神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu):人工智能基礎(chǔ)與應用Thankyouverymuch!4-3項目1—識別貓狗模塊?分門別類:幫你“分而治之”目錄CONTENTS提出問題01預備知識03解決方案02任務1—樣本數(shù)據(jù)預處理04任務3—評估模型效果06任務2—構(gòu)建及訓練KNN模型05一.提出問題問題描述
對于人類來說,可以很容易識別身邊的貓和狗,這是人類視覺經(jīng)千萬年演變進化的結(jié)果。但對于計算機而言,想讓它識別一個圖像上的貓和狗就不那么容易了。如何能讓計算機識別出下圖中的貓和狗呢?二.解決方案1.選擇分類器選用KNN其核心思想是:如果一個樣本在特征空間中的k個最近鄰中的多數(shù)屬于某個類別,則該樣本也屬于這個類別。通常采用歐氏距離來計算兩樣本之間的距離大小,并據(jù)此找到某樣本的k個最近鄰。貓或狗?K個最近鄰中,多數(shù)是貓K個最近鄰中,多數(shù)是狗二.解決方案2.解決方案三.預備知識1.圖像灰度化灰度化實現(xiàn)代碼:三.預備知識2.歐氏距離點X與點Y之間的歐氏距離等于各特征值之差的平方和的平方根用KNN算法計算兩個樣本之間的距離,以此來判定某個樣本周圍哪些鄰居離它是最近的或者是最相似的。歐氏距離是常用的一種計算公式。樣本X與樣本Y之間的歐氏距離等于各特征值之差的平方和的平方根三.預備知識3.
KNN算法的主要參數(shù)點X與點Y之間的歐氏距離等于各特征值之差的平方和的平方根三.預備知識4.分類性能度量指標(1)真正(TruePositive,TP):被模型預測為正的正樣本。(2)假正(FalsePositive,F(xiàn)P):被模型預測為正的負樣本。(3)假負(FalseNegative,F(xiàn)N):被模型預測為負的正樣本。(4)真負(TrueNegative,TN):被模型預測為負的負樣本。(1)真正(TruePositive,TP):被模型預測為正的正樣本。(2)假正(FalsePositive,F(xiàn)P):被模型預測為正的負樣本。(3)假負(FalseNegative,F(xiàn)N):被模型預測為負的正樣本。(4)真負(TrueNegative,TN):被模型預測為負的負樣本。三.預備知識4.分類性能度量指標(1)精確率(2)正確率(3)召回率(4)F1值四.任務1——樣本數(shù)據(jù)預處理1.將圖像信息轉(zhuǎn)存為向量(1)導入相關(guān)的庫(2)定義轉(zhuǎn)換函數(shù)img2array將圖像數(shù)據(jù)轉(zhuǎn)換成一維向量四.任務1——樣本數(shù)據(jù)預處理1.將圖像信息轉(zhuǎn)存為向量(3)調(diào)用函數(shù)生成向量保存灰度圖像信息的向量內(nèi)容四.任務1——樣本數(shù)據(jù)預處理2.批量生成樣本數(shù)據(jù)(1)生成所有樣本的特征值和標簽值四.任務1——樣本數(shù)據(jù)預處理2.批量生成樣本數(shù)據(jù)(2)樣本數(shù)據(jù)的歸一化處理歸一化數(shù)據(jù)生成訓練集和測試集四.任務2——構(gòu)建及訓練KNN模型1.構(gòu)建KNN模型上述代碼定義一個KNN模型knn,模型中參數(shù)n_neighbors=13(采用訓練樣本數(shù)量的平方根的一半)、p=2表示使用歐氏距離來計算樣本相似度大小,weights='distance'表示權(quán)重與距離成反比,即更近的近鄰有更高的權(quán)重。四.任務2——構(gòu)建及訓練KNN模型2.訓練模型(1)用訓練集x_train、y_train來訓練模型(2)觀察模型訓練效果訓練效果不錯,在測試集上是否任然有很好的表現(xiàn)?四.任務3——評估模型效果1.
測試模型性能模型性能測試報告評價精度為63%狗的召回率62%貓的召回率64%什么原因?qū)е履P筒焕硐???任務3——評估模型效果2.通過交叉表了解模型的錯分情況(1)直觀分析:四.任務3——評估模型效果2.通過交叉表了解模型的錯分情況(2)交叉表分析:正確識別36個錯誤劃分34個四.任務3——評估模型效果2.通過交叉表了解模型的錯分情況如何去改善模型的性能例如嘗試改變模型參數(shù)K人工智能基礎(chǔ)與應用Thankyouverymuch!3-4項目2—輔助診斷乳腺癌模塊?分門別類:幫你“分而治之”目錄CONTENTS提出問題01預備知識03解決方案02任務1—準備訓練集和測試集04任務3—評估模型診斷效果06任務2—構(gòu)建和訓練模型05一.提出問題問題描述隨著醫(yī)療AI在醫(yī)療領(lǐng)域的投入使用,如今智慧醫(yī)療科技的新紀元已經(jīng)開啟,如圖4-17所示,借助“人工智能大腦”,AI輔助診療新時代正在到來。而現(xiàn)在AI輔助診斷技術(shù)的應用,能夠很大程度地提高醫(yī)療機構(gòu)、醫(yī)生的工作效率,降低醫(yī)生的工作強度,降低漏診率。那么,AI是如何輔助醫(yī)生進行病情診斷的呢二.解決方案1.問題本質(zhì)從活檢數(shù)據(jù)中判斷患者是有病還是沒病,本身是一個二分類問題,另外,活檢數(shù)據(jù)稀有、獲取成本高,符合SVM的適用條件,為此,采用SVM進行分類。采用SVM求解問題二.解決方案2.解決方案三.預備知識1.SVM的最優(yōu)分界面H0則是最優(yōu)分界面,因為它到兩邊臨界分界面的距離最大,具有較強的抗噪聲能力和較小的泛化誤差。三.預備知識2.SVM模型參數(shù)核函數(shù)K(x,y)變換線性不可分線性可分SVM模型的常用參數(shù)三.預備知識3.解讀數(shù)據(jù)集其中id列是編號,無實際意義。診斷列diagnosis取值[M|B],分別表示診斷為惡性或良性。其他30個列由細胞核的10個不同特征的平均值、標準差、最差值等構(gòu)成。四.任務1——準備訓練集和測試集1.按比例生成訓練集和測試集8:2比例降為1維四.任務1——準備訓練集和測試集2.觀察測試集的分布情況用數(shù)據(jù)預測是否患病五.任務2——構(gòu)建和訓練模型1.用訓練樣本訓練SVM模型訓練模型構(gòu)建模型用支持向量機svm構(gòu)建預測模型,核函數(shù)為rbf,懲罰參數(shù)C取值為1五
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 宜賓2025年宜賓三江新區(qū)事業(yè)單位第一次考核招聘26人筆試歷年參考題庫附帶答案詳解
- 廣安職業(yè)技術(shù)學院《成本與管理會計學》2023-2024學年第二學期期末試卷
- 漳州衛(wèi)生職業(yè)學院《中外建筑鑒賞》2023-2024學年第二學期期末試卷
- 惠州衛(wèi)生職業(yè)技術(shù)學院《組織行為學(I)》2023-2024學年第二學期期末試卷
- 北京政法職業(yè)學院《西藏民族與宗教事務管理》2023-2024學年第二學期期末試卷
- 吉首大學張家界學院《生物化學與分子生物學(1)》2023-2024學年第二學期期末試卷
- 呼倫貝爾職業(yè)技術(shù)學院《西醫(yī)外科學B》2023-2024學年第二學期期末試卷
- 科爾沁藝術(shù)職業(yè)學院《資產(chǎn)評估學B》2023-2024學年第二學期期末試卷
- 安徽農(nóng)業(yè)大學《插圖設(shè)計》2023-2024學年第二學期期末試卷
- 西北師范大學《機器人技術(shù)雙語》2023-2024學年第二學期期末試卷
- 2025滬教牛津版七年級英語下冊全冊培優(yōu)講義
- 水利工程施工文明措施與環(huán)保要求
- 書香校園讀書主題班會 課件
- 課題申報書:智能教育視角下基于眼動追蹤的在線學習認知模型及自適應機制研究
- 2022石油化工消防設(shè)施維護保養(yǎng)技術(shù)標準
- 2025年度考研政治馬克思主義政治經(jīng)濟學核心考點復習匯編
- (二模)2024~2025學年度蘇錫常鎮(zhèn)四市高三教學情況調(diào)研(二)生物試卷(含答案)
- 《康復技術(shù)》課件-脛腓骨骨折術(shù)后康復
- “童”心協(xié)力 守護健康-校園傳染病防控教育
- 域名解析換編碼 課件 2024-2025學年人教版(2024)初中信息科技七年級上冊
- 整形美容醫(yī)院醫(yī)患溝通流程
評論
0/150
提交評論