分類模型 特征表示 (作業第四周講)- 330_第1頁
分類模型 特征表示 (作業第四周講)- 330_第2頁
分類模型 特征表示 (作業第四周講)- 330_第3頁
分類模型 特征表示 (作業第四周講)- 330_第4頁
分類模型 特征表示 (作業第四周講)- 330_第5頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

分類模型&特征表示Classificationmodel&featuressaid主講人:juan日期:2021年3月30日?計算機視覺?--周平2023/10/122#4查準率和查全率特征表示目錄#1#2#3模式識別分類模型2023/10/1232023/10/124一、模式識別定義1:將一個目標實例以一個目標原型或類別定義進行匹配的過程成為驗證。〔e:銀行自動柜員機〕模式識別是根據輸入的原始數據對其進行各種分析判斷,從而得到其類別屬性,特征判斷的過程。模式是存在于時間和空間中的可觀察的事物,如果我們可以區別它們是否相同或者是否相似,那我們從這種事物所獲取的信息就可以稱之為模式。 人們為了掌握客觀的事物,往往會按照事物的相似程度組成類別,而模式識別的作用和目的就在于把某一個具體的事物正確的歸入某一個類別。 識別的一個定義是再認識。“人以類聚,物以群分〞 用計算機實現人對各種事物或現象的分析、描述、判斷、識別。2023/10/125用例子說明,哪些是模式識別的范疇:1.將鉛筆、鋼筆、圓珠筆、毛筆、彩筆都歸類為書寫用的“筆〞;2.醫生根據心電圖化驗單來判斷病人是否得心臟病;3.警察根據指紋來進行身份驗證;4.利用計算機進行字符識別;5.根據用戶的虹膜進行身份識別;〔虹膜與指紋一樣獨一無二〕6.判斷當前用戶發出的聲音是什么字符;7.判斷當前圖片中是否有行人、人臉、車輛等;8.對出現在圖片序列中的行人、車輛進行跟蹤;9.對圖片中的人臉進行身份識別驗證;10.對車輛的拍照進行識別;11.判斷車輛的顏色、車型;12.在海量圖片庫當中尋找與某一張圖片相似的假設干圖片;13.根據用戶哼唱的音調搜索對應的歌曲......二、分類模型2023/10/128 一個理想類別是一些具有重要工頭屬性的目標的集合在實際中,某目標所屬類別用類別標號來標識。分類就是根據目標的屬性表示賦予目標類別號的過程。分類器是一種設備或算法,她輸入的是目標的表示,輸出的是類別標號。 拒絕類別是無法歸入任何類別的目標設置的通用類別。特征空間:從模式得到的對分類有用的度量、屬性或基元構成的空間。解釋空間:將C個類別表示為,其中為所屬類別的集合,稱為解釋空間。

二、分類模型分類任務的輸入數據是記錄的集合。每條記錄也稱實例或者樣例,用元組〔x,y〕表示,其中x是屬性的集合,而y是一個特殊的屬性,指出樣例的類標號〔也成為分類屬性或目標屬性〕。2023/10/129分類〔classification通過學習得到一個目標函數〔targetfunction〕,也成為分類模型〔classificationmodel〕,把每個屬性集x映射到一個預先定義的類標號y。目的:1、描述性建模分類模型可以作為解釋性的工具,用于區分不同類中的對象。2、預測性建模分類模型還可以用于預測未知記錄的類標號。2023/10/1210分類分類器的任務:根據輸入屬性集x確定類標號y。分類技術非常適合預測或描述二元或標稱類型的數據集,對序數分類不太有效,因為分類技術不考慮隱含在目標類中的序關系。2023/10/1211輸入屬性集〔x〕

分類模型輸出類標號〔y〕解決分類問題的一般方法分類技術是一種根據輸入數據集建立分類模型的系統方法。2023/10/1212分類技術這些技術都使用一種學習算法確定分類模型,修改這個模型能夠很好地擬合輸入數據中類標號和屬性集之間的聯系。學習算法得到的模型不僅要很好地擬合輸入數據,還要能夠正確地預測未知樣本的類標號。訓練算法的目標:建立具有很好的泛化能力的模型。表中每個表項表示實際類標號為i但是被預測為類j的記錄數。被分類模型正確預測的樣本總數是,而被錯誤預測的樣本總數是。2023/10/1213二類問題的混淆矩陣2023/10/1214二類問題的混淆矩陣同樣,分類模型的性能也可以用錯誤率〔errorrate〕來表示,其定義如下:目標:尋求最高的準確率或者最低的錯誤率雖然混淆矩陣提供衡量分類模型的信息,但是用一個數匯總這些信息更便于比較不同模型的性能。為實現這一目的,可以使用性能度量〔performancemetric〕,如準確率〔accuracy〕,其定義如下:2023/10/1215三、查準率查全率定義1:文檔檢測系統的查準率,是檢索出的相關文檔數〔屬于C1類〕與檢索出的文檔總數〔屬于C1類的文檔數加上實際是C2類的誤報文檔數〕之比。定義2:文檔檢索系統的查全率,是檢索出的相關文檔數與數據庫中總的相關文檔數之比,即分子是檢索出的屬于C1的文檔數,分母是檢索出的屬于C1的文檔數與漏報的文檔數之和。2023/10/1216查準率和查全率假設一個圖像數據庫包含200張用戶感興趣的日落圖像,用戶希望能與查詢圖像匹配。假設系統檢索出200個相關圖像中的150幅以及另外100幅歐諾個戶不感興趣的圖像。 這次檢索〔分類〕的查準率是:150/250=60% 查全率是:150/200=75%如果系統將數據庫中的所有圖像返回,那么查全率是100%,但查準率將非常低,另一方面,如果分類是為了低誤報率的話,查準率將偏高,而查全率將偏低。什么是圖像特征?理想的特征描述符應該具有:可重復性、可區分性、集中以及高效等特性;還需要能夠應對圖像亮度變化、尺度變化、旋轉和仿射變換等變化的影響。計算機視覺中通常把角點〔corner〕作為是圖像的特征,而角點能夠作為圖像特征點的原因有以下兩點:1、角點具有唯一的可識別性,當然,這是基于兩幅圖像沒有非常大的差異的前提下適用的;2、角點具有穩定性,換句話說,就是當該點有微小的運動時,就會產生明顯的變化。于是,可以清晰的看到該點的移動,這有利于特征點的跟蹤;對于圖像上其它的特征描述,如邊〔edge〕,區域〔patch〕等,用數學的語言來描述,就是,這些特征點變化性比較小。如某一灰度相似的區域,其一階導數為常數,二階導數也為常數。因此,假設選取一幅圖像中這樣的某個區域作為特征,那么在另一幅圖像中,便很難找到同時滿足唯一可識別性和穩定性要求的對應特征。2023/10/1217四、特征表示特征向量及其幾何解釋:2023/10/1218四、特征表示圖像特征的分類有多種標準,如根據自身的特點可以將其分為兩大類:描述物體外形的形狀特征和描述物體外表灰度變化的紋理特征。而根據特征提取所采用的方法的不同又可以將其特征分為統計特征和結構特征。灰度〔彩色〕圖像像素矩陣圖像特征的分類:我們常將某一類對象的多個特型組合在一起,形成一個特征向量來代表該類對象,如果只有單個數值特征,那么特征向量為一個一維向量;如果是n個特征組合,那么為一個n維特征向量,常常被作為識別系統的輸入。一般講帶分類的對象稱為樣本,將其特征向量稱為樣本特征向量或樣本向量。2023/10/1219〔a〕三維空間中的3維特征向量樣本〔b〕二維空間中的2維特征向量及其上的一種可能的劃分四、特征表示2023/10/1220四、特征表示投影降維法字符樣本的特征舉例2023/10/1221四、特征表示特征處理的根本方法:分別處理單個特征,并除去那些幾乎不具〔新的、不相關〕區分能力的特征;將特征綜合考慮,通過線性/非線性變換,使結果維數降低且具有更好地區分能力。2023/10/1222四、特征表示通常假定給出了維數為d確實定的模式樣本集,但d維特征如何確定尚未明確實際設計一個模式識別系統時,首先要解決的問題用各種可能的手段對識別對象的性質作各種可能的測量,并將這些測量值作為分類的特征為了設計出好的分類器,一般需要對原始的測量值集合進行分析,進行選擇或變換,組成識別特征,在保證一定分類精度的前提下,減少特征維數,使分類器的工作又快又準確要到達上述目的,關鍵是所提供的模式特征應具有很好的可分性〔類別可別離性判據來衡量〕,同時去掉那些關聯性較強的特征 需要依據某種準那么進行特征提取和選擇,為此應當首先構造這樣的準那么——類別可別離性判據 可別離性判據應能反映各類樣本在特征空間中的分布情況,能刻畫各特征分量在分類識別中的重要性或奉獻 1類別可別離性判據滿足的要求〔1〕與錯誤概率〔或其的上下界〕有單調關系〔2〕當特征獨立時有可加性2023/10/12232023/10/1224四、特征表示〔3〕具有“距離〞的某些特性,即〔4〕對特征數目是單調不減,即參加新的特征后,判據值不減應當指出,所構造的可別離性判據并不一定同時具有上述的四個性質,但這并不影響它在實際使用中的性質。2023

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論