




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
資料內(nèi)容僅供您學習參考,如有不當或者侵權(quán),請聯(lián)系改正或者刪除。人臉識別研究的背景意義現(xiàn)狀及特征提取方法研究1研究背景與意義 12國內(nèi)外研究現(xiàn)狀 22.1人臉識別的研究現(xiàn)狀 22.2人臉識別中稀疏編碼的研究現(xiàn)狀 33人臉的特征提取方法概述 53.1基于局部特征的方法 53.2基于整體特征的方法 5基于特征臉方法 6基于彈性匹配的方法 6基于神經(jīng)網(wǎng)絡(luò)的方法 6基于不變性的方法 6基于Fisher線性判別方法 71研究背景與意義人臉識別技術(shù)具有廣泛的應(yīng)用前景,在國家安全、軍事安全和公共安全領(lǐng)域,智能門禁、智能視頻監(jiān)控、公安布控、海關(guān)身份驗證、司機駕照驗證等都是典型的應(yīng)用;在民事和經(jīng)濟領(lǐng)域,各類銀行卡、金融卡、信用卡、儲蓄卡的持卡人的身份驗證,社會保險人的身份驗證等具有重要的應(yīng)用價值;在家庭娛樂等領(lǐng)域,人臉識別也具有一些有趣有益的應(yīng)用,比如能夠識別主人身份的智能玩具、家政機器人,具有真實面像的虛擬游戲玩家等等。近年來許多神經(jīng)生理學家在視覺系統(tǒng)上已展開了全面深入的研究,而且取得了一些有重要意義的研究成果。這就使得在工程上利用計算機來模擬視覺系統(tǒng)成為可能。基于這一認識,利用已有的生物學科研成果,聯(lián)系信號處理、計算理論以及信息論知識,經(jīng)過對視覺系統(tǒng)進行計算機建模,使計算機能在一定程度上模擬人的視覺系統(tǒng),以解決人工智能在圖像處理領(lǐng)域中碰到的難題。神經(jīng)稀疏編碼算法正是這樣一種建模視覺系統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)方法。這種算法編碼方式的實現(xiàn)僅依靠自然環(huán)境的統(tǒng)計特性,并不依賴于輸入數(shù)據(jù)的性質(zhì),因而是一種自適應(yīng)的圖像統(tǒng)計方法。傳統(tǒng)的人臉識別系統(tǒng)中,不論是基于整體的或者局部特征的人臉識別方法,都需要建立很好的模型來提取特征,而稀疏編碼理論對特征的選取方面要求相對較低,因此結(jié)合特征提取方法再對稀疏編碼算法進行深入研究,并應(yīng)用到人臉識別中,擴展了人臉識別的方法理論,將會對該領(lǐng)域的研究起到一定的促進作用,因此具有很重要的學術(shù)意義。當前,稀疏編碼SC方法在盲源信號分離、語音信號處理、自然圖像特征提取、自然圖像去噪以及模式識別等方面已經(jīng)取得許多研究成果,具有重要的實用價值,是當前學術(shù)界的一個研究熱點。進一步研究稀疏編碼技術(shù),不但會積極地促進圖像信號處理、神經(jīng)網(wǎng)絡(luò)等技術(shù)的研究,而且也將會對相關(guān)領(lǐng)域新技術(shù)的發(fā)展起到一定的促進作用。2國內(nèi)外研究現(xiàn)狀2.1人臉識別的研究現(xiàn)狀人臉識別的研究歷史比較悠久,Galton早在1888年和19就分別在《Nature》雜志發(fā)表了兩篇關(guān)于利用人臉進行身份識別的文章,對人類自身的人臉識別能力進行了分析,但當時還不可能涉及到人臉的自動識別問題。最早的關(guān)于人臉識別問題的研究論文見于1964年Bertillon在PanoramicResearchInc.發(fā)表的技術(shù)報告,和1965年Chan在PanoramicResearchInc.發(fā)表的技術(shù)報告,到現(xiàn)在已有四十余年的歷史。近年來,人臉識別研究得到了諸多研究人員的青睞,涌現(xiàn)出了諸多技術(shù)方法。特別是1990年以來,人臉識別更得到了長足的發(fā)展,每年都有大量的學術(shù)論文發(fā)表。現(xiàn)在,幾乎所有知名的理工科大學和IT產(chǎn)業(yè)的主要公司都有研究組在從事人臉識別的研究。人臉識別的研究大致可分為四個階段。第一個階段以Bertillon,Allen和Parke為代表,主要研究人臉識別所需要的面部特征。該階段是人臉識別研究的初級階段,非常重要的成果不是很多,也基本沒有獲得實際應(yīng)用。第二個階段是人機交互識別階段。該階段代表性工作是Goldstion,Harmon和Lesk等用幾何特征參數(shù)來表示人臉正面圖像。她們用21維特征矢量表示人臉面部特征,并設(shè)計了基于這一特征表示的識別系統(tǒng)。在這個階段,Kanade博士于1973年在京都大學完成了第一篇人臉識別方面的博士論文。該階段的方法仍擺脫不了操作員的干涉。第三個階段是真正的機器自動識別階段。這一階段時間相對短暫,但卻是人臉識別研究的高潮期,不但誕生了主成分分析、線性判別分析、彈性圖匹配、局部特征分析、獨立分量分析、支持向量機、神經(jīng)網(wǎng)絡(luò)、隱馬爾可夫模型、柔性模型(FlexibleModels)(包括主動形狀模型(ASMs)和主動表觀模型(AAMs))等若干代表性的人臉識別算法,美國軍方還組織了著名的FERET人臉識別算法測試,并出現(xiàn)了若干商業(yè)化運作的人臉識別系統(tǒng),最為著名的是Visionics(現(xiàn)為Idenfx)的Facelt系統(tǒng)。這一階段的人臉識別技術(shù)發(fā)展非常迅速,所提出的算法在較理想圖像采集條件、用戶配合、中小規(guī)模正面人臉數(shù)據(jù)庫上達到了非常好的性能。從技術(shù)方案上看,2D人臉圖像線性子空間判別分析、統(tǒng)計表觀模型、統(tǒng)計模式識別方法是這一階段的主流技術(shù)。第四個階段是魯棒的人臉識別技術(shù)的研究階段。近幾年來,研究人員針對影響人臉識別的一些主要因素,例如光照、姿態(tài)、表情、年齡、遮擋、低分辨率等變化因素,提出了很多解決方法。如對于光照變化的處理方法主要有熵圖像法、光照錐法、球諧波函數(shù)法、九點光源法等。對于姿態(tài)變化的處理方法主要有多視角法、局部到整體幾何特征變換匹配法、通用3D模型法、3D形變模型法、光流場法[7]等。總體而言,當前非理想成像條件下(特別是光照和姿態(tài))、用戶不配合、大規(guī)模人臉數(shù)據(jù)庫上的人臉識別問題逐漸成為研究的熱點。解決這類問題的方法的特點是經(jīng)過描述和補償變化因素,從而提高算法的性能。非線性建模方法、基于Boosting的學習技術(shù)、基于3D模型的人臉建模與識別方法等逐漸成為備受重視的技術(shù)發(fā)展趨勢。當前,國外對人臉識別問題的研究很多,比較著名的有CMU(卡耐基·梅隆大學)、MIT(麻省理工學院)、YALE(耶魯大學)等機構(gòu);國內(nèi)的清華大學、中國科學院自動化研究所、上海交通大學、南京理工大學、哈爾濱工業(yè)大學等單位都有人員從事人臉識別相關(guān)工作的研究。關(guān)于人臉識別研究的重要國際會議有IEEE的FG(IEEEInternationalConferenceAutomaticFaceandGestureRecognition)、ICIP(InternationalConferenceonImageProcessing)、CVPR(ConferenceonComputerVisionandPatternRecognition)等。2.2人臉識別中稀疏編碼的研究現(xiàn)狀假設(shè)條件稀疏編碼模型能夠表示初級視覺皮層簡單細胞編碼外界視覺刺激圖像的過程和特征,這種動態(tài)映射和表示層細胞的發(fā)放特性導致了細胞發(fā)放的稀疏分布。由于哺乳動物的視覺生理過程是很復雜的,在用稀疏編碼模型模擬初級視覺系統(tǒng)神經(jīng)元的感受野特性時,一般需要設(shè)置以下的假設(shè):輸入數(shù)據(jù)具有稀疏性(或超高斯性)結(jié)構(gòu);各個稀疏系數(shù)之間是統(tǒng)計獨立的;稀疏變換是一種線性變換;基函數(shù)非奇異,即特征矩陣的行列式;有噪聲時,稀疏分量和噪聲信號是相互獨立的。稀疏編碼模型基于上述假設(shè)的稀疏編碼模型的研究主要內(nèi)容有:Olshausen等人把超完備基(基函數(shù)A的維數(shù)大于輸出神經(jīng)元的個數(shù))引入到稀疏編碼模型中,利用概率密度估計模型建模V1區(qū)感受野,并應(yīng)用于時變的(time-varying)自然圖像數(shù)據(jù);此模型比靜止自然圖像的稀疏編碼模型計算復雜,訓練時間也較長;Tenenbaum等人提出了雙線性稀疏編碼模型,對稀疏系數(shù)和基函數(shù)進行兩次稀疏變換,能夠更好地體現(xiàn)自然圖像的內(nèi)容和類型,但訓練速度較慢;Olshausen和Simocelli從小波變換的角度對自然數(shù)據(jù)進行神經(jīng)表示和有效編碼,這是一種完備基(基函數(shù)A的維數(shù)等于輸出神經(jīng)元的個數(shù))的稀疏編碼模型,此模型對圖像數(shù)據(jù)的類型具有依賴性;Oja和Hyv?rinen等人圍繞ICA模型和不變特征子空間展開深入研究,由于ICA方法要求的假設(shè)條件太強,其應(yīng)用范圍受到限制;Hoyer在Olshausen和Field提出的標準稀疏編碼模型的基礎(chǔ)上,提出一種非負稀疏編碼(NNSC)模型。NNSC模型考慮了人眼以不同的通道(ON-channel和OFF-channel)接收非負數(shù)據(jù),符合人眼的生理特性和主視皮層V1區(qū)簡單細胞神經(jīng)元的電生理特性,但由于模型過于簡化,易受噪聲的干擾;Donoho等人提出的經(jīng)過L1范數(shù)最小化的通用字典的最佳稀疏表示方法。該方法的困難在于如何選擇恰當?shù)摹弊值洹?以獲得最大的稀疏性;中國的楊謙[9]等利用二維Gabor小波函數(shù)建立的一個基于超定完備基的簡單細胞群稀疏編碼的計算模型,并實現(xiàn)了自然圖像的編碼;中國的孫玉寶等提出的基于Gabor感知多成份字典的圖像稀疏表示算法,根據(jù)圖像的幾何結(jié)構(gòu)特征建立匹配各層面圖像結(jié)構(gòu)的Gabor感知多成分字典,該字典具有對圖像中平滑、邊緣與紋理結(jié)構(gòu)的自適應(yīng)性。稀疏編碼存在的問題當前,由于人們對主視皮層V1區(qū)如何對復雜的自然環(huán)境進行有效編碼的過程依然知之甚少,因此上述的稀疏編碼模型只是一種啟發(fā)式的學習方法。主要存在的問題[10]是:理論依據(jù)不完善。主視皮層V1區(qū)的稀疏編碼的研究首先必須借助感知神經(jīng)科學的研究成果,必須結(jié)合計算技術(shù)、統(tǒng)計學理論、估計理論、人工神經(jīng)網(wǎng)絡(luò)等基礎(chǔ)理論。這些理論的發(fā)展和完善有助于稀疏編碼理論的發(fā)展;神經(jīng)元估計模型不精確。稀疏編碼算法必須依靠一個好的神經(jīng)元的計算模型,這個計算模型必須建立在神經(jīng)生理科學研究的成果上。當前科學家們對V1區(qū)神經(jīng)細胞復雜的響應(yīng)特性的研究仍處于探索階段,故對V1區(qū)的神經(jīng)元建模問題仍處于不斷發(fā)展和完善的狀態(tài)。3人臉的特征提取方法概述人臉特征主要可分為幾何特征和代數(shù)特征兩大類:幾何特征也稱為直觀特征,它是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量一般包括人臉指定兩點間的歐氏距離、曲率、角度等;代數(shù)特征即人臉圖像在本征空間形成的降維投影。人臉的幾何特征比較穩(wěn)定,受人臉的姿態(tài)變化與光照條件等因素的影響小,可是不容易抽取,而且測量精度也較差;人臉的代數(shù)特征容易得到,可是穩(wěn)定性較差,容易受到外界因素的影響。當前國內(nèi)外研究人臉識別的方法層出不窮,人臉特征提取的方法可分為基于局部特征的識別和基于整體特征的識別。下面對這些方法進行分別介紹。3.1基于局部特征的方法基于局部特征的方法是從臉部器官的形狀及其相互位置關(guān)系為出發(fā)點,提取與識別人臉特征。盡管各個人的臉部器官在形狀、大小上存在一定的差異,但其相互位置關(guān)系及特征點形狀等特性方面均有一定的規(guī)律,這為人臉特征提取與識別提供了可能。局部模板匹配是一種較為常見的方法。文獻[11]采用可變形模板技術(shù)建立眼睛模型,根據(jù)能量函數(shù)調(diào)整模板參數(shù)達到最佳匹配,以實現(xiàn)人臉識別目標。受人臉側(cè)面輪廓的啟發(fā),使用一種簡單而有效的灰度投影方法進行人臉特征提取與識別,并運用于三維人臉識別。由于灰度投影法的特性,可將其與模板匹配方法結(jié)合,提高識別的效果。3.2基于整體特征的方法基于整體特征的方法從整體上對人臉進行特征提取,進而識別人臉。單個器官的某些變化不會對整個人臉識別造成多大影響。此類方法較多,它是當前人臉識別領(lǐng)域的一種主流方法。基于特征臉方法特征臉方法是從主分量分析法導出的一種人臉識別方法。K-L變換是種常見的正交變換,將其用于人臉識別取得了較好的效果。它根據(jù)一組人臉圖像構(gòu)造主分量子空間,由于主元具有人臉的形狀,也稱特征臉。將測試圖像投影到主分量子空間上,得到了一組投影系數(shù),與各個已知的人臉圖像進行比較識別,取得了較好的識別效果。特征臉方法原理簡單、易于實現(xiàn),實質(zhì)上是一種統(tǒng)計性的模板匹配方法。特征臉方法把人臉作為一個整體來處理,大大降低了識別復雜度。可是,由于忽視了人臉的個性差異,該方法有一定的理論缺陷。研究表明,隨著光照條件、人臉角度及人臉相對尺寸的變化,識別率將急劇下降。實驗證明,特征臉方法的識別率隨訓練圖像數(shù)目的增大而增大,當然,計算復雜程度也相應(yīng)增加了。基于彈性匹配的方法該方法采用網(wǎng)格作為模板,將圖像間的比較變?yōu)榫W(wǎng)格間的比較。使用一種基于動態(tài)鏈接結(jié)構(gòu)的彈性匹配法來定位人臉,并根據(jù)人臉數(shù)據(jù)庫進行匹配識別。將物體用稀疏圖形描述,其頂點用局部能量譜的多尺度描述來標記,邊則表示拓撲連接關(guān)系,并用幾何距離標記,再應(yīng)用彈性圖形匹配技術(shù)來尋找最近的已知圖形。彈性匹配方法整體識別性能優(yōu)于特征臉方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新型集體經(jīng)濟背景下鄉(xiāng)村治理共同體的建構(gòu)-以陜西省Z村為例
- 大心理健康教育講課件
- 2025至2030中國太陽能藍牙揚聲器行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2025至2030中國天然石英制品市場運營模式與未來競爭力深度分析報告
- 2025至2030中國多股錨具行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2025至2030中國城市交通行業(yè)市場發(fā)展現(xiàn)狀及消費需求及有效策略與實施路徑評估報告
- 2025至2030中國地質(zhì)災害防治行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2025至2030中國在線圖編輯器行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2025至2030中國咖啡行業(yè)市場發(fā)展現(xiàn)狀及競爭格局與投資發(fā)展報告
- 一次難忘的自然探索活動記事作文(7篇)
- 雅馬哈YS12編程手冊
- 5G(UE)中PDU會話建立流程(消息)
- 組合數(shù)學(第二版)遞推關(guān)系
- 酒水廠家授權(quán)書范本
- 產(chǎn)品供貨質(zhì)量保證措施方案
- 項目成本核算表格(全套)
- 河南產(chǎn)業(yè)分析介紹課件
- 三病信息管理制度
- 湘教版七年級下冊地理期末試卷-附答案
- 2023年副主任醫(yī)師(副高)-中西醫(yī)結(jié)合外科學(副高)考試歷年真題薈萃帶答案
- 教科版五年級下冊科學知識點整理
評論
0/150
提交評論