基于模糊線性判別分析的人臉識別算法設計畢業設計_第1頁
基于模糊線性判別分析的人臉識別算法設計畢業設計_第2頁
基于模糊線性判別分析的人臉識別算法設計畢業設計_第3頁
基于模糊線性判別分析的人臉識別算法設計畢業設計_第4頁
基于模糊線性判別分析的人臉識別算法設計畢業設計_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于模糊線性判別分析的人臉識別算法設計學 院專 業班 級學 號姓 名指導教師負責教師摘 要人臉識別技術是生物識別技術的一種,以其直接性,唯一性,方便性等特點,在公安,海關,交通,金融,視頻會議,機器人的智能化研究等方面得到了越來越廣泛的應用。人臉識別技術是模式識別領域中的一個前沿課題。在過去的幾十年里,研究者嘗試利用計算機來模仿人類識別人臉的能力,并提出了很多人臉識別的有效算法,利用不同技術提高了人臉識別算法的平均識別率。本文著重討論一種把特征臉和模糊線性判別分析(flda)算法結合起來進行人臉識別的方法。該方法利用主成分分析(pca)方法求得訓練樣本的特征空間,然后在此基礎上計算flda算法

2、的特征子空間,進一步對特征臉空間降維。經過flda降維后的子空間中,同一類別的樣本盡可能靠近,不同類別的樣本盡可能分散(即降維后同一個人的人臉圖像盡可能的靠近,不同人的人臉圖像盡可能的分散開)。模糊lda方法引入了模糊技術來優化特征提取,利用隸屬度信息來描述樣本的分布信息,能得到一個更好的類中心位置估計。應用于yale及orl人臉庫的實驗結果表明,該算法具有較高的識別率。關鍵詞:人臉識別;主成分分析;模糊線性判別分析;特征臉face recognition algorithm based on fuzzy linear discriminant analysisabstractface rec

3、ognition technology is a kind of biological recognition technology. with its immediacy, uniqueness and convenience, etc. it gets more and more widely used in terms of public security, customhouse, traffic, finance, video conference, the study on robots intelligence. face recognition technology is a

4、frontier topic in the field of pattern recognition. in the past few decades, the researchers tried to use a computer to imitate humans ability to recognize faces, and a lot of effective algorithm of face recognition was proposed, and they used different technology increased the average recognition r

5、ate of face recognition algorithm. this paper focuses on a face recognition method which combining with the principal component analysis and fuzzy linear discriminant analysis (flda) algorithm.this method obtains the characteristics space of the training sample with the principal component analysis(

6、pca) algorithm, then on the basis of this calculation, get another fldas feature subspace which has lower dimensions. in this fldas feature subspace, samples of the same category are as near as possible, different types of sample are as disperse as possible (in other words, after the dimension reduc

7、tion, the same person face image are as near as possible, the different human face image are as far as possible). the fuzzy technology is used in fuzzy lda to optimize feature extraction, it can get a better class center position estimate with using membership information to describe the distributio

8、n information of the sample. the experimental results on yale and orl face database show that this algorithm has high recognition rate.keywords: face recognition; principal component analysis; fuzzy linear discriminate analysis; eigenface目 錄1 緒 論11.1 人臉識別的研究背景和意義21.2 人臉識別的發展史和應用31.2.1 發展歷史及發展現狀31.2.

9、2 應用和分類41.3 本文的主要內容與安排52 人臉識別基礎72.1 人臉庫72.1.1 yale人臉庫72.1.2 orl人臉庫82.2 特征提取82.2.1 主成分分析92.2.2 線性辨別分析102.3 分類器設計133 基于子空間分析的人臉識別方法153.1 基于pca的特征臉算法153.2 基于lda的fisher臉算法173.3 基于flda的模糊線性判別分析算法184 基于pca和flda的人臉識別204.1 基于pca+flda的人臉識別算法204.2 實驗仿真214.2.1 yale人臉庫214.2.2 orl人臉庫244.3 小結27結 論28參考文獻30致 謝32附錄

10、源程序清單331 緒 論人臉在日常生活中發揮著重要作用,人類根據人臉進行身份識別和表情判斷,完成日常的交際,人臉因此成為最重要和最自然的身份識別對象。人類有著與生俱來的自動識別人臉的能力,能在劇烈變化不確定因素影響下快速且準確的識別人臉,同時進行身份匹配和表情判斷。身份識別與驗證是人類日常活動中的基本活動之一。在目前的技術水平下,幾乎全部的身份驗證還依靠傳統的物理驗證方式來完成,主要包括身份證件、鑰匙、密碼等,但這些驗證方式存在方便性、可靠性和安全性等問題,因而不能適應社會的發展和需求。因此我們需要更加方便、可靠、安全的身份驗證方式。而生物特征識別技術的出現很好的解決了這一問題,近年來已經逐步

11、成為重要場所必備的安檢手段。與傳統的身份驗證方法相比,生物特征識別技術的優勢在于生物特征是人類固有的特性,可以從根本上杜絕偽造和竊取的現象,從而滿足了人類對于驗證方式可靠性和安全性方面的需求。由于人臉識別對識別對象沒有侵犯性,所以到目前為止是一種最有好的生物特征識別技術。人臉識別系統通過視頻或靜態圖像來自動捕獲和識別人臉,在生物特征認證、監控、安檢、人機交互和多媒體監督等領域有著廣泛的應用前景。人臉識別技術就是通過圖像采集設備捕捉人類的臉部區域,然后把捕捉到的人臉圖像和人臉數據庫中的圖像進行匹配分析,進而完成身份識別的任務。然而,開發一個能完全自動識別人臉的系統是十分困難的,實際環境中,采集人

12、臉圖像的過程會受到人臉姿態、光照條件、面部表情和臉部飾物等諸多不確定因素的影響。過去的幾十年里,研究者嘗試利用計算機模仿人類識別人臉能力,提出了許多人臉識別的有效算法。盡管已經取得很多進展,但到目前為止人臉識別仍然是一個難度很大的課題,識別算法只能在用戶配合、條件理想、小規模的人臉庫上取得較好的識別效果。人臉識別的評估報告表明多數人臉識別方法的最佳性能在人臉姿態,光照,表情和部分遮擋等因素變化時都會發生很大的退化,人臉識別因此成為圖像處理,模式識別,人工智能和計算視覺等領域最活躍的研究課題之一,也是本文的主要研究探討對象。1.1 人臉識別的研究背景和意義人臉識別(face recognitio

13、n)是一種很重要的生物特征識別技術。所謂的生物特征識別技術是指通過對人類固有的特征進行自動的身份鑒別甄選技術。現階段技術水平可依據的生理特征一般為:手型、掌紋指紋、人臉、虹膜、耳廓、dna等;可依據的行為特征如:字跡、步態、語音等。目前,基于這些人類特征,已有相對應的生物識別技術,比如指紋識別、人臉識別、語音識別、虹膜識別、簽名識別、步態識別等。在科技、人文高速發展的現今社會中,基于傳統的物理性的身份標識方法如:證件、鑰匙、用戶名、密碼等,由于其易丟失、易遺忘、易造假、易冒充等問題,已經遠不能滿足人類的需求,現今的人類迫切需要一種快捷、有效并且安全的身份識別、標識方法。而基于生物特征識別的身份

14、鑒定系統與傳統的物理性身份鑒定手段相比,具有唯一性、安全性、可靠性、不易丟失、不易偽造等優點,因此正在逐步取代傳統的身份鑒別方法,在信息安全、金融、交通、公共安全等領域得到了廣泛的應用,并且對其識別技術、識別率等要求越來越高。在各種生物特征識別技術中,人臉識別技術更具有其獨特的優勢,主要有以下幾個方面:(1)隱蔽性強,可在一定距離之外,識別對象不知情的情況下完成識別過程,特別適用于安全監控系統。(2)非接觸式操作,對識別對象沒有侵犯性,可被大多數人接受,理論上來說是最友好的生物特征識別技術。(3)圖像采集數據存儲,成本低廉。(4)用戶界面簡單直接,相比較于文字等信息,圖片信息更容易被人理解,交

15、互性較強。(5)通過對人臉的表情,姿態,口型等分析,能獲得較其他識別技術更多更難以獲得的信息。由此可見,人臉識別技術已經逐漸成為最有發展潛力的生物特征識別技術,是當前的熱門研究課題之一。并已在反恐,人事檔案管理,視頻監控,通行識別管理,人機交互等領域得到廣泛應用,成為自動身份認證領域的主要研究方向。另外,對于人臉識別技術的研究也帶動了多門相關學科的相互促進和相互發展。人臉識別作為典型的圖像模式分析、理解與分類計算問題,其研究面跨越了模式識別、圖像處理分析與理解、計算機視覺、人工智能、認知科學、人工神經網絡、神經生理學、心理學等眾多的學科領域,并為這些學科領域創造新方法、驗證新理論和解釋新現象提

16、供了良好的應用平臺。人臉識別技術的相關研究可以極大地促進這些相關學科領域的發展、創新和成熟,同時這些學科領域的成熟也反過來促進人臉識別技術中問題的解決和技術的革新。1.2 人臉識別的發展史和應用1.2.1 發展歷史及發展現狀人們從事人臉識別技術的研究歷史比較悠久。最早在1888年,calton在nature上發表了一篇關于利用人臉進行身份鑒別的文章,對人類自身對面孔的識別能力進行了分析。人臉識別技術的研究從最開始需要人工干預、識別方法匱乏、識別率低下逐步發展到現在的自動化識別程度較高、識別方法算法豐富、識別率較高階段,大致經過了三個發展階段:第一階段為非自動識別階段,以bertillon,al

17、len和parke為代表,主要研究如何提取人臉特征。1893年,bertillon用一個簡單的語句與數據庫中的某張人臉相連接,同時結合指紋分析,提供了一個完整的身份識別系統。allen為待識別人臉提供了一種逼真的摹寫方法。parke則用計算機實現了這一方法,生成出質量較高的人臉灰度圖模型。這一階段的工作模式特點是需要人工干預,識別過程完全依賴操作人員。第二階段為人機交互階段。1972年,goldstion,harmon等嘗試利用幾何特征表示人臉圖像,他們用21維特征向量表征人臉的面部特征,并設計出基于這種表征方法的識別系統。kaya和kobaysshi則采用統計學方法,利用歐氏距離來表示人臉的

18、面部特征,如嘴唇和鼻子間距,鼻子高度,兩眼間距離等。t.kanad(m.nagao)設計了一個有一定知識導引的半自動回溯識別系統,利用積分投影法從單張圖像上提取計算出一組人臉特征參數,然后利用模式分類技術與標準人臉圖像相匹配,相較于之前的識別系統,kanad的系統實現了快速、實時地處理,這是一個很大的進步。baron將人臉圖像灰度歸一化,再用四個掩模表示人臉,然后分別計算這四個掩模與數據庫中每幅標準圖像相互掩模之間的相互關系數,以此作為判別依據。這一階段工作模式的特點是需要利用操作員的先驗知識,仍然不能算作是一種完全自動的識別系統。第三階段是真正的自動識別階段。上個世紀90年代起,計算機、數字

19、圖象處理、模式識別等技術的發展和人類社會對人臉圖像自動識別系統的迫切需求推動了人臉識別技術的突破,多種基于計算機的全自動人臉識別系統開始問世。1996年,美國軍方組織了一個人臉自動識別系統大賽,勒克菲勒大學的faceit系統獲得冠軍。在這之后,美國lau公司研制出一個人臉圖像自動識別系統,這個系統是一個以正常人眼辨別其他人臉的原理,基于生物測量學、人像復原技術而開發的裝置,利用人臉的12-42個特征點,對人群中待尋找的人進行定量定性的識別,并已應用在機場、車站等公共場所和重點控制地區。現今,隨著社會需求的提高,人臉識別引起了各個科研機構的重點關注,并將研究成果轉化為實用產品。比如vision

20、nics公司的face it人臉識別系統,microsoft公司的trueface系統,和zn boc hum gmbh公司的zn-face系統等。國際上很多公司和研究機構如德國cognitec s ystem gmbh、美國identix inc、viisage及neven vision、韓國三星、日本東芝、麻省理工學院、密西根州立大學、卡耐基梅隆大學、耶魯大學、新澤西理工學院、休斯敦大學等正在對人臉自動識別技術做更加深入的研究。國內對人臉自動識別技術的研究起始于上世紀80年代,相對起步較晚,但清華大學、北京大學、復旦大學、哈爾濱工業大學、北京科技大學、中科院自動化所、中科院計算所等研究單位

21、的研究已經取得了可喜成果,以清華大學智能圖文信息處理研究室研制的th-id人臉識別系統為代表,該系統的測試結果位于國際領先水平。1.2.2 應用和分類隨著人臉識別技術的不斷發展和應用領域的拓寬,人臉識別技術在多個領域的發展前景已經逐漸越來越廣泛。反過來也正是越來越多領域對人臉識別技術的應用和需求愈加增長,大力推動了人臉識別技術的發展速度。歸納起來,人臉識別技術的應用主要分為以下幾類:人臉驗證:人臉驗證是一種身份驗證手段,指利用人臉識別技術來驗證某個人是否確實是他(她)所聲稱的那個人。具體來說大多應用在機場、海關或一些保密部門及出入口控制等場所用以替代或輔助證件驗證來甄別出入人員的身份、證件等的

22、真實性。人臉辨別:人臉辨別主要是應用人臉識別技術來辨別未知身份人員的真實身份。大多應用在公共安全領域:如公安系統中對嫌疑犯、被害人等的身份進行鑒定;銀行、公司等公共場合發生非法分子闖入或異常狀況時先通過視頻監控采集人臉圖像,再利用人臉識別技術與數據庫進行對比,確定闖入者身份。視頻監視:在視頻監視系統中,人臉識別系統的任務目標是在人群中篩選出特定目標并實行跟蹤監控,這是一個典型的動態匹配過程。主要應用于國家安全、公安布防以及機場、海關等反恐監控系統中。視頻監視系統采集的人臉經過相關處理后與數據庫對比,若發現目標人物或危險個體則發出警報,這與人臉辨別有些類似,都是先采集人臉圖像,然后與數據庫中人臉

23、圖像進行一對多的對比匹配,最終確定待測人臉的身份歸屬。隨著人臉識別技術的不斷發展和創新,人臉識別的應用領域將會更加的廣闊。民用市場有很大的可能成為人臉識別技術發展的最有力的支持。如果防盜門采用人臉識別系統來驗證戶主身份,人們將告別鑰匙;簽證、身份證等如果采用電子證件,人臉識別將會是必不可少的應用之一;我國每年僅高考考生就近千萬,如果考生驗證系統采用人臉識別而不是傳統的紙張驗證,無論從安全、快捷、環保等任何一個角度來看都是一個極大的進步,屆時這個巨大的市場也將大大促進人臉識別技術的發展。1.3 本文的主要內容與安排人臉識別技術的算法多種多樣,足夠高的識別率是最重要的指標。本文中,主要采用主成分分

24、析(即pca)和模糊線性判別分析(即flda)兩種算法結合設計一個人臉識別算法。先使用特征臉方法(pca)將人臉圖像的原始數據投影到特征臉空間進行降維,接下來使用fisher臉方法(lda),從特征空間里提取最具判別能力的低維特征,達到進一步降維的作用,最后引入模糊技術改進原始的線性判別分析方法,能更有效的提取判別能力高的、對識別過程有正面效果的信息,盡量消除因訓練圖像中由于光照、姿勢等變化引起的識別性能退化。本文主要內容如下:第一章,緒論。主要介紹了本設計的研究背景和立題意義,人臉識別技術在國內外的發展史、發展現狀,人臉識別技術主要的應用領域及應用分類。第二章,人臉識別基礎知識。由于人臉識別

25、算法的測試都是在公開的基準數據庫上進行,所以在前面首先介紹了有關人臉庫的基礎知識,并介紹了幾個目前學術界較流行的測試用人臉基準數據庫。然后介紹了人臉圖像的特征提取方法的基礎知識以及分類器的設計理念和選用的分類方法。第三章,人臉識別算法介紹及比較。本章介紹了基于主成分分析(pca)的特征臉算法、基于線性判別分析(lda)的fisher臉算法和基于模糊線性判別分析(flda)的算法。第四章,人臉識別算法設計及仿真。本章主要介紹pca+flda算法,并與pca+lda算法進行比較。應用maltab軟件編寫程序進行人臉識別算法設計的實現,并在yale人臉庫和orl人臉庫中進行實驗仿真,求出識別率,繪制

26、識別率曲線。總結此算法的特點。最后是對全文工作的總結。2 人臉識別基礎2.1 人臉庫在人臉識別技術的研究中,必不可少的資源之一是人臉數據庫。任何一個人臉識別系統的設計成形都需要經過測試、仿真或實驗過程,在這個測試的過程中就需要用到包含一定數量人臉圖像的數據庫來生成人臉識別系統的訓練集和測試集。所以人臉數據庫的存在對人臉識別算法的設計、測試、識別率求取和系統性能評估有重大的意義。按照目前人臉識別技術的水平來看,一個可以應用在任何環境、在任何可能出現的非正常情況下都能準確無誤進行識別的人臉識別系統是不可能存在的,由此,所有的人臉數據庫都會附加一些約束條件,比如光照強度、光照方向、表情變化、姿態變化

27、、臉部飾品、人臉尺寸等都受到一定的限制,這些人臉數據庫復雜度的高低又影響了對算法性能的評估結果。所以人臉數據庫的選擇至關重要。下面將介紹幾個目前人臉識別實驗測試中常用的典型人臉庫。2.1.1 yale人臉庫yale人臉庫是人臉識別中很流行的測試數據庫,由美國耶魯大學計算視覺與控制中心創建,包含15位志愿者的165張臉部灰度圖像,每人11張圖像,包含各種表情、光照下的圖像,并且包含眼鏡等遮擋正面人臉圖像。所有的圖像都在不同的光照和表情下正面拍攝的,主要包括:正面光照,左側光照,右側光照,戴眼鏡,不戴眼鏡,高興,面無表情,悲傷,困倦,吃驚,和眨眼等變化。yale人臉庫的主要特點就是光照變化很明顯,

28、且有面部眼鏡遮掩,主要用來測試當前光照和表情變化時,識別算法的性能。圖2.1 yale人臉庫中的光照變化圖2.1給出了yale人臉庫最大的特點,光照變化的示例,這是yale人臉數據庫中一位志愿者的部分人臉圖像,這三張圖像分別是在正面光照、左側光照和右側光照三種約束條件下拍攝的,代表了數據庫中人臉圖像的光照變化情況。2.1.2 orl人臉庫orl人臉庫又被稱為at&t人臉庫,是人臉識別領域最流行的測試數據庫之一。由英國劍橋大學at&t實驗室創建,包含40個不同年齡、不同性別和不同種族的人。每個人有10幅臉部圖像共計400幅灰度圖像,圖像背景為黑色。其中人臉部分表情和細節均有變化,例如笑與不笑,眼

29、睛睜著或閉著,戴或不戴眼鏡等;人臉姿態也有變化,其深度旋轉和平面旋轉可達20度,人臉的尺寸也有最多10%的變化。該庫是目前使用最廣泛的標準數據庫。圖2.2 orl人臉庫中的圖像變化圖2.2是orl人臉庫中一個志愿者的全部十張圖像。通過觀察這十張圖像不難發現,人臉圖像的旋轉變化、姿態變化、表情變化、人臉尺寸變化和眼鏡遮掩臉部等人臉數據庫的約束條件均有涉及到。2.2 特征提取特征提取是計算機視覺和圖像處理中的一個概念。它指的是使用計算機提取圖像信息,決定每個圖像的點是否屬于一個圖像特征。特征提取的結果是把圖像上的點分為不同的子集,這些子集往往屬于孤立的點、連續的曲線或者連續的區域。特征提取是一種數

30、據預處理方法,是指對某一模式的一組測量值進行變換以突出該模式具有代表性特征的方法。是一種提取有效信息的方法。主要針對高維數據的降維處理,通過提取出一部分特征值較高,最具代表性的優秀特征,刪除不相關特征以達到降維的目的,最終目的是減少需要處理的數據量,簡化分類器計算,提高算法的識別準確率。日常生活中我們所見到的圖像都是采用像素空間來表征,這種表征方法使圖像看起來精準易懂,但是這種圖像的維度是很高的,如果把這樣的圖像不經處理直接拿來計算,工作量是非常大的。幾乎全部的識別算法都需要先將圖像降維處理,提取出對識別有用的高特征值信息投影到低維子空間中,但一定要保證低維子空間包含了圖像中絕大部分的基本特征

31、信息,且易于分類。人臉識別系統的第一步工作就是特征提取,也是關鍵性的一步,特征提取的好壞將直接影響測試結果。下面,本文將介紹一種典型的特征提取方法,該方法是目前人臉識別算法中最常見,同時具有最重要地位的特征提取方法,并得到了廣泛的應用和發展。2.2.1 主成分分析主成分分析(principal component analysis,pca)是一種統計方法,它對多變量表示的數據集合尋找盡可能少的正交矢量來表征數據信息特征。作為應用十分廣泛的特征提取方法之一,已在模式識別、信號處理、數字圖像處理等領域得到了廣泛的應用,主成分分析法的基本思想是設法將原來眾多(比如p個)具有一定相關性指標,重新組合成

32、一組新的互不相關的指標來代替原來的指標。主成分分析,是考察多個變量間相關性的一種多元統計方法,研究如何通過少數主成分來揭示多變量間的內部結構,即從原始變量中提取出少數幾個主成分,使它們盡可能多的保留原始變量信息,且彼此間互不相關。通常數學上的處理方法就是將原來p個指標作線性組合,作為新的綜合指標。最經典的做法是用f1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即var(f1)越大,表示f1包含的信息越多。因此在所有線性組合中選取的f1應該是方差最大的一個,稱f1為第一主成分。如果第一主成分還不足以代表原來p個指標的信息,再考慮選取f2即選第二個線性組合,為了有效反映原始信息,f1中

33、已有的信息就不再出現在f2中,即f1和f2的協方差為零,稱f2為第二主成分,以此類推可以構造出第三、第四,第p個主成分。設矩陣表示一個由p個記錄組成的數據集合,每個記錄有n個屬性,即矩陣的元素表示第i條記錄在第j個屬性上的取值,則x的協方差矩陣為。記, ,。可定義如下的線性組合: (2.1) 其中是的矩陣,且,就是主成分。這樣的協方差,使用lagrange方法求解等式下的極大值,即 (2.2)其中是lagrange乘子,使用一般求解方法,可求出最優解,顯然,最優解就是原始數據協方差矩陣的特征向量,是與相對應的特征值。這樣可以利用矩陣的奇異值分解(singular value decomposi

34、tion, svd)求出s的特征值和特征向量。2.2.2 線性辨別分析關于線性鑒別分析(lda)的研究可追溯到fisher在1936年發表的經典論文(fisher r a. the use of multiple measurements in taxonomic problems),其基本思想是選擇使得fisher準則函數達到極值的向量作為最佳投影方向,從而使樣本在該方向上投影后,達到最大類間離散度和最小類內離散度。在fisher思想的基礎上,wilks和duda分別提出了鑒別矢量集概念,即尋找一組鑒別矢量構造子空間,以原始樣本在該子空間的投影矢量作為鑒別特征來用于識別。lda采用fishe

35、r線性判別函數而得以實現,最初被用于解決兩類的分類問題。我們一般直接利用樣本集設計分類器,來把兩類分開。具體點說,就是先給定某個判別函數,然后利用樣本集確定判別函數中的未知參數。線性判別函數是一種較簡單的判別函數。它首先假定判定函數g(x)是x的線性函數,即: (2.3)需用樣本去估計w和,并把未知樣本x歸類到具有最大判別函數值的類別中去。本文主要研究fisher線性判別函數如何確定。為了把兩個類分開,我們可以嘗試把d維空間的樣本直接投影到一條直線上,形成一維空間,即把維數壓縮到一維。當把d維空間里的若干緊湊的集群投影到一條任意的直線上,結果可能是幾類樣本混在一起而變得無法識別。但一般情況下,

36、總可以找到某個方向,使得在這個方向的直線上,樣本的投影能分得最開。現在的問題是如何找到這條最優的、最易于分類的投影線。假設有n個樣本,其中前個樣本屬于類,后個樣本屬于類,把樣本往方向為w的直線上投影,就可以得到: (2.4)從幾何方面看,要得到在方向w的直線上的投影,需要有,而實際上w的長度并無實際意義,只是對改變比例而已,重要的是w的方向。我們希望落在直線上的類的樣本和類的樣本投影能很好的分開而不是混在一起。可用樣本均值差來度量投影之間的可分性,設是每類的個d維樣本的均值: (2.5)投影之后各類樣本均值: (2.6)可以得到投影后的均值差: (2.7)只要對w給予適當的值就可以使差值變得任

37、意大。事實上,為使投影數據獲得較好的分離,只要求這兩個均值差比每類的標準差較大即可,即: (2.8)其中,對于屬于一類的投影樣本的類內離散度: (2.9)把作為所有樣本的方差估計。稱為投影樣本總的類內離散度。而fisher線性判別函數被定義為這樣的一個函數,它能使判決函數: (2.10)達到最大。顯然,為了使j最大,應使兩類均值差越大越好(各類樣本分布盡量分離開),而各類類內離散度越小越好(各類樣本內布盡量密集)。為把j表示為w的顯函數形式,定義樣本類內離散度矩陣和總類內離散度矩陣如下: (2.11) (2.12)由于: (2.13) (2.14)因此: (2.15)由此: (2.16)矩陣稱

38、為總類內離散度矩陣,是對稱的半正定的,當nd時它通常是非奇異的。引入,可以將fisher線性判別函數寫成: (2.17)則基于fisher線性判別函數的fisher準則即為: (2.18)這個公式是數學物理中的廣義rayleigh商。為求得最優鑒別向量,將j對w微分即得: (2.19)需: (2.20)設,不難看出,使j達到極大的向量w必須滿足: (2.21)很顯然這是一個求解廣義特征值的問題,若非奇異,則可得到一個一般特征值問題: (2.22)我們把的特征向量稱為fisher鑒別向量。fisher鑒別向量使類間離散度與類內離散度比值達到最大,這樣就把高維樣本(n維問題)轉化為一維樣本(1維問

39、題)并在一維空間上保持最優的鑒別力,也就是說fisher鑒別向量能將高維模式以最優的可分性指標轉換成一維模式。2.3 分類器設計分類器的設計是人臉識別系統設計過程中的一個重要環節。將待測圖像的特征提取出來之后,接下來就需要利用已經提取出來的特征向量來計算辨析圖像間的相似程度,確定圖像中人臉的身份歸屬。一般情況下最常用的辨析與分類方法都是借助于模式識別和機器學習。如最近鄰方法、貝葉斯決策、人工神經網絡和支持向量機等。本文的工作重心是圖像的特征提取算法,因此分類方法選用了最基礎最常用的距離分類法。所謂距離分類法,是一種簡單且直觀易懂的分類方法,它直接使用各類訓練樣本點的特征集合所構成的區域來表示各

40、個決策域,以樣本點間距離作為度量樣本間相似程度的主要標量,即定義空間中兩點間距離越近,則代表兩個樣本間相似度越高。樣本間距離有多種計算方法,在各種計算方法中,歐氏距離是最常見的距離分類方法:歐氏距離又被稱為范式,廣泛應用于向量間距離度量,定義如下: (2.23)式(2.32)中,表示輸入特征矢量x的第i個分量,表示參考特征矢量r的第i個分量,k表示特征矢量維數。則相應的點和類間最小歐氏距離定義如下: (2.24)式(2.33)中,表示參考類的第c個特征矢量的第i個元素,表示熟人特征矢量和參考類全部c個參考特征矢量間歐氏距離的最小值。本文在歐氏距離分類的基礎上,應用最近鄰分類器對人臉特征矢量進行

41、分類識別,即定義待測樣本與距離其最近的訓練樣本是屬于同一類別的。3 基于子空間分析的人臉識別方法人臉識別技術經過多年的發展,取得了很大的進步,涌現出大量的識別算法。這些算法涉及到的學科領域非常廣泛,包括模式識別、圖像處理、計算機視覺、人工智能、統計學習、神經網絡、小波分析、子空間理論和流形學習等眾多學科。所以很難用一個統一的標準對這些算法進行分類。本文中提到的主成分分析、線性判別分析和模糊線性判別分析算法主要應用的是子空間分析方法,子空間分析方法的思想是以一定的特征提取的性能目標為準則,將人臉圖像從原始的圖像空間投影到一個低維的子空間中,不但降低了算法的計算量,而且保持了人臉圖像在低維空間中的

42、可分性和獨立性。該類方法由于其計算量小、可分性好和描述能力強等優點已成為人臉識別的主流方法之一。基于子空間分析方法的人臉識別算法主要有主成分分析,線性辨別分析,獨立成分分析和非負矩陣因子等,其中基于pca的特征臉法在對高維圖像進行降維處理方面取得了很大的成效,并在特征提取的過程中依然保持了數據原有的可分性,是子空間分析方法中的首選算法。基于lda的fisher臉法利用原始數據中的類標信息進行數據降維,能更有效地提取對分類有用的特征,顯著的提高了人臉識別算法的性能。3.1 基于pca的特征臉算法主成份分析(pca)方法是模式識別領域里一種占有非常重要地位的特征提取方法。該方法通過k-l變換展開式

43、來提取樣本的主要特征。由于它保留了原向量在其協方差矩陣最大特征值對應的特征向量方向上的投影主分量,所以被稱為主成分分析。在人臉識別領域中pca方法又被成為特征臉方法。這是因為通過pca方法對原始人臉數據提取出來的特征向量投影到新的低維子空間后仍然是人臉的形狀,因此它被稱為“特征臉”,它保留了人臉圖像的基本信息而去除了無用信息,簡化了計算。在人臉識別中,記訓練集合包含了c個人的n幅臉部圖像。如果每幅圖像的大小為,pca方法首先將其按列方式拉伸為一個維的列向量來表示。例如,yale數據庫中的圖像大小為,就可以用一個45045維的列向量來表示。設m幅圖像構成訓練集,記為,則訓練數據的協方差矩陣為:

44、(3.1)其中為均值向量: (3.2)令: (3.3)則: (3.4)顯然,c的維數為。如果直接計算c的特征值和特征向量,那么計算代價非常高。為了解決這個問題,下面給出一種更加有效的計算方法。構造矩陣,矩陣b的維數為。根據奇異值分解原理,矩陣b和c的特征值是相等的,通過求解b的特征值和特征向量來獲得c的特征向量。對矩陣b使用pca算法,求出m個單位正交特征向量和對應的特征值,并將特征向量按照其對應特征值大小降序排列。特征臉定義如下: (3.5)其中是第特征向量。求得特征臉后,利用特征值選擇合適數量的特征向量,也就是選取合適的特征臉個數,一般選擇個特征臉,以這些特征臉作為基礎,足以表示和區分所有

45、人臉。通過(3.6)式即可將訓練集中的圖像投影到特征空間中: (3.6)一幅圖像投影完,可形成一個向量,其中,這個向量就是原始圖像在特征空間中的表示,每個分量都代表對應的特征臉在表征這幅圖像中的重要度。識別過程中,遇到的新圖像,按(3.7)式投影到特征空間: (3.7)投影完后形成向量即是該圖像在特征空間中的表示。按照式(3.8)計算新圖像和訓練集中圖像的距離: (3.8)其中。如果特別小,說明新圖像和訓練集中圖像最相似,即可認為圖像和是同屬于一個人的圖像。給訓練集設定一個閾值,若存在使得成立,則可以繼續判斷圖像隸屬于訓練集中哪個人,若所有的都大于,則判定圖像不屬于人臉庫中任何一人。3.2 基

46、于lda的fisher臉算法fisher臉算法目的是尋求一個線性變換w,使圖像在該變換作用下投影到特征子空間,同一個人的所有圖像盡可能的聚集在一起,不同人的圖像盡可能分開。換言之,就是尋找一個投影空間,使得訓練圖像投影到該空間后類間散度和類內散度比值最大。記訓練集合包含了c個人臉n張臉部圖像,則其類間散度矩陣和類內散度矩陣如下: (3.9) (3.10)式中, 為第i類訓練樣本總個數,是第i類均值,m是所有樣本均值。如果是非奇異的,那么lda算法準則函數為: (3.11)其中是與和的前p個最大廣義特征值對應的廣義特征向量,即有: (3.12)廣義特征值個數最多c-1個,其中c是訓練集中類別數。

47、識別階段,將測試集中的圖像x按式(3.13)投影到特征空間: (3.13)按照式(3.14)計算新圖像和訓練集中圖像的距離: (3.14)其中。如果最小,說明測試圖像x和訓練圖像最相近,可認為圖像x和同屬一人。3.3 基于flda的模糊線性判別分析算法在圖像處理領域,大多問題都存在著固有的不確定性,基于這一問題,很多的課題研究都利用模糊技術來盡量消除這些不確定因素。尤其人臉圖像由于受到環境條件的影響較大,其表觀都會發生不同程度的變化。如果在最開始的特征提取過程中就考慮到這些不確定因素并加以量化,那么算法的性能就會有一定的提高。keun-chang kwak等提出模糊線性判別(flda)方法,引

48、入模糊技術改進了原始的lda線性判別分析方法,flda方法能更加有效的提取對識別有用的信息。訓練樣本的隸屬度信息描述了樣本的分布信息,較好的反應訓練圖像中由于光照、姿態等不確定因素引起的變化。記訓練集,共包含c個人的n幅臉部圖像。應用k近鄰方法計算訓練集中所有樣本的隸屬度矩陣,其中表示第j幅圖像屬于第i個人的隸屬度。根據模糊集約束,隸屬度要滿足如下兩個條件: (3.15)k近鄰方法計算隸屬度過程如下:首先計算訓練集中任意兩個樣本間距離,然后記錄每個樣本附近與該樣本最鄰近的k個樣本的類別信息,最后可根據式(3.16)計算第j個樣本屬于第i類的隸屬度: (3.16)其中,是第j個樣本k個最鄰近點中

49、屬于第i類的樣本個數。不難驗證,如此計算得到的滿足式(3.15)中兩個約束條件。得到樣本隸屬度后,就可以計算模糊線性判別分析的投影矩陣了,利用最優投影矩陣將訓練樣本投影至子空間中,可以得到人臉在fisher準則下的最優表示。首先計算所有訓練樣本的均值m: (3.17)再利用得到的隸屬度重新計算每個人人臉向量的均值,即每一類的中心: (3.18)接下來計算模糊類間散度矩陣和模糊類內散度矩陣: (3.19) (3.20)則根據fisher準則可以得到最優投影矩陣: (3.21)其中,是與矩陣和的廣義特征值相對應的廣義特征向量。4 基于pca和flda的人臉識別4.1 基于pca+flda的人臉識別

50、算法綜合第三章提到的三種人臉識別算法,不難發現,flda算法具有最好的分類效果,但flda算法存在兩個不可避免的問題:第一是由于人臉圖像的高維數產生的計算復雜問題;第二是奇異。針對這兩個問題,本文采用先使用pca方法對人臉空間進行降維的方法來解決。具體步驟如下:1) 應用主成分分析(pca)方法對人臉空間進行特征提取(同時降維)后投影到特征臉空間。2) 應用模糊線性判別分析(flda)方法在特征臉空間中線性分類,計算出最優投影矩陣。需要注意的是,第一步pca對人臉空間降維過程中,特征臉空間的維數要謹慎選擇,維數選擇得當則可以解決奇異的問題,同時保證降維后的特征臉空間盡可能保留了原始圖像空間的線

51、性可分性。本文在pca降維處理后的特征臉空間中選取flda作為分類算法而不是lda,其主要原因是flda方法引入了模糊技術,利用樣本隸屬度信息對類中心重新計算,能得到較lda方法更好的類中心估計,反映在圖像上就是能更好的描述訓練圖像由于光照等不確定因素引起的變化,提高了整體算法的識別率。由此可見,pca+flda的人臉識別算法是一種比較優秀的算法,它既包含了pca算法能在均方誤差最小情況下對原始圖像進行降維重構的優點,又包含了flda算法優秀的分類識別能力。顯著的提高了識別算法的識別準確率和計算效率。整體算法結構圖如下圖所示:顯示識別結果訓練圖像測試圖像隨機讀取圖像pca特征提取flda線性分

52、類歐氏距離分類圖4.1 pca+flda算法結構圖4.2 實驗仿真由于圖像的本質就是由若干像素點排列成點陣,因此圖像處理可以等同于矩陣計算。而matlab眾所周知擁有強大的矩陣計算能力,所以本設計實驗平臺選用了matlab,人臉數據庫則選用yale和orl兩個常用人臉庫。實驗時在人臉數據庫中隨機抽取訓練集樣本與測試集樣本,并在同等條件下進行多次重復實驗,最后計算識別率并繪制曲線圖。4.2.1 yale人臉庫yale人臉庫包含15位志愿者共165張人臉圖像,每人11張灰度圖像,包含各種表情、光照下的圖像,并且包含眼鏡等遮擋正面人臉圖像。yale人臉庫主要特點是光照的變化明顯。測試過程如下:(1)

53、按人臉庫路徑讀取全部人臉圖像,并用矩陣形式存儲在數據庫中;(2)從全部人臉圖像中隨機抽取每人6張,共計90張圖像作為訓練集。剩下的每人5張,共計75張圖像為測試樣本; (3)利用主成分分析方法(pca)對人臉圖像進行降維處理,提取特征信息,投影到子空間生成特征臉空間,如圖4.2所示:圖4.2 特征值2.78e+07的特征臉(4)在經過pca方法降維處理后的特征臉空間上應用奇異值分解(svd)和flda算法計算出新的最優投影矩陣。(5)將全部圖像向最優投影矩陣上投影,得到識別特征,然后利用最近鄰準則判別分析完成人臉識別過程。隨機抽取測試集待測人臉圖像如下圖所示:圖4.3 測試集第7張人臉圖像程序

54、運行結果顯示訓練集中與圖4.3最相似人臉圖像如下圖:圖4.4 訓練集中與圖4.3最相似人臉圖像(6)相同條件下重復實驗50次,求出pca+flda算法下的平均識別率和方差,繪制識別率曲線圖。平均識別率:mean(precisionflda) =96.9600%方差:std(precisionflda) =1.5437識別曲線如圖4.5所示:圖4.5 yale上識別率曲線圖圖4.5中,橫坐標表示實驗次數,縱坐標表示識別率百分比。4.2.2 orl人臉庫orl人臉庫又被稱為at&t人臉庫,由英國劍橋大學at&t實驗室創建,包含40個不同年齡、不同性別和不同種族的人。每個人有10幅臉部圖像共計400

55、幅灰度圖像,圖像背景為黑色。其中人臉部分表情和細節均有變化,人臉姿態也有變化,人臉的尺寸也有最多10%的變化。每幅圖像大小為112*92.實驗過程如下:(1)按人臉庫路徑讀取全部人臉圖像,并用矩陣形式存儲在數據庫中。(2)從全部人臉圖像中隨機抽取每人6張,共計240張圖像作為訓練集。剩下的每人4張,共計160張圖像為測試樣本。 (3)利用主成分分析方法(pca)對人臉圖像進行降維處理,提取特征信息,投影到子空間生成特征臉空間,如圖4.6所示:圖4.6 特征值0.18e+06的特征臉(4) 在經過pca方法降維處理后的特征臉空間上應用奇異值分解(svd)和flda算法計算出新的最優投影矩陣。(5)將全部圖像向最優投影矩陣上投影,得到識

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論