



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基于局部特征和整體特征融合的面部表情識別劉 松 應自爐 時間:2008年10月09日 字 體: 大 中 小關鍵詞:人臉特征點測量距離特征提取人臉識別摘要: 提出融合局部特征和整體特征的方法實現人臉面部表情特征的提取。在每一個人臉圖像上測量10個距離,把這些距離標準化后作為局部表情特征,用Fisher 線性判別提取面部表情的整體特征;為了解決小樣本問題,采取“PCA+FLD”的策略,先通過PCA把人臉圖像向量投影到一個較低維的空間,再通過標準的FLD提取表情特征。融合后的特征輸入到基于反向傳播的前向型神經網絡進行分類。在耶魯大學yaleface數據庫和日本ART建立的日本女性表情數據庫(JAFF
2、E)上實驗,得到令人滿意的結果。關鍵詞: 局部特征 整體特征 表情識別 FLD PCA 神經網絡隨著人機交互研究的深入和巨大的應用前景,人臉面部表情識別已經成為當前模式識別和人工智能領域的一個研究熱點。在過去幾十年內,研究者已經提出了很多用于面部表情識別的方法1。目前的人臉面部表情識別方法可以分為兩種:基于局部特征和基于整體特征的。基于局部特征的人臉面部表情識別是利用每個人的面部特征(眉毛、眼睛、鼻子、嘴巴和面部輪廓線等) 的位置、大小及其相互位置的不同進行特征提取,達到人臉面部表情識別的目的。基于人臉整體特征的識別是從整個人臉圖像出發,提取反映人臉整體的特征實現人臉面部表情識別。基于局部特征
3、的方法很大程度上減少了輸入的數據,但是用有限的特征點來代表人臉圖像,一些重要的表情識別和分類信息就會丟失。為了彌補局部特征的這些不足,本文用 Fisher 線性判別提取面部表情的整體特征,然后通過局部特征和整體特征的融合來提高識別率。Fisher準則函數就是為了發現這樣的投影方向,使得樣本類間離散度和樣本類內離散度的比值最大。換言之,就是在這樣的投影方向,同一個類的樣本聚集在一起,而不同類的樣本相對比較分散。1 面部表情特征的提取1.1 局部特征的提取人臉由眼睛、鼻子、嘴巴、下巴等部件構成,正因為這些器官的形狀、大小和相對位置的各種變化才使得人臉表情千差萬別。因此對這些器官的形狀和結構關系變化
4、的幾何描述,可以作為人臉表情識別的重要特征。最早,研究人員利用人臉特征顯著點導出一組用于識別的特征進行人臉及其表情識別2 。本文在人臉圖像上標記24個面部特征點,如圖1所示。由這24個面部特征點形成12個測量距離,距離與面部特征點之間長度的對應關系如表1。表1中tij表示面部特征點i和j之間的直線長度,di表示第i個測量距離。由這些測量距離歸一化,即按照下式形成表征面部表情的特征:1.2 整體特征的提取Fisher線性判別(FLD),也稱為線性判別分析 (LDA),是基于樣本的類別進行整體特征提取的有效方法,在模式識別中有著廣泛的應用。設訓練樣本集共有N 個訓練樣本x1,,xN,分為c類x1,
5、,xc,每一類的均值為: i=xk;總均值為:xk;第i類樣本的離散度矩陣為:由于最多只有c-1個非零廣義特征值,因此m的最大值為c-1。在人臉面部表情識別研究中,所面臨的一個問題是小樣本問題,即用于訓練的圖像數目N是遠小于每幅圖像的像素數目。本文采用“PCA+FLD策略,先將訓練樣本的人臉圖像向量投影到一個較低維的空間,使類內分布矩陣為非奇異的。可以通過PCA將特征空間降為N-c維,然后通過標準的FLD 將維數降為c-1。通過PCA將人臉圖像投影到N-c維特征空間:需要指出的是, Wpca的優化是基于由正交列向量組成的n(N-c)維矩陣,而Wfld的優化是基于由正交列向量組成的(N-c)n維
6、矩陣,在計算Wpca時只丟掉了最小的c-1維主成分向量。2 前向型神經網絡本文用基于反向傳播算法的前向型多層神經網絡識別人臉面部表情,為了更好地提高人臉面部表情的識別率,如何優化設計網絡結構和參數是關鍵。對于網絡的大部分參數,采取實驗修正的方法進行確定。本文采用的網絡結構為三層:輸入層有15個輸入單元對應融合后的表情特征,隱含層用10個神經元,網絡的輸出用兩個神經元代表兩位二進制數表示不同面部表情。基于反向傳播的前向型神經網絡的基本思想是據樣本集S=(x1,y1),(x2,y2),(xs,ys)中的每一個樣本(xk,yk)逐一計算出實際輸出Ok的誤差測度El,對W(1),W(2),W(L)各做
7、一次調整,重復此循環,直到Ep。用輸出層的誤差調整輸出層權矩陣,并用此誤差估計輸出層的直接前導層的誤差,再用輸出層前導誤差估計更前一層的誤差。如此獲得所有其他各層的誤差估計,并用這些估計實現對隊矩陣的修改。形成將輸出端表現的誤差沿著與輸入信號相反的方向逐級向輸入端傳遞的過程。本文采用基于隨機梯度下降版本的BP算法完成人臉面部表情的分析與識別。具體的算法描述如下:(1)初始化,初始化所有網絡權值為小的隨機數。(2)直到終止條件do對于每一個訓練樣本do 把輸入向前傳播到網絡并計算被考察的輸出按下式計算誤差,并把誤差反向傳播:對于每個網絡輸出單元k,計算其誤差量k=ok(1-ok)(tk-ok)
8、結束3 實驗過程和結果在兩個數據庫上進行實驗,從耶魯大學的yaleface數據庫中選取60幅人臉圖像作為實驗樣本,共15個人,4幅/人,其中訓練樣本56幅,14個人;4幅/人;測試樣本為剩下的4幅圖像,1個人,4幅/人,通過隨機變換訓練樣本和測試樣本,重復15次這樣的實驗。從日本女性表情數據庫中(JAFFE)選取120幅圖像作為實驗樣本,共10個人,12幅/人,其中80幅圖像作為訓練樣本,10個人,8幅/人;測試樣本為40幅圖像,10個人,4幅/人。通過隨機變換訓練樣本和測試樣本,重復12次這樣的實驗。人臉面部表情識別的步驟如下:(1)圖像的預處理。文獻3指出人臉識別的對象應該是純臉(pure
9、 face),而不應包括頭發、肩膀和背景等不相關的數據。如果待識別的人臉圖像中含有這些非純臉的信息,很有可能是這些信息對決策起關鍵作用,也不再是真正意義上的人臉識別。因此本文首先用人工的方法,對圖像做純臉部分的分割形成5060的圖像。然后對純臉圖像進行標準化和歸一化處理,以便表情特征的提取和面部表情的分析與識別。(2)局部特征提取。首先在面部標記24個面部特征點,如圖1;然后按照表1的關系得到12個測量距離;最后按公式(1)把這些測量距離標準化后形成12維向量作為表征人臉面部表情的特征。(3)整體特征的提取。用Fisher線性判別提取面部表情特征,關鍵是如何解決小樣本問題,本文采取“PCA+F
10、LD”策略。在耶魯大學yaleface數據庫上用m=N-c=52維特征向量構造特征子空間。在JAFFE上用m=N-c=76維特征向量構造特征子空間,其中N為訓練樣本數目,c為類別數;然后FLD變換到c-1=3維特征空間作為表示面部表情特征的一部分特征。(4)特征融合。本文表征面部表情特征的局部特征與整體特征融合在一起,形成15維特征,把X輸入到神經網絡的輸入層。(5)表情識別。本文用15102基于反向傳播的前向型神經網絡進行人臉面部表情的分析與識別。對于網絡參數,例如隱含層神經元數目等本文采取實驗修正的方法。表2和表3分別是yaleface 數據庫和日本女性表情數據庫(JAFFE)上的識別結果。參考文獻1 Maja Pantic,Leon J. M .Rothkrantz. Automatic Analysis of Facial Expressions: The State of the Art, IEEE Trans. On Pattern Analysis and Machine Intelligence, 2000;2(12)2 T. Kanade. Computer recognition of human faces. Basel &Stuttgart:Birkhauser Verlag. 19773 Li-Fen Chen. Why recogn
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 艱難梭菌來源的膜囊泡通過抑制滋養細胞運動性促進胎兒生長受限的機制研究
- 電商平臺中用戶信息回避行為影響因素研究
- Co、Zn碲化物-單寧炭的制備及其在鋰硫電池中的應用研究
- 上海新江灣城植被動態與植物景觀特征研究
- 事件:一次難忘的運動會經歷記事作文15篇
- 金屬銅棒采購合同
- 城市公交線路規劃方法及仿真關鍵技術研究
- 2024年黑龍江省民族宗教事務委員會下屬事業單位真題
- 魏晉南北朝志怪中的“三國”故事研究
- 秋天的童話秋天的魂1200字(14篇)
- 鄉村治理-課件
- 教師教學對話分析方案T-SEDA可編輯模板
- 國開《人工智能專題》終考試題及答案
- 增材制造技術發展課件
- 市級課題結題報告-“雙減”背景下小學數學課堂開展學生“項目式學習”的實踐研究(優秀等次)
- 暨南大學《馬克思主義基本原理概論》題庫歷年期末考試真題分類匯編及答案
- DB44-T 2267-2021《公共機構能源資源消耗限額》-(高清現行)
- DLT 1055-2021 火力發電廠汽輪機技術監督導則
- 青霉素的發現與作用課件
- 學校后勤服務滿意度調查問卷
- 施工進度計劃網絡圖、橫道圖
評論
0/150
提交評論