



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一種改進的ldp人臉描述方法
1局部二元模式人臉描述方法人臉識別廣泛應用于門禁系統、攝像頭監控系統、身份識別、網絡支付、信息安全、刑事司法等領域。隨著軟硬件技術的發展,人臉識別領域在最近幾十年獲得了長足的發展。人臉描述是人臉識別系統的核心技術,這一問題受到了普遍關注,涌現出了大量的人臉描述方法。根據人臉表示數據的空域特性,可將人臉描述方法分為基于全局特征[1,2,3,4,5,6,7,8,9,10,11]和基于局部外觀特征兩大類。其中,局部二元模式(LBP,localbinarypatters)人臉描述方法由于其簡單的原理和卓越的人臉識別性能受到了廣泛的關注,文獻和對原始LBP算子和擴展算子LBPu2P,R作了詳盡的論述。但是,LBP具有對非單一光照的變化和隨機噪聲比較敏感的缺點。為此,Jabid等人提出了一種對噪聲更具魯棒性的局部方向模式(LDP)人臉描述方法。LDP充分利用局部邊緣梯度信息進行人臉特征的表達,但是LDP僅僅參照了局部3×3鄰域的梯度信息而忽視了更大范圍的梯度信息。從對噪聲信號進行平滑操作的角度,小范圍采樣受到噪聲干擾的程度要大于大范圍采樣。本文針對LDP的不足提出了一種改進的LDP(ILDP)方案,利用局部井型鄰域的邊緣梯度值進行人臉特征提取。實驗結果表明,無論是復雜面部的狀態變化情況,還是在無人眼定位等圖像預處理情況,ILDP比同類基于局部紋理的單一人臉描述器更具魯棒性。2il審判2.1局部作用下的ldp模式人臉圖像的每個像素點都有一個局部3×3鄰域,該像素點處于鄰域的中心。鄰域中心像素點的四周8個點處于不同的方向,從正東、東北、正北、西北、正西、西南、正南、直到東南。將該局部3×3鄰域的灰度值與8個Kirsch模板(參見圖1)卷積得到8個邊緣梯度值mi(i=0,1,…,7),這些梯度值分別位于上述8個不同的方向。一個LDP模式表示為一個八位二進制數——LDP碼,該數的每一位分別代表這8個方向。將邊緣梯度值的絕對值|mi|進行排序,求出第k大的值|mk|,并將大于等于|mk|的|mi|對應的第i位二進制數設置為1,剩余8-i位設置為0。圖2給出了LDP碼的計算過程,圖3給出了k=3時計算LDP碼的一個實例。2.2ildp碼的計算為考察局部更大范圍的梯度信息,設計了局部井型鄰域,如人臉圖像某中心像素點(i,j)的井型鄰域參見圖4。井型鄰域與傳統的3×3鄰域相比采樣范圍更廣,包含采樣半徑R=1和R=2;而與傳統的5×5鄰域相比采樣點更少,只有16個像素。同時,以(i,j)點為中心,井型鄰域的16個采樣點所在徑線不重疊,這保證了在采樣充分的前提下而避免了信息的冗余。ILDP將局部中心像素的井型鄰域16個像素根據采樣半徑(R=1或2)分成兩組{Pi}和{Qi}(i=0,1,…,7)并排列成兩個3×3子鄰域,將{Pi}和{Qi}分別與8個Kirsch模板卷積,得到兩組邊緣梯度值{pi}和{qi}。邊緣梯度值pi和qi的正負號代表兩個相對立的梯度變化趨勢,正號表示梯度上升,而負號表示梯度下降。再加上人臉圖像局部像素灰度值在空域存在相關性,因此ILDP不對邊緣梯度求絕對值,而直接利用{pi}和{qi}中各自的最大值的方向作為局部特征信息,同時用pi或qi的下標i代表pi或qi所在的方向。設pa是{pi}的最大值,qb是{qi}的最大值,中心像素的ILDP模式可用一個兩位的八進制數(ab)8表示,稱該數為ILDP碼,可由ILDPcode=a×81+b×80(1)轉換為十進制數。a和b均可取8個值,所以ILDP模式共有82=64種。圖5描述了ILDP碼的完整計算過程。一張人臉圖像的所有像素分別以己為中心獲取井型鄰域并轉換成ILDP碼,所有像素的ILDP碼根據原圖坐標排列而形成對應的ILDP圖,該人臉圖像就可用對應的ILDP圖代表。圖6給出了一張來自YALE人臉庫的人臉圖像和對應的ILDP圖。2.3子塊直方圖的形成通過對人臉圖像的ILDP圖進行直方圖統計提取人臉的鑒別特征,直方圖包含了局部邊緣梯度值的分布信息。為了獲取空域的信息可將人臉圖像劃分成一定數量的子塊B1,B2…Bm,分別提取每一個子塊的直方圖HRi=(hi,0,…,hi,63)。直方圖為hi?j=∑x?yJ((x?y)∈Ri)J(C(x?y)=Cj)?1≤i≤m;0≤j≤63(2)其中:C(x,y)是像素(x,y)的ILDP碼,J(A)是一個布爾函數,當A為真時函數值為1,反之為0。將各子塊的直方圖連接形成連接直方圖,該連接直方圖作為人臉的特征表達,圖7給出了連接直方圖的形成過程。最終,提取的人臉特征由一個64×m維向量(即連接直方圖)所描述。2.4log相似性統計在人臉識別階段,可用直方圖正交、Log相似性統計和卡方統計等非相似性度量工具計算提取的人臉連接直方圖間的距離。Log相似性統計在小窗口尺寸上性能較差,卡方統計的性能比直方圖正交更好,故本文采用卡方統計非相似性度量。卡方非相似性度量定義為χ2(Η1?Η2)=∑i(h1i-h2i)2h1i+h2i(3)另外,為簡便,采用最近鄰分類器進行分類,這并不影響對同類描述器的性能對比結果。3溫度和圖像域變換操作通過實驗對幾種性能最佳的基于局部紋理特征的單一人臉描述器的性能進行評估,包括CS-LBP、LDP、LBPu28,1和本文提出的ILDP。所謂單一人臉描述器是指該方法沒有采用圖像域變換和圖像濾波等復雜操作,這些操作不僅大大增加了時間開銷,而且破壞了實驗對比的公平環境。比如Gabor小波變換對CS-LBP、LBP、LDP、ILDP的鑒別性能都有所提高,但是性能提高有限而時間開銷大幅上升。實驗分為兩個類型,第1類是常規的無人為添加噪聲的實驗,第2類是人為添加噪聲的實驗。所有的實驗均在IntelT2350+RAM1G+WindowsXP平臺上進行,使用Matlab7.9得出實驗數據。3.1對orl人臉庫的選擇為驗證在既包含光照變化又包含表情和小飾物變化的情況下識別性能的對比,選擇YALE人臉數據庫。YALE庫包含15個人,每個人11張共計165張圖片。每個人的圖片包含光照(左、中、右),表情(正常、高興、悲傷等)和小飾物(戴眼鏡、不戴眼鏡)的變化。所有圖片根據人的兩眼坐標進行校準,然后裁剪并調整分辨率為100pixel×100pixel,圖8(a)給出了一個人經過預處理后的11張人臉圖像。為了驗證在沒有人眼標定、坐標重定位、分辨率調整并進行裁剪等有利于識別的預處理情況下的識別性能,ORL人臉庫被選作第2個實驗數據庫。ORL人臉庫包含40個人的400張圖片,每個人10張。每個人的圖片包含表情(閉眼和睜眼、笑和不笑)、面部有無眼鏡以及10%以內的尺度變化,同時部分人的部分圖片是在不同的時間采集的。所有圖片背景都是黑色,分辨率是92pixel×112pixel,部分圖片有20°以內的角度變化。對該庫的圖片不做任何的預處理,圖8(b)給出了其中一個人的10張圖片。另外,以上兩個個實驗庫的圖片格式都為BMP。3.2實驗結果和討論共進行兩組實驗,分別在上述的兩個實驗數據庫中進行。YALE庫和ORL庫中圖片都劃分成5×5個子塊。同時,為比較不同大小訓練集情況下的識別性能,隨機選擇每個人的k(k=2,3,4,5,6)張樣本圖像構成訓練集,剩余的樣本圖像形成測試集。每一種情況重復10次實驗,記錄實驗中的正確識別率,并計算平均識別率和標準偏差。表1給出了在YALE人臉庫上的實驗結果,表2給出了ORL庫上的實驗結果。表1的數據表明,ILDP在有光照、表情和小飾物變化下的人臉識別性能優于LDP和CS-LBP,跟LBPu28,1的性能互有高低。表2的數據表明,在無進一步圖像預處理的ORL人臉庫中,ILDP的性能要稍優于其它幾種方法。3.3實驗結果和討論分別在YALE人臉庫和ORL人臉庫上進行兩組實驗,同樣將圖像劃分為5×5個子塊。這里不再考察訓練樣本數對識別率的影響,故將每個人的前5張圖像作為訓練樣本,剩余的圖像作為測試樣本。由于現實中噪聲來源復雜,并且每張圖像受噪聲污染的程度也千差萬別,因此試驗中很難準確模擬噪聲污染的各種參數。采用人臉識別仿真實驗中常規的添加噪聲方式。首先,只對測試樣本圖像人為添加噪聲,而訓練樣本沒有故意添加的噪聲;其次,噪聲模型選擇高斯白噪聲,其均值設為0,歸一化方差分別設置為0.0001,0.0002,0.0003,0.0004,0.0005。在每一個實驗庫中一個特定設置的噪聲參數下進行10次實驗,記錄每次實驗的正確識別率并計算每一種情形下的平均正確識別率。在兩個實驗庫中的結果分別通過折線圖表示,一條折線是某種算法在一個實驗庫中的平均正確識別率與高斯白噪聲歸一化方差的二維對照。圖9是在YALE人臉庫中的實驗結果,圖10是在ORL人臉庫中的實驗結果。實驗結果表明,ILDP抗噪聲的能力明顯優于其它幾種基于局部紋理特征的人臉描述方法。4人臉描述階段針對基于LDP的人臉描述方法的不足,通過進一步挖掘更大范圍的梯度信息改善人臉特征的鑒別性,從而提出了一種ILDP人臉描述方法。ILDP將中心像素的井型鄰域根據采樣半徑分成兩組,每組按照原來的相對位置排列在8個不同的方向;然后將兩組像素的灰度值與Kirsch模板卷積,分別得到兩組邊緣梯度值;最后對兩組梯度值中各自最大值的方向信息編碼成一個二位八進制數,形成ILDP碼。在人臉描述階段,首先對人臉圖像進行分塊,把每塊轉換成ILDP圖,然后對ILDP圖進行直方圖統計,將所有子塊的直方圖連接生成人臉特征。最后根據產
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年秋季課程改革實施計劃
- 相關性血管炎的護理查房
- 二年級邏輯思維訓練計劃
- 醉酒駕車案例分析心得體會
- 銷售部各崗位職責與業績考核標準
- 幼兒園疫情期間家庭互動工作計劃
- 公共事業合同審批流程透明化
- 創業計劃書苗繡
- 2025年中國石油天然氣輸送管項目投資計劃書
- 中國脫毛凍臘項目商業計劃書
- 檢驗檢測服務公司績效與薪酬管理方案
- 風電項目設備物資采購計劃
- 核磁共振波譜法之氫譜解析
- 唐詩三百首word版
- 造林工程模式典型設計圖文版
- 二次函數集體備課活動記錄(2)
- 國家開放大學《工程數學(本)》形成性考核作業1-5參考答案
- 硬筆書法考級專用紙(4—5級)
- 旅游景區財務制度及流程
- Dell 2950 SAS5RAID完全配置手冊
- 淺談初中語文教學中學困生的轉化
評論
0/150
提交評論