




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一章緒論
1.1人臉檢測技術
人臉檢測技術的發(fā)展背景
近幾年來計算機科學在人機交互領域的研究得到了長足日勺發(fā)展。重要H勺研究方向包
括:人臉檢測及識別,語音識別,性別分類,種族分類等。這些研究在平常的身份認證,
人口記錄,社會調查,實時監(jiān)測,刑事偵查等多種領域均有著廣泛的應用。人臉檢測作
為其中一種重要的組員,其應用范圍也非常廣泛,除了可以應用到人臉識別中,還可以
廣泛應用于基于圖像內容的數據庫和圖像檢索、基于內容的圖像或視頻壓縮、智能人機
交互、新一代人機交互界面和安全監(jiān)控系統等許多方面。因而研究人臉檢測技術具有十
分重要的意義。新一代視頻編碼原則MPEG-4中引入了基于內容編碼日勺概念,人日勺臉部
有著豐富的表情和變化,在人和人交流的過程之中傳遞著大量信息。因此,在基于內容
的編碼中,人臉毫無疑問的成為感愛好的區(qū)域。我們需要在每一幀圖像中定位出人臉,
并把它從編碼圖像中分割出來,采用低壓縮率的編碼;其他非感愛好區(qū)域(如背景)就采
用壓縮率較高的編碼措施。目前這種編碼方式在可視Jnlernel視頻聊天、視頻會議
等方面已經開始應用。
人臉檢測的概念和難點
人臉檢測是指對于?幅任意給定口勺圖像,采用?定時方略對其進行搜索以確定其中
與否具有人臉,假如是則返回人臉的位置、大小和姿態(tài)。
人臉檢測重要分為動態(tài)人臉檢測和靜態(tài)人臉檢測兩類,對于動態(tài)人臉檢測,檢測速
度占主導地位,另一方面是檢測率和誤檢率,對于靜態(tài)人臉檢測則規(guī)定檢測率和誤檢率
相對比較嚴格。人臉檢測是一種復雜的具有挑戰(zhàn)性的模式檢測問題,其重要向難點有兩
方面,首先是由于人臉內在的I變化所引起:(1)人臉具有相稱復雜口勺細節(jié)變化,不一樣
的外貌如臉形、膚色等,不一樣的表情如眼、嘴的開馬閉等;(2)人臉的遮擋,如眼鏡、
頭發(fā)和頭部飾物以及其他外部物體等:
另首先由于外在條件變化所引起:(1)由于成像角度的不一樣導致人臉的多姿態(tài),
如平面內旋轉、深度旋轉以及上下旋轉,其中深度旋轉影響較大;(2)光照的影響,如
圖像中的I亮度、對比度的變化和陰影等;(3)圖像的成像條件,如攝像設備的焦距、成像
距離,圖像獲得的I途徑等等。這些困難都為處理人臉檢測問題導致了難度。假如可以找
到某些有關日勺算法并能在應用過程中到達實行,將為成功構造出具有實際應用價值的人
臉檢測與跟蹤系統提供保證。
人臉檢測的I研究現實狀況
人臉檢測在科學技術和實際日勺安全應用上有著十分誘人日勺前景和潛在H勺經濟價值,
從而激發(fā)了世界上廣大科研工作者及有關商家的濃厚愛好,在諸多國家已經開展了大量
有關項目的研究。
國內外對人臉檢測問題的研究諸多并獲得了一定的成果,重要是美國、歐洲國家、
日本、新加坡、韓國等,著名的研究機構有美國MITn勺Medialab、AIlab,CMU口勺
Human-ComputerInterfaceInstitute,MicrosoftResearch,英國的DepartmentofEngineering
inUniversityofCambridge等。國內開展人臉檢測研究日勺重要單位有清華大學、哈爾濱工
業(yè)大學、北京工業(yè)大學,中科院計算所,中科院自動化所,復旦大學,南京理工大學等,都
獲得了一定的成果。
MPEG7原則組織已經建立了人臉識別草案小組,人臉檢測算法也是一項征集的內容。
伴隨人臉檢測研究的深入,國際上刊登口勺有關論文數量也大幅度增長,如IEEE的
FG(IEEEInternationalConferenceonAutomaticFaceandGestureRecognition)、
ICIP(InternationalConferenceonImageProcessing)xCVPR(ConferenceonComputerVision
andPatternRecognition)等重要國際會議上每年均有大量有關人臉檢測日勺論文,多種各樣
的人臉檢測措施層出不窮,有歡I在前人措施的基礎上繼續(xù)深入研究,也有的采用綜合某
些基本措施進行檢測。
人臉檢測成果的評價原則
評價原則重要有:檢測率(hit-rate),誤檢率(false-alarm-rate),檢測速度
(detectingspeed),魯棒性(robustness)o
(1)檢測率:被對H勺檢測到的人臉數與原圖像內包括的人臉數的比值。檢測率越高,
闡明檢測系統對人臉的接受能力越強。
(2)誤檢率(或虛警率、誤報率):被誤檢為人臉日勺非人臉子窗口數與原圖像內被檢
測H勺所有非人臉子窗口數的比值。假設原圖像內被檢測的所有非人臉子窗口數為N1被
誤檢為人臉的非人臉子窗口數為N],那么誤檢率二%;再假設原圖像內被檢測的所有
子窗口數為N,原圖像內包括人臉數為N2,N=N,+N2,那么誤檢率也等于%'_電)’
當N2N2時,誤檢率近似于N%。檢測率無法反應系統對非人臉的I排除能力,有也許
出現這種狀況:所有人臉都被檢測到,同步諸多非人臉區(qū)域也被誤認為是人臉。因此引
入誤檢率來衡量系統對非人臉樣本的排除能力。誤檢率越低,闡明檢測系統對非人臉口勺
排除能力越強。
(3)檢測速度:大部分應用領域需要在線實時地檢測人臉,如人臉識別、人臉跟蹤、
可編程視頻監(jiān)控等。在檢測率和誤檢率到達滿意口勺前提下,檢測速度越快越好。
(4)魯棒性:在多種條件下,檢測系統啊適應能力。基于膚色模型措施無法檢測灰
度圖像;大部分檢測系統無法檢測任意角度旋轉日勺人臉,一般把旋轉角度限制在一定范
圍內;有些檢測措施受岌雜背景的干擾,在背景較簡樸時效果好,反之較差,
這四個原則有些是互相制約的,如檢測率和誤檢率就常常需要權衡,實踐表明誤檢
率伴隨檢測率歐J提高而提高,檢測率伴隨誤檢率的減少而減少。諸多措施,如神經網絡
措施,檢測率已經到達90%以上,誤檢率也不高,但檢測速度慢是其最大毛病;而模板
匹配措施檢測速度雖然快,但其距離函數在不一樣環(huán)境下產生的效果差異很大,如背景
簡樸時檢測效果好,背景復雜時效果很差,這就是其魯棒性不好的體現;膚色模型也有
魯棒性不好的毛病,由于膚色輕易受到復雜背景、光線等條件的影響,并且對灰度圖無
能為力。
1.2人臉檢測圖像庫
人臉檢測圖像數據庫是人臉檢測算法研究、開發(fā)、評測的基礎。目前人瞼檢測領
域常用的人臉數據庫重要有:
①CMU/MIT正臉檢測數據庫
由CMU人臉檢測項目創(chuàng)立,是用來為正面人臉檢測算法提供評估的一種人臉數據集,
最初來自于基于神經網絡的人臉檢測工作。數據集中日勺人臉來自CMU和MIT。數據集由
四個部分構成,包括三個豎直的正面人臉數據集與一種旋轉H勺正面臉數據集。詳細信息
參見:。
②CMU側臉檢測數據庫
由CMU人臉檢測項目創(chuàng)立,是用來為正面人臉和側面人臉檢測算法提供評估口勺一種
人臉據集。詳細信息參見。
第二章圖像的底層處理
2.1圖像時預處理
我們懂得圖像處理中,在大多數H勺狀況下由于受到客觀原因,如:光照、環(huán)境H勺影
響,輸入圖像也許出現顏色分布不均衡、亮度過高或過低或者噪聲過大口勺狀況,使得圖
像的質量不很理想,因此必須通過某些處理過程才能輸入到處理系統中,這些處理環(huán)節(jié)
就被稱為圖像的預處理過程。圖像的預處理也是一種清除無用信息,提高算法效率和速
度的過程。預處理做得好可以減少背面關鍵算法中的工作量,相反假如缺乏必要口勺預處
理過程,則會對有也許導致工作量的增大和效率日勺減少,更有也許決定算法的有效性。
在本系統中共波及到圖像增強、圖像濾波等過程,下面予以討論。
在圖像日勺生成、傳播或變換的過程中,由于多種原因日勺影響,會導致圖像質量的下
降。圖像增強就在于修正這種降質,到達如下兩個目H勺:
一、改善圖像的視覺效果,提高圖像H勺清啦度;
二、將圖像轉換成一種更適合人或機器分析處理的形式。
總之,就是通過處理來有選擇的突出圖像中感愛好MJ信息,克制無用的信息,以提
高圖像的有用價值。圖像的增強措施按作用域可分為空域法和頻域法兩類。本文重要采
用空域法,下面對此法經行詳細簡介:
一幅數字圖像f(x,y)通過增強處理后變?yōu)榱硪环碌膱D像g(x,y),這種處理措施
就成為空域處理法。在一維空間—上進行增強處理,重要是在灰度級上做文章,即運用
灰度對比度增強的措施,進行灰度級映射變換,它重要包括:灰度線性變化即f(x,y)和
g(x,y)成恒定日勺線性關系。這是在曝光局限性或曝光過度的狀況下,圖像的灰度值會
局限在一種較小的范圍內,或曝光雖然充足,但圖像中我們感愛好部分H勺灰度值范圍小,
層次少,此時日勺圖像也許是一種模糊、灰度層次不清晰日勺圖像。運用這種變換H勺目的重
要是為了突出圖像中感愛好日勺灰度區(qū)域或目日勺向相對克制不感愛好的區(qū)域;灰度非線性
變換,則是指f(x,y)和g(x,y)成非線性關系,如:對數變換、指數變換等,以上的變
換基本上都是像素H勺“點對點”的變換,目前應用較多的是基于圖像直方圖的一種措施。
下面對這一技術進行簡樸簡介。
灰度直方圖是灰度級分布H勺函數,它表達圖像中具有每種灰度級的像素內個數,反
應圖像中每種灰度出現的概率。從圖像上來講,它是一維曲線,表征了圖像的最基本的
記錄特性。通過直方圖可以清晰的理解圖像對應的動態(tài)范圍的狀況,也可以理解到圖像
的重要集中范圍。下面舉一種簡樸的例子來闡明圖像的灰度直方圖。如圖2.1所示,假
設有一幅如圖所示日勺4X4大小、具有4個灰度級(0,1,2,3)的I圖像,則圖像的I灰
度分布圖如2.2所示。
8
6
4
2
r(灰度級)
?
0
Y'123
圖2.1灰度圖像圖2.2灰度分布圖
當圖像由于光照條件較差而過亮或者過暗時,我們可以對直方圖進行調整,對圖像
進行增強處理。“直方圖均衡化”技術是目前應用比較多的I處理措施,它的基本原理是:
對圖像中像素個數較多日勺灰度值進行展寬,而對像素個數較少的灰度值進行歸并,從而
到達清晰圖像的目日勺。以圖像灰度r的積累分布函數為映射函數,從而產生灰度級具有
均勻宓度的圖像,如2.3所示。
cc&-+??fVlIZ-i,皿11/
2.2圖像的二值化
邊緣檢測
數字圖像的邊緣檢測是圖像分割、目口勺區(qū)域識別、區(qū)域形狀提取等圖像分析領域十
分重要的基礎,在工程應用中占有十分重要的地位。物體的邊緣是以圖下個局部特性不
持續(xù)的形式出現H勺,也就是指圖像局部亮度變化最明顯的部分,例如灰度值H勺變換、顏
色日勺突變、紋理構造日勺突變等,同步物體的邊緣也是不一樣區(qū)域日勺分界處。邊緣檢測就
是要確定圖像中有無邊緣點,若有還要深入確定其位置。詳細實行時可分為一下兩步。
首先對圖像中的每一種像素施以檢測算子,然后根據事先確定的準則對檢測算子日勺輸出
進行鑒定,確定該像素點與否為邊緣點。采用的詳細檢測算子和鑒定準則取決于實際應
用環(huán)境及被檢測H勺邊緣類型。。邊緣檢測的措施有諸多,重要有如下幾種.
第一種措施是空域微分算子,也就是老式的邊緣檢測措施。由于邊緣是圖像上灰度
變化最劇烈的地方,對應持續(xù)情形就是函數梯度較大的地方,因此研究比很好的求導算
子就成為一種邊緣檢測口勺思緒。老式的邊緣檢測就是運用這個特點,對圖像各個像素點
進行一階活二階微分來確定邊緣像素點。一階微分圖像的峰值處對應著圖像的邊緣點;
一階微分圖像的過零點處對應著圖像的邊緣點。邊緣檢測算子檢查每個像素的領域并對
灰度變化率進行量化,一般也包括著方向確實定。目前已經提出許多種算子,例如
Prewitt算子、Robert算子、Sobel算子等就是比較簡樸并且常用的)邊緣檢測算子。
第二種措施是擬合曲面。擬合曲而是一種比較直觀日勺措施,該措施運用目前像素領
域中的某些像素值擬合一種曲面,然后求這個持續(xù)曲面在目前像素出日勺梯度。從記錄角
度來說,可以通過回歸分析得到一種曲面,然后做類似的處理。
第三種措施就是小波多尺度邊緣檢測。20世紀90年代,伴隨小波分析的迅速發(fā)展,
小波開始用于邊緣檢測,作為研究非平穩(wěn)信號的工具,小波檢測在邊緣檢測方面具有得
天獨厚H勺優(yōu)勢,Mallat在這首先做了不少的工作。
第四種措施是基于數學形態(tài)學日勺邊緣檢測。形態(tài)學運算時物體形狀集合與構造元素
之間的互相作用,對邊緣方向不敏感,并能在很大程度上克制噪聲和探測真正的邊緣,
同步數態(tài)特性上具有獨特的優(yōu)勢。
因此,將數學形態(tài)學應用于邊緣檢測,既能有效的濾除噪聲,又可保留圖像中的原
有信息,是邊緣檢測日勺?種重大突破。目前較成熟的有:基于多尺度形態(tài)學的邊緣檢測、
基于均衡化和數學形態(tài)學的組合邊緣檢測、基于偏微分方程和形態(tài)學日勺邊緣檢測等。本
文重要采用邊緣檢測算子來進行檢測,下面簡介兀種常用日勺老式日勺邊緣檢測算子。
1、Prewitt算子
Prewitt算子用卷積模板來描述:
G(")=|川+|可(2-1)
-101111
式中P,=-101000,前者為水平模板,后者為垂直模板,圖像
-101-1-1
中日勺每個點都用這兩個模板進行卷積,取最大值作為輸出,最終產生一幅邊緣幅度圖像。
2、Kirsch算子
Kirsch算子使用8個模板來確定梯度的幅值和方向,故又稱為方向算子,通過一組
模板分別計算不一樣方向上日勺差分值,取其中最大時值作為邊緣強度,而將與之對應的
方向作為邊緣的方向。假設原始圖像的3x3子圖像如圖2.4所示。則邊緣的梯度大小為
aa
3a2
i
(i,j)a
a4
0
a5a6a
7
圖2.43X3子圖像示意圖
G(z\j)=max[l,max(|557.-4tk\:k=0,1,…,7)](2-2)
式中“=4+%+%+2
4=。人+3+4+1+…%+7
上式中日勺下標超過7就用8清除并取余數。Z=0,1,實際上就是使用了8個模板。
Kirsch算子實現起來相對說稍微麻煩某些,它采用8個模板對圖像的每個像素點進
行卷積求導數,這8個模板代表8個方向,分別對圖像上的8個特定邊緣方向做出最大的
響應,運算中取所有8個方向口勺最大值作為圖像的邊緣輸出。
3、LOG(Lap1acian-Gauss)算子
當使用一階導數的邊緣檢測算子時,假如所求的一階導數高于某一閾值,則確定該
點為邊緣點,這樣做會導致檢測的邊緣點太多。一種更好時措施就是求梯度局部最大值
對應的點,并認定它們是邊緣點。通過清除一階導數的非局部最大值,可以檢測出更精
確日勺邊緣。一階導數的局部最大值對應著二階導數的I零交叉點,通過找圖像強度日勺二階
導數的零交叉點就能確定精確地邊緣點。在二維空間中,一種常用的二階導數算子是
Laplacian算子。不過,Laplacian算子有兩個缺陷,其一是邊緣日勺方向信息「貝丟失,其
二是Laplacian算子是二階差分算子,因此雙倍加強了圖像噪聲H勺影響。由于圖像強度
二階導數的零交叉點求邊緣點算法對噪聲十分敏感,為了消除噪聲影響,Marr和
Hi1dreth將Gaussian濾波器和Lap1acian邊緣檢測結合在一起,形成了LOG(Laplacianof
gaussian)算法。即先用高斯函數對圖像進行平滑,然后再用拉普拉斯算子進行運算,
得到Laplacian-Gauss算法,它使用一種墨西哥草帽函數形式。
a2分21..,2
LOG(x,y)=(彳T+—)—^exp(—
dx23)廣2k2b
-r?922
1cx+y~/x+y\/cc、
=-27-exp(;-)(2-3)
2m[,J2/
這種措施的特點是圖像首先與高斯濾波器進行卷積,既平滑了圖像又減少了噪聲和
較小的構造組織將被濾除。
4、Sobel算子
在圖像處理中,一階導數就是通過梯度來實現的,因此,運用一階導數檢測邊緣點
的措施就稱為Sobel算子法。
圖像函數f(x,y)是在點(x,y)日勺梯度是一種具有方向和大小矢量,即
Vf(x,y)=—i+—j(2-4)
3x3yJ
在夕方向的變化率可由下式給出
df
cos。+——力sin。(2-5)
變化率最大方向為
(2-6)
梯度值日勺大小為
g(x,(2-7)
所有基于梯度的邊緣檢測器之間的主線區(qū)別就是算子應用的方向,以及在這些方向
上迫近圖像一維導數的方式和將這些近視值合成為梯度幅度日勺方式。
當我們考慮數子圖像的離散域時,可將圖像的一階差分直接替代圖像函數的偏導數。
二維離散圖像函數在x方向的一階差分定義為
f(x+l,y)-f(x,y)(2-8)
y方向的一階差分定義為
f(x,y+l)-f(x,y)(2-9)
根據上面所述的I原理,索貝爾(sobel)提出種將方向差分運算和局部平均運算
相結合日勺措施,即sobel算子。該算子是在認為f(x,y)中心日勺3X3的領域上計算x和y方
向上的偏微分,即
Sx={f(x+1,y-l)+2(x+1,y)+f(x+1,y+l)}-{f(x-1,y-l)+2f(x-Ly)+f(x-by+1)}
Sv={f(x-1,y+l)+2f(x,y+l)+f(x4-1,y+l)}-{f(x-1,y-l)+2f(x,y-l)+f(x+1,y-1)}
(2-10)
實際上,上式應用了f(x,y)鄰域日勺圖像強度日勺加權平均插值。其梯度日勺大小為:
g(x,y)「S=Js£+S(2-11)
或取絕對值
g(x,y)aS=|5X|+|5.(2-12)
本文采用了背面一種梯度近視值。
在實際H勺應用中,一般是運用簡樸的模板卷積來計算方向差分,不一樣的算子對應
不一樣H勺模板卷積,它們產生的兩個偏導數在圖像一種點上用均方值或絕對值求和的形
式結合起來,下圖給出了sobel算子常采用的梯度模板:
-10112
-202000
-101-1-2-1
5、Canny算子
在高斯噪聲中,一種經典的邊緣代表一種階躍的強度變化。根據這個模型,好的邊
緣檢測算子應當TT3個指標:第一是低失誤率,即真正H勺邊緣點盡量少日勺丟失,同步又
要盡量防止將非邊緣檢測為邊緣;第二是高位置精度,檢測口勺邊緣應盡量靠近真實的邊
緣;第三是對每一種邊緣點有唯一的響應,得到單像素寬度口勺邊緣。為此JohnCanny提
出了邊緣檢測算子H勺如下3個準則。
(1)信噪比準則
信噪比越大,提取的邊緣質量越高。信噪比SNR定義如下:
I[G(-x)h(x)dx
SNR=…(2-13)
式中,G(x)代表邊緣函數;〃(x)代表寬度為①的濾波器的脈沖響應;。代表高斯
噪聲時均一方差。
(2)定位精度準則
邊緣定位精度L定義如下:
\[JG\-X)h\x)dx
i(2-14)
crJj'h,2{x}dx
式中G'(x)和h\x)分別代表G(x)和/?")的導數,乙越大表明定位精度越高。
(3)單邊緣響應準則
為了保證單邊緣只有一種響應,檢測算子口勺骯沖響應導數的零交叉點平均距離
。(/')應滿足:
2
「方23)右]2
皆二—⑵⑸
fh(x)dx
、J-?J
式中h\x)為h(x)H勺二階導數。
將CannyMj3個準則相結合可以獲得最優(yōu)Fl勺檢測算子,在此基礎上,Canny設計了一
種邊緣檢測算法,其詳細環(huán)節(jié)如下:
①首先用2D高斯濾波模板進行卷積以平滑圖像
②運用微分算子(例如Prewitt算子、Sobel算子),計算梯度的幅值和方向。、
③對梯度幅值進行非極大值克制。即遍歷圖像,若某個像素的I灰度值與其梯度方向上
的前后兩個像素的灰度值相比不是最大,那么這個像素值置為0,即不是邊緣。
④使用雙閾值算法檢測和連接邊緣。雖然用合計直方圖計算兩個閾值,但凡不小于高
閾值的一定是邊緣;但凡不不小于低閾值的一定不是邊緣。假如檢測的成果不小于
低閾值但又不不小于高閾值,那就要看這個像素的鄰接像素中有無超過高閾值的邊
緣像素,假如有,則該像素是邊緣,否則就不是邊緣。
圖2.5是應用于上述算法所得到日勺試驗成果,從圖中我們可以看到不一樣算子對人
臉檢測和定位所取到的效果。本文重要采用sobcl算子進行檢測。
圖2.5幾種梯度算子檢測邊緣點時示例
閾值的選擇
運用閾值分割圖像以及對原始圖像進行二值化處理是圖像處理日勺基本問題,并在圖
像分析和識別中起到了重要日勺作用。不過由于圖像處理對象和目日勺的千差萬別,在實際
工作中常常碰到這樣的現象,即一種閾值的選擇措施對某些應用問題很有用,而對另某
些問題也許變得很不適應。因此,木論文中在邊緣檢測日勺閾值的選擇問題上,還需要以
我們研究的圖像對象的狀況來確定。常見的閾值確定措施有如下幾種:
1)邊界灰度作為分割閾值
邊界的灰度一般介于相鄰兩個區(qū)域日勺平均灰度之間,可以作為圖像分割的閾值。
在通過其他途徑獲取邊界灰度后,該措施簡便易行。假如事先用微分算子或梯度算子處
理過的圖像,則該措施不再適應。
2)根據直方圖谷點確定閾值
假如目日勺區(qū)域和背景區(qū)域在灰度.上有較明顯日勺差異,那么該圖像日勺灰度直方圖將展
現雙峰一谷狀。其中一種峰值對應于目日勺的中心灰度,另一種峰值對應背景日勺中心灰度。
由于目的I邊界點較少且其灰度介于他們之間,因此雙峰之間的I谷點對應邊界日勺灰度,可
以將谷點的灰度作為分割閾值,獲得很好的分割效果。
需要注意H勺是,由于直方圖是各級灰度日勺像素記錄,假如沒有圖像其他方面日勺知識,
只靠直方圖分割時不也許的。如圖2.6所示,直方圖谷點于最佳分割閾值之間總是存在
誤差,有時甚至無法確定,如圖2.6(f)所示。
/c\
圖26第一行:目日勺和背景的灰度分布:第二行:與第一行對應的圖像直方圖
3)記錄判決措施確定閾值
記錄判決法是指運用記錄學措施確定最佳分割閾值。例如:運用誤差最小準則、也
許性最大準則和方差最大準則等。本文重要采用最小誤判概率準則確定最佳分割閾值。
設圖像具有目H勺和背景,目的的平均灰度高于背景H勺平均灰度。目的點的灰度分布
函數p(x),均值和方差為/J和°;,背景點日勺灰度分布密度函數為q(x),均值和方差為
〃2和,則
(2-16)
(2-17)
設目的點的個數占圖像總像素數十萬比例為。,背景點位1-那么這幅圖像的灰度分
布密度函數為
s(x)=0^)(x)+(1-(9)q(x)(2-18)
假如以閾值t進行分割,灰度不不小于t『、J像點座位背景,否則座位目的點,于是將目
時點誤判為背景點的J概率為
£已二fP(X)dx(2-19)
把背景點誤判為目的I點日勺概率為
41=[q(X)dx(2-20)
選用的閾值t應使總的誤判率
£=3與+(1-6)4=p(x)dx+(1-6)[q(x)dx(2-21)
最小。對t求導并令成果為零,即令生J=O有
at
毋(t)-(l-e)q(t)=()(2-22)
即
比2P_
ln=(2-23)
(1-0)O-,2b:-2a;
當er;二0;二/時
T〃i+〃2b?.e
T=―—―+In(2-24)
2〃2"11-。
若先驗概率已知,例如,0=1,則有
2
(2-25)
一2
邊界跟蹤
圖像的輪廓(邊界)跟蹤與邊緣檢測是親密有關的,由于輪廓跟蹤實質上就是沿著
圖像的外部邊緣“走”一圈。輪廓跟蹤也稱為邊緣點連接,是一種基于梯度內圖像分割
法,是指從梯度圖中一種邊界點出發(fā),一次通過對前一種邊界點日勺考察而逐漸確定下一
種信得邊界點,并將它們連接進而逐漸檢測初步邊界日勺措施。一般輪廓跟蹤算法具有很
好口勺抗噪性,產生的I邊界具有很好的剛性。圖形曰勺輪廓跟蹤技術與圖像歐I邊界提起技術
是不一樣的,邊界提取既要提取圖像日勺外部邊緣乂要提取圖像的內部邊緣,而圖像的輪
廓跟蹤技術只對圖像H勺外部邊緣進行跟蹤。因此輪廓跟蹤H勺目的重要是將目的與背景辨
別出來。
按照邊緣H勺特點,有的邊界取正值(階躍邊緣一階導數為正值),有日勺取負值(房
頂型邊緣二階導數為負值),有的邊界值取0(階躍邊緣二階導數、房頂型一階導數均過
零點)。因此輪廓跟蹤措施按邊緣特點分,有極大跟蹤法、極小跟蹤法、極大一極小跟
蹤法與過零點跟蹤法。實際跟蹤比較復雜,跟蹤準則要隨問題內容而定,準則不一樣,
跟蹤措施也不一樣。詳細輪廓跟蹤過程大體分為如下三步:
1)確定輪廓跟蹤日勺起始邊界點。根據算法日勺不一樣,選擇一種或多種邊緣點作為
搜索的起始邊緣點。
2)選擇一合適的數據構造和搜索方略,根據已發(fā)現的邊界點確定下一種檢測目的并
對其進行檢測。
3)制定出終止搜索日勺準則(一般是將形成閉合邊界作為終止條件),在滿足終止條
件時結束搜索。
常用的輪廓跟蹤技術有兩種,一種是探測法,一種是梯度圖法。下面重要簡介梯度
圖法H勺輪廓跟蹤技術。
對于一種給定目的內人簡樸圖像,先計算出梯度圖。可通過在梯度圖中搜索梯度最
大H勺點來作為輪廓的起始點。第二點可以再其前一點H勺8一領域中尋找,一般是選擇梯
度最大的點作為第二個邊界點。由于根據前一種點P和目前點CH勺互相位置可以大體確
定出邊緣的走向,因此在對下一點的搜尋時不必在對目前點的8一領域進行計算比較,
而可以根據前一點P和目前點C在位置上的不一樣得到如圖2.7所示的8種也許的方向。
為了保證邊界的光滑性,每次只對P與C連線方向上成扇形的3個候選邊緣像素進行梯
度值計算及比較,并取最大梯度值最為下一種邊界點。這樣將減少相稱多的計算量。得
到日勺邊界8一連通。
前一點P目前點c候選點N
圖2.7多種梯度圖
圖像的歸一化
當對圖像進行基于橢圓形整體特性和從于分布特性的檢測之后,為了背面進行人臉
識別處理時以便,我們需要對人臉圖!像的I尺度和灰度進行歸一化處理。尺度歸一化重
要是根據人臉圖像中特性點日勺位置、人臉圖像中分布特性日勺尺寸以及我們在背面識別處
理過程中所需要日勺輸入II像尺寸,三方面的規(guī)定進行歸一化處理。由于原始圖像日勺尺寸
有也許根據實際狀況存在尺度上日勺不統一,人臉日勺尺寸也有也許有大有小,因此在歸一
化H勺過程中會存在減少辨別率的狀況,當辨別率減少到一定的水平會導致背面識別處理
的難度,因此我們對原始輸入圖像在尺度上還是有一定的限制的。由于尺度以一化和灰
度歸一化在于技術實現上比較簡樸,這里不在論述。
第三章基于Adaboost算法的人臉檢測
3.1AdaBoost算法的發(fā)展應用
1984年I1月Vaiiant刊登日勺"PAC”(ProhabIyApproximatp1yCorrect)learning
model,Boosting的提出最初來源于這篇文章,在這篇文章中,分別定義了弱學習和強
學習算法,弱學習算法是僅比隨機猜測略好,精確率不規(guī)定很高的一種算法,強學習算
法是精確率規(guī)定很高的學習算法。然而這篇文章并沒有給出怎樣將弱學習和強學習關聯
起來,也沒有闡明與否適合于所有樣本空間分布。1989年Schapire初次提出\Boosting
算法,處理了三個問題:(1)目的集只有滿足強學習算法的狀況下才有弱學習算法;(2)
存在弱學習算法適合任何樣本空間分布意味著強學習算法也適合任何樣本空間分布;(3)
通過遞歸措施可以提高弱學習為強學習從而提高分類日勺精確率。
1990年Freund提出了更有效歐Iboosting算法,不過在弱學習算法中需要精確的懂
得訓練樣本日勺先驗知識,實際上我們并不能精確日勺懂得每次訓練樣本日勺先驗知識,因此
在實際應用上有一定日勺局限性。
1995年FreundandSchapire提出了AdaBoost算法,AdaBoost算法即為
AdaptiveBoosting算法,之因此取這個名字,是由于它自適應的調整弱學習算法H勺錯誤
率,使通過若干次遞歸后整體錯誤率可以到達我們日勺期望值,同步,不需要精確懂得樣
本空間分布,每次弱學習后調整樣本空間分布,更新每個訓練樣本的權重,將樣本空間
中對的分類口勺樣本權重保持不變,而將被錯誤分類的樣本權重提高,這樣下次弱學習時
能更關注這些錯分類的樣本。
最初文章中都是將AdaBoost算法應用于字符識別上,因其特性空間維數相對比較
少些。伴隨算法的不停成熟,AdaBoost算法已成為機器學習日勺一大亮點,能運用到各個
領域,例如手寫體數字識別,人臉檢測,人臉識別,車牌字符識別,數據挖掘,虹膜識
別等等。
2023年Viola和Jones刊登了一篇基于AdaBoost算法日勺人臉檢測器,這篇文章重
要有三大奉獻:(1)引入“積分圖”概念,使得檢測器中特性的計算輕易迅速;(2)基于
AdaBoost的學習算法,它能從一種很大的特性集中選擇很小的一部分關鍵H勺特性來產生
一種及其有效的分類器,它最終形成的強分類器日勺訓練錯誤率靠近于零,并且具有很好
的推廣性;(3)在級聯的檢測器中不停增長更多日勺強分類器,這樣可以很快排除背景區(qū)
域,從而節(jié)省出時間用于對那些更像人臉的區(qū)域進行計算。這個人臉檢測系統的檢測率
可以和當時最佳的算法匹敵,并且檢測速度高達15幀/秒。
2023年StanZ.Li提出了一種基于FloatBoost的多視角的人臉檢測算法。通過運
用FloatBoost將學到的弱分類器構導致?種強分類器,該系統是?種從粗到精、從簡
樸到復雜的金字塔型的人臉檢測系統,同基于AdaBoost的算法相比,它能在提高人臉
檢測速度的同步提高檢測的精度。為了檢測具有多種深度旋轉角度的人臉,他們將多種
角度H勺人臉進行了分類,此外,他們還提出了一種實時的多視角H勺人臉檢測、跟蹤、姿
態(tài)估計、對齊和識別的綜合系統。
2023年RainerLienhart在Viola口勺基礎上又提出了某些新【付旋轉Haar-1ike特性,
他通過學習得到口勺系統可以用于旋轉人臉的迅速瞼測,同步也能使平均的誤檢率減少
10%。此外他還研究了某些其他的Boosting算法,如:離散口勺(DiscreteAdahoost),實
值日勺(RealAdaboost)和平緩時(GentleAdaboost),通過比較得出基于平緩日勺(Gentle
Adaboost)效果很好。
2023年C.Liu等人提出了一種基于Kullback-LeiblerBoosting(KLB)算法構造日勺
一種緊湊的(compact)分類器。該算法處理了AdaBoost算法中存在的兩個問題:第一,
怎樣根據學習得到歐I系數對弱分類器進行最佳的組合,其處理的方略是通過迭代調整系
數以最小化人臉檢測日勺錯誤率,它能保證在特性不停增多日勺狀況下檢測的錯誤率不會增
長;第二,怎樣選擇最佳H勺弱分類器或特性,其方略是尋找使人臉和非人臉之間的KL
散度的對稱性最大化的KL特性,通過最優(yōu)H勺特性來構造最優(yōu)的分類器。
2023年JianxinWu等人針對運用AdaBoost算法選擇特性訓練時間長H勺缺陷,提出
了前向特性選擇措施,兩者重要區(qū)別在于弱分類器選擇的措施,給定所有樣本的所有初
始特性值集,AdaBoost算法需要每次從特性值集中選擇錯誤率最小的特性作為一種弱分
類器,由于運用AdaBoost算法更新了樣本權重,因此每次樣本口勺特性值集分布會有所
變化,因此選擇下?種弱分類器時要重新挑選;而前向特性選擇只要從初始特性值集中
挑選出滿足檢測率和誤檢率條件日勺特性值集,不需要更新權重,這種措施雖然縮短了訓
練時間,不過最終選擇口勺弱分類器的個數要遠遠超過運用提高機制選擇的特性,增長了
檢測時間,原因在于這種措施是一種次優(yōu)選擇特性的措施。
2023年JianxinWu等人又刊登了一篇基于線性非對稱分類日勺多層檢測器,線性非
對稱重要是考慮到老式AdaBoost算法中并沒有明確給出最終得到的強分類器所能到達
的檢測率和誤檢率,而重視點在尋找錯誤率最小口勺特性,沒有考慮到每次找到的特性怎
樣有效H勺組合到達較高的檢測率和較低的誤檢率。該文根據每個強分類器口勺檢測率和誤
檢率,通過數學公式推導出怎樣有效組合各個弱分類器的加權和公式。
3.2人臉檢測訓練算法
3.2.1使用Haar-like特性的Adaboost人臉檢測算法
Viola和Jones于2023刊登文章,成為人臉檢測速度提高的轉折點,Viola本人也
在人臉檢測日勺速度提高方面做出了突出奉獻。他通過使用HaarTike特性和積分圖迅速
算法,并綜合Adaboost和Cascade算法實現了實時日勺人臉檢測系統,使得人臉檢測從
真正意義上走向了實用,圖3.1給出了使用Adabcost算法進行人臉檢測的流程圖。
:川3mu4A;lihRvl-4:M
PT]甘工-侑*+UAAa工口
(1)Haar-like特性和積分圖
Haar-1ike特性是一種線性變換特性,曾經被Papageorgious等用來做物體檢測。
由于其計算代價相稱小,因此非常適合用來抽取人臉特性。一組經典【付Haar-like特性
由圖3.2所示,每種特性都由大小及排列方式相似的矩形構成。對于一種由兩個矩形框
構成的HaarTikc特性,其特性的值就是兩個矩形內部像素值之和的差(白色減黑色部
分);對于三個矩形框構成E向HaarTikc特性,其特性時值就是兩個外部的白色矩形框
內的像素值之和減去兩倍的I中間黑色矩形框內的I像素值之和;對于四個矩形框構成日勺
Haar-like特性,其特性時值就是主對角的兩個矩形框內日勺像素值之和與副對角線兩個
矩形框內的像素值之和日勺差。
為了提高計算HaarTike特性值日勺速度,Viola等提出了積分圖(IntegralImage)
的概念。一幅圖像產生H勺積分圖,坐標為A(x,y)位置的積分圖元素日勺值即為由原圖A
點H勺左上方口勺矩形圍成H勺所有像素值H勺和(圖3.2),即
ii(x,y)=(x\yO(3-1)
x<x?y<y
其中ii(x,y)表達像素點(x,y)時積分圖日勺值,i(x,y)表達原始圖像的值。ii(x,y)可
以通過下式迭代進行計算:
s(x,y)-s(x>y-l)-i-i(x,y)(32)
ii(x,y)=ii(x-1,y)+s(x,y)(3-3)
其中s(x,y)表達行日勺積分和,且s(x,-l)=0,ii(-Ly)=0o求一幅圖像日勺積分圖,只需
遍歷一次圖像即可。
圖3.2檢測窗內的Haar-like特性例子。
特性值的求法為白色矩形框內的所有像素點的和減去灰色矩形框中的所有像素點
的和。(A)(B)表達口勺是兩個矩形框的Haar-like特性。(C)(D)表達的是三個矩形框口勺
Haar-like特性。(E)表達的是四個矩形框『、JHaar-like特性。
通過使用積分圖可以非常迅速地計算五個簡樸的HaarTikc特性(圖3.2)。圖中由
兩個矩形構成的特性,其像素和之差可通過六個參照矩形求得;由三個矩形構成日勺特性
可以通過八個參照矩形求得;由四個矩形構成歐I特性可以通過九個參照矩形求得。如圖
3.4所示:點1的積分圖值是矩形框A中所有像素的像素值之和。點2的積分圖所對應
時值為A+B,點3是A+C,點4是A+B+C+D,因此D中所有像素值之和可以用4+1-(2+3)
計算。
Sum
pixels
(x,y)
圖3.3積分圖
圖3.3在點(x,y)歐I積分圖口勺值是由原圖(〉:,y)點的左上方的I矩形圍成的所有像
素值的和。
(2)Adaboost算法的訓練過程
上述的HaarTike特性,針對20X20窗口大小的訓練數據,可以產生45396個之
多H勺候選特性,但并不是所有特性都對分類有很好的效果。并且,構建一種具有近5萬
個特性生成口勺弱分類器組合生成的強分類器也是不現實口勺,因此,我們需要用到
Boosting措施來做特性選用并根據選用的特性生成弱分類器,最終身成強分類器。在分
類算法中,Boosting措施是一種新發(fā)展起來的重要H勺措施,諸多分類算法的性能可以通
過持續(xù)地分派不一樣的權值給訓練數據,根據帶權值的訓練數據作分類訓練,生成弱分
類器,然后再根據這個弱分類器更新訓練數據的權值,以此往復,得到理論上分類對日勺
率靠近100郵勺分類器。這種結論令人驚奇日勺措施可以用記錄原則來解釋,叫做附加建模
和最大似然估計。
通過Boosting措施中的Adaboost措施進行訓練,可以得到一種由若干個弱分類器
構成的強分類器作為最終的分類器。一種弱分類器hj(x)由一種特性f『一種閥值"和
一種指示不等式方向的校驗器Pj構成:
1ifPjfj〈Pj°j
hj(x)—<(3-4)
0otherwise
其中x表達圖像中一種N*N像素大小的子窗口,一種通用的Adaboost的學習過程如下:
①給出訓練樣本(X],y。,(X2,丫2),…,(xn,yn),其中yj={0,1},分別對應于
負例與正例。
②對負例和正例樣本分別初始化權值幼,i,其中m和1分別為負例和正例
J2m21
樣本數
③對于每一次迭代t=L2,T:
▲對權值進行歸一化,使得傷符合概率分布:%j=牡,i
X",j
▲對于每一種候選特性j,訓練一種由此特性生成的弱分類器hj,用這個分類器
分類樣本,得到分類錯誤率專=£聞與3-丫力
▲選擇使得或最小的若分類器hi
▲更新權值,例+】,i=Q/一"其中ej當樣本Xj被對日勺分類時取值為0,被錯
誤分類時取值為1,且四=冬
1-媒
▲最終的強分類器即為:
h(x)=」^二產四0;2:=1%(3-5)
0otherwise
其中a【=logj-
(3)Cascade級聯檢測器
人臉檢測器H勺級聯(cascade)構造是根據由粗到精的方略來實現迅速實時H勺人
臉搜索。Viola最先提出此構造,并使用這種級聯構造實現了世界上第一種實時口勺人
臉檢測系統。一種級聯的人臉檢測系統由圖3.5所示。
級聯的人臉檢測器每一種結點就是一種由人臉檢測基本學習算法學習出來的分類
器,它是用來辨他人臉和非人臉模式的。設置級聯檢測器里面時每個節(jié)點分類器日勺閾值
b,使得大多數(如99.9%)人臉都能通過,在此基礎上盡量拋棄非人臉模式。位置越靠
后日勺節(jié)點分類器日勺構造越復雜,即包括越多日勺弱分類器,因而也具有更強日勺分類能力。
這樣做是由于非人臉樣本通過的節(jié)點個數越多就越像人臉,因而越難以和人臉模式辨別
開來。級聯檢測器就像一系列串連起來的篩子,每一種篩子都能篩除某些前面篩子所不
能篩掉的非人臉模式。最終通過所有節(jié)點分類器H勺樣本才被接受為人臉。
被拒絕的非人臉窗口
1川CC
要根據檢測器性能目的日勺規(guī)定來設計級聯構造。一種訓練好日勺級聯檢測器的誤
檢率(falsepositiverate)為:
K
F=P[fj(3-6)
i=l
其中K是節(jié)點分類器的個數,*是第i個節(jié)點分類器在訓練樣本集上面的誤檢率。檢測
率為:
K
D=n<li(3-7)
i=l
其中K是節(jié)點分類器的個數,也是第i個節(jié)點分類器在訓練樣本上面歐I檢測率。
使用Boosting算法需要大量日勺訓練數據。在訓練過程中,我們不停使用Bootstrap
措施來獲得新的數據,即運用目前已經訓練好的級聯分類器來篩選數據,對于前一階段
的訓練數據,僅保留分對的正例樣本和分錯口勺負例樣本,再從候選的負例樣本中選擇分
錯的部分作為補充,直到負例樣本數足夠構成下一次訓練所需。如此反復訓練,直到檢
測器的誤檢率符合我們的規(guī)定。例如,我們訓練具有10個節(jié)點口勺級聯分類器,每個訓
練節(jié)點日勺檢測率(detectionrate)為0.99,誤檢率(falsepositiverate)為30%,
則最終H勺級聯分類器的檢測率為0.9(0.9^0.9910),誤檢率為6X10-6(6X10-6
=O.3,o)c
一種經典的級聯分類器日勺學習算法如下所示:
①輸入:人臉樣本集Pos和非人臉樣本集Neg。設定每個節(jié)點最大誤檢率f,每個
節(jié)點最小通過率d和整個檢測器的)目的誤檢率F^ga
②初始化:F1=l,i=l
③當滿足條件耳氏雅e
▲用Pos和Neg譏練第i個節(jié)點并設定閾值b使得誤檢率fj不不小于f,通過率不
小于d
▲耳十]一與耳,i-i+1.Net-。
▲假如居+1〉居猴8,則用目前的級聯檢測器掃描非人臉圖片庫,搜集所有的誤
檢樣本到集合Neg
強分類器越復雜、越嚴格,對非人臉的排除能力就越強,但同步也會導致部分人臉
被錯誤排除,因此制作級聯分類港歐I時候需要從整體上考慮各級強分類器H勺分類能力。
伴隨級聯分類器級數的增長,誤檢率迅速下降,但同步漏檢率也會上升。為了更好的闡
明級聯分類器歐J檢測效果,圖3.6給出了一組級聯分類器的檢測成果,越靠后的強分類
器分類越嚴格,圖中橫軸表達級聯分類器的級數,縱軸表達檢測對的率。
圖3.6一組級聯分類器的檢測率
從圖中可以看出,伴隨級聯分類器級數的增長,分類器對負樣本的排除率越來越高,
但同步也將部分正樣本排除。表37給出了各級強分類器的測試成果:
表3-1級聯分類器前10級單級測試成果
第1級第2級第3級第4級第5級第6級第7級第8級第9級第】0級
弱分類
81182636534575162245
器個數
正樣本
0.9930.9930.9950.9920.9880.9880.9830.960.940.89
對口勺率
負樣本
0.220.1Q40.1550.190.2180.310.320.320.43
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生成式AI驅動下數字創(chuàng)意產業(yè)發(fā)展現狀與挑戰(zhàn)
- 完整社區(qū)建設實施方案
- 田徑短跑項目中的力量訓練方法與策略
- 公司外包保潔員管理制度
- 公司女員工形象管理制度
- 公司電動車充電管理制度
- 公司目標兌現獎管理制度
- 公司私家車車輛管理制度
- 公司管理者聘任管理制度
- 公司給員工租房管理制度
- 2025年山西云時代技術有限公司招聘筆試參考題庫含答案解析
- 河南省駐馬店市2023-2024學年高二下學期7月期末考試 英語 含解析
- 2025年中國中煤能源集團限公司招聘10人高頻重點提升(共500題)附帶答案詳解
- 發(fā)展性障礙學生就業(yè)轉銜的家長支持研究
- 《保密意識培訓》課件
- 2024年6月英語四級考試真題及答案(第1套)
- 2024中國糖尿病合并慢性腎臟病臨床管理共識解讀
- 糖尿病的中醫(yī)科普
- 寺院承包合同范例
- JJF(蘇) 50-2024 水泥混凝土稠度試驗儀校準規(guī)范
- 冷庫建設項目可行性研究報告5篇
評論
0/150
提交評論