




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
面部識別的算法分析與設(shè)計案例目錄TOC\o"1-3"\h\u26758面部識別的算法分析與設(shè)計案例 1213711.1基于MTCNN的檢測算法 1108811.1.1卷積神經(jīng)網(wǎng)絡(luò) 1214241.1.2多種任務(wù)的學(xué)習(xí) 3111491.2算法的選取 5202631.3人臉識別的算法 51.1基于MTCNN的檢測算法近年來,在計算機(jī)視覺領(lǐng)域卷積的神經(jīng)網(wǎng)絡(luò)取得了劃時代的進(jìn)步,基于卷積神經(jīng)網(wǎng)絡(luò)的臉部計算算法不斷登場。最有名的是KaippengZhang團(tuán)隊提出的基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的多任務(wù)學(xué)習(xí)水平的面部檢測算法。該算法主要設(shè)計了一種輕量卷積的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),能夠充分保證實時性能,并提出了一種解決困難在線樣本的方法。該算法目前基于與算法相同的算法,具有最高的識別精度。1.1.1卷積神經(jīng)網(wǎng)絡(luò)CNN是一種將二維的數(shù)據(jù)作為輸入處理的不完整連接的N層神經(jīng)網(wǎng)絡(luò)的算法。網(wǎng)絡(luò)各層有N個二維的平臺面,各平臺面有N個獨(dú)立的神經(jīng)元。神經(jīng)元之間的連接只存在于相鄰之間。CNN的底層主要用于提取圖像的紋理和邊框。然后將最下層得到的信息通過神經(jīng)元連接傳遞到下一層,圖像最重要的結(jié)構(gòu)信息被分階段提取出來。簡單來說,層越多,性能越好。CNN使用的算法和普通的神經(jīng)網(wǎng)絡(luò)算法的區(qū)別在于CNN是由本地連接和共享。這樣一來,需要訓(xùn)練的重量就會減少,網(wǎng)絡(luò)模型的學(xué)習(xí)復(fù)雜性也會減輕。卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。圖3-1主要包括卷積層、環(huán)層和完全連接的層。圖1.-1卷積神經(jīng)網(wǎng)絡(luò)的基本架構(gòu)圖卷積層上圖所示的C1和C2是卷積層。卷積層通過如上圖的conv1和conv2所示的可學(xué)習(xí)卷積內(nèi)核。首先,從上一層矩陣中提取大小相同的卷積內(nèi)核區(qū)域,然后按順序?qū)⒕矸e內(nèi)核的相應(yīng)位置值與該區(qū)域值相乘,最后添加偏移量。最后,其他區(qū)域的結(jié)果按照卷積內(nèi)核的移動步長順序計算。所有折疊完成后,這些結(jié)果是為了生成新的矩陣而結(jié)合的。L-1第一個單層卷積神經(jīng)網(wǎng)絡(luò)的第無數(shù)個特征圖為的意思是從L的第一層的第M層到第L層的第n層的圖表的卷積內(nèi)核。所以第n個特征圖的公式為1.1.1:(3-1)*對于符號,這是離散卷積算法的運(yùn)算符號。f(*)是算法的激活函數(shù),通常是信令函數(shù),表示為圖1.1.2(3-2)這里面的X是輸入,f(x)是輸出池化層上圖的S1和S2是池化層。池化層對主要的視覺特征進(jìn)行過濾,通過采樣將其整合抽象和視覺功能。環(huán)層采用最大值的采樣方法,采樣大小為4X4。首先,由上一層提取的特征矩陣被分割成4X4矩陣,然后獲得各矩陣的最大值,進(jìn)行最終輸出。尺寸是原來的1/2。減少采樣后的計算量,可以避免圖像轉(zhuǎn)換的影響。儀式如下公式1.1.3:(3-3)其中L-1層網(wǎng)絡(luò)表示輸出的無數(shù)個特征的圖表,這是L層網(wǎng)絡(luò)優(yōu)化后的無數(shù)個圖表,down表示最大函數(shù)。全部連接層圖3-1的F1由于連接層和完全連接層主要可以提高網(wǎng)絡(luò)映射,所以網(wǎng)絡(luò)上的上一層的所有神經(jīng)元都會連接到當(dāng)前網(wǎng)絡(luò)的所有神經(jīng)元,而同一層的神經(jīng)元不會連接。其公式為1.1.4(3-4)這里面的L所表示的當(dāng)前的網(wǎng)絡(luò)的層數(shù),N表示的是第L-1層網(wǎng)絡(luò)的神經(jīng)元的個數(shù),這個表示是第L-1層的網(wǎng)絡(luò)的第i個神經(jīng)元輸入的值。表示的是第L層網(wǎng)絡(luò)神經(jīng)元J和第L-1層網(wǎng)絡(luò)神經(jīng)元i之間的連接的權(quán)值,表示的是第L層網(wǎng)絡(luò)神經(jīng)元J的偏置。表示的是激活函數(shù)。1.1.2多種任務(wù)的學(xué)習(xí)所提出的MTCNN算法記述了多任務(wù)學(xué)習(xí)面部檢測框架【13】【8】。所以可以同時執(zhí)行下面的三個功能:(1)人臉檢測:面部檢測可以被視為二進(jìn)制分類問題,使用交叉熵的損失函數(shù)用公式1.1.5來描述:(3-5)里面的用來表示第i個訓(xùn)練樣本的真實,這個表示的是人臉,如果沒有等于1就說明不是人臉。用來表示第i個的訓(xùn)練樣本為人臉的改了吧。(2)檢測框的回歸:通過用歐式距離公式1.1.6用來表示候選窗口的損失【13】:(3-6)這個表示的是第無數(shù)個的樣本的真實向量。矢量由決定了邊界線的四個元素(水平坐標(biāo)、垂直坐標(biāo)、h和寬度)此表示第i個訓(xùn)練樣本的預(yù)繪制包圍盒矢量。人臉的特征點(diǎn)的檢測:面部特征點(diǎn)的構(gòu)成基本上與檢測幀回歸相同,由二維排列構(gòu)成。用歐幾里德距離表示的特征點(diǎn)損失的說明如公式1.1.7:(3-7)這表示為第i個訓(xùn)練樣本的實際面部坐標(biāo)。共有5個點(diǎn),各點(diǎn)有4個坐標(biāo)。由此就知道為20元組。如圖3-2這主要表示第N個樣本的坐標(biāo)【13】。圖3-2MTCNN的主要架構(gòu)解析MTCNN的算法講述:操作1:首先,初始化訓(xùn)練樣本和網(wǎng)絡(luò)權(quán)重。樣品集主要由部分臉部和部分非面部樣品構(gòu)成。假設(shè)樣本總數(shù)為N,則訓(xùn)練樣本集可以輸入金字塔。在網(wǎng)絡(luò)中裝入各種大小的圖像。操作2:把目標(biāo)全部綜合在一起,然后再使用廣撒網(wǎng)法來調(diào)整網(wǎng)絡(luò)。操作3:將一樣的圖像放置在不同大小的結(jié)構(gòu)中,并且一起傳送到訓(xùn)練的網(wǎng)絡(luò)里面。操作4:使用P-Net生成候選窗口和邊界。再用Bounding盒子進(jìn)行校正,最后使用NMS的算法進(jìn)行疊加重組。操作5:把P-Net輸出和改善后的候選窗口及Bounding盒得到矢量傳輸?shù)絅-Net。用這種方法的優(yōu)點(diǎn)就是淘汰了消極樣本。操作6:將N-Net得到改善后的結(jié)果輸入O-Net,再重復(fù)操作4,最后的得到臉部的具體位置。1.2算法的選取根據(jù)本論文算法和結(jié)果的要求,需要選擇合適的算法。需要結(jié)果的精度,實現(xiàn)高速化。翻閱很多優(yōu)秀的論文以及期刊,最后決定MTCNN算法。它主要是利用卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)造,并且它在最近幾年的呼聲是相對很多其他算法中最好的。檢測率是指實際檢測出的面部數(shù)量與正確檢測出的面部數(shù)量的比率,錯誤檢測率是指實際檢測出的面部錯誤的比率。MTCNN這個算法的成功率是最高的,并且很少存在失誤的,至于檢測的速度這個由于人臉太多以及人臉也不一樣,所以對于速度我們可以進(jìn)行忽略不計。所以綜上所述我們選擇的是MTCNN這個人臉識別算法作為本文的算法。1.3人臉識別的算法面部識別主要是將收集的圖像輸入保存在面部數(shù)據(jù)庫中,然后在數(shù)據(jù)庫中找到一致的面部的過程,進(jìn)而達(dá)到最初的目的——身份的認(rèn)證。直接對照臉部圖像時,因為計算量變多,所以為了用低次元的特征向量來表達(dá)臉部,需要使用特征提取方法。這個階段有兩個主要問題需要解決。一個是確認(rèn)輸入是誰,另一個是確認(rèn)輸入是否在數(shù)據(jù)庫中有保存。隨著時代的進(jìn)步,科技的飛速發(fā)展,技術(shù)的不斷成熟,近幾年提出的面部識別算法的識別率非常優(yōu)秀,主要分為:第一類這是一種傳統(tǒng)的機(jī)器學(xué)習(xí)方法,主要使用比較流暢的表現(xiàn)論,將臉部圖像映射到部分空間以進(jìn)行識別。第二類就是我們現(xiàn)在說的使用深度卷積神經(jīng)網(wǎng)絡(luò)理論應(yīng)用到網(wǎng)絡(luò)讓網(wǎng)絡(luò)學(xué)習(xí)到人臉最本質(zhì)的特征然后再進(jìn)行識別。1.1.1FACENET的識別算法深層學(xué)習(xí)主要是基于深層神經(jīng)網(wǎng)絡(luò)的包括多電平非線性轉(zhuǎn)換的機(jī)器學(xué)習(xí)方法。實際上,深層學(xué)習(xí)的概念是在2006年之前提出的,但是受到當(dāng)時條件的影響,受到了限制。只能識別早期深層學(xué)習(xí)手寫數(shù)字等小樣本。這個適用于面部樣品的話是非常沒有效果的。隨著技術(shù)的進(jìn)步,計算機(jī)的硬件已經(jīng)不再是限制條件,深度學(xué)習(xí)再次受到關(guān)注。FACENET是谷歌提出的基于卷積神經(jīng)網(wǎng)絡(luò)的最新算法。FACENET直接學(xué)習(xí)從圖像到空間的映射。以下3-3是FACENET的圖像:圖3-3FACENET的主要圖像1)FACENET的基本構(gòu)架提高深層神經(jīng)網(wǎng)性能的最直接的方法是增加大小。當(dāng)然尺寸包括深度和寬度。深度主要是網(wǎng)絡(luò)的層數(shù),寬度是網(wǎng)絡(luò)各層的神經(jīng)元。但是這個制度也有很多缺點(diǎn)。因為畢竟能得到數(shù)據(jù)是有限的,網(wǎng)絡(luò)的大小越大就會發(fā)生釣魚的現(xiàn)象。這主要是因為深層神經(jīng)網(wǎng)由串聯(lián)的多種神經(jīng)網(wǎng)絡(luò)層組成,大小越大,參數(shù)越大,訓(xùn)練參數(shù)隨x的增大而增大,導(dǎo)致計算越發(fā)的復(fù)雜。在有限的計算資源設(shè)備中,如果大小的增加導(dǎo)致性能的提高沒有太大變化,則會浪費(fèi)很多資源。但是為了解決上面的這些問題,F(xiàn)ACENET的深層神經(jīng)網(wǎng)使用了Inception的網(wǎng)絡(luò)結(jié)構(gòu),Inception對完全連接層應(yīng)用完全連接層,通過應(yīng)用卷積層來對網(wǎng)絡(luò)進(jìn)行深度的優(yōu)化進(jìn)而提高性能。Inception這個是使用了解析網(wǎng)絡(luò)結(jié)構(gòu)。核心想法是在網(wǎng)絡(luò)上尋找最佳Locapos結(jié)構(gòu),取代原來的非稀缺結(jié)構(gòu)。Arra的團(tuán)隊提出了一種具有相互連接層的網(wǎng)絡(luò)結(jié)構(gòu)。在這個結(jié)構(gòu)中,每個層的輸入必須計算網(wǎng)絡(luò)最后一層的結(jié)構(gòu)特性和最后一層的輸出集中在該層的輸入上。因此,網(wǎng)絡(luò)最底層的每個節(jié)點(diǎn)都對應(yīng)于輸入特征圖的特定區(qū)域,這個節(jié)點(diǎn)也被用來輸入網(wǎng)絡(luò)的下一層。在最下級網(wǎng)絡(luò)中,相關(guān)關(guān)系強(qiáng)的節(jié)點(diǎn)集中在相對空間。根據(jù)各層連接,Inception具有更多的系數(shù),減少了必要的訓(xùn)練參數(shù)。使用1*1、3*3、5*5的維護(hù)并列構(gòu)建Inception。使用3*3帶環(huán)層進(jìn)行帶環(huán),在基礎(chǔ)網(wǎng)絡(luò)輸入通過各種卷積過濾器分支后,輸出向量將堆疊在網(wǎng)絡(luò)的下一層輸入中。考慮到成本問題,輸出后添加3*3帶環(huán)層1*1卷積濾波器。圖3-4是Inception的結(jié)構(gòu)展示:圖3-4Inception架構(gòu)圖2)三元損失函數(shù)對于深神經(jīng)網(wǎng)絡(luò)提取的180個微特征向量,F(xiàn)ACENET將使用損失函數(shù)作為解決函數(shù),減少距離來減少錯誤。圖3-5是三元損失函數(shù)的過程:圖3-5損失函數(shù)三元函數(shù)的約束公式為1.1.1:(3-8)α表示間隔的差τ表示樣品的全部集合,變換以后得到下面的1.1.2公式:(3-9)丟失的L函數(shù),優(yōu)化不滿足條件的元組,忽略已經(jīng)滿足條件的。步驟詳解步驟1:用標(biāo)簽訓(xùn)練臉部樣本后,重置FACENET網(wǎng)絡(luò)的加權(quán)值,將面部樣品批輸入網(wǎng)絡(luò)。步驟2:通過卷積和采樣的操作得到一個網(wǎng)絡(luò)輸出為128的向量。步驟3:結(jié)合上面的公式,計算輸出和預(yù)測之間的誤差。步驟4:采用降維法反向更新FACENET的值,直到誤差收斂完成。步驟5:將測試圖像輸入到步驟4的網(wǎng)絡(luò)中,輸出表示當(dāng)前矢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- AI賦能高校思政教育的策略及實施路徑
- 散文的鑒賞技巧:初中語文高級教學(xué)
- 寫人繪形畫影的繪畫作文(12篇)
- 上海建平中學(xué)高一(下)期末語文試題及答案
- 我心中的老師抒情作文5篇
- 描寫月全食作文八年級(8篇)
- 廉頗藺相如列傳故事解析:初中語文教案
- 案件執(zhí)行協(xié)議書
- 詳細(xì)工作經(jīng)歷及崗位證明文書(6篇)
- 公交公司學(xué)雷鋒活動方案
- 2024年山東省煙臺市中考生物試題卷(含答案解析)
- 重慶市沙坪壩區(qū)第八中學(xué)校2023-2024學(xué)年八年級下學(xué)期期末英語試題(解析版)
- 上海市徐匯區(qū)2023-2024學(xué)年七年級下學(xué)期數(shù)學(xué)期末練習(xí)卷
- 植物拓染非物質(zhì)文化遺產(chǎn)傳承拓花草之印染自然之美課件
- TD/T 1044-2014 生產(chǎn)項目土地復(fù)墾驗收規(guī)程(正式版)
- 霧化吸入團(tuán)體標(biāo)準(zhǔn)解讀
- 信息光學(xué)智慧樹知到期末考試答案章節(jié)答案2024年北京工業(yè)大學(xué)
- 電大財務(wù)大數(shù)據(jù)分析編程作業(yè)3
- MOOC 質(zhì)量工程技術(shù)基礎(chǔ)-北京航空航天大學(xué) 中國大學(xué)慕課答案
- 【數(shù)字人民幣對貨幣政策的影響及政策探究12000字(論文)】
- 江蘇省鹽城市大豐區(qū)2023-2024學(xué)年八年級上學(xué)期期中數(shù)學(xué)試題(解析版)
評論
0/150
提交評論