




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3講:計算機視覺技術及應用數字媒體技術概論第3章:計算機視覺技術及應用1計算機視覺的定義與發展2深度學習與計算機視覺3計算機視覺關鍵技術4計算機視覺的實際應用一、計算機視覺的定義§3.1計算機視覺的定義與發展計算機視覺是用計算機來看世界的科學。使用攝像機和計算機來代替人眼和人腦來觀察分析圖像和視頻,對其中的目標進行識別、跟蹤、測量。計算機視覺通過將圖像與其中的多維數據建立起聯系從而獲取更多的信息。計算機視覺是一門綜合性的工程學科,它包含了計算機科學、信號處理、物理學、應用數學、統計學、生物學、認知科學等多種學科。§3.1計算機視覺的定義與發展二、計算機視覺的發展神經生物學家DavidHubel和TorstenWiesel對視覺神經的研究為計算機視覺奠定了基礎,Russell在同階段與其同學研制了第一臺數字圖像掃描儀,從此數字圖像處理迎來了開端計算機視覺于這個階段正式投入了市場應用20世紀50年代20世紀60年代麻省理工學院人工智能實驗室提出了計算機視覺理論,成為了計算機視覺下一階段發展的重要框架理論20世紀70年代計算機視覺經歷了漫長的發展。從20世紀中期開始,計算機視覺經歷了從二維圖像到三維圖像再到視頻的不斷探知,算法也從簡單的神經網絡發展到深度學習。§3.1計算機視覺的定義與發展人們開始致力于研究特征識別計算機視覺從理論走向了應用20世紀80年代20世紀90年代21世紀初計算機視覺的發展走向了高潮21世紀10年代深度學習在計算機視覺中被廣泛應用三、計算機視覺相關學科§3.1計算機視覺的定義與發展圖像處理
指將圖像用計算機進行分析,轉化為另一幅包含更多特征的圖像。模式識別(模式分類)
指用計算機根據不同圖像中特征的不同進行統計,劃分為不同的類別。圖像理解指給計算機一張圖像,計算機不但能描述圖像本身,還可以對圖像內的物體做出解釋,研究圖像中有哪些目標,目標之間有什么樣的關聯,圖像所處的場景是怎樣的。計算機視覺涉及的學科眾多,上述的幾種學科以及很多其他的學科都有著密切的關系,因此計算機視覺是一個極為復雜、研究領域極廣的學科。第3章:計算機視覺技術及應用1計算機視覺的定義與發展2深度學習與計算機視覺3計算機視覺關鍵技術4計算機視覺的實際應用一、深度學習§3.2深度學習與計算機視覺深度學習是機器學習中的一個領域,它是通過對數據集或樣本庫進行深層次的理解與學習,對圖像、視頻、文字、聲音等多個數據進行研究。定義深度學習在搜索技術、機器翻譯、計算機視覺、自然語言處理、個性化推薦等多個領域的技術都發揮了極大的作用。應用一、深度學習§3.2深度學習與計算機視覺研究內容基于卷積計算的神經網絡系統(常稱為卷積神經網絡)基于多層神經元的自編碼神經網絡深度置信網絡隨著對深度學習研究的深入化,科研人員逐漸將不同的方法和不同的訓練步驟相結合,以達到更加優秀的訓練結果。與傳統的方法相比較,深度學習中設置了更多的參數模型,因此參與訓練的數據量就更大,模型的訓練難度就更大,但訓練達到的效果會更好。一、深度學習§3.2深度學習與計算機視覺學習能力強覆蓋范圍廣,有較強的適應性,可解決復雜問題數據量越大,表現效果越好多平臺多框架兼容優點受所需算力和數據規模過大的限制,難以在移動設備上使用對硬件要求高使用困難,模型設計復雜對數據依賴性高,可解釋性不高,當數據種類不平均時會產生較大誤差缺點一、深度學習§3.2深度學習與計算機視覺
深度學習的本質是人工神經網絡,深度神經網絡指的是具有一層及一層以上的隱含層的神經網絡,通常用于對復雜的非線性系統進行建模,其中常用的幾種網絡結構如下:(1)CNN定義:NN是為了完成生物視知覺仿造任務而構造的,是一種包含卷積計算且具備深度結果的前饋神經網絡,可以用監督學習和非監督學習進行訓練應用:可以對數據進行平移不變的分類,因此也稱為平移不變人工神經網絡
CNN網絡架構一、深度學習§3.2深度學習與計算機視覺(2)深度信念網絡定義:深度信念網絡(DeepBeliefNetwork,DBN)是一種包含多層隱藏層的概率生成模型,與傳統的神經網絡判別模型相對比,生成模型對數據和標簽進行聯合對比觀察應用:DBN是由多個限制玻爾茲曼機層構成,采用無監督逐層訓練的方式進行訓練,可以對訓練的數據進行深層次的表達DBN網絡架構一、深度學習§3.2深度學習與計算機視覺(3)循環神經網絡定義:循環神經網絡(RecurrentNeuralNetwork,RNN)是以序列數據為輸入并在序列的方向上進行遞歸的遞歸式神經網絡,網絡內的循環單元按鏈式相連接應用:RNN由于其記憶性的特點在對序列數據進行學習時有一定的優勢,常被應用在各種時間序列預測中。CNN和RNN相結合的神經網絡可以用來處理輸入為序列的計算機視覺問題RNN網絡架構一、深度學習§3.2深度學習與計算機視覺(4)監督學習監督學習是指參與訓練的數據都帶標簽,且訓練的誤差是從上向下傳輸的訓練過程。監督學習的第一步是對輸入數據進行學習,得到各層的參數并進一步對多層模型的參數進行優化調整。監督學習第一步得到的初始值接近全局最優,因此取得的效果更好。(5)無監督學習無監督學習是指參與訓練的數據不帶有標簽,從底層開始一層一層向上的訓練過程。由于人工給數據進行分類打標簽的任務成本過高,因此需要計算機來幫助實現這一目標。首先用沒有標簽的數據訓練第一層并學習到數據本身的結構,得到比輸入的數據更加有表現能力的輸出,并輸入到下一層中。學習到n-1層時,將輸出作為n層的輸入,從而做到自下而上的訓練,并得到各層的參數。二、深度學習與計算機視覺§3.2深度學習與計算機視覺傳統的視覺算法通常包含五個步驟,分別為特征感知、圖像預處理、特征提取、特征篩選和推理預測與識別。傳統的特征提取主要依靠人工完成,對于簡單的任務來說效果好,但對于規模較大的數據集難以實現。
深度學習在處理信息量較為豐富的任務上有很好的表現,非常適合計算機視覺任務,大規模的數據集和深度學習網絡的強大能力為計算機視覺提供了廣闊的發展空間。傳統的特征提取存在的缺點二、深度學習與計算機視覺§3.2深度學習與計算機視覺(1)局部卷積神經網絡
局部卷積神經網絡(Region-CNN,R-CNN),是第一個將深度學習運用到目標檢測上的算法。R-CNN保存著傳統的目標檢測的思路,保留使用區域框進行特征提取、圖像分類、非極大值抑制的方法,但區別在于將傳統的特征提取方法換成了深度卷積網絡特征提取的方法。傳統的目標檢測一般先在圖片上圈出所有可能是目標物體的區域框,然后對這些區域框進行特征提取并使用圖像識別的方法分類,分類后的區域用非極大值抑制的方法進行輸出。二、深度學習與計算機視覺§3.2深度學習與計算機視覺對輸入的一張圖片采用選擇性搜索(SelectiveSearch,SS)算法提取2000個類別獨立的區域框。將每個區域框調整為固定的大小,用CNN提取特征向量。對每個區域框進行支持向量機(SupportVectorMachine,SVM)目標分類R-CNN的具體步驟訓練一個邊界框回歸模型,對框的準確位置進行修正。樣例二、深度學習與計算機視覺§3.2深度學習與計算機視覺二、深度學習與計算機視覺§3.2深度學習與計算機視覺(2)常見數據集數據集合是深度學習中不可缺少的部分,深度學習的學習都是基于數據集內大量數據所攜帶的信息,訓練用的數據集量越大,得到的訓練結果可能會更好。計算機視覺所需要的數據集比較龐大,且個人收集起來十分復雜,因此網絡上有許多公開的數據集可供研究人員學習使用。ImageNetMSCOCOCityscapesKITTI幾個常用的開源數據集:第3章:計算機視覺技術及應用1計算機視覺的定義與發展2深度學習與計算機視覺3計算機視覺關鍵技術4計算機視覺的實際應用一、特征檢測§3.3計算機視覺關鍵技術在計算機視覺技術中,特征檢測是十分基礎而重要的角色。計算機視覺中的多種任務,如目標識別、圖像分類、圖像分割、立體視覺、三維重建等工作都是以特征檢測為基礎,通過對特征的檢測與提取從而完成后續任務。特征檢測中的特征包括特征點、輪廓、邊緣等,有明顯的可以識別的與周圍環境差異較大位置都是特征。有些特征人眼可以輕易分辨識別,而計算機視覺技術是通過檢測兩張圖像中的特征點,判斷相同的特征點來進行匹配:樣例一、特征檢測§3.3計算機視覺關鍵技術(a)原始圖片生活中隨手拍攝的照片都可以用于特征檢測,圖(a)是一張手機拍攝的風景圖片一、特征檢測§3.3計算機視覺關鍵技術(b)截取部分圖片圖(b)是從(a)中截取出的校徽部分并進行了放大。用眼睛可以輕易的分辨識別出(b)圖片是(a)圖片的哪一部分,而計算機視覺技術則是通過檢測兩張圖像中的特征點,判斷相同的特征點來進行匹配。特征點:也可以稱為是興趣點、角點,是圖像的重要因素之一,指的是圖像中關鍵、顯而易見的點,如圖像中某個部分的邊角點、特殊形狀物體的邊緣端點等。一、特征檢測§3.3計算機視覺關鍵技術(c)特征點檢測經過特征檢測后,圖(a)中圖像的特征點用圓圈圈出來,如圖(c)所示,圖片中的字、建筑物的邊角點、樹枝的末端、校徽內不同顏色的交界點等都是特征點。一、特征檢測§3.3計算機視覺關鍵技術(d)特征點匹配特殊點可以用來尋找不同圖像中特殊點相同的對應部分,下面通過特殊點的識別與匹配將圖(a)、(b)中的兩張圖片匹配起來,圖(d)所示,可以看出兩張圖片中相同的特殊點用直線相連接,通過檢測兩張圖像的特殊點,并對特殊點進行比對,相同特征的點即可對應連接匹配起來。一、特征檢測§3.3計算機視覺關鍵技術
用于進行特殊點檢測的算子稱為特征描述算子,常用的特征描述算子有尺度不變特征檢測、Harris特征點檢測、偏差和增益規范化檢測等。尺度不變特征變換(Scale-invariantfeaturetransform,SIFT)是一種經典的局部特征描述算子,是由DavidLowe于1999年最初發表的。SIFT主要是通過將圖像高斯模糊后,圖像中不同區域點的變化不同,變化較小的點一般為平滑區域,變化較大的點則為特征點。通過檢測到的關鍵特征點為中心,選擇16×16的窗口,將這個區域平均分為多個4×4的子區域,每個4×4子區域分成8個區間,即可得到4×4×8=128維度的特征向量。
SIFT算法主要可以分為四個步驟:尺度空間極值檢測精確特征點的位置確定特征點的方向特征點的描述一、特征檢測§3.3計算機視覺關鍵技術(1)尺度空間極值檢測尺度空間是在進行圖像處理的模型內引入一個尺度的參數來使其擁有尺度不變性的特征,通過對空間內的各個尺度的圖像進行處理,模擬人眼距離看到目標的遠近差異的過程,對圖像進行逐漸增長的模糊處理,圖像的模糊程度與尺度成正比。公式及相關參數(3-1)
(3-2)
是高斯尺度
是尺度空間因子一、特征檢測§3.3計算機視覺關鍵技術上文描述了尺度空間的定義,接下來通過高斯金字塔的方式來實現尺度空間的搭建。定義:高斯金字塔是通過將圖像逐層高斯濾波并進行降階采樣,得到的圖像進行由大到小的圖像構成金字塔狀,金字塔模型的最底下一層為原始的圖像。
步驟:1)首先對原始圖像進行不同參數的高斯濾波,得到多張模糊程度不同的圖像;2)然后進行降價采樣后得到上一層的圖像;3)得到的圖像作為再上一層的原始圖像,重復進行操作直到滿足層數需求。金字塔每層的圖像進行多參數高斯模糊,因此塔每層都包含多張圖像,每一層的多張圖像組合稱為Octave,這些圖像的大小一致但模糊程度不同。一、特征檢測§3.3計算機視覺關鍵技術在SIFT特征點檢測中選擇了差分高斯金字塔代替高斯金字塔,可以有效地提高檢測的效率。尺度空間極值檢測一、特征檢測§3.3計算機視覺關鍵技術(2)精確特征點的位置由于數字圖像都為離散采樣的圖像,而實際的圖像是連續的,并且還需要考慮在邊緣位置的極值點,因此在上一步驟中檢測出的極值點有可能出現偏差。因此要對差分高斯空間進行擬合處理,來精確特征點的位置。
通過設置閾值來判斷極值點是否在邊緣上,H(x,y)為差分高斯金字塔中對x和y的二階導數,(3-3)一、特征檢測§3.3計算機視覺關鍵技術(3-5)若極值點不滿足下式,則舍去該點。(3-6)
Tr(H)為矩陣H的跡,Det(H)是行列式(3-4)一、特征檢測§3.3計算機視覺關鍵技術(3)確定特征點的方向通過對圖像的每個關鍵點賦予一個方向,可使這個特征檢測算子具有旋轉不變性,也就是當目標發生方向的變化時,只要其他的特征都相對應,也可以識別出。極值點的方向通過其周圍的像素的梯度來確定方向,梯度的公式為:(3-7)一、特征檢測§3.3計算機視覺關鍵技術梯度的幅值為:(3-8)梯度的方向為:(3-9)一、特征檢測§3.3計算機視覺關鍵技術(4)特征點的描述
經過上述步驟產生的特征點都是基于圖片的點坐標的,如果想根據特征點與其他的圖像進行對比,需要將特征點單獨提取出來。通過對特征點周圍進行分塊,并計算梯度直方圖,生成具有唯一性的方向向量來代表這部分的圖像,從而產生SIFT特征向量。§3.3計算機視覺關鍵技術二、圖像分割定義:圖像分割即為將想要識別的目標從圖像中分割出來應用:圖像分割是計算機視覺中十分重要的任務,它在實際生活中有廣泛的應用,并發揮著核心的作用。例如在行人檢測、視頻監控、自動駕駛、醫學圖像分析等方面,圖像分割都扮演著不可或缺的角色圖像分割二、圖像分割§3.3計算機視覺關鍵技術圖像分割將圖像中的待識別目標分割出來,并對分割的目標進行分類。圖像中一般都會同時存在多種物體,語義分割通過對像素級別將圖片分為多個部分,分割出不同類別的目標。語義分割將圖像中的待識別目標分割出來,對分割的目標分類后,還需要對分類后的目標進行區分,將每個不同的實例單獨分割。相較于語義分割,實例分割將每一個目標作為一個待分割的實例。實例分割§3.3計算機視覺關鍵技術圖像分割算法(按分割方式的不同進行分類)閾值分割法:選取一個合適的像素值作為邊界,將圖像處理成對比度較高的、分割部分容易識別的方法。區域增長細分方法:通過將屬性相似的像素組合在一起形成一個區域,將區域內找到一個種子像素,將周圍的屬性與種子像素相似的像素合并到區域中。將這些新合并進來的像素作為新的種子像素繼續合并,可以得到沒有滿足屬性相似的像素。邊緣檢測分割方法:主要通過圖像的灰度值不同以及邊緣的突出進行分割基于聚類分割方法:通過將類的劃分以物體間的相似性作為標準,使相似的類別盡可能的相似,不相似的類別區別盡可能大。基于CNN的弱監督學習分割方法:對圖像內待識別對象區域用部分像素進行標記。二、圖像分割二、圖像分割§3.3計算機視覺關鍵技術圖像分割算法的發展三、R-CNN系列算法§3.3計算機視覺關鍵技術基于R-CNN的幾種算法的演進:FastR-CNN在基于R-CNN的基礎上,在R-CNN的最后一個卷積層后添加感興趣區域(RegionsofInterest,ROI)的池化層,采用將bbox回歸與區域在神經網絡內部合并成為多重任務模型,并使用Softmax代替了SVM分類器。FastR-CNN的改進有效地解決了R-CNN嚴重的速度問題,并且為FasterR-CNN做了鋪墊。FasterR-CNN在FastR-CNN的基礎上使用了區域生成網絡(RegionProposalNetwork,RPN)來生成候選框,讓RPN和FastR-CNN共享CNN特征,成為一個端到端的CNN對象檢測模型。三、R-CNN系列算法§3.3計算機視覺關鍵技術MaskR-CNN算法在FasterR-CNN的基礎上創新了RoI對齊操作,引用全卷積網絡(FullyConvolutionalNetwork,FCN)生成Mask,并且添加了用于語義分割的Mask損失函數,改變了算法損失函數的計算方法。MaskScoringR-CNN創新出了一種新方法,添加MaskIoUHead模塊,將MaskHead操作后得到的預測分數與ROI特征輸入到卷積層和全連接層,從而得到模型的分數。三、R-CNN系列算法§3.3計算機視覺關鍵技術表3-1幾種基于R-CNN的算法對比
使用方法缺點改進R-CNN選擇性搜索SS提取候選區域(RegionProposal,RP)CNN提取特征SVM分類/bbox回歸訓練步驟繁瑣訓練所占空間大訓練耗時長mAP為66%FastR-CNNSS提取RP/CNN提取特征Softmax分類多任務損失函數邊框回歸沒有實現端到端訓練測試mAP提升至70%;測試耗時縮短。FasterR-CNNRPN提取RPCNN提取特征Softmax分類多任務損失邊框回歸計算量依舊比較大測試精度和速度提升;實現端到端目標檢測;迅速生成建議框。MaskR-CNNRPN提取RPResNet-FPN提取特征ROI對齊的方法來取代ROI池化Mask分支邊框分類置信度用來作為Mask準確率時不夠精確ROI對齊能將像素對齊,滿足了圖像語義分割的準確度要求。MaskScoringR-CNNRPN提取RPResNet-FPN提取特征加入MaskIOU分支
獲得更加可靠的Mask分數。三、R-CNN系列算法§3.3計算機視覺關鍵技術圖像分割評分指標平均正確率(AveragePrecision,AP),指的是所有類別的正確率。(3-10)像素精度(PixelAccuracy,PA),指標記正確的像素占全部像素的比例。(3-11)三、R-CNN系列算法§3.3計算機視覺關鍵技術均像素精度(MeanPixelAccuracy,MPA),指在PA的基礎上對標記正確像素占全部像素的比例做類平均。(3-12)交并比(IntersectionOverUnion,IoU),指計算真實值和預測值兩個集合的交集和并集之比(3-13)三、R-CNN系列算法§3.3計算機視覺關鍵技術均交并比(MeanIntersectionUnion,MIoU),指在每一個類上計算IoU后進行平均。MIoU是使用最頻繁的圖像分割精準度度量標準。(3-14)頻權交并比(FrequencyWeightedIntersectionoverUnion,FWIoU),指在MIoU的基礎上進行升級,根據類別出現的頻率設置權重。(3-15)四、立體視覺§3.3計算機視覺關鍵技術立體視覺指的是用兩個或多個攝像頭來獲取深度的視覺信息的技術。首先介紹雙目視覺求解深度:雙目視覺求解深度就是根據透視幾何圖形學的三角化原理,通過左邊拍攝的圖像上面的任意一個點,在右邊拍攝的圖像上找到相應的匹配點,即可確定該點的三維坐標。下圖所示為雙目視覺求深度的過程。P為選中的任意一點P點左右兩個相機中成像的位置為P0和P1兩個相機的焦距分別為f0和f1兩個相機的相對位移為R和T四、立體視覺§3.3計算機視覺關鍵技術根據小孔成像原理可知:(3-16)(3-17)由相機的左右相對位置關系可得:(3-18)相機的左右相對位置關系為:因此只要找到左圖上一點在右圖上的匹配點,即可求出該點在相機坐標系中的坐標。四、立體視覺§3.3計算機視覺關鍵技術接下來解決從右圖找左圖對應點坐標的問題。一般來說,從右圖中找左圖中已知的對應點是一個復雜度較高的2維搜索問題,為了降低算法的復雜度,使用極線約束將此問題轉換為一維問題。左圖上的點在右圖中可能的投影是在某一條線上,將搜索范圍由面降低到線。將左右攝像頭完美對齊,使他們的焦距等參數完全一致,即可將左右攝像頭的極線矯正成行相同的平行線。因此左圖中任意一點在右圖中只能映射到與其對應的相同行上。四、立體視覺§3.3計算機視覺關鍵技術
立體視覺的研究主要由以下幾個方面組成:圖像獲取:立體視覺研究中需要從圖像中獲取許多要素,且圖像的場景復雜度會受到一些因素的影響。攝像機模型:對立體攝像機組的重要幾何和物理特征的表示,提供圖像上對應點空間和實際場景空間之間的映射關系,還約束尋找對應點時的搜索空間。特征抽取:該過程即為提取匹配基元的過程。圖像匹配:是立體視覺的核心,建立圖像之間的對應關系,從而計算視差。深度計算:解決匹配問題的復雜化、提高深度計算精度。內插:該過程可以近似連續深度圖。第3章:計算機視覺技術及應用1計算機視覺的定義與發展2深度學習與計算機視覺3計算機視覺關鍵技術4計算機視覺的實際應用§3.4計算機視覺的實際應用隨著人工智能技術的迅速發展,人們生活越來越智能化,計算機視覺的技術也深入到生活中去。人工智能已經在不知不覺中滲透進生活的每個細枝末節。2016年3月,谷歌智能圍棋機器人阿爾法狗與人類圍棋世界冠軍李世石的人機圍棋大戰。在這場對弈中,阿爾法狗以4比1的成績戰勝李世石,人工智能開始受到大家的廣泛關注,成為研究熱點。計算機視覺作為人工智能的一個重要的、實用性極強的分支,更是受到許多研究人員的青睞。§3.4計算機視覺的實際應用我們生活中的方方面面都離不開眼睛的幫助,許多工作也都是基于人眼的觀察才可以完成,但人眼觀察受到的限制比較多。而計算機視覺正是用計算機代替人眼工作的,并且計算機的算力、速度遠遠強于人類,且成本較低,因此計算機視覺在生活中的實際應用范圍十分廣闊。例如停車場內的智能車牌識別系統、上班打卡的虹膜識別和指紋識別系統、手機應用軟件中的智能物體識別功能、人臉面部表情識別、人類肢體動作識別、手寫字體識別等都是生活中和我們息息相關的技術。下面為大家詳細介紹人臉識別、三維重建以及自動駕駛這三個實際應用的計算機視覺技術。一、人臉識別§3.4計算機視覺的實際應用
人臉識別是計算機視覺在實際應用中使用范圍比較廣泛的一項技術,在許多的場景都能見到它的身影。學生進出圖書館進行人臉識別人臉的特征和虹膜、指紋一樣,有著唯一性、不易變性、以及不可復制性,因此為人的身份鑒定打下了基礎。例如過去火車站進站在核驗乘車人身份時,檢票員只使用肉眼粗略比對持證人與所持身份證上的照片是否一致,很容易出現紕漏。而今在進站口設有多臺人臉識別機器,乘車人刷身份證的同時進行面部比對,高效又安全。一、人臉識別§3.4計算機視覺的實際應用
人臉識別的主要步驟:人臉圖像的采集:人臉識別所需要的圖像為人五官清晰的臉部圖像,可以通過視頻、動圖、圖片等多種途徑獲取。人臉圖像的預處理:采集得到的包含人臉的圖像不能直接用于人臉識別,需要進行預處理操作。需要對圖片灰度變換、過濾噪聲、銳化以及歸一化等多種處理。人臉特征的提取:人臉特征的提取可以看作是對圖像進行關鍵點定位,通過圖像中人的五官的位置來判斷人臉的位置和大小。人臉特征的對比與匹配:將待識別的人臉特征與數據庫內的人臉特征進行搜索匹配,當特征的相似度到達一個設定的值時,即認為兩者有較大的相似度,從而實現人臉識別任務。一、人臉識別§3.4計算機視覺的實際應用值得注意的是,在人臉識別任務的實現中數據庫是必不可少的,數據庫在人臉識別的任務中也發揮了十分重要的作用。用于商用的人臉識別技術需要單獨建立數據庫,而數據庫的建立不可避免的涉及到用戶的個人信息。因此數據庫的安全、信息保密是十分重要的,但許多科技公司的技術和財力難以實現對用戶人臉信息的保護,導致了網絡上經常會出現人臉信息的售賣。2020年11月1日,國家標準《信息安全技術遠程人臉識別系統技術要求》正式實施,此標準對我國人臉識別技術體系和應用場景都做出了進一步的詳細約束。二、三維重建§3.4計算機視覺的實際應用定義:計算機視覺中的三維重建就是通過對圖像進行處理,分析圖像中隱含的信息來重建圖像所處的三維環境。應用:三位重建技術是環境感知的重要技術之一,自動駕駛、虛擬現實技術、增強現實技術、運動目標檢測、行為分析等多種計算機視覺的實際應用中都存在著三維重建的身影。對比:三維重建一般是通過單一的視圖或者多角度的視圖來對當前環境進行三維信息還原的過程。多角度的視圖所包含的條件信息比較充足,因此三維重建的難度較小,而單一視圖的三維重建則比較困難。表示方法:深度圖、點云、體積元素和網格二、三維重建§3.4計算機視覺的實際應用深度圖用于表示場景中各點與計算機間的距離,深度圖中的每像素表示的是圖像中對應的場景與攝像機之間的距離。1.深度圖體積元素又稱體素,與像素一樣,體素是三維空間內分割的最小的單位,用恒定的標量或向量來表示一個立體的區域。2.體積元素三維重建通常采用的四種表示方法二、三維重建§3.4計算機視覺的實際應用點云是通過測量一起得到的圖像中物體表面的數據集合。點云可以分為系數點云和密集點云。稀疏點云:使用三維坐標測量機得到的間距較大的點云。密集點云:使用三維激光掃描儀得到的比較密集的點云。3.點云前視圖俯視圖左視圖原圖點云三視圖二、三維重建§3.4計算機視覺的實際應用網格即為用網格模擬組成三維立體物體的表面,計算機視覺中的網格常用的有三角網格和四角網格。4.網絡二、三維重建§3.4計算機視覺的實際應用
三維重建在實際應用中有不同的方向,例如自動駕駛和機器人領域中三維重建叫作即時定位與地圖構建(SimultaneousLocalizationAndMapping,SLAM)。
計算機視覺里還有基于深度學習的三維重建,以及對人體的三維重建、對人臉的三維重建、對各種物體的三維重建、對室內場景的三維重建等。三、自動駕駛§3.4計算機視覺的實際應用自動駕駛汽車(無人駕駛汽車)是通過電腦進行控制來實現的新型技術。自動駕駛是由人工智能、計算機視覺、雷達系統、全球定位系統等多種技術相結合的技術,無需人類的操控即可實現對車輛的安全駕駛。自動駕駛技術是一項十分復雜難度極大的工程,需要駕駛人全神貫注、時刻保持清醒,對路況有著清晰迅速的判斷力,而路況本身就很復雜,參與交通的因素多,路況信息實時發生改變,稍有不慎就會發生交通事故。三、自動駕駛§3.4計算機視覺的實際應用自動駕駛汽車(無人駕駛汽車)是通過電腦進
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CHC 115.1-2021 T/CAS 115.1-2021保健紡織品第1部分:通用要求
- T/CGCC 17-2018商業信譽評價體系
- T/CECS 10181-2022消防排煙通風天窗
- T/CCSAS 026-2023化工企業操作規程管理規范
- T/CCS 027-2023煤礦地理信息系統地圖服務接口要求
- T/CCOA 14-2020組織蛋白
- T/CCMA 0166-2023施工升降機標識
- T/CCASC 6007-2023水合肼、ADC發泡劑行業清潔生產評價指標體系
- T/CCAAS 001-2023“黨建+企業文化管理”評價標準
- T/CATCM 026-2023中藥液體廢棄物循環利用指導原則
- 2025至2030年中國智能學習機行業投資前景及策略咨詢研究報告
- (高清版)DG∕TJ 08-7-2021 建筑工程交通設計及停車庫(場)設置標準
- 教育咨詢保密協議書
- 無房無車離婚協議書
- 南師附中高三數學備忘錄及答案詳解
- 2025-2030年中國甲巰咪唑片行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025年安徽國控資產管理有限公司第二季度社會招聘5人筆試參考題庫附帶答案詳解
- 2025年安全知識競賽題庫及答案(共200題)
- 2024年湖北省中考地理生物試卷(含答案)
- 工學結合一體化課程教學設計的編寫(課堂PPT)
- 電氣裝置安裝工程接地裝置施工及驗收規范——50169-2006
評論
0/150
提交評論