




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
計算機視覺
計算機視覺是從圖像或視頻中提出符號或數值信息,分析計算該信息以進行目標的識別、檢測和跟蹤等。更形象地說,計算機視覺就是讓計算機像人類一樣能看到并理解圖像。
計算機視覺(ComputerVision,CV)是一門涉及圖像處理、圖像分析、模式識別和人工智能等多種技術的新興交叉學科,具有快速、實時、經濟、一致、客觀、無損等特點。
計算機視覺是研究如何讓機器“看”的科學,其可以模擬、擴展和延伸人類智能,從而幫助人類解決大規模的復雜問題。因此,計算機視覺是人工智能主要應用領域之一。
計算機視覺技術的基本原理是利用圖像傳感器獲得目標對象的圖像信號,然后傳輸給專用的圖像處理系統,將像素分布、顏色、亮度等圖像信息轉換成數字信號,并對這些信號進行多種運算與處理,提取出目標的特征信息進行分析和理解,最終實現對目標的識別、檢測和控制等。1966年,人工智能學家明斯基在給學生布置的作業中,要求學生通過編寫一個程序讓計算機描述它通過攝像頭看到了什么,這被認為是計算機視覺最早的任務描述。20世紀70~80年代,隨著現代電子計算機的出現,計算機視覺技術也初步萌芽。MIT的人工智能實驗室院首次開設計算機視覺課程計算機視覺的發展歷史20世紀90年代,計算機視覺技術取得了更大的進步,開始廣泛應用于工業領域。進入21世紀,得益于互聯網的興起和數碼相機的出現帶來的海量數據,以及機器學習方法被廣泛應用,計算機視覺發展迅速。2010年以后,借助于深度學習的力量,計算機視覺技術得到了爆發增長和產業化發展。通過深度神經網絡,各類視覺相關任務的識別精度都得到了大幅提升。
計算機視覺在采集圖像、分析圖像、處理圖像的過程中,其靈敏度、精確度、快速性都是人類視覺所無法比擬的,它克服了人類視覺的局限性。計算機視覺系統的獨特性質,使它在各個領域的應用中顯示出強大生命力。計算機視覺的應用及面臨的挑戰
目前,在醫學上采用的圖像處理技術大致包括壓縮、存儲、傳輸和自動/輔助分類判讀,此外還可用于醫生的輔助訓練。與計算機視覺相關的工作包括分類、判讀和快速三維結構的重建等方面。2.公共安全領域的應用
公共安全領域是計算機視覺技術的重要應用場景,尤其是人臉識別技術,作為構建立體化、現代化社會治安防控體系的重要抓手和技術突破點,在當前的安防領域中具有重要應用價值。3.在無人機與自動駕駛領域的應用
無人機與自動駕駛行業的興起,讓計算機視覺在這些領域的應用成為近年來的研究熱點。以無人機為例,簡單至航拍,復雜至救援救災和空中加油等應用,都需要高精度的視覺信號以保障決策與行動的可靠性。在無人機的核心導航系統中,很重要的一個子系統就是視覺系統4.工業領域的應用
計算機視覺在工業領域也有著極為重要的應用。在工業領域,計算機視覺是工業機器人領域的關鍵技術,配合機械裝置能夠實現產品外觀檢測、質量檢測、產品分類、部件裝配等功能。5.其他領域的應用
計算機視覺的應用非常廣泛,除了上文提到的多個重要的領域之外,在其他產業(如農業、服務業)都有著大量的應用實踐,為人類生活提供了越來越多的便利。6.計算機視覺面臨的挑戰目前,計算機視覺技術的發展面臨的挑戰主要來自以下3個方面。(1)有標注的圖像和視頻數據較少(2)計算機視覺技術的精度有待提高(3)計算機視覺技術的處理速度有待提高圖像分類
圖像分類是根據不同類別的目標在圖像信息中所反映的不同特征,將它們區分開來的圖像處理方法。
圖像分類的任務就是輸入一個圖像,正確輸出該圖像所屬的類別。對于人類來說,判斷一個圖像的類別是件很容易的事,但是計算機并不能像人類那樣一下獲得圖像的語義信息。計算機能看到的只是一個個像素的數值,對于一個RGB圖像,假設其尺寸是32×32,那么計算機看到的就是一個3×32×32的矩陣,或者更正式地稱其為張量(可以簡單理解為高維的矩陣)。圖像分類就是尋找一個函數關系,這個函數關系能夠將這些像素的數值映射到一個具體的類別(類別可以用某個數值表示)。
假定一個可能的類別集categories={dog,cat,eagle},向分類系統輸入一張圖片。圖像分類系統的目標是根據輸入圖像,從類別集中分配一個類別,在此為dog類別。分類系統也可以根據概率給圖像分配多個標簽,如dog:90%,cat:6%,eagle:4%。圖像分類算法
1.傳統圖像分類算法
完整建立圖像識別模型一般包括底層特征提取、特征編碼、空間約束、分類器分類等幾個階段。2.基于深度學習的圖像分類算法
基于深度學習的圖像分類算法的原理是輸入一個元素為像素值的數組,然后給它分配一個分類標簽。CIFAR-10是一個非常流行的圖像分類數據集。這個數據集包含了60?000張32×32的小圖像,每張圖像都有10種分類標簽中的一種,這60000張圖像被分為包含50?000張圖像的訓練集和包含10?000張圖像的測試集。(1)VGG模型VGG模型與以往的模型相比,進一步加寬和加深了網絡結構。它的核心是5組卷積操作,每2組之間做最大池化的空間降維。(2)GoogLeNet模型GoogLeNet模型由多組Inception模塊組成。該模型的設計借鑒了NIN(NetworkinNetwork)的一些思想。(3)ResNet模型
殘差網絡(ResidualNetwork,ResNet)是用于圖像分類、圖像物體定位和圖像物體檢測的深度學習模型。目標檢測
目標檢測需要定位出圖像目標的位置和相應的類別。由于各類物體有不同的外觀、形狀、姿態,加上成像時光照、遮擋等因素的干擾,目標檢測一直是計算機視覺領域最具有挑戰性的問題。
目標檢測的任務是在圖像中找出所有感興趣的目標(物體),并確定它們的位置和大小,是計算機視覺領域的核心問題之一。圖像分類任務關心整體,給出的是整張圖片的內容描述;而目標檢測則關注特定的物體目標,要求同時獲得該目標的類別信息和位置信息。
目標檢測需要解決目標可能出現在圖像的任何位置、目標有各種不同的大小以及目標可能有各種不同的形狀這3個核心問題目標檢測框架模型1.R-CNNR-CNN采用的是選擇性搜索(SelectiveSearch)算法,使用聚類的方法對圖像進行分組,得到多個候選框的層次組。2.SPP-NETSPP-NET是在R-CNN的基礎上提出的,由于R-CNN只能接受固定大小的輸入圖像,若對圖像進行裁剪以符合要求,會導致圖片信息不完整;若對原始圖像進行比例縮放又會導致圖像發生形變。在R-CNN中,需要輸入固定尺寸圖像的是第一個全連接層,而對卷積層的輸入并不做要求。3.FastR-CNN由于R-CNN在候選區域上進行特征提取時存在大量重復性計算,為了解決這個問題,提出了FastR-CNN。FastR-CNN借鑒SPP-NET對R-CNN進行了改進,檢測性能獲得提升。4.FasterR-CNNSPP-NET和Fast-CNN都需要單獨生成候選區域,該步驟的計算量非常大,并且難以用GPU進行加速。針對這個問題,在FastR-CNN的基礎上提出了FasterR-CNN,不再由原始圖片通過SelectiveSearch算法提取候選區域,而是先進行特征提取,在特征層增加區域生成網絡區域提取候選框(RPN,RegionProposalNetwork),每個單元按照規則選擇不同尺度的9個錨盒,利用錨盒計算預測框的偏移量,從而進行位置回歸。5.MaskR-CNNMaskR-CNN在FasterR-CNN中增加了并行的Mask分支,該分支是一個小全連接卷積網絡(FullyConvolutionalNetworksforSemanticSegmentation,FCN),對每個候選區域生成一個像素級別的二進制掩碼,該掩碼的作用是對目標區域空間布局進行二進制編碼。6.YOLOYOLO不同于以R-CNN為代表的兩步檢測算法,YOLO的網絡結構更為簡單,而且在速度上比FasterR-CNN快10倍左右,可以滿足目標檢測對于實時性的要求。7.YOLOv2YOLOv2對YOLO的網絡結構進行了改進,首先加入了批量歸一化,而且在訓練過程中采用高分辨率圖像,訓練448×448像素的高分辨率分類網絡,然后利用該網絡訓練檢測網絡。8.SSD因為YOLO對小目標檢測的準確率不高,SSD是對YOLO進行改進的成果,它可以既保持檢測準確率,又保證檢測的速度。圖像分割
圖像分割是圖像分析的第一步,是計算機視覺的基礎,是圖像理解的重要組成部分,同時也是圖像處理中最困難的問題之一。
圖像分割是利用圖像的灰度、顏色、紋理、形狀等特征,把圖像分成若干個互不重疊的區域,并使這些特征在同一區域內呈現相似性,在不同的區域之間存在明顯的差異性。
圖像分割其實可以看成把圖像分成若干個無重疊的子區域的過程,即假設R是整個要分割的圖像區域,將此區域分成n個區域R1,R2,R3…Rn的過程就是圖像分割。圖像分割算法
1.基于閾值的圖像分割算法
閾值分割法具有易于操作、功能穩定、計算簡單高效等優點。閾值分割法的基本原理是根據圖像的整體或部分信息選擇閾值,依據灰度級別劃分圖像。2.基于邊緣檢測的圖像分割算法
邊緣檢測分割法的基本原理是通過檢測邊界來把圖像分割成不同的部分。在一幅圖像中,不同區域的邊緣通常是灰度值劇烈變化的地方,邊緣檢測分割法就是根據灰度突變來進行圖像分割的。3.基于區域的圖像分割算法
區域分割法的基本原理是連通含有相似特點的像素點,最終組合成分割結果。區域分割法主要利用圖像局部空間信息,能夠很好地避免其他算法圖像分割空間小的缺陷。4.基于神經網絡技術的圖像分割算法
神經網絡分割法的基本原理是將樣本圖像數據用來訓練多層感知機,得到決策函數,進而用獲得的決策函數對圖像
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國土壤污染修復項目創業計劃書
- 中國家校互動系統項目創業計劃書
- 中國肉禽魚類制品項目創業計劃書
- 中國開封項目創業計劃書
- 中國精準農業軟件項目創業計劃書
- 中國計算機通信及數據傳輸項目創業計劃書
- 中國檸檬種植項目創業計劃書
- 中國高速光纖傳感器項目創業計劃書
- 中國釣魚項目創業計劃書
- 內蒙古飼料項目創業計劃書
- 鹽城市首屆“金聯杯”防范和打擊非法金融活動競賽練習卷含答案(一)
- 老年病人防跌倒護理對策論文
- 糖尿病足課件
- 頂管工作井最小尺寸的確定及頂力計算書
- 早產兒母乳強化劑使用專家共識解讀課件
- 體育營銷策劃方案
- 卡爾曼濾波與組合導航考試試卷A
- 《冷庫場所消防安全知識》培訓
- DB2101T 0047-2022 街道和鄉鎮政務誠信評價指標與規范
- 兒童鉆石畫課件
- 河南省第二屆職業技能大賽網絡安全(世賽)項目技術工作文件
評論
0/150
提交評論