



免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)視覺綜述華顯明(重慶師范大學(xué)數(shù)學(xué)系系統(tǒng)分析與集成)摘要:自從1956 年Dartmouth學(xué)會(huì)上提出“人工智能”后,世界各國(guó)的研究者發(fā)展了眾多理論和原理。人工智能是一門極富挑戰(zhàn)性的學(xué)科,研究他的工作人員必須懂得多門學(xué)科的知識(shí),比如計(jì)算機(jī)、心理學(xué)、哲學(xué)、生物學(xué)、仿生學(xué)等等,它涉及的范圍相當(dāng)?shù)膹V泛。并且在這些廣泛的學(xué)科又由不通的領(lǐng)域組成,如計(jì)算機(jī)學(xué)習(xí)、計(jì)算機(jī)視覺等。研究人工智能的目的是使機(jī)器能夠擔(dān)任一些需要人工處理的工作。而這些工作需要做一定的決策,要求機(jī)器能夠自行的根據(jù)當(dāng)時(shí)的環(huán)境做出相對(duì)較好的決策。這就需要計(jì)算機(jī)不僅僅能夠計(jì)算,還能夠擁有一定得智能。而要對(duì)周圍的環(huán)境進(jìn)做出好的決策就需要對(duì)周邊的環(huán)境進(jìn)行分析,即要求機(jī)器能夠“看”到周圍的環(huán)境,并能夠理解它們。就像人做的那樣。所以計(jì)算機(jī)視覺是人工智能中非常重要的一個(gè)領(lǐng)域。關(guān)鍵詞:計(jì)算機(jī); 視覺; 圖像;Abstract:Since 1956 the Dartmouth learn put forward “artificial intelligence”, many countries in world have developed many theories and principles. Artificial intelligence is an extremely challenging subject. The researchers must know lots of other knowledge. Such as the computer, psychology, philosophy, biology, bionics, etc. It involved a widespread discipline. And in these widespread disciplines are composed by many different fields, such as computer learning, computer vision, etc. The artificial intelligence is designed to make the machine to do some work that need people do now. And these work needs to be done certain decision-making, the machine can make according to the requirements of the environment to make a relatively good decision. This needs the computer can not merely calculate, can also have intelligence. That need the computer can see the world and also know them, just like human do. So the computer vision is a very important field in the artificial intelligence.計(jì)算機(jī)視覺的應(yīng)用人類正在進(jìn)入信息時(shí)代,計(jì)算機(jī)將越來越廣泛地進(jìn)入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計(jì)算機(jī)專業(yè)訓(xùn)練的人也需要應(yīng)用計(jì)算機(jī),而另一方面是計(jì)算機(jī)的功能越來越強(qiáng),使用方法越來越復(fù)雜。這就使人在進(jìn)行交談和通訊時(shí)的靈活性與目前在使用計(jì)算機(jī)時(shí)所要求的嚴(yán)格和死板之間產(chǎn)生了尖銳的矛盾。人可通過視覺和聽覺,語言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計(jì)算機(jī)卻要求嚴(yán)格按照各種程序語言來編寫程序,只有這樣計(jì)算機(jī)才能運(yùn)行。為使更多的人能使用復(fù)雜的計(jì)算機(jī),必須改變過去的那種讓人來適應(yīng)計(jì)算機(jī),來死記硬背計(jì)算機(jī)的使用規(guī)則的情況。而是反過來讓計(jì)算機(jī)來適應(yīng)人的習(xí)慣和要求,以人所習(xí)慣的方式與人進(jìn)行信息交換,也就是讓計(jì)算機(jī)具有視覺、聽覺和說話等能力。這時(shí)計(jì)算機(jī)必須具有邏輯推理和決策的能力。具有上述能力的計(jì)算機(jī)就是智能計(jì)算機(jī)。計(jì)算機(jī)視覺就是用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。而計(jì)算機(jī)視覺技術(shù)正廣泛的應(yīng)用于各個(gè)方面,充醫(yī)學(xué)圖像到遙感圖像,充各有檢查到文件處理。在需要人類視覺的場(chǎng)合幾乎都需要用感到計(jì)算機(jī)視覺,許多人類視覺無法感知的場(chǎng)合,如精確定律感知、危險(xiǎn)場(chǎng)景感知、不可見物體感知等,計(jì)算機(jī)視覺更突出他的優(yōu)越性。現(xiàn)在計(jì)算機(jī)視覺已在一些領(lǐng)域的到應(yīng)用,如零件識(shí)別與定位,產(chǎn)品的檢驗(yàn),移動(dòng)機(jī)器人導(dǎo)航遙感圖像分析,安全減半、監(jiān)視與跟蹤,國(guó)防系統(tǒng)等。它們的應(yīng)用于計(jì)算機(jī)視覺的發(fā)展起著相互促進(jìn)的作用。2、計(jì)算機(jī)視覺與人類視覺計(jì)算機(jī)視覺正如它的名字一樣,就是一門研究計(jì)算機(jī)“看”的學(xué)科,即使指通過攝像機(jī)和計(jì)算機(jī)的處理來對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等,并進(jìn)一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。作為一個(gè)科學(xué)學(xué)科,計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。同時(shí)計(jì)算機(jī)視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。通過這些技術(shù)來讓計(jì)算機(jī)代替人完成對(duì)問題的處理。計(jì)算機(jī)視覺最終的目標(biāo)是讓計(jì)算機(jī)能夠像人一樣通過視覺對(duì)外部環(huán)境進(jìn)行觀察和理解,從而具有自主適應(yīng)環(huán)境的能力。雖然當(dāng)前還難以實(shí)現(xiàn),但人們正超這一目標(biāo)努力。現(xiàn)在的前期目標(biāo)是建立一個(gè)初步的系統(tǒng),這個(gè)系統(tǒng)能夠反饋某種程度的信息,能在一定程度上完成一些任務(wù)。比如自主車輛的視覺導(dǎo)航,這種導(dǎo)航能夠使車輛在高手公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這種系統(tǒng)就像是在開車一樣,它是模仿人腦進(jìn)行各種判斷。而就目前而言人類視覺系統(tǒng)是人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。因此,對(duì)人類視覺處理機(jī)制的研究將給計(jì)算機(jī)視覺的研究提供啟發(fā)和指導(dǎo)。視覺是人類最重要的感覺,它是人類的主要感覺來源,人類認(rèn)識(shí)外界信息80%來自視覺。人們看東西的時(shí)候視乎是毫不費(fèi)力、輕而易舉的事,但實(shí)際上視覺系統(tǒng)在你看東西的時(shí)候所完成的工作是十分復(fù)雜的。當(dāng)眼睛看到某種東西時(shí),先要對(duì)它的各部分進(jìn)行分類,然后從中選出有用的特征信息來做出判斷。人的眼睛并不會(huì)對(duì)事物、信息進(jìn)行判斷,它是將信息反饋給大腦,然后大腦根據(jù)得到的信息與原來大腦里的信息來進(jìn)行比較得出解釋結(jié)果。敏感、感覺、認(rèn)識(shí)是視覺系統(tǒng)的3個(gè)重要的概念。敏感是把外界的各種刺激轉(zhuǎn)換成人體神經(jīng)系統(tǒng)能夠及時(shí)的生物點(diǎn)信號(hào)。它所完成的是信號(hào)的轉(zhuǎn)換,并不涉及對(duì)信號(hào)的理解。感覺的任務(wù)是把敏感器官的各種輸入轉(zhuǎn)換和處理成為對(duì)外部世界的理解。而認(rèn)識(shí)是以人們對(duì)周圍客觀世界的概念為基礎(chǔ)的。如果沒有感覺作為人與外部世界的橋梁或窗口,人的思維活動(dòng)就失去了基本的依據(jù)了。因此人們?cè)谀7氯祟愐曈X時(shí)需要相應(yīng)的各種處理,比如攝取圖像,處理圖像,理解圖像。3、 計(jì)算機(jī)視覺的研究3.1計(jì)算機(jī)視覺的處理過程模仿人類的視覺系統(tǒng),計(jì)算機(jī)視覺系統(tǒng)中信息的處理和分析大致可以分成兩個(gè)階段:圖象處理階段又稱視覺處理中的低水平和中水平階段;圖象分析、理解階段又稱視覺處理中的高水平處理階段。在圖象處理階段,計(jì)算機(jī)對(duì)圖象信息進(jìn)行一系列的加工處理,這主要是:(1)、校正成象過程中系統(tǒng)引進(jìn)的光度學(xué)和幾何學(xué)的畸變,抑制和去除成象過程中引進(jìn)的噪聲統(tǒng)稱為圖象的恢復(fù)。(2)、從圖象信息如亮度分布信息中提取諸如邊沿信息,深度信息圖象點(diǎn)沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息。(3)、根據(jù)抽取的特征信息把反映三維客體的各個(gè)圖象基元,如輪廓、線條、紋理、邊緣、邊界、物體的各個(gè)面等從圖象中分離出來,并且建立起各個(gè)基元之間的拓樸學(xué)上的和幾何學(xué)上的關(guān)系稱之基元的分割和關(guān)系的確定。在圖象分析和理解階段,計(jì)算機(jī)根據(jù)事先存貯在數(shù)據(jù)庫(kù)中的預(yù)知識(shí)模型,識(shí)別出各個(gè)基元或某些基元組合所代表的客觀世界中的某些實(shí)體稱之為模型匹配以及根據(jù)圖象中各基元之間的關(guān)系在預(yù)知識(shí)的指導(dǎo)下得出圖象所代表的實(shí)際景物的含義,得出圖象的解釋或描述。3.2計(jì)算機(jī)視覺的處理技術(shù)3.2.1圖像獲取圖像的獲取是通過輸入設(shè)備來得到的。輸入設(shè)備包括成像設(shè)備和數(shù)字化設(shè)備。成像設(shè)備是通過光學(xué)攝像機(jī)或紅外、激光、超聲、X射線對(duì)周圍場(chǎng)景或物體進(jìn)行探測(cè)成像,得到關(guān)于場(chǎng)景或物體的二維或三維數(shù)字圖像。好的成像系統(tǒng)能夠很好的對(duì)圖像的處理做好前期準(zhǔn)備。如紅外成像系統(tǒng),激光成像系統(tǒng),還有計(jì)算機(jī)成像系統(tǒng),即每個(gè)像素元(或)若干像素元對(duì)應(yīng)一個(gè)簡(jiǎn)單的處理器,這樣可以適應(yīng)復(fù)雜場(chǎng)景動(dòng)態(tài)變化的場(chǎng)合。3.2.2圖像預(yù)處理這一過程主要對(duì)輸入的原始圖像進(jìn)行處理。這一過程借助大量的圖像處理技術(shù)和算法,如圖像濾波、圖像增強(qiáng)、邊緣檢測(cè)等,以便從圖像中抽取諸如角點(diǎn)、邊緣、線條、邊界已經(jīng)色彩等官員場(chǎng)景的基本特征;這一過程還包括了各種圖像變換(如校正)、圖像紋理檢測(cè)、圖像運(yùn)動(dòng)檢測(cè)等。在對(duì)圖像實(shí)施具體的計(jì)算機(jī)視覺方法來提取某種特定的信息前,一種或一些預(yù)處理往往被采用來使圖像滿足后繼方法的要求。3.2.3圖像復(fù)合主要任務(wù)是恢復(fù)場(chǎng)景的深度、表面法線方向、輪廓等有關(guān)場(chǎng)景的2.5維信息,實(shí)現(xiàn)的途徑有立體視覺、測(cè)距成像、運(yùn)動(dòng)估計(jì)、明暗特征、紋理特征等所謂的蔥X恢復(fù)形狀的估計(jì)方法。系統(tǒng)表達(dá)、系統(tǒng)成像模型等研究?jī)?nèi)容一般也在這里進(jìn)行。3.2.4圖像恢復(fù)任務(wù)是在以物體為中心的坐標(biāo)系中,在原始輸入圖像,圖像基本特征、2.5為圖像的基礎(chǔ)上,恢復(fù)舞臺(tái)的完整三維圖,建立舞臺(tái)三維描述,識(shí)別三維物體并確定舞臺(tái)的位置和方向。3.2.5圖像理解到這一步是為了辨別物體并對(duì)物體進(jìn)行分類。經(jīng)過前幾個(gè)步驟的處理將被認(rèn)為含有目標(biāo)物體的部分進(jìn)行處理。驗(yàn)證得到的數(shù)據(jù)是否符合前提要求,估測(cè)待定系數(shù),比如目標(biāo)姿態(tài),體積,位置等。最后進(jìn)目標(biāo)進(jìn)行分類理解,解釋目標(biāo)的各種特性。4、 對(duì)計(jì)算機(jī)視覺的認(rèn)識(shí)從80年代至今,研究者夢(mèng)對(duì)計(jì)算機(jī)視覺各個(gè)層次進(jìn)行了大量的研究,在國(guó)際上以計(jì)算機(jī)視覺為主題,或主要以計(jì)算機(jī)視覺為主題的國(guó)際會(huì)議有國(guó)際計(jì)算機(jī)視覺會(huì)議(ICCV),國(guó)際模式識(shí)別會(huì)議(ICPR),國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR)等每年都有大量的論文發(fā)表。大體上將,對(duì)計(jì)算機(jī)視覺系統(tǒng)的各個(gè)部分,研究者們都在計(jì)算理論、表達(dá)與算法及硬件實(shí)現(xiàn)等各個(gè)層次上提出了大量的方法。但這些方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 沙漠游記題目及答案解析
- 2023-2024學(xué)年山東省部分學(xué)校高二下學(xué)期期末聯(lián)合教學(xué)質(zhì)量檢測(cè)數(shù)學(xué)試卷(解析版)
- 2023-2024學(xué)年湖北省十堰市高二下學(xué)期6月期末調(diào)研考試數(shù)學(xué)試卷(解析版)
- 2024-2025學(xué)年浙江省嘉興市高二上學(xué)期期末考試語文試題(解析版)
- 店面房屋租賃協(xié)議-房屋店面租賃合同模板-店面房屋租賃協(xié)議
- 高層建筑結(jié)構(gòu)試題庫(kù)
- 高中語文選擇性必修下冊(cè)8《茶館》課件(32張課件)
- 飲酒檢討書范文
- 口服保肝藥講課件
- 佛山校園封閉管理制度
- DB62T 3081-2022 綠色建筑工程驗(yàn)收標(biāo)準(zhǔn)
- 河北大學(xué)《民法學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年全球視域下的中國(guó)文化試題及答案
- 食品供應(yīng)商協(xié)議合同模板
- 揚(yáng)州市儀征市2024-2025學(xué)年三下數(shù)學(xué)期末質(zhì)量檢測(cè)試題含解析
- 口服給藥安全警示教育
- 黃金飾品購(gòu)銷合同(2025版)
- 2025年廣西南寧市中考一模地理試題(含答案)
- 廣東省深圳市31校2025年中考物理一模試卷(含答案)
- 2025年河北雄安友信能源技術(shù)服務(wù)有限公司招聘筆試參考題庫(kù)含答案解析
- 云南開放大學(xué)水利工程材料與檢測(cè)作業(yè)1-3
評(píng)論
0/150
提交評(píng)論