人工智能與計算機視覺_第1頁
人工智能與計算機視覺_第2頁
人工智能與計算機視覺_第3頁
人工智能與計算機視覺_第4頁
人工智能與計算機視覺_第5頁
已閱讀5頁,還剩38頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人工智能與計算機視覺1.

人工智能的發展歷程2.

計算機視覺技術在現實場景中的應用3.

人工智能技術未來發展方向主要內容of422of423研究內容:能夠模擬、延伸和擴展人類智慧的理論、方法、技術及應用系統

呈現形式:人工智能是什么:模擬、延伸和擴展人類智慧of人工智能

(Artificial

Intelligence:AI)研究目的:探尋智慧本質,研制出具有類人智慧的智能機器。會行動:機器人、自動駕駛汽車、無

人機會看:

圖像識別、文字識別、車牌識別會思考:人機對弈、

定理證明、醫療診

斷會聽:語音識別、說話人識別、機器翻譯會說:語音合成、人機對話會學習:機器學習、

知識表示424人工智能的起源提問者,

問/答交流

,回答者圖靈測試:

如果計算機在5分鐘的文字對話中能回答由人類測試者提出的一系列問題

且其

超過30%的回答讓測試者誤認為是人類所答

,則計算機通過圖靈測試

,被認為具有智能。of阿蘭·圖靈:英國數學家、密碼學家、計算機

科學家,

1936

型,1950年提出了“機器能夠思維”的論述425麥卡錫羅徹斯特1956年夏天約翰.麥卡錫等人在

美國達特茅斯學院開會研討“如

何用機器模擬人的智慧”,會上提出“人工智慧”這一概念,標志著人工智能學科的誕生。人工智能的起源of達特茅斯學院明斯基香農426人工智能的發展歷程:推理-知識-深度神經網絡of1956

達特茅斯會議1946

1954

195619701976n

第一次人工智能浪潮(1956-1976):推理1969馬文·明斯基和西摩爾·帕普特提出了簡單神經網絡的局限性1973英國劍橋大學數學家詹姆斯·萊特希爾稱人工智能沒帶來任何影響1952圖靈提出讓計算機來冒

充人1954IBM-701首次完成

英俄機器翻譯1970

日本早稻田大學

造出第一個人形機器人1958,約翰·麥卡錫開發Lisp語言1946第一臺電子計算機

ENIAC誕生1957Rosenblatt提

出感知器模型427人工智能的發展歷程:推理-知識-深度神經網絡8of421977,吳文俊首次發表定理的機械化證明的論文,開辟全新的方向1976198220061993,中國研制成功首臺采用微處理器的并行處理機系統“曙光一號”,定點速度每秒6.4億次n

第二次人工智能浪潮(1976-2006):知識1984

在年度AAAI會議上,羅杰·單克和馬文·明斯基警告“AI之冬”即將到來1981

日本國際貿易和工業部提供8.5億美元用于第五代電腦專案研究1979斯坦福大學的自動駕駛汽車成功駛過一個充滿障礙的房間1980卡耐基梅隆大學為DEC制造出了專家系統IBM、蘋果等PC性能超越Symbolics等通用電1990863計劃支持

研發農業專家系統腦人工智能的發展歷程:推理-知識-深度神經網絡2016-2017谷歌研發的AlphaGo

連續擊敗頂尖人類棋手9of422006

至今n

第三次人工智能浪潮(2006-至今):深度神經網絡2011IBM超級計算機沃森在美國老牌益智節目擊敗人類2009

谷歌汽車在內華達州通過自

動駕駛汽車測試2006

杰夫·辛頓提出深度學習的

理論框架

,提出學習生成模型2007

李飛飛和普林斯頓大學的

同事開始建立ImageNet人工智能的發展歷程of深度學習在ImageNet上的識別準確率已經超過了人類水平谷歌研發的AlphaGo、AlphaZero連續擊敗人類頂尖棋手n

深度神經網絡(深度學習)4210?深度學習是使用包含復雜結構或由多重非線性變換構成的多個處理層對資料進行高層抽象的算法?深度學習是一種基于對資料進行表征學習的方法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個圖元強度值的矢量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處是用非監督式或半監督式的特徵學習和分層特徵提取高效演算法來替代手工獲取特征人工智能的發展歷程?

機器學習的基本定理

模型的出錯率

∝推論:模型復雜-》大樣本

樣本小-》簡化模型x

-

F(x)

y

{ofClass

label

(Classification)Vector(Estimation)通過經驗自

動改進的電

腦算法用資料優化

計算機程序的

模型參數n

深度學習算法簡介模型的復雜程度

樣本的大小4211n

深度神經網絡(深度學習)?人腦是通過分級的、多層網絡模型來識別?減少資料量,保留物體的有用資訊?對效果影響極大?

手動化特征工程?

非常耗時

低層信息圖像識別的一般流程人工智能的發展歷程of識別分類特征提取預處理

4212人工智能的發展歷程ofn

深度神經網絡(深度學習)2017年,

DenseNet2014年,VGGNet2012年,AlexNet2016年,

ResNet4213基礎層資料資源通用資料行業資料軟件設施智慧云平臺大資料平臺硬件設施GPU/FPGA等加速硬件智慧芯片計算機視覺自然語言處理語音交互資料采擷生物識別監督學習無監督學習強化學習自主學習自我調整學習TensorFlowPytorchMxNetCaffeTheano人工智能的研究領域of機器人自動駕駛

智慧醫療智慧制造智慧金融智能零售智慧作業系統通用技術學習方法開發框架技術層應用層應用平臺智慧產業4214人工智能的研究領域ofn

手機中的AI4215人工智能的研究領域ofn

自動駕駛—GoogleWaymo4216人工智能的研究領域ofn

快速藝術圖像生成4217人工智能的研究領域of專用人工智能在多領域取得成功應用:人機對話領域4218計算機視覺技術of又叫機器視覺

,是一門讓機器學會像人一樣看4219基于深度學習技術

計算機視覺近年來取得了突飛猛進的進展圖像分類

目標檢測語義分割計算機視覺技術of貓貓、鴨子、狗貓、鴨子、狗4220計算機視覺技術of分類

+定位(Classification+Localization)圖像分類:給定一張圖片

,識別類別單個物體

多個物體實例分割(InstanceSegmentation)物體檢測(Object

Detection)分類(Classification)4221of計算機視覺技術圖像分類:給定一張圖片

,識別類別深度學習三個步驟……步驟2:模型和資料的擬合步驟

1:定義一組函數步驟3:選擇最優函數深度學習是如此簡單……4222of計算機視覺技術圖像分類:給定一張圖片

,識別類別深度學習三個步驟……定義

組步驟2:模型和資料的擬合步驟3:選擇最優函數深度學習是如此簡單……神

絡步驟

1:4223計算機視覺技術of神經網絡建模人類的大腦120到140億個4224 卷積過程包括:用一個可訓練的濾波器fx去卷積一個輸入的圖像,然后加一個偏置bx,得到

卷積層Cx。 子採樣過程包括:每鄰域四個圖元求和變為一個圖元,加權再增加偏置,通過一個啟動函數,產生一個縮小四倍的特征映射圖計算機視覺技術32*32卷積窗大小:5*56輸出特征圖數量:628*28神經元數量:470712304

[(5*5+1)*6]*(28*28)156

[(5*5+1)*6]ofC1層:輸入圖片大小:卷積窗種類:輸出特征圖大小:連接數:可訓練參數:神經網絡建模4225計算機視覺技術of7.3%VGG(2014)神經網絡建模超深網絡19

layers152

layersGoogleNet(2014)8

layersAlexNet(2012)ResNet(2016)22

layers3.5%16.4%6.7%4226計算機視覺技術ofImageNet挑戰賽4227計算機視覺技術ofImageNet挑戰賽4228計算機視覺技術of物體檢測4229物體檢測的定義?物體檢測:判斷一副圖像上是否存在感興趣的物體,如果存在,就給出所有感興趣物體的類別和

位置(WhatandWhere)計算機視覺技術of4230計算機視覺技術of分類

+定位(Classification+Localization)單個物體

多個物體實例分割(InstanceSegmentation)物體檢測(Object

Detection)分類(Classification)物體檢測相關任務對比4231計算機視覺技術of分類

+定位(Classification+Localization)實例分割(InstanceSegmentation)物體檢測(Object

Detection)分類(Classification)物體檢測相關任務對比4232計算機視覺技術of語義分割:在圖元級別上的分類

,屬于同一類的圖元都要被歸為一類。分類

+定位(Classification+Localization)單個物體

多個物體實例分割(InstanceSegmentation)物體檢測(Object

Detection)分類(Classification)4233語義分割步驟:①

輸入圖像:輸入一張待分割的圖像②

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論