




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
深度學習及其在計算機視覺中的應用常見應用場景目錄01卷積神經網絡02生成對抗網絡03資源卷積神經網絡回顧:卷積空間相關與卷積回顧:卷積空間相關與卷積回顧:卷積離散卷積的邊緣效應回顧:卷積離散卷積的邊緣效應忽略這些點輸出尺寸<輸入尺寸使用常數填充圖像保證圖像不收縮,但會在邊緣產生梯度Zero-Padding其他方法填充圖像edge-paddingreflect-padding擴展:“學習”模板模板的參數是否可以進行學習?卷積神經網絡深度學習(DeepLearning)conv2d展成列向量spreadlinear(c_in,c_out)卷積神經網絡數據表示:矩陣,張量(Tensor)卷積神經網絡基本操作單元:卷積層卷積神經網絡基本操作單元:卷積層卷積神經網絡基本操作單元:卷積層卷積神經網絡基本操作單元:卷積層size=3c_in=3c_out=2stride=1padding=0卷積神經網絡基本操作單元:卷積層卷積神經網絡基本操作單元:卷積層擴展:深度學習基本操作單元:激活層ReLU卷積神經網絡基本操作單元:激活層卷積神經網絡基本操作單元:激活層卷積神經網絡基本操作單元:池化Pooling/降采樣層卷積神經網絡基本操作單元:池化Pooling/降采樣層卷積神經網絡池化Pooling/降采樣層卷積神經網絡基本操作單元:池化Pooling/降采樣層卷積神經網絡典型網絡結構卷積神經網絡典型網絡結構卷積神經網絡目標函數:損失Loss/誤差卷積神經網絡目標函數:損失/誤差卷積神經網絡目標函數:損失Loss/誤差優化方法梯度下降隨機梯度下降SGDAdamRMSprop...卷積神經網絡優化/訓練/學習卷積神經網絡卷積神經網絡優化/訓練/學習卷積神經網絡CNN以圖像的原始像素作為輸入,基于輸出層定義的損失函數使用反向傳播算法端到端(End-to-end)學習,從而自動學習得到圖像底層到高層的層次化語義表達卷積神經網絡深度特征學習L=||y-f(x)||1L=1,ify≠f(x)L=CE(y,f(x))交叉熵擴展:深度學習深度特征學習卷積神經網絡CNN模型結構變遷針對移動端的輕量型網絡LeNet(1998)AlexNet(2012)VGGNet(2014)NIN(2013)GoogLeNet(2014)ResNet(2015)DenseNet(2016)MobileNetV3(2016.04)ShuffleNet(2016.06)Xception(2016.10)SqueezeNet(2016.02)NAS(2018)研究課題舉例:人臉識別AlphaGo分布式系統:1202個CPU和176塊GPU單機版:48個CPU和8塊GPU走子速度:3毫秒-2微秒目標檢測(ObjectDetection)MaskRCNNOCR圖像生成DeepDream風格遷移對抗樣本研究課題舉例:醫學影像智能輔助診斷Zhu,Wentao,etal."DeepLung:3DDeepConvolutionalNetsforAutomatedPulmonaryNoduleDetectionandClassification."(2017).生成對抗網絡GAN是什么生成對抗網絡(GenerativeAdversarialNetwork,GAN)生成器G生成讓D無法判斷真假的樣本輸入z:從一個先驗概率分布取樣的隨機向量輸出G(z):生成的樣本判別器D判斷樣本是真實的還是生成的輸入:真實樣本/G生成的樣本輸出:對真實樣本輸出1,生成樣本輸出0GAN是什么生成對抗網絡(GenerativeAdversarialNetwork,GAN)GD對抗GAN是什么DeepConvolutionGAN全部都是卷積層需要使用VirtualBatchNormalizationLeakyReLU作為激活函數DCGANGeneratorNetwork(Pytorch)DiscriminatorNetwork(Pytorch)GAN是什么
GAN是什么
DCGANDCGANsforLSUNBedroomsGAN是什么DensityEstimationDiscriminativemodel:p(y|x)y=0(大象elephant),y=1(馬,horse)Generativemodel:p(x|y)p(x|y=0)p(x|y=1)GAN是什么GAN是什么/jayleicn/animeGAN示例:生成小姐姐GAN是什么示例:生成人臉(PG-GAN,BigGAN,StyleGANetc.)GAN是什么ConditionalGAN(cGANorPix2Pix)GAN是什么ConditionalGAN(cGANorPix2Pix)GAN是什么U-Net(Pix2Pix)GAN是什么DiscriminatorStructure:PatchGAN(Pix2Pix)GAN是什么LossFunction:AdversarialLoss+L1ReconstructionLossGAN能干什么?ImageCompletion/Inpainting[17]IizukaS,Simo-SerraE,IshikawaH.Globallyandlocallyconsistentimagecompletion[J].ACMTransactionsonGraphics(ToG),2017,36(4):107.GAN能干什么?ImageSuper-Resolution圖像超分辨率重建SRGANESRGAN
[18]LedigC,TheisL,HuszárF,etal.Photo-realisticsingleimagesuper-resolutionusingagenerativeadversarialnetwork[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2017:4681-4690.GAN能干什么?Anime4K:/bloc97/Anime4K開源算法,能在動畫播放中,實時把畫面變成4k,延時低至3毫秒。能把720p/1080p變成2160p,也能把480p變成1080pGAN能干什么?ConditionalGANGAN能干什么?自動上妝MakeupBeautyGANGAN能干什么?由左至右依次為:經修改的圖像、檢測到修改、自動還原后的圖像、原始圖像自動卸妝GAN能干什么?GAN能干什么?Text2ImageAttnGANStackGANStackGAN++GAN能干什么?圖像屬性編輯GAN能干什么?人臉轉正GAN能干什么?圖像修復圖像去雨/去霧圖像補全圖像超分辨率重建GAN能干什么?由左至右依次為:經修改的圖像、檢測到修改、自動還原后的圖像、原始圖像圖像合成GAN能干什么?視頻生成[21]WangTC,LiuMY,ZhuJY,etal.Video-to-videosynthesis[J].arXivpreprintarXiv:1808.06601,2018.GAN能干什么?FacePhoto-SketchSynthesis擴展:深度學習深度學習框架擴展:深度學習PytorchHub模型庫參考資料ComputerVision:AModernApproachbyDavidForsythandJeanPonce(2nded.)ComputerVision:AlgorithmsandApplications,byRichardSzeliski,/Book/計算攝影
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年計算機科學入門考試題及答案
- 2025年茶藝師職業能力測試試卷及答案
- 2025年產品設計與開發課程考試試題及答案
- 物資設備部門管理制度
- 物資采購歸檔管理制度
- 特殊人才獎勵管理制度
- 特殊場所規范管理制度
- 特殊工藝過程管理制度
- 特殊法人客戶管理制度
- 特色高校餐飲管理制度
- 城鄉居民醫療保險業務培訓
- 學校民族團結先進集體事跡材料
- UL1034標準中文版-2020電子防盜鎖UL標準中文版
- 網絡直播平臺化妝師合作協議
- 2025版國家開放大學法學本科《知識產權法》期末紙質考試第一大題單項選擇題題庫
- 山東師范大學《思想道德與法治》2023-2024學年第一學期期末試卷
- 中南運控課設-四輥可逆冷軋機的卷取機直流調速系統設計
- 風景園林專業中級職稱《法律法規及技術標準》考試題及答案
- 高效能人士的七個習慣(課件)
- 四年級英語下冊 Recycle2-階段測試卷(人教版)
- DB11T 893-2021 地質災害危險性評估技術規范
評論
0/150
提交評論