




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
深度學習及其在計算機視覺中的應(yīng)用常見應(yīng)用場景目錄01卷積神經(jīng)網(wǎng)絡(luò)02生成對抗網(wǎng)絡(luò)03資源卷積神經(jīng)網(wǎng)絡(luò)回顧:卷積空間相關(guān)與卷積回顧:卷積空間相關(guān)與卷積回顧:卷積離散卷積的邊緣效應(yīng)回顧:卷積離散卷積的邊緣效應(yīng)忽略這些點輸出尺寸<輸入尺寸使用常數(shù)填充圖像保證圖像不收縮,但會在邊緣產(chǎn)生梯度Zero-Padding其他方法填充圖像edge-paddingreflect-padding擴展:“學習”模板模板的參數(shù)是否可以進行學習?卷積神經(jīng)網(wǎng)絡(luò)深度學習(DeepLearning)conv2d展成列向量spreadlinear(c_in,c_out)卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)表示:矩陣,張量(Tensor)卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:卷積層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:卷積層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:卷積層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:卷積層size=3c_in=3c_out=2stride=1padding=0卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:卷積層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:卷積層擴展:深度學習基本操作單元:激活層ReLU卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:激活層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:激活層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:池化Pooling/降采樣層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:池化Pooling/降采樣層卷積神經(jīng)網(wǎng)絡(luò)池化Pooling/降采樣層卷積神經(jīng)網(wǎng)絡(luò)基本操作單元:池化Pooling/降采樣層卷積神經(jīng)網(wǎng)絡(luò)典型網(wǎng)絡(luò)結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)典型網(wǎng)絡(luò)結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)目標函數(shù):損失Loss/誤差卷積神經(jīng)網(wǎng)絡(luò)目標函數(shù):損失/誤差卷積神經(jīng)網(wǎng)絡(luò)目標函數(shù):損失Loss/誤差優(yōu)化方法梯度下降隨機梯度下降SGDAdamRMSprop...卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化/訓練/學習卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化/訓練/學習卷積神經(jīng)網(wǎng)絡(luò)CNN以圖像的原始像素作為輸入,基于輸出層定義的損失函數(shù)使用反向傳播算法端到端(End-to-end)學習,從而自動學習得到圖像底層到高層的層次化語義表達卷積神經(jīng)網(wǎng)絡(luò)深度特征學習L=||y-f(x)||1L=1,ify≠f(x)L=CE(y,f(x))交叉熵擴展:深度學習深度特征學習卷積神經(jīng)網(wǎng)絡(luò)CNN模型結(jié)構(gòu)變遷針對移動端的輕量型網(wǎng)絡(luò)LeNet(1998)AlexNet(2012)VGGNet(2014)NIN(2013)GoogLeNet(2014)ResNet(2015)DenseNet(2016)MobileNetV3(2016.04)ShuffleNet(2016.06)Xception(2016.10)SqueezeNet(2016.02)NAS(2018)研究課題舉例:人臉識別AlphaGo分布式系統(tǒng):1202個CPU和176塊GPU單機版:48個CPU和8塊GPU走子速度:3毫秒-2微秒目標檢測(ObjectDetection)MaskRCNNOCR圖像生成DeepDream風格遷移對抗樣本研究課題舉例:醫(yī)學影像智能輔助診斷Zhu,Wentao,etal."DeepLung:3DDeepConvolutionalNetsforAutomatedPulmonaryNoduleDetectionandClassification."(2017).生成對抗網(wǎng)絡(luò)GAN是什么生成對抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,GAN)生成器G生成讓D無法判斷真假的樣本輸入z:從一個先驗概率分布取樣的隨機向量輸出G(z):生成的樣本判別器D判斷樣本是真實的還是生成的輸入:真實樣本/G生成的樣本輸出:對真實樣本輸出1,生成樣本輸出0GAN是什么生成對抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,GAN)GD對抗GAN是什么DeepConvolutionGAN全部都是卷積層需要使用VirtualBatchNormalizationLeakyReLU作為激活函數(shù)DCGANGeneratorNetwork(Pytorch)DiscriminatorNetwork(Pytorch)GAN是什么
GAN是什么
DCGANDCGANsforLSUNBedroomsGAN是什么DensityEstimationDiscriminativemodel:p(y|x)y=0(大象elephant),y=1(馬,horse)Generativemodel:p(x|y)p(x|y=0)p(x|y=1)GAN是什么GAN是什么/jayleicn/animeGAN示例:生成小姐姐GAN是什么示例:生成人臉(PG-GAN,BigGAN,StyleGANetc.)GAN是什么ConditionalGAN(cGANorPix2Pix)GAN是什么ConditionalGAN(cGANorPix2Pix)GAN是什么U-Net(Pix2Pix)GAN是什么DiscriminatorStructure:PatchGAN(Pix2Pix)GAN是什么LossFunction:AdversarialLoss+L1ReconstructionLossGAN能干什么?ImageCompletion/Inpainting[17]IizukaS,Simo-SerraE,IshikawaH.Globallyandlocallyconsistentimagecompletion[J].ACMTransactionsonGraphics(ToG),2017,36(4):107.GAN能干什么?ImageSuper-Resolution圖像超分辨率重建SRGANESRGAN
[18]LedigC,TheisL,HuszárF,etal.Photo-realisticsingleimagesuper-resolutionusingagenerativeadversarialnetwork[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2017:4681-4690.GAN能干什么?Anime4K:/bloc97/Anime4K開源算法,能在動畫播放中,實時把畫面變成4k,延時低至3毫秒。能把720p/1080p變成2160p,也能把480p變成1080pGAN能干什么?ConditionalGANGAN能干什么?自動上妝MakeupBeautyGANGAN能干什么?由左至右依次為:經(jīng)修改的圖像、檢測到修改、自動還原后的圖像、原始圖像自動卸妝GAN能干什么?GAN能干什么?Text2ImageAttnGANStackGANStackGAN++GAN能干什么?圖像屬性編輯GAN能干什么?人臉轉(zhuǎn)正GAN能干什么?圖像修復圖像去雨/去霧圖像補全圖像超分辨率重建GAN能干什么?由左至右依次為:經(jīng)修改的圖像、檢測到修改、自動還原后的圖像、原始圖像圖像合成GAN能干什么?視頻生成[21]WangTC,LiuMY,ZhuJY,etal.Video-to-videosynthesis[J].arXivpreprintarXiv:1808.06601,2018.GAN能干什么?FacePhoto-SketchSynthesis擴展:深度學習深度學習框架擴展:深度學習PytorchHub模型庫參考資料ComputerVision:AModernApproachbyDavidForsythandJeanPonce(2nded.)ComputerVision:AlgorithmsandApplications,byRichardSzeliski,/Book/計算攝影
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新目標引領(lǐng)新未來
- 《測控一體化閘門安裝及驗收規(guī)程》(征求意見稿)編制說明
- 2025年教育培訓行業(yè)品牌塑造與市場推廣策略研究報告:品牌區(qū)塊鏈營銷策略
- 2025年運動醫(yī)學醫(yī)療市場增長動力報告:技術(shù)創(chuàng)新趨勢下的市場前景
- 醫(yī)藥流通行業(yè)供應(yīng)鏈優(yōu)化與成本控制2025年競爭格局分析報告
- 元宇宙社交平臺用戶行為洞察報告:2025年用戶體驗優(yōu)化與瓶頸解析
- 探索廢棄礦井資源再利用與綠色發(fā)展協(xié)同推進模式
- 2025年綠色金融發(fā)展趨勢與投資策略研究報告
- 2025年互聯(lián)網(wǎng)醫(yī)療平臺在線問診醫(yī)療服務(wù)質(zhì)量監(jiān)控報告
- 2025年潮流玩具市場分析報告:收藏價值與文化傳承深度挖掘
- 2025年安徽省中考數(shù)學試卷真題(含標準答案)
- 高級記者考試試題及答案
- 2025年福建日報新聞發(fā)展有限公司招聘題庫帶答案分析
- 2025國家開放大學《高級財務(wù)會計》期末機考題庫
- 2025年浙江寧波大劇院文化發(fā)展有限公司招聘筆試參考題庫附帶答案詳解
- 新疆開放大學2025年春《國家安全教育》形考作業(yè)1-4終考作業(yè)答案
- GB/T 17775-2024旅游景區(qū)質(zhì)量等級劃分
- 保安管理制度與應(yīng)急預案
- 《活板》同步練習及答案
- 化學品安全技術(shù)說明(膠水)
- 動物簡筆畫各種小動物簡(課堂PPT)
評論
0/150
提交評論