




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于CycleGAN的图像风格转换所谓图像风格转换,是指利用算法学习一类图像的风格,然后将学习到的风格应用到另外一张图像上的技术。随着深度学习的兴起,图像风格迁移获得了进一步的发展,并取得了一系列突破性的研究成果,其出色的风格迁移能力引起了学术界和工业界的广泛关注,具有重要的研究价值。本案例将使用艺术风格图像与现实风景图像数据集,构建CycleGAN网络,进行图像风格转换。一是将艺术风格图像转换成现实风景图像风格。二是将现实风景图像转换成艺术风格。基于CycleGAN的图像风格转换1数据准备目录目标分析2构建网络3训练网络4结果分析5在使用神经网络进行图像风格迁移之前,图像风格迁移的程序设计有一个共同的思路:分析某一种风格的图像,并为该风格建立一个数学或统计模型,再将模型应用到待迁移的图像中。因此带来了一个问题,一个程序基本只能做某一种风格或某一个场景间的转换,存在较高的局限性。所以,传统的风格转换研究的实际应用非常有限。图像风格转换的核心在于获得输入图像的特征表达。卷积神经网络对于图像高层特征的抽取,使得获取特征的表达变得相对容易。因此,随着深度学习技术的兴起,图像风格转换再次回到了大众的视野。背景生活中,图像风格转化的实际运用较少,多数运用偏娱乐性,例如,智能手机相机里的卡通滤镜功能,可以将拍摄的图像转换成卡通风格。本案例将基于CycleGAN进行图像风格转换。CycleGAN是图像风格转换中常用的网络,其特点是样本数据无需配对即可实现转换,例如,将斑马转换成马,如图所示。背景CycleGAN特点就是图像会经过两次风格转换。首先将图像从风格A转换到风格B。然后再从风格B转换回风格A。如果两次转换的效果都比较好,那么转换后的图像应该与输入的图像基本一致。CycleGAN通过对比转换前后的图像,形成了有监督学习,提升了转换效果。背景本小节主要介绍图像风格转换的相关背景、运用领域以及本案例的分析目标和相关流程。利用艺术风格与现实风景图像数据集,可以实现以下目标。让模型将现实风景图像的风格转换成艺术风格。让模型将艺术风格图像转换成现实风景图像的风格。本案例的总体流程主要包括以下4个步骤。加载数据,加载艺术风格与现实风景图像数据集。构建网络,包含残差网络、生成器、判别器及缓存队列。训练网络,计算生成器和判别器的损失,从而对生成器和判别器进行训练。结果分析,对迭代中输出的风格转换图像进行分析。分析目标本案例的总体流程图如图所示,主要包括加载数据、构建网络、训练网络、结果分析4个步骤。分析目标本案例基于PyTorch1.8.1、CUDA10.2和cuDNN8.2.0环境下运行,其中PyTorch1.8.1也可以是CPU版本。本案例的目录包含三个文件夹,分别是code、data和tmp。如右上图所示。所有原始图像数据存放在data文件夹,其中包含了四个文件夹,分别是trainA、trainB、testA、testB,如右下图所示。项目工程结构所有的代码文件放在code文件夹,如图所示。代码运行过程中生成的转换图像会放入tmp文件夹中,如图所示。构建网络包括构建残差网络、生成器、判别器以及缓存队列。其中生成器与判别器是CycleGAN的主要组成部分。项目工程结构1数据准备目录目标分析2构建网络3训练网络4结果分析5本案例使用的数据是艺术风格图像与现实风景图像数据集,包含了四个子数据集。testA文件夹里包含了263张艺术风格图像。testB文件夹里包含了751张现实风景图像。trainA文件夹里包含了562张艺术风格图像。trainB文件夹里包含了6287张现实风景图像。数据准备1数据准备目录目标分析2构建网络3训练网络4结果分析5
构建网络使用残差网络增加浅层网络到深层网络的信息传输,可以解决网络拥有层数较多时,网络准确度出现饱和,甚至出现下降的问题。在定义残差网络block时,ResidualBlock类继承自父类Module,并通过block_layer对象定义残差模块中的网络层。残差网络block生成器的目的是对输入的图像进行风格的转换,生成能够以假乱真的图像。同时,生成器所生成的图像也将作为输入对象提供给下一个生成器或判别器。在生成器中,使用了镜像填充卷积(ReflectionPad2d)由低维的特征生成高维特征,同时使用图像生成的归一化层(InstanceNorm2d)加速模型收敛,最终得到了生成的图像x。生成器Generator判别器的目的是对输入的图像进行判断,判断图像是真实的图像或生成的图像。在判别器中,使用了大量的卷积层用于提取输入图像的特征,在网络的结尾使用avg_pool2d函数进行均值池化。均值池化前的特征维度为torch.Size([10,1,14,14]),池化时对10个[14,14]大小的向量求均值并返回结果。判别器Discriminator训练网络时,每个周期都会读取一定批量大小的数据用于训练。需要注意艺术风格图像与现实风景图像是成对被读取的,图像对中的固定搭配可能会被网络学习到。因此,需要将输入数据的顺序打乱重新分组。定义缓存队列ReplayBuffe。在ReplayBuffer函数中,有如下两种可能。如果缓存池中的图像数量小于阈值max_size,那么返回原图像,并向缓存池增加输入的图像。如果缓存池中的图像数量大于阈值max_size,那么从缓存池中随机选择图像返回,并将输入的图像替换返回的图像。缓存队列ReplayBuffer1数据准备目录目标分析2构建网络3训练网络4结果分析5训练网络的过程。首先需要实例化生成器、判别器和缓存队列。然后设置损失函数和优化器。其次开始训练网络中的生成器和判别器。最后将风格转换的结果输出保存。G_A2B表示生成风格B图像的生成器,G_B2A表示生成风格A图像的生成器,netD_A表示对风格A图像进行判别的判别器,netD_B表示对风格B图像进行判别的判别器。real_A和real_B为输入的真实图像。训练网络生成器的训练过程主要包含如下6个步骤。利用G_A2B将real_B生成same_B,并获取real_B和same_B之间的损失。利用G_B2A将real_A生成same_A,获取real_A和same_A之间的损失。利用G_A2B将real_A生成fake_B,通过netD_B判断fake_B,将netD_B的返回作为损失。利用G_B2A将real_B生成faka_A,通过netD_A判断fake_A,将netD_A的返回作为损失。利用G_B2A将fake_B生成recovered_A,获取recovered_A与real_A之间的损失。利用G_A2B将fake_A生成recovered_B,获取recovered_B与real_B之间的损失。训练网络生成器的训练过程及图像名称解释,如图所示,主要包含6个步骤。训练网络对获得的损失进行加权求和即可得到生成器的总损失,训练完毕的G_A2B生成器需要满足以下3点要求。如果输入是图像real_B,那么生成的图像same_B在总体像素层面上与real_B相同。如果输入是图像real_A,那么生成的图像fake_B会具有B型的风格。如果输入是图像fake_A,那么生成的图像recovered_B在内容上与real_B相同,在风格上与风格B相同。训练完毕的判别器可以满足以下4点要求。判别器netD_A可以对real_A判真。判别器netD_A可以对fake_A判伪。判别器netD_B可以对real_B判真。判别器netD_B可以对fake_B判伪。训练网络训练网络完成后最终的输出结果是4张图像。一张艺术风格的真实图像a_real。一张现实风景图像的真实图像b_real。一张具有艺术风格的现实风景图像a_fake。一张具有现实风景图像风格的艺术图像b_fake。训练网络1数据准备目录目标分析2构建网络3训练网络4结果分析5通过观察训练过程中某些周期的输出结果来分析图像风格转换模型的效果。训练第1个周期时,生成的图像基本是噪声,如图所示。其中a_fake.png为由真实艺术风格图像a_real.png生成的现实风景图像,b_fake.png为由现实风景图像a_real.png生成的艺术风格图像。结果分析训练第200个周期时,模型已经能够生成具有简单色彩的图像,如图所示。训练第560个周期时,生成的图像已经
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025设备租赁的合同协议书
- 2025年人教版PEP五年级英语下册期末试卷(含答案无听力原文无音频)
- 2025商业综合体绿化维护合同
- 2025市场营销行业员工培训合同
- 2025年外派船员雇佣合同范本
- 2025网站委托建设合同模板
- 2025社保合同协议书模板
- 2025年上海市小麦买卖合同样本
- 2025合同解除与违约责任
- 2025全新版的房屋买卖合同示例
- 了不起的我课件完整版
- 油藏工程重点知识点
- 金属波纹管的焊接技术
- GB/T 22235-2008液体黏度的测定
- CAD输入文字时提示“找不到主词典无法启动拼写检查程序”怎么办
- -活出心花怒放的生命 课件 心理健康
- 给水泵检修方案
- 设备出入库管理办法
- KEGG代谢通路中文翻译
- GB∕T 17832-2021 银合金首饰 银含量的测定 溴化钾容量法(电位滴定法)
- 低成本自动化的开展与案例77页PPT课件
评论
0/150
提交评论