


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、深度卷积对抗生成网络(DCGAN)版权声明: 本文为 CSDN 博主原创文章, 未经博主允许不得转载。卷积神经网络在有监督学习中的各项任务上都有很好的表现,但在无监督学习领域,却比较少。本文介绍的算法将有监督学习中的 CNN 和无监督学习中的 GAN 结合到了一起。在非 CNN 条件下, LAPGAN 在图像分辨率提升领域也取得了好的效果。与其将本文看成是 CNN 的扩展,不如将其看成 GAN 的扩展到 CNN 领域。而 GAN 的基本算法,可以参考对抗神经网络。 GAN 无需特定的 cost function 的优势和学习过程可以学习到很好的特征表示,但是GAN 训练起来非常不稳定,经常会使
2、得生成器产生没有意义的输出。而论文的贡献就在于:为 CNN 的网络拓扑结构设置了一系列的限制来使得它可以稳定的训练。使用得到的特征表示来进行图像分类,得到比较好的效果来验证生成的图像特征表示的表达能力对GAN学习到的 filter 进行了定性的分析。 展示了生成的特征表示的向量计算特性。模型结构模型结构上需要做如下几点变化:将pooling层convolutions替代,其中,在discriminator上用strided convolutions替代,在generator上用fractional-strided convolutions替代。在 generator和discriminator
3、上都使用 batchnorm 。 解决初始化差的问题帮助梯度传播到每一层防止generator把所有的样本都收敛到同一个点。直接将BN 应用到所有层会导致样本震荡和模型不稳定,通过在generator输出层和 discriminator输入层不采用 BN 可以防止这种现象。移除全连接层global pooling增加了模型的稳定性,但伤害了收敛速度。在generator的除了输出层外的所有层使用ReLU ,输出层采用tanh 。在discriminator的所有层上使用LeakyReLU 。DCGAN 的 generator 网络结构:其中,这里的 conv 层是 four fractiona
4、lly-strided convolution ,在其他的 paper 中也可能被称为是deconvolution.训练细节预处理环节,将图像mini-batch训练, batch size0.02) 的正态分布中随即得到scale 到 tanh 的 -1, 1 。是 128. 所有的参数初始化由(0,LeakyReLU的斜率是 0.2. 虽然之前的GAN使用momentum来加速训练,DCGAN使用调好超参的 Adam optimizer 。 learning rate=0.0002 将 momentum 参数 beta 从 0.9 降为 0.5 来防止震荡和不稳定。 LSUN 效果图经过一
5、次循环的训练 (online learning) 和收敛后得模型得到的效果分别如下: 这表明了 DCGAN 不是通过记忆训练数据来生成 /过拟合高质量的图片。DCGAN capabilities验证为了验证DCGAN 的特征表示的有效性,将特征表示输入到L2-SVM 中,并将分类结果与其他的无监督学习算法进行对比。为了做到这一点,使用在ImageNet-1K上训练得到的generator ,使用所有层的所有 CNN 特征作为输入,将每一层的 CNN 特征使用 max-pooling 的方式降到 4× 4,然后展开,形成一个 28672 维的向量,输入到 L2-SVM 中。 Mnist
6、 数据集上的效果对比: SVNH 数据集上的对比:漫游隐空间通过慢慢的调整初始向量来探索隐空间是如何影响最终图片的生成的。这样,既可以探索图片特征是如何折叠到隐空间的,又可以判断这些图片是由于真正学习到了语义特征还是只是记住了图片(如果有 sharp 的变化)。由上图,可以看到一些逐渐的变化,比如第六行中,逐渐有了一个窗户。第四行中,电视逐渐消失。Discriminator Filter通过分析filter ,我们可以看到,在对房屋特征的学习中,GAN 确实学习到了床、窗口等特征。 左侧是随机 filter ,右侧是学习到的filter ,可见,右侧的filter 还是有意义的。Semanti
7、c Mask在隐空间上,假设知道哪几个变量控制着某个物体,那么僵这几个变量挡住是不是就可以将生成图片中的某个物体消失?论文中的实验是这样的:首先,生成150 张图片,包括有窗户的和没有窗户的,然后使用一个逻辑斯底回归函数来进行分类,对于权重不为0 的特征,认为它和窗户有关。将其挡住,得到新的生成图片。 Vector Arithmetic 类似于 word2vec ,图像是不是也有类似的特点,可以在隐空间里进行加减法来得到新的图像?实验表明,使用单张图片的表示并不稳定,使用三张图片会比较稳定。可以看到,单张图片并不稳定,而三张图片则可以学到表情和墨镜等特征。更甚者,可以学到一个稳定的向量, 来进行某种变换, 比如,方位变换。总结这篇 paper 的主要贡献看似简单,但其实工作量很大,充分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年盘锦下载货运从业资格证模拟考试系统试题
- 离婚协议书标准版女方(2025年版)
- 2024年高中化学 专题4 烃的衍生物 第二单元 第2课时 酚的性质和应用 基团间的相互影响教学实录 苏教版选修5
- 2023八年级道德与法治下册 第一单元 坚持宪法至上 第一课 维护宪法权威 第1框 党的主张和人民意志的统一教学实录 新人教版
- 幼儿皮肤的专业知识讲解
- 2025年建筑防水卷材及制品项目合作计划书
- 2025年寄生虫病防治兽药项目发展计划
- 手机应用在营销中的应用价值
- 袋鼠式护理的应用
- 2025年新型诊断试剂与生物疫苗项目建议书
- 人教部编版道德与法治八年级下册:3.2 《依法行使权利》听课评课记录
- 机电一体化专业课程改革调研报告及改革建议
- 2025年甘肃甘南州国控资产投资管理集团有限公司招聘笔试参考题库附带答案详解
- 新生儿各种导管的护理
- 《天津天狮奖金制度》课件
- 2025年中远海运投资控股有限公司招聘笔试参考题库含答案解析
- 《市场营销STP战略》课件
- 人力资源内部培训课件
- 医院临床医学带教老师培训
- 《S中学宿舍楼工程量清单计价编制(附三维图)》30000字
- 全国运动员注册协议书范本(2篇)
评论
0/150
提交评论