生成式对抗网络理论模型和应用综述_第1页
生成式对抗网络理论模型和应用综述_第2页
生成式对抗网络理论模型和应用综述_第3页
生成式对抗网络理论模型和应用综述_第4页
生成式对抗网络理论模型和应用综述_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    生成式对抗网络理论模型和应用综述    张红蕊摘 要:生成式對抗网络gan(generative adversarial networks)源于二人零和博弈理论,即一方所得是另一方的损失,两人利益之和为零,它结合机器学习中的生成模型和判别模型的思想,演化成网络模型中的生成器和判别器,两者采用对抗学习的方式,目的是估测样本的潜在分布并根据真实的数据样本生成可以仿真的虚假样本。在图像处理与视觉计算、语音识别、视频处理等方面,gan正在被广泛研究并且具有极大的发展趋势。本文主要概括了gan的理论模型和基本原理、演变模型以及主要应用,最后进行总结展望。关

2、键词:深度学习 生成式对抗网络 对抗学习1. gan模型1.1 gan基本原理生成式对抗网络gan1是2014年由goodfellow等提出的一种新型神经网络模型,思想起源于二人零和博弈理论,即纳什均衡思想。gan网络模型由生成器和判别器共同构成,两者采用对抗学习的方式训练,生成器用于捕捉真实数据样本的概率分布,并生成新的样本;判别器可以看作是一个二分类器,用于判断数据是来自真实样本还是生成样本,并输出一个0到1的固定概率值。1.2 gan网络结构gan核心思想是极大极小二人博弈游戏,网络结构如图1-1所示,将100维随机噪声z输入生成模型g中,生成器内部经过多层感知器或是复杂的神经网络生成新

3、的样本,将真实数据和生成数据输入判别模型d,判别器用于输出样本的概率值,并将梯度信息反馈给生成模型g。训练过程中,g的目标是尽可能生成可以欺骗判别器d的样本,而判别器的目标是尽可能分辨数据样本的真假性,最终达到平衡。在这一过程中,判别器为更好的区分生成数据与真实数据,并将二者输出的概率值尽可能二分化,固定一方权重以训练另一方,得到最优判别器公式如公式1-1所示,当,时,此时最优。2. gan演变模型gan衍生模型在创新发展原始gan基础上提出新的想法,cgan2 加入条件因素;lapgan3将生成器与判别器定义为laplacian pyramids框架内的级联卷积网;dcgan4 将生成器和判

4、别器用深度神经网络来代替多层感知器;wgan5 将js散度提出用wasserstein距离代替;cyclegan6 双向gan机制能够生成双向域中图像。随着gan技术的不断成熟和发展,更多的演变模型在这些模型的基础架构上加以优化。3. gan模型应用gan作为深度学习领域的新星,在许多领域都具有较多的研究成果,本节主要从以下五方面阐述。3.1 超分辨率图像复原超分辨率图像复原思路是将的低分辨率的图像作为基准,生成真实可观的或是等更大分辨率图像。srgan7基于gan的改进,采用vgg19作为判别器的网络结构,生成器由深度残差网构成,同时在模型后部加入了子像素模块,在提高分辨率的同时优化了对人类

5、感知更敏感的损失。3.2图像风格迁移图像风格迁移思想是存在一张内容图,一张风格图,目标将的风格作用在图上,生成新的图像。文献8实现成对数据集上的风格转换,双向gan机制cyclegan实现不成对数据的图像翻译工作,实现照片风格、马到斑马的转换,而dualgan、discogan也在双向gan机制的作用下实现风格转换任务。3.3 视频、音频生成在处理静止图像任务的同时,gan在视频动态画面和音频生成上取得良好效果,vgan9利用一些未标记的视频素材训练模型解决识别问题和视频生成任务,同时模型学习到的特征可以用来进行图片分类;c-rnn-gan10利用gan和循环神经网络的结合生成古典音乐,在处理

6、时序相关的自然语言同时生成听觉良好的音乐。3.4 语音识别将gan目标来实现鲁棒性的语音识别系统,文献11使用gan网络架构,以可扩展、端到端的方式提高序列到序列模型的鲁棒性,编码器组件搭建生成器,训练以输出噪声音频样本和干净音频样本之间不可分辨的嵌入,这种新型的对抗学习方式在语音识别系统中表现出极强的应变能力和可行性。3.5 其他应用在无监督或半监督学习领域中,gan逐渐应用到各种领域中。文献12提出文字到图像的转换,准确输出图像对于文字的正确表达;dcgan实现了表情模型的矢量运算,可对表情信息进行加减操作;watergan实现了水下图像的实时色彩矫正;patch gan完美的完成图像上色

7、任务;seqgan在自然语言处理领域取得良好的效果;tp-gan完成人像修复,通过单一侧面照片合成正面照片。4. 总结与展望本文综述了生成式对抗网络gan的基本原理、网络结构、模型演变以及应用拓展。概述gan在图像合成、图片修补、超分辨率、图片上色,以及语音识别、视频生成、自然语言处理等方面应用。由于gan结构不适用于离散型结构的样本,预期在未来工作中可以得到较完善的解决。参考文献:1 goodfellow i j, pouget-abadie j, mirza m, et al. generative adversarial networksj. advances in neural inf

8、ormation processing systems, 2014, 3:2672-2680.2 mirza m, osindero s. conditional generative adversarial netsj. computer science, 2014:2672-2680.3 fergus r, fergus r, fergus r, et al. deep generative image models using a laplacian pyramid of adversarial networksc/ international conference on neural

9、information processing systems. mit press, 2015:1486-1494.4 radford a, metz l, chintala s. unsupervised representation learning with deep convolutional generative adversarial networksj. computer science, 2015.5 arjovsky m, chintala s, bottou l. wasserstein ganj. 2017.6 li m, huang h, ma l, et al. un

10、supervised image-to-image translation with stacked cycle-consistent adversarial networksj. 2018.7 ledig c, theis l, huszar f, et al. photo-realistic single image super-resolution using a generative adversarial networkj. 2016:105-114.8 isola p, zhu j y, zhou t, et al. image-to-image translation with

11、conditional adversarial networksc/ ieee conference on computer vision and pattern recognition. ieee computer society, 2017:5967-5976.9 vondrick c, pirsiavash h, torralba a. generating videos with scene dynamicsj. 2016.10 mogren o. c-rnn-gan: continuous recurrent neural networks with adversarial trainingj. 2016.11 sriram a, jun h, gaur y, et al. robust speech recognition using generative adversarial networksj

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论