版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、生成对抗网络(GAN我们提出了一个通过对抗过程估计生成模型的新框架,在新框架中我们同 时训练两个模型:一个用来捕获数据分布的生成模型 G和一个用来估计样本 来自训练数据而不是G的概率的判别模型D, G的训练过程是最大化D产生错误 的概率。这个框架相当于一个极小化极大的双方博弈。在任意函数G和D的空间中存在唯一的解,其中G恢复训练数据分布,并且D处处都等于1/2。在G 和D由多层感知器定义的情况下,整个系统可以用反向传播进行训练。在训练 或生成样本期间不需要任何马尔科夫链或展开的近似推理网络。实验通过对生成的样品进行定性和定量评估来展示这个框架的潜力。目标函数GAN勺目标函数:minnwcV
2、(D,G) =叽凡皿+旧九即阻1 - D(G:),从判别器D的角度,他希望自己可以尽可能的区分真是样本和虚假样本,因此 希望D (x)尽可能的大,D (G (x)尽可能的小,即V (D,G)尽可能的大。 从生成器的角度看,他希望自己尽可能的骗过 D,也就是希望D (G (x)尽可 能的大,即V (D,G)尽可能的小。两个模型相对抗,最后达到全局最优。(b)(c)(d)图中,黑色曲线是真实样本的概率分布函数,绿色曲线是虚假样本的概率分布 函数,蓝色曲线是判别器D的输出,它的值越大表示这个样本越有可能是真实 样本。最下方的数噪声z,它映射到了 Xo我们可以看到,一开始,虽然 G(z)和x是在同一个
3、特征空间里的,但它的的差 异很大,这时,虽然鉴别真实样本和虚假样本的模型D性能也不强,但它很容易就能把两者区分开来,而随着训练的推进,虚假样本的分布住建与真实样本 重合,D虽然也在不断更新,但也已经力不从心了。最后黑线和绿线几乎重合,模型达到了最优状态,这时D的输出对弈任意样本都是0.5.最优化问题表达定义最优化问题的方法由两部分组成,首先我们需要定义判别器D以判别样本是不是从Pdata(x)分布中取出来的,因此有:4心口) 1。虱。(工)其中E指代取期望。这一项是根据正类(即辨别出x属于真实数据data )的对数损失函数而构建的。最大化这一项相当于令判别器D在x服从于data的概率密度时能准
4、确地预测 D(x)=1 ,即:0(工)1 when pd睢式力另外一项是企图欺骗判别器的生成器 Go该项根据负类的对数损失函数而 构建,即:Jg log(l-D(G(z)我们定义目标函数为:=旧工一*logQQ) +叽Lg(l - D(G(z).G tJ对于D而言要尽量使公式最大化(识别能力强),而对于 G又想使之最小(生成的数据接近实际数据)。整个训练是一个迭代过程。其实极小极大化博弈可以分开理解,即在给定 G的情况下先最大化 V(D,G)而取D,然后固定D, 并最小化V(D,G)而得到Go其中,给定G,最大化V(D,G)评估了 Pg和 Pdata之间的差异或距离。最后,我们可以将最优化问题
5、表达为:G. 理向心/。方)理论推导3.1知识预备一KL散度要进行接下来的理论推导.掰盾先需要一点预备知识,KL散段(KL divergence ),这是统计中的一个覆念.是r星两种吸率分布的相 似程度,其建小表示网种柢率分布越接近.对于总敌的概率分布,定义如下:以期|0一工口叫留对于连期概率分布,定义如下Dkl(P Q) = /)(幻修翳i*找们想耍将一个例机部通道T生成网络(汨到一个和真的数据分布Pdaia(r)差不多的生成分布 人(明。)旦中的参数0 255? 络的娄我决定的,我们号空找到e化伴pG(xe)和/%“)尽可独按通Maximun Likelihood Estimation我们
6、从其实数据分布Pdata(x)里面取样m个点,储,/,,小 根据给翔0我(I何以计算如下的嗫率及(洌.哪么生 成斌m个用竭08的似然(likelihood)就是:L一3*例 i-I我侑加翌仔的韦情就是找列&至H大化这个似然估计O - anctuax IT R;(, c arxinaxlog II %(,洌 i-i te=argmax 52 log (r1;fl)=arg max &%七(;州j arg max / /(x) log PG(x; O)dx - / %式力 log 几在上面的推导中,我屏里特大化似然由敢L.若对似佼逑做取对嵌,肥么鸵桑II就能恁化为里E ,并且这TH程并不会改变最优
7、 化的结聿.因此我们可I脂极大似然估计化为求令kgR;(j:6)期里最大化的。.向朗空Ek)年(1;6)可以展开为在工上的快分形 式 f Efrj(x) log Pa(x;0)dx.又因为该M优化过程是行对9的.所以我们添加一项不含e的积分并不fiflW讹翅,田可添加log、(*)/1添加 该积分后.我何以合并这两个失分并存*类似KI前物诩式.该过的下: ag max /入匕噂 A匕3(*)-NgmEKL(Pj(“川心(&)这年在前面添7L个负号 将log干面的分敌士一下,就变成了KL散层: 而外(工冶)如何算出来呢?%(1) - /小川)加上时*二里面的I去示示酶妓,也就会:Jo G(”工
8、以 X1 G(z) = x这特我们日实根本没办法求出这个pcx)出土,这就是生成糖现建本想法.3.2 Global Optimality of p(f =下面,豆(焉要证明:该片优化何轴唯一隹G并且该唯一解满足Pa Pdala.Basic Idea of GAN生 5G:G是一个生成器.给走先蛉分在片优生存到生城分布心(工),这里短迤通也畛似然估计耳到*崛富D:D是一个科做,充南是P(M 与凡必(工)之间的差不.这呈闲来取代极大蝗诂估计政玻喝在板MR大博弈的第一步中,给定生成器G ,最大化V(D, G)而得出最优判削器Do其中,或人化V(D. G)评怙了 Pc和 外皿之郝I爰异或跑奇.因为在原
9、论文中价值函数可写为在x上的枳分,即将数学期里层开为枳分形式:P(x)logD(x)dz | J p(z) log(l l)(G(z)dz=Jj&M l D(# 4 加(工)k电(1 例工)d2美于上两枳分式的证明在GAN原论文中,T7T四?KB布很圣方法都不同,即生18 G不。隔足可送条件 Scott Rome认为这一点,因为刘4中G就是不 可逆的.而很步证明宅已都期8 了法 点,fWfWI哪州馍地使用了枳分换元公式,而织分怏元又恰好至于G的可逆第K Scott认为证明只汨 基于以下等式的施立性:. log(l- RG(z) = E所却log(l -。(工)该吟式来源于测度论中的Radon
10、Nikodym定理有I明国程卷用了枳分随讼式,但进行空泄玩就必须计贬G(T).而G的迪丽没有艇为存在,井目在呻绛网络的实疑中,它也并不在 在.可阖这个方法在矶器学习和统计竽文献中太常见了,因urn们3座了它.在数据给定,G给定的前提下. 脸(工)与PcM 都可以看作是常数,我们可以分别用a,b耒表示他们,这样我,麻可以得到如下 的式子:f(D) 01由。+ 6log(l - D)= ax(l-D)= bxDProposition 1. For G fixedt the optimal discriminator D isHT该彳优的D在女心中并不是可计更的.但在数学上十分里航 我们并不应S3先
11、验的 心小工),所以我,口在VI稣中永远不会用到它. 另一方面,它的存在今我们可以证明给值为G是存在的.并且在川康中找们只点姿逼近D.星优生忒H当然GAN过程的目标是令PG - 啧1这对彳优的D触味后什么呢?我ff何以格这Tit代入DG.的表达式中:及意味若判刖器已0克全。了,它完全分辨不出Pdata和PO的区&J .暝斯样本安自和PG的钱率为;基于这一观点.GAN作者证明了 G就是极蛾大博弃的解.该定理如下:Theorem 1. The global minimum of the virtual training criterion C(G) is achieved if and only
12、if pg = Pdaia- Ai that point. C(G) achieves the value - log 4.即当目仅当Pc- Pdata,训缘昧准C(G) - max V(G9D)的可以达到最优.以上定理fl网大极A.求令V(G, ZT)船J的生成餐G (N中ZT代而配加9判则修).之所以当Pc三 为皿 可以令 价值就鼓最小化,是因为这时财个分布的JS R5LS JSDtPdaMWPaix)等于跖 这一过程的详细解超原论文中的这理是当且仅当声明,所以倒穴要从两个方向遭队 首先我们先从反向逼近开证明C(G)的取值,然后再利用在 及向荻用的新知识从正向证明.设生=Pdata (反向
13、指预先知痴E优条他并做推9 ),我们可I力爻向推出:V(G.D) (punMOOJug;)必?)=-。2 / z3 A -/2 / x(,)dr = -2咻2 = - 44谈值JE全层最小值的怪造.因为它只有在Pg = P* 的时候才出见 倒现在需要从正向证明这一Hfi常常为量小但也就是同时满 是当J和仅当J的条件.现在放弃Pc = Pj aoeis,对任意一个G.建们可以将上T求出的H优#H8J35 D9代入到 C(G) = maxV(G,D)中:的/i(小(讴工:匕,)内理工.)山因为已知Iog4为全同会吸选值,麻”我们希望构道某个僚以使方程式中出现Iog2.因此我f可以在抵个枳分中加上硒去k)g2 ,开 不上概也以示.这是一个十分常见并且不会改变等式的故学证明技【5 .因为本质上髭们只JE在方例口上了 0.c-止2由1,) aM (京:匕,)3i+ MX(内”黑曲j)也采用该技巧主要是希望麟构建成含Ioq2 ffl JS的度的形式,上式化劣后可以得至蚁下方达式:C(G) - -log2 %”)+ Pd“a(H)dz+鬲端融十卬3 (log 2十叫p ) da国力1率电度的定义,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 同居生子分手协议书电子版
- 天津市小型建设工程合同的适用范围
- 《地铁设施设备系统》课件
- 2025年宜春货运从业资格证模拟考试题目
- 2025年陇南道路货物运输从业资格证考试
- 2025年泸州货物从业资格证考试题
- 动物屠宰产业升级
- 智能家居投资管理办法
- 挖掘机地铁建设施工合同
- 汽车行业市场调研全解析
- 债务优化服务合同范例
- 专题19 重点用法感叹句50道
- 2024-2025学年统编版五年级语文上册第七单元达标检测卷(原卷+答案)
- 人教版七年级语文上册《课内文言文基础知识 》专项测试卷及答案
- 2024年光伏住宅能源解决方案协议
- 【初中数学】基本平面图形单元测试 2024-2025学年北师大版数学七年级上册
- 江苏省苏州市2023-2024学年高二上学期1月期末物理试卷(含答案及解析)
- 2025届陕西省四校联考物理高三上期末联考试题含解析
- 外墙装修合同模板
- 中国发作性睡病诊断与治疗指南(2022版)
- 律师事务所律师事务所管理手册
评论
0/150
提交评论