现代机器学习 课件 第17章 迁移学习_第1页
现代机器学习 课件 第17章 迁移学习_第2页
现代机器学习 课件 第17章 迁移学习_第3页
现代机器学习 课件 第17章 迁移学习_第4页
现代机器学习 课件 第17章 迁移学习_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第17章迁移学习17.1迁移学习概述17.2迁移学习17.3深度迁移学习17.4迁移学习的应用本章小结

17.1迁移学习概述

17.1.1迁移学习的历史

传统的数据挖掘和机器学习算法通过使用之前收集到的带标记的数据或者不带标记的数据进行训练,进而对将来的数据进行预测。半监督分类通过利用大量未标记数据和少量已标记的样本数据,解决了由于标记数据过少而无法构建一个良好分类器的问题。

图17.1展示了传统机器学习和迁移学习的学习过程之间的不同。传统的机器学习技术试图从头学习每个任务;而迁移学习在目标任务缺少高质量的训练数据时,试图将一些先前任务的知识迁移到目标任务。图17.1传统机器学习和迁移学习的学习过程

17.1.2迁移学习的本质

根据目前已有的迁移学习

方法,可大致将迁移学习划分如下:

1.根据源域和目标域分类

根据源域和目标域的不同情况,可将迁移学习分为三类,分别是归纳式迁移学习、直推式迁移学习和无监督迁移学习。

1)归纳式迁移学习

当源域中有大量标签数据时,归纳式迁移学习与多任务学习类似。然而,归纳式迁移学习通过从源任务迁移知识来实现目标任务的高性能,而多任务学习试图同时学习目标任

务和源任务。当源域中没有可用的标签数据时,归纳式迁移学习相当于自学习。在自学习中,源域和目标域之间的标签空间可能不同,这意味着源域的辅助信息不能直接使用。因此,自学习类似于源域中没有可用的标签数据的归纳式迁移学习。

2)直推式迁移学习

在直推式迁移学习中,源任务和目标任务相同,但源域和目标域是不同的。在这种情况下,目标域中没有可用的标签数据,而源域中有许多标签数据。此外,根据源域和目标域

之间的不同情况,直推式迁移学习可以进一步分为以下两种情况进行讨论:

①源域和目标域之间的特征空间不同,即ΞS≠ΞT;

②特征空间相同,即ΞS=ΞT,但边缘分布概率不同,即P(XS)≠P(XT)。

3)无监督迁移学习

无监督迁移学习集中解决目标域中的无监督学习任务,如聚类、降维和密度估计等。在这种情况下,训练中的源域和目标域都没有可用的标记数据。

2.根据迁移知识的形式分类

1)基于实例的迁移学习

2)基于特征的迁移学习

3)基于参数的迁移学习

4)基于关系的迁移学习

17.2迁移学习

迁移学习的目的是解决学习任务中目标域标记样本数量很少甚至可能没有的问题。根据迁移知识的形式不同,迁移学习可以分为基于实例的迁移学习、基于特征的迁移学习、基于参数的迁移学习和基于关系的迁移学习。

17.2.1基于实例的迁移学习

基于实例的迁移学习是指在源域和目标域的分布不同的情况下,在源域中依然存在部分数据适合被利用并有益于目标域的学习。简言之,通过在源域中找到与目标域相似的数

据,对数据的权值进行调整,将这些数据与目标域的数据进行匹配,然后进行训练学习并获得适用于目标域的模型。如图17.2所示。图17.2基于实例的迁移学习

目前主要采用以下两种方法来学习权重。

种是基于Boosting的迁移学习算法,其目的是通过迭代更新其权重来识别具有误导性的源域实例。Boosting算法的核心思想是将多个弱学习器组合成一个强分类器。目前使用较多的基于Boosting的迁移学习算法是TrAdaBoost算法,该算法是Dai等人在2007年提出的,它是第一个基于实例的归纳迁移学习算法。

在TrAdaBoost算法中,通常假设源域和目标域的分布是不同的,但其数据的特征维数和标签空间是相同的。鉴于源域和目标域数据分布的差异,源域中存在部分有益于目标

域学习的数据,也存在一些无益甚至有害的数据。因此,通过TrAdaBoost算法能够在迭代中对源域数据进行加权,增加有益数据,同时降低无益数据对目标域学习的作用,进而提高目标域的学习性能。具体算法流程如下:

另一种基于实例的归纳迁移学习方法是通过生成模型为目标域生成新的实例,从而学习出精确的目标域预测模型。这种生成模型通常需要足够的源域数据和少量的目标域数据

作为输入。总之,基于实例的迁移学习方法简单,容易实现,但较为注重源域与目标域之间的相似性。若二者的相似性较高,则可以通过较低的时间复杂度获取更好的学习效果;若二者的相似性较低,则往往会造成负迁移现象。

17.2.2基于特征的迁移学习

在许多真实场景中,源域数据和目标域数据无法实现较高的相似或相同的分布。图17.3所示,在基于特征的迁移学习中,需要从源域和目标域中的特征出发,考虑数据样本中潜在的共同特征。值得注意的是,特征并不受目标域和源域的限制,也可引入辅助特征进行学习。此类方法的核心在于寻找更好的特征表示,从而达到提高学习性能的目的。图17.3基于特征的迁移学习

对于不同类型的源域数据,寻找“好的”特征表示的策略是不同的。如果源域中有大量标记数据,则可以使用监督学习方法构造特征表示,这类似于多任务学习领域的共同特征学习。如果源域中没有标记数据,则采用无监督学习方法来构造特征表示。基于有监督的特征迁移学习类似于多任务学习,通过分析源任务和目标任务的共有特征,将其在多个任

务中联合优化,同时提高多任务的学习性能。该方法的基本思想是:首先学习出一个目标域与源域相关任务共享的特征表示,然后利用这个特征表示来提高每个任务的学习性能。

特别地,在特征学习过程中,挖掘源域与目标域的共同特征可被转化为最优化问题来进行求解。

需要注意的是,基于特征的迁移学习方法和基于实例的迁移学习方法的不同之处是:基于特征的迁移学习需要进行特征变换将源域和目标域的数据变换到同一特征空间进行学

习,而基于实例的迁移学习从源域数据中找出相似的或有益的数据用于目标域的学习。

17.2.3基于参数的迁移学习

基于参数的迁移学习方法也叫基于模型的迁移方法,该方法从源域和目标域中找到它们之间共享的模型参数或经验知识,以实现迁移。这种迁移方法假设源域中的数据与目标

域中的数据可以共享一些模型的参数,也就是将之前在源域中通过大量数据训练好的模型应用到目标域上进行预测。基于模型的迁移学习方法比较直接,其优点是可以充分利用模

型之间存在的相似性,缺点在于模型参数不易收敛。

例如,利用成千上万个图像来训练好一个图像识别的系统,当遇到一个新的图像领域问题的时候,就不用再去找几千几万个图像来训练了,只需要把原来训练好的模型迁移到新的领域,在新的领域往往只需几万张图片,同样可以得到很高的精度,如图17.4所示。图17.4基于参数的迁移学习

17.2.4基于关系的迁移学习

基于关系的迁移学习方法与上述三种方法具有截然不同的思路。该方法侧重于源域和目标域样本之间的关系。若两个域相似,则它们之间会共享相似关系,并将源域中学习到

的逻辑网络关系应用到目标域上来进行迁移,如生物病毒传播规律到计算机病毒传播规律的迁移,如图17.5所示。图17.5基于关系知识的迁移学习

目前,基于关系的迁移学习有两种机制:一种是基于一阶关系的迁移学习;另一种是基于二阶关系的迁移学习。一阶关系假设两个关系域是相关的,那么它们可能在跨域传输的数据实例之间共享一些相似的关系。二阶关系则假设两个相关的关系域共享一些相似的通用结构规则,这些规则可以从源域中提取出来,然后在目标域上使用。目前已有的方法主要是采用马尔可夫网络实现迁移。

四种迁移方式中,基于实例的迁移学习算法是最直观的,可以通过对源域样本进行重加权和将目标域样本结合来改善目标域的学习性能。但是,值得注意的是,当源域样本数据较少时,其数据偏差较大可能会对迁移效果产生一定的负面作用。基于参数的迁移学习和基于关系的迁移学习分别为两种迁移思路:前者注重学习任务的整体相似性,源域和目标域具有不同分布,但具有相似的知识和特性;而后者假设源域和目标域相互独立,但具有统一的样本分布。

共享属性的迁移学习更侧重于源域和目标域任务的相似性,忽略了对样本属性的归纳,那么当样本较少且共享属性不明显时该方法并不合适。基于特征的迁移学习侧重于获得能够对源域和目标域进行表示的最优属性,强调域与域之间的映射关系,并不局域于某个指定的域,因此比其他三种迁移方式更实用。

17.3深度迁移学习

深度学习的概念是由Hilton等人于2006年初次提出的。近些年,深度学习在各个领域大放异彩,成为人工智能领域的热门研究之一。深度学习的主要思想是模拟人类大脑的神经结构,希望机器能够像人一样将接收的数据进行处理,实现过程是通过多个非线性层对数据进行特征抽取。深度卷积网络目前已在语音、图像识别等任务中展现出了突破性的成果,应用数量呈爆炸式增加,目前被大量应用在无人驾驶汽车、癌症检测、人工智能(ArtificialIntelligence,AI)游戏等实际问题中。

如前所述,迁移学习能够通过充分利用过期数据,保证目标模型具有更好的效果,从而降低了新目标任务中收集数据的成本。它充分利用源域数据训练得到的参数和模型,将其用在另外一个具有共同因素但又不同的目标域,从而对之前学习到的知识进行充分利用。目前,深度学习中的神经网络占据了主导地位,随着深度神经网络在图像、语音识别领域的优秀表现,深度神经网络的迁移学习也慢慢成为了迁移学习中的研究热点。深度神经网络的迁移是应用目标数据在相似领域中经过大量数据训练的深度学习模型,根据目标要求对模型中学习的架构和参数进行微调,构建满足要求的深度神经网络。它的主要流程如图17.6所示。图17.6深度神经网络的迁移学习

17.3.1基于网络的深度迁移学习

基于网络的深度迁移学习是指将源域中预先训练好的部分网络(包括其网络结构和连接参数)重新使用,将其转换为目标域中使用的深层神经网络的一部分。它基于这样一个假设:神经网络与人脑的处理机制相似,是一个迭代的、连续的抽象过程。网络的前几层可以看作一个特征提取器,所提取的特征是通用的。基于网络的深度迁移学习示意图如图17.7所示。图17.7基于网络的深度迁移学习

最简单基于网络的深度迁移学习是微调(Finetune),主要是利用别人已经训练好的网络微调,然后针对自己的任务进行调整。其好处是不用完全重新训练模型,从而提高了效率。微调主要包括参数或者全连接层神经元个数的变动,需要针对自己的任务,固定原始网络的相关层,修改网络的输出层,以使结果更符合需求。当目标域的数据集数量很小时,我们可以仅仅改变最后一层全连接层的神经元的个数;当目标域的数据集数量很大时,我们可以选择训练网络模型的后几层参数。

VGG网络是由Oxford的VisualGeometryGroup提出的。该网络获得了2014年ImageNet大型视觉识别挑战比赛的亚军和定位项目的冠军,其主要工作是证明了增加网络

的深度能够在一定程度上影响网络最终的性能。VGG有两种结构,分别是VGG16和VGG19,两者并没有本质上的区别,只是网络深度不一样。

与AlexNet网络相比,VGG网络的一个改进是采用连续的几个3×3的卷积核代替AlexNet中的较大卷积核,如11×11。对于给定的感受野(与输出有关的输入图片的局部大小),采用堆积的小卷积核优于采用大的卷积核,因为多层非线性层可以增加网络深度来保证学习更复杂的模式,而且代价比较小。简单来说,在VGG中,使用了3个3×3卷积核来代替7×7卷积核,使用了2个3×3卷积核来代替5×5卷积核,这样做的主要目的是在保证具有相同感知野的条件下提升网络的深度,在一定程度上提升神经网络的效果。VGG16包括5个卷积组和3个全连接层,5个卷积组分别有2,2,3,3,3个卷积层,因此网络共

有16层。网络结构如图17.8所示。图17.8VGG16网络结构图

17.3.2基于生成对抗网络的深度迁移学习

生成对抗网络(GenerativeAdversarialNetworks,GAN)是目前人工智能领域最炙手可热的概念之一。由此发展而来的对抗网络也成了提升网络性能的利器,被成功引入若干领域并发挥重要的作用。著名的围棋程序AlphaGo战胜人类顶级选手李世石引起了人们对深度学习的广泛关注,而AlphaGo中的策略网络(PolicyNetwork,PN)在训练过程中正是

采取了两个网络相互对抗的方式,最终的策略网络获得棋局状态之后才能返回相应的策略和对应回报,并用博弈回报的期望函数的最大化作为最后的目标函数。

生成对抗网络模型包含两部分:一部分是生成网络(GenerativeNetwork),负责生成尽可能以假乱真的样本,被称为生成器(Generator);另一部分是判别网络(Discriminative

Network),负责判断样本是否真实,被称为判别器(Discriminator)。该模型通过生成器和判别器之间的互相博弈来实现对抗训练,最终生成器能够生成拟合真实数据的分布的样本,以至于判别器也无法正确区分生成数据和真实数据。生成对抗网络的结构如图17.9所示。图17.9生成对抗网络的结构

在目标域中,有标签的数据通常很难获取,同时其标记

成本也很高,通过生成模型则可以解决这一难题,生成有标

签的目标域数据。目前主要有两种模型:第一种是从源域数

据到目标域数据的映射,用于生成有标签的目标域数据;另一种模型是在两个域之间建立双向映射。处理双向映射的经

典模型是CycleGAN。其网络架构如图17.10所示。该模型主要包括两个生成器和两个判别器。图17.10CycleGAN网络框架

基于特征的对抗迁移学习是将源域和目标域中的数据映射到共享空间,然后利用两个域的数据来完成学习任务。此时,生成器的作用将不再是生成新样本,而是提取特征,通过

不断学习领域数据的特征,使得判别器无法对两个领域进行区分。那么,原来的生成器也被称为特征提取器。深度对抗网络的损失由网络训练的损失lc和领域判别损失ld两部分构

成,即图17.11DANN网络框架

17.4迁移学习的应用

近年来,迁移学习技术已经成功运用于各类领域,这些领域包括但不限于计算机视觉、文本分类、行为识别、自然语言处理、室内定位、视频监控、舆情分析、人机交互等。图17.12展示了迁移学习潜在的应用领域。下面针对当前的一些研究热点,对迁移学习在这些领域的应用场景进行简单介绍。图17.12迁移学习的应用

1.生物信息学与生物成像

在生物学中,许多实验不仅代价高,数据也非常少,如医生试图使用计算机发现潜在疾病的生物成像实验。当前,迁移学习越来越多地被用来将知识从一个领域迁移到另一个领域,以解决生物学中获取标记数据成本高的难题。

在生物医学图像分析中,一个难题是收集新的数据来识别指定疾病,如从医学图像中识别癌症的类型等。这类识别需要大量的训练数据,然而获得这些数据通常非常昂贵,因

为它们需要专家标记。此外,预训练模型和未来模型的数据往往来自不同的分布。这些问题激励着许多研究工作应用迁移学习将预训练模型迁移到新的任务中。可以预见,迁移学

习在那些不易获取标注数据的领域将会发挥越来越重要的作用。

2.图像理解

从物体识别到行为识别的许多图像理解任务需要大量标记数据来训练模型,然而当计算机视觉情况稍微有变化(如从室内到室外,从静止摄像机到移动摄像机)时,模型需要适应新的情况。迁移学习就是解决这些适应问题的常用技术。室内定位与传统的室外用的GPS定位不同,它通过WiFi、蓝牙等设备研究人在室内的位置。不同用户、不同环境、不同时刻采集的信号分布不同。图17.13展示了不同时间、不同设备的WiFi信号变化。图17.13室内定位由于时间和设备变化导致的信号变化

3.文本挖掘

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论