版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
迁移学习认识迁移学习01任务finetune03任务迁移学习特点02任务学习目标掌握迁移学习的基本概念掌握finetune的概念掌握迁移学习的特点1认识迁移学习1认识迁移学习深度学习面临的困境1.大数据与少标注之间的矛盾。深度学习模型的训练和更新,均依赖于数据的标注。数据的标注是一个耗时且昂贵的操作,因为没有足够的标定数据用来学习,使得这些领域一直不能很好的发展。2.大数据与弱计算之间的矛盾。大数据,就需要大设备、强计算能力的设备来进行存储和计算。绝大多数普通用户是不可能具有这些强计算能力的。在这种情况下,普通人想要利用这些海量的大数据去训练模型完成自己的任务,基本上不太可能。3.普适化模型与个性化需求之间的矛盾。深度学习的目标是构建一个尽可能通用的模型,使得这个模型对于不同用户、不同设备、不同环境、不同需求,都可以很好地进行满足。4.特定应用的需求。深度学习已经被广泛应用于现实生活中。在这些应用中,也存在着一些特定的应用,怎样去高效的使用通用模型解决特定的需求。1认识迁移学习迁移学习的基本概念迁移学习(TransferLearning)是一种深度学习方法,就是把为任务A开发的模型作为初始点,重新应用在为任务B开发模型的过程中,顾名思义就是把已学训练好的模型参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务是存在相关性的,所以通过迁移学习可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型从而加快并优化模型的学习效率不用像大多数网络那样从零学习
(StartingFromScratch)。2迁移学习的特点2迁移学习的特点迁移学习与一般深度学习的区别主要表现在数据分布,数据标签,以及模型使用三个方面。在数据分布方面,一般的深度学习需要训练数据和测试数据同分布,即标准数据和非标准数据在训练集和测试集中所占的比例大致相同。而在迁移学习中,训练数据和测试数据的分布可以不同。在数据标签方面,一般的深度学习往往需要大量的数据标注,而在迁移学习中,数据标注可以不用那么多。在模型使用方面,一般的深度学习需要针对每个任务分别建模,而在迁移学习中,任务不需要重新开始建立模型,可以重用之前的模型。2迁移学习的特点迁移学习使用方法:可以在自己的预测模型问题上使用迁移学习,通常有两种方法:开发模型方法和预训练模型方法。
对于开发模型方法,分为四步:(1)选择源任务:必须选择一个与大量数据相关的预测模型问题,这个大量的数据需要与输入数据,输出数据或从输入到输出数据映射过程中学习的概念之间存在某种关系。(2)开发源模型:接下来,必须为这个第一项任务开发一个熟练的模型;该模型必须比原始模型更好,以确保一些特征学习已经发挥了其作用。(3)重用模型:然后可以将适合源任务的模型用作感兴趣的另一个任务模型的起点;这取决于所使用的建模技术,可能涉及到了全部或部分模型。(4)调整模型:可选项,对感兴趣任务的调整输入—输出配对数据或改进模型。2迁移学习的特点对于预训练模型方法,分为三步:(1)选择源任务:从可用的模型中选择预训练的元模型,许多研究机构会发布已经在大量的且具有挑战性的数据集上训练好的模型,在可用模型的模型池里面也能找到这些模型。(2)重用模型:然后可以将预训练的模型用作感兴趣的另一个任务模型的起点,这取决于所使用的建模技术,可能涉及使用全部或部分模型。(3)调整模型:可选项,对感兴趣任务的调整输入—输出配对数据或改进模型。
其中,第二类迁移学习方法在深度学习领域是很常见的。3finetune3finetune在介绍finetune之前,先了解一下什么是预训练模型。在搭建一个网络模型来完成一个特定的图像分类的任务时,首先,需要随机初始化参数,然后开始训练网络,不断调整直到网络的损失越来越小。在训练的过程中,一开始初始化的参数会不断变化。当结果很满意的时候,就可以将训练模型的参数保存下来,以便训练好的模型可以在下次执行类似任务时获得较好的结果。这个过程就是pre-training。之后接收到一个类似的图像分类任务。这时候,就可以直接使用之前保存下来的模型的参数作为这一任务的初始化参数,然后在训练的过程中,依据结果不断进行一些修改。这时候使用的就是一个pre-training/trained模型,而过程就是fine-tuning。所以,预训练就是指预先训练的一个模型或者指预先训练模型的过程;微调就是指将预训练模型作用于自己的数据集,并使参数适应自己数据集的过程。3finetune为什么使用微调?首先要了解卷积网络的核心是:浅层卷积提取基础特征,比如边缘,轮廓等;深层卷积提取抽象特征,比如整个脸型;全连接层根据特征组合进行评分分类。而预训练模型的特点是:使用大型数据集进行训练,具备提取浅层基础特征和深层抽象特征的能力。使用微调不仅可以有效避免从头开始训练,浪费时间和资源的问题,而且可以一定程度上解决模型泛化能力低的问题。3finetune什么情况下使用微调呢?首先,使用的数据集与预训练模型的数据集相似,如果不太相似,比如使用的预训练模型是自然场景下的图片训练的,而目标任务是人脸识别,效果可能就没有那么好了。因为人脸的特征和自然景物的特征提取是不同的,所以相应的参数训练
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省东营市2023-2024学年高二期末考试政治试题 含解析
- 2024至2030年中国摩托车曲柄行业投资前景及策略咨询研究报告
- 2024至2030年电池展示架项目投资价值分析报告
- 2024至2030年气源机项目投资价值分析报告
- 2024至2030年扭矩测量卡项目投资价值分析报告
- 2024至2030年可控硅电镀电源项目投资价值分析报告
- 2024至2030年中国互移式双头激光裁剪机行业投资前景及策略咨询研究报告
- 2024年钩花线衫项目可行性研究报告
- 2024至2030年三机头纸管机项目投资价值分析报告
- 2024年中国超柔长毛绒市场调查研究报告
- 2023年佛山高三一模地理试题
- 车间日常安全生产检查表
- SIwave电源完整性仿真教程
- 《西游记 》课本剧
- (1.3.1)-苏联解体的原因与教训
- 新进医用耗材申购表
- GB/T 1408.1-2006绝缘材料电气强度试验方法第1部分:工频下试验
- GB/T 1040.3-2006塑料拉伸性能的测定第3部分:薄膜和薄片的试验条件
- 11468工作岗位研究原理与应用第6章
- 沥青混凝土路面施工组织设计
- Python教案-教学设计Word版
评论
0/150
提交评论