版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、迁移学习域自适应性-李宏毅笔记迁移学习域自适应性导语在真实的机器学习项目中,我们的训练数据集与测试数据集之间是存在一定数据分布差异的,这个时候往往模型会出现过拟合的情况,模型在测试集上的效果不是很理想。那怎么样在不改变数据集的情况下,提升测试集准确率呢。这个时候就有了迁移学习的一种代表方法,域自适应(Domainadaptation)。另外在迁移学习中又分样本迁移、特征迁移和模型迁移,其中模型迁移学习与fine-tune(微调)有一些不同的地方:虽然二者都是利用训练过的模型来解决问题,但实际上存在一些差异:“fine-tune(微调):是对已经训练好的模型,把整个这个模型放到另一个数据集上继续
2、进行训练(其中参数继续发生变化)“迁移学习:提取模型中所需要的部分层,对这些层进行冻结(固定层的参数)在冻结层后增加新的训练层,最后完成训练。fine-tune是继续更新模型的参数,迁移学习是固定一部分参数,训练更新一部分参数。Domainadaptation域自适应方法,通常表示域不同,但任务相同的方法,这里域代表一个数据集的集合。什么样子的域(数据集),可以适合来做域自适应呢通常我们的源域(与测试样本不同的数据集,也可以说是训练集)数据集有标签,目标域数据(测试集)没有标签或者很少数据有标签2.1Domainadaptation思路定义源域(训练集):source定义目标域(测试集):ta
3、rget主要的思路就是将source训练好的模型能够用在target上,域适配问题最主要的就是如何减少source和target不同分布之间的差异。域适配包括无监督域适配和半监督域适配,前者的target是完全没有label的,后者的target有部分的Iabel,但是数量非常的少通过在不同阶段进行领域自适应,研究者提出了三种不同的领域自适应方法:样本自适应:对源域样本进行加权重采样,从而逼近目标域的分布。特征层面自适应:将源域和目标域投影到公共特征子空间。模型层面自适应:对源域误差函数进行修改,考虑目标域的误差。2.2样本自适应样本自适应也可以说是样本迁移。基本思想:通过对source,进行
4、重采样,在source里找到与target相似的数据,命这些相似数据为新的source。把source数据的数据量,量权值进行调整,使其这些数据与target数据分布基本一致,如下图所示:优点缺点缩放,白噪声等。缺点:权2.特征自适应特征自适应也可以说是特征迁移,基本思路:通过构建特征提取网络,训练网络模型,使模型能够提取出source与target的共同特征部分,相似的数据分布。如下图所示,我们输入source和target数据集正数据分布相似。最后如上器,%LZ-征提取器可以看成GAN中的geneitor训练集与测试这里的提取瞽做的是让进一步优卜布,几乎一样难以分辨出(也就是说domain
5、classifier就是GAN中的discriminator,我们的目的,就是找到一个特征提取过:曰domainclassifier。classifier的反馈,下图为不(同soUrcd和target文器),这样才能让下,只有source和加曲正很相似classifier是要努力分辨他们(我们通过我们最后要的是提取器。MethodITHMBHSyrNino5VHNSynSkmGT训优缺点点多今数方法适耳9targeti丿训练下的结果。缺点:在于难于求解,容易发生过适配2.4模型自适应模型自适应就是最常用的迁移学习方式,模型迁移。基本思想:通过已经训练好的模型,将模型放入到一个新的领域数据集中训练固定住模型部分层(不改变层的结构,以及参数)更改部分模型层,(初始化这些层的参数,可能也会改变层的结构)训练模型如下图案例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度医疗器械生产许可资质转让合同3篇
- 二零二五年度金融机构公对公汇款业务合作协议3篇
- 2025年度房地产公司挂靠合作经营管理协议3篇
- 2025年度环保技术兼职合同3篇
- 2025年度新型商业空间使用权转让合同3篇
- 二零二五年度竞业协议期限及竞业限制解除赔偿2篇
- 二零二五年度国有企业劳动用工合同范本3篇
- 2025年度新材料研发与应用合伙人股权合作协议书3篇
- 2025年度留学生实习实训项目资金资助协议3篇
- 二零二五年度大米产业链品牌建设与市场营销服务合同3篇
- NY 5052-2001无公害食品海水养殖用水水质
- 【讲座】2020年福建省高职分类考试招生指导讲座
- 性格决定命运课件
- 球磨机安全检查表分析(SCL)+评价记录
- 学习会计基础工作规范课件
- 双面埋弧焊螺旋钢管公称外公壁厚和每米理论重量
- 富士施乐VC2265打印机使用说明SPO
- 服务态度决定客户满意度试题含答案
- 中学历史教育中的德育状况调查问卷
- 教科版四年级科学上册全册复习教学设计及知识点整理
- 重庆万科渠道制度管理办法2022
评论
0/150
提交评论