版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
AI建模师素养手册第理解Diffusion——从DAE降噪出发By高焕堂/AI建模师俱乐部会长—般AE面对MissingDataDAE有更强的过滤能力过滤能力愈强,生成能力愈好多层DAE设计OvercompleteDAE模型-本文发表于台湾AIC产业联盟技术分享大会上•原来的主题是:AI生成与DAE降噪机制。-最近,由于Diffusi。n的爆红,它又非常依赖降噪机制的训练,所以我就拿简单的DAE降噪机制来做为理解Diffusion的基础。本文发表于台湾AIC产业联盟
技术分享大会(2022.2.17)2022/2/172022/2/17台灣AIC(AI+IC)技術分享大會请参阅:/pdi7id=h4EOymDV3vV这文章里写道:-最近,以连续时间随机微分方程形式的扩张(Diffusion)模型,已被证实是一个成功的〈非对抗性〉生成模型。-这类模型是采用〈降噪分数匹配(DSM)>的加权和进行训练,可以看作是多尺度的DAE(降噪自编码器)。也请参阅:https://www.iro.umontreal.ca/~vincentp/Publications/smdae_techreportpdf-这篇文章的主题是:“AConnectionBetweenScoreMatchingandDenoisingAutoencoders”(降噪分数匹配(DSM)与DAE的连结)一般AE面对MissingDataAE面对MissingData复习AE(Autoencoder)-在上一集里,您已经看到了,一般典型的AE就具有过滤的能力。而本集所介绍DAE的过滤能力将更上一层楼。-于此先复习一下AE的基本性质,然后看看它如何面对MissingData。AE面对MissingData从补值角度来看AE-先从AE说起。例如有一个AE模型(daeOLpy):ABcABcDEFGHIJKLMNX(輸入值)H(潛藏空間)T(目標值)xOxlx2hOhltotlt26162161621135135135135-请按下〈学习〉,就展幵训练流程。X(輸入值)xOxlx26■2■16■2■11■3■5135训练资料(4只动物)耳朵长度X(輸入值)训练资料(4只动物)耳朵长度眼睛大小训练资料(4只动物)耳朵长度眼睛大小胡须长度训练资料(4只动物)X(輸入值)xOxlxOxl训练资料TOC\o"1-5"\h\z6 2 1训练资料6 2 11 3 51 3 5EncoderDecoderY^X幵始训练•得出Encoder和Decoder:ABCDEFGHIJKLM1X(輸入值)H(潛藏空間)T(目標值)2xOxJx.2hOhltot]t23610.990.016214610.99Q016215<<1350.010.9911355勇35J0,99391OCQ3WH0.87-1.06JWO3.711-0.81A學習&補值100,090,15-1,392,013,2611-1.181.11BO2330.991.7812BH0.420□J完成了!13K_XEncoderH1DecoderY XWH0.97-0.96WO4,160.86I-1.21H30.060.12-0.921.892.87BH-1.290.42L010BO]L88L12I2.17WH0.97-0.96BH0.060.12-1.29L010.420显著特征显著特征显著特征显著特征显著■特征-0.960.12-1.21显著特征X0k■0.861.072.8/AE面对MissingDataI检验一下这个AE模型新資料6 2 1新資料6 2 11 3 5EncoderDecoderEncoderDecoderWH 0.97 -0.960.06 0.12WH 0.97 -0.960.06 0.12-1.29 L01BH 0.42 0WO 416 0.86 -L21-0.92 L89 2.87BO L88 1.12 2J7AE面对MissingDataI检验一下这个AE模型•实际操作daeOl.py:
AE面对MissingDataI进行测试-按下〈预测〉,就得到:。WHABCDE新資料621135BHW04.160.864,21預測(還原)-0.921,892.87B01.881.122.17•正确地还原了。AE面对MissingData使用MissingData来测试-刚才的输入数据,都是完整的。•如果测试数据含有MissingData,会如何呢?AE面对MissingData使用MissingData来测试MissingData6某些特征值遗失了MissingData6某些特征值遗失了•如果测试数据含有MissingData,如下:MissingDataMissingDataEncoderDecoderWH0.97-0.960.060.12-1.29WH0.97-0.960.060.12-1.29L01BH0.420-0.92 L89 2.87BO L88 1.12 2J7AE面对MissingDataI进行预测(补值)•准备输入数据(MissingData)°H向量MissingDataImputedData"收9平均值0.97預測(還原)-0.960.12AI2345d6789WH101112BH134.160.86-1,21-0.921,892.87L881.122.1714141414AE面对MissingDataX(輸入值)x0xlx2进行预测(补值)-先设定为〈平均值〉。ABCDEFGH2.5MissingData6661122331155H向量ImputedData設定平均值6789WH0.97-0.96WO4,160.864.21100.060.12-0.921,892.8711-1.29L01BO1.881.122J7435212BH0,420133.5預測(還原)AE面对MissingDataI进行预测(补值)-按下〈预测〉,就得到:。12345678MissingData613.50.930.080.090.920.520.48H向量ImputedData619WH0.97-0.96WO4.160.86-1,21100,060,12-0,921.892,8711-1.291,01BO1.881.122.1711BH0.42■13設定
平均值預測(還原)很好补值很好补值AE面对MissingDataI进行预测(补值)12345678BMissingData61G3.50.930.080.090.920.520.48H向量611LM[moutedData213523設定平均值9WH0.97-0.96WO4.160.86-1,21100,060,12-0,921.892,8711-1.291,01BO1.881.122.1711BH0.42■13預測(還原)AE面对MissingDataI进行预测(补值)不理想的补值!BMissingData61G3.50.930.080.090.920.520.48H向量6MImputedData19WH0.97-0.96WO4.160.86-1,21100,060,12-0,921.892,8711-1.291,01BO1.881.122.1712BH0.42■137設定
平均值預測(還原)H1H向量230.930,08MissingData继续改进10111213WHBH■60.970,06-1.290.42-0.960,121.01WOBO0.090.524.16
-0,921.880.920.480.86L891.12-1.212,872.17不理想的补值!LMImputedData21,/J35/423领醐惧設定平均值預測(還原)DAE有更好的过滤能力简介DAE(DenoisingAutoencoder)-顾名思义,DAE的〃Denoising”是去除噪音之意,也就是把噪音<过滤〉掉。•而本集所介绍DAE的过滤能力将更上一层楼。•DAE有更好的过滤能力|复习:典型的AE架构feHiddenLayerInputLayerOutputLayer复习:典型的AE架构(潜藏空间)HiddenLayerIlDecoderyInputLayer XOutputLayer(输入值)(输出值)•DAE有更好的过滤能力|扩大为DAE架构autoencoder::hautoencoder::h■denoisingautoencoderiHiddenLayerInputData■VICorrupted■
partially:InputLayerOutputLayer;autoencoder:: …… j;IdenoisingautoencoderiX(輸入值)xOxlx2621621135X(輸入值)X(輸入值)MissingDataDAEX(輸入值)MissingDataDAE有更好的过滤能力训练数据也能含有MissingData•将上一节的一笔MissingData并入训练数据集I使用MissingData来训练它Encoder新的训练资料(含MissingData)DecoderY&X建立AE模型123456J8123456J89101112131415X(輸入值)KLM一(百標值)tOt)t2設定
平均值學習&補值-按下〈设定>和<学习〉按钮,就展开学习:幵始训练•得出Encoder和Decoder:123456BCDX(輸入值)x0xlx2621611351353521H(潛藏空間)h0hl0.010.490.490.93KLMT(目標值)tot]t26216211351356210.930.016凯0.48完成了!1,690.010.34-0.31-1.520.750.61-07110111213 BH15EncoderDecoderWH WH 1.69 0.010.34 -0.31-1.52 0.75BH 0.61 -0.21TOC\o"1-5"\h\zWO5 -0.21 -2.98-0.16 1.77 2.4BO 1.08 1.35 2.81
MissingDataMissingDataEncoderDecoderWH 1.69 0.010.34 -0.31-1.52 0.75BH 0.61 -0.21MissingDataMissingDataEncoderDecoderWH 1.69 0.010.34 -0.31-1.52 0.75BH 0.61 -0.21-0.16 1.77 2.4BO 1.08 1.35 2.81实际操作•准备输入数据(MissingData)°-按下〈设定>和<预测〉按钮,就进行还原:
DAE有更好的过滤能力|展开补值-输出预测结果:
•DAE有更好的过滤能力改进了I提升补值能力了改进了MissingData-0.21H向量0.79-2.980.220.750.93-0.21-0.16ImputedData6設定平均值預測(還原)X(輸入值)X(輸入值)MissingDataX(輸入值)X(輸入值)MissingDataDAE有更好的过滤能力拿更多MissingData来训练它建立AE模型-按下〈设定>和<学习〉按钮,就进行训练:得到更好的补值I111213141516171819xOxlx261621351353.521132.43-2.53-0,450,36-2.162.010.47-071cDWHBHMissingData1B一X(輸入值)3hOhl10100101100.010.994.490.71-1.27-0,521,712,411.511.292.61H向量100.010.990.830.09HWOBOG瓦:潛藏空間)KLMNT(目標值)totlt26-很不错
的补值學習&補值完成了!5設定平均值23tedData1.31.8精益求精…例如,采随机方式,从X里得出更多MissingData来训练它denoisingautoencoder•潜藏空间H向量的变化|H向量的意义•DAE是一种能接受损坏(遗失)资料作为输入,并训练AE来预测(补值)原始未被损坏资料作为输出的自编码器。autoencoder:hdenoisingautoencoder
潜藏空间H向量的变化-DAE通过学习原始数据和损坏数据的共同潜在表示。(…learningcommonlatentrepresentationiovertheoriginalandcorrupteddata.)InputDataCorrupted:partially:InputLayertHiddenLayerOutputLayer;:Zautoencoder:: _________——……登:■denoisingautoencoderi潜藏空间H向量的变化-DAE通过学习原始数据和损坏数据的共同潜在表示。J./earningcommonlatentrepresentationovertheoriginalandcorrupteddata.)-俗语说:万变不离其宗。•这个<宗>就是共同潜在的表示(Commonlatentrepresentation)涵意。•潜藏空间H向量的变化|请看一个简单的AE模型(dae02.py)-按下〈学习〉按钮,就进行训练:14141414•潜藏空间H向量的变化I展幵训练•得出Encoder和Decoder:ABCDEFGHIJKLM1X(輸入值)H(潛藏空間)T(目標值)2x0xlx2hOhltotlt231350.010.9813546110.036156lotAWH1.04-0.770.030.1-L36BH0.410學習EncoderEncoderDecoderWH 1.04 -0.770.03 0.1-136 0.89BH 041 0TOC\o"1-5"\h\zWH 1.04 -0.770.03 0.1-136 0.89BH 041 0-0.6 1.76 2.56BO 1.57 1.27 2.5新資料2EncoderEncoderDecoderWH 1.04 -0.770.03 0.1-136 0.89BH 041 0TOC\o"1-5"\h\zWH 1.04 -0.770.03 0.1-136 0.89BH 041 0-0.6 1.76 2.56BO 1.57 1.27 2.5•潜藏空间H向量的变化|准备预测-按下〈预测〉按钮,就进行预测:潜藏空间H潜藏空间H向量的变化|展开预测•输出结果:很不错
的预测661新資料預測值DecoderEncoderWH1.04-0.770.030.1-1.360.8904110,03WO4470,69-1,57-0.61.762.56BO1.571.272.5新資料0,03EncoderDecoder新資料0,03EncoderDecoder
Decoder
潜藏空间H向量的变化检验一下它的补值能力-刚才是拿完整的数据来预测。•现在改拿MissingData来进行补值。基于一样的Encoder和Decoder:EncoderDecoderMissingDataEncoderEncoderDecoderWH 1.04 -0.770.03 0.1-136 0.89BH 041 0TOC\o"1-5"\h\zWH 1.04 -0.770.03 0.1-136 0.89BH 041 0-0.6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年新版中国橡胶剪切隔振器项目可行性研究报告
- 2024-2030年撰写:中国铝焊机项目风险评估报告
- 2024-2030年撰写:中国罗茨旋片机组行业发展趋势及竞争调研分析报告
- 2024-2030年撰写:中国炔诺孕酮行业发展趋势及竞争调研分析报告
- 2024-2030年心血管药物亚硝酸异戊酯公司技术改造及扩产项目可行性研究报告
- 2024-2030年小儿退热灵片公司技术改造及扩产项目可行性研究报告
- 2024-2030年吹瓶空压机公司技术改造及扩产项目可行性研究报告
- 2024-2030年单轴磁粉制动器搬迁改造项目可行性研究报告
- 2024-2030年动物大脑提取胆固醇公司技术改造及扩产项目可行性研究报告
- 2024-2030年全球及中国被褥吸尘器行业销售策略及营销动态分析报告
- 钢筋混凝土楼板及楼地面构造
- 穿越北纬18度-海南旅游文化知到章节答案智慧树2023年三亚中瑞酒店管理职业学院
- 论农村幼儿自然教育的教育理念 论文
- 学生心理危机干预工作流程
- 德语智慧树知到答案章节测试2023年西安理工大学
- 全国2016年10月自考00043经济法概论(财经类)试题及答案
- 净化工程施工验收报告正规版
- 分娩镇痛规范及流程
- 基于改进蚁群算法的移动机器人路径规划研究共3篇
- 济南美莱整形医院员工手册
- 市场主体住所(经营场所)申报承诺书
评论
0/150
提交评论