




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
产生式判别式第1页,课件共22页,创作于2023年2月内容提要摘要简介产生式模型(GenerativeModel)判别式模型(DiscriminativeModel)两者之间的关系实验分析第2页,课件共22页,创作于2023年2月摘要产生式模型:无穷样本==》概率密度模型==》产生模型==》预测
判别式模型:有限样本==》判别函数=预测模型==》预测
第3页,课件共22页,创作于2023年2月简介简单的说,假设o是观察值,q是模型。
如果对P(o|q)建模,就是Generative模型。其基本思想是首先建立样本的概率密度模型,再利用模型进行推理预测。要求已知样本无穷或尽可能的大。
这种方法一般建立在bayes理论的基础之上。第4页,课件共22页,创作于2023年2月简介如果对条件概率P(q|o)建模,就是Discrminative模型。基本思想是有限样本条件下建立判别函数,不考虑样本的产生模型,直接研究预测模型。代表性理论为统计学习理论。
这两种方法目前交叉较多。
第5页,课件共22页,创作于2023年2月产生式模型估计的是联合概率分布(jointprobabilitydistribution),p(class,context)=p(class|context)*p(context)。=p(context|class)*p(class)用于随机生成的观察值建模,特别是在给定某些隐藏参数情况下。在机器学习中,用于直接对数据建模,或作为生成条件概率密度函数的中间步骤。通过使用贝叶斯规则可以从生成模型中得到条件分布。第6页,课件共22页,创作于2023年2月产生式模型特点:
主要是对后验概率建模,从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度。优点:
由于产生式方法可以在联合分布空间插入变量、不变量、独立性、先验分布等关系的知识。因此,在联合分布空间,通用性(或称多面性)是其本质。这包括了系统中的未知的、观察到的、输入或输出变量,这就使得产生式概率分布成为一个非常灵活的建模工具。第7页,课件共22页,创作于2023年2月产生式模型缺点产生式分类器需产生的所有变量的联合概率分布仅仅是分类任务的中间目标,对该中间目标优化的过程,牺牲了最终分类判别任务上的资源和性能,影响了最终的分类性能。第8页,课件共22页,创作于2023年2月产生式模型常用方法
Gaussians,NaiveBayes,Mixturesofmultinomials
MixturesofGaussians,HMMs
Bayesiannetworks
Markovrandomfields
第9页,课件共22页,创作于2023年2月判别式模型又可以称为条件模型,或条件概率模型。估计的是条件概率分布(conditionaldistribution)
判别式方法并不对系统中变量和特征的基本分布建模,仅仅对输入到输出之间映射的最优化感兴趣。因此,仅需调整由此产生的分类边界,没有形成可对系统中变量建模的生成器的中间目标,可以得到准确率更高的分类器。第10页,课件共22页,创作于2023年2月判别式模型主要特点:
寻找不同类别之间的最优分类面,反映的是异类数据之间的差异。优点:
相比纯概率方法或产生式模型,分类边界更灵活;能清晰的分辨出多类或某一类与其他类之间的差异特征,适用于较多类别的识别
判别模型的性能比产生模型要简单,比较容易学习
第11页,课件共22页,创作于2023年2月判别式模型缺点:不能反映训练数据本身的特性。可以告诉你的是1还是2,但没有办法把整个场景描述出来;判别式方法在训练时需要考虑所有的数据元组,当数据量很大时,该方法的效率并不高;缺乏灵活的建模工具和插入先验知识的方法。因此,判别式技术就像一个黑匣子,变量之间的关系不像在产生式模型中那样清晰可见。第12页,课件共22页,创作于2023年2月判别式模型常见的主要有:
logisticregression
SVMs
neuralnetworks
Nearestneighbor
Conditionalrandomfields(CRF):目前最新提出的热门模型,从NLP领域产生的,正在向ASR和CV上发展。
第13页,课件共22页,创作于2023年2月判别式模型主要应用:
Imageanddocumentclassification
Biosequenceanalysis
Timeseriesprediction第14页,课件共22页,创作于2023年2月两者之间的关系由生成模型可以得到判别模型,但由判别模型得不到生成模型。
例如当样本的各属性之间相互独立的并且满足高斯概率密度分布时,可以由NaïveBayes分类算法得到LogisticRegression分类算法第15页,课件共22页,创作于2023年2月实验分析实验内容
对于UCI的Adult数据集、BreastCancer数据集、Ionosphere数据集以及OpticalRecognitionofHandWrittenDigits数据集,分别用NaïveBayes算法与LogisticRegression算法对其进行分类,并对这两种算法进行比较分析。第16页,课件共22页,创作于2023年2月实验分析实验结果图1breastcancer数据集上NB与LR分类结果比较
第17页,课件共22页,创作于2023年2月实验分析实验结果图2ionosphere数据集上NB与LR分类结果比较
第18页,课件共22页,创作于2023年2月实验分析实验结果图3adult数据集上NB与LR分类结果比较
第19页,课件共22页,创作于2023年2月实验分析实验结果图4lymphography数据集上NB与LR分类结果比较
第20页,课件共22页,创作于2023年2月实验分析结果分析从实验结果可见,在breast_cancer和lymphography数据集上NaiveBayes分类器的分类效果明显优于LogisticRegression分类器在四个数据集中,adult数据集的数据量最大,因此在这个数据集上可以看出LogisticRegression分类器的训练时间明显大于NaiveBayes分类器。第21页,课件共22页,创作于2023年2月实验分析结果分析对于adult和ionosphere数据集,图中显示NaiveBayes分类器的分类正确率曲线与LogisticRegression分类器的分类正确率曲线有交叉的现象。当训练
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 轻松应对2025年语文挑战试题及答案
- 宠物营养师考试间歇期的复习方法与试题及答案
- 美容师实践操作注意事项分析试题及答案
- 三年级品德与社会下册 来自社会的爱教学设计2 人教新课标版
- Unit 6 Topic 1 Section C 教学设计 2024-2025学年仁爱科普版九年级英语下册
- Unit2 Different families Part B Let's learn(教学设计)-2024-2025学年人教PEP版(2024)英语三年级上册
- 频率分布的统计特征测试题及答案
- 药物治疗的经济学考量试题及答案
- 2024年自考汉语言文学重点复习与试题及答案
- 高中语文 第10课 短文三篇-热爱生命教学设计2 新人教版必修4
- 义乌市事业单位招聘考试真题2024
- 企业廉洁风险防控课件教学
- T-SDFA 047-2024 混合型饲料添加剂中卡那霉素的测定 液相色谱-串联质谱法
- 2025年管道工(高级)职业技能鉴定参考试题(附答案)
- 2025年上海市各区中考语文一模卷【说明文阅读题】汇集练附答案解析
- 2025年单相电子电能表项目可行性研究报告
- 2025年人教五四新版八年级数学上册阶段测试试卷
- 公路护坡施工合同
- 2025年广东省财政厅所属事业单位公开招聘历年高频重点提升(共500题)附带答案详解
- 供热管网施工技术培训
- 广东广州市榄核咨询服务有限公司招聘笔试冲刺题2024
评论
0/150
提交评论