基于决策能力的属性约简模型的综述报告_第1页
基于决策能力的属性约简模型的综述报告_第2页
基于决策能力的属性约简模型的综述报告_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于决策能力的属性约简模型的综述报告属性约简是数据挖掘中的一个重要问题,目的是通过删除无关属性或者合并相关属性,将原数据集中的属性数目迅速缩小,同时保留关键信息,从而降低计算复杂度,提高决策准确率。属性约简在模式识别、数据分类、信息检索等领域都有着广泛应用。决策能力是评价属性重要性的一个重要指标,因此基于决策能力的属性约简模型也受到了广泛研究。本文将对基于决策能力的属性约简模型进行综述,并介绍一些相关的研究成果。一、基本概念属性约简是指将原数据集的属性数目缩小,但又尽可能地保留原数据集的信息,同时使得决策过程更为简化和准确。属性约简中涉及到的基本概念有:(1)决策规则:对判定对象的决策性说明,包括条件部分和结论部分。例如:若年龄大于等于60岁且血压高,则患冠心病。(2)属性:指事物的某种特征;属性集合是用于描述待分类对象的属性集合,一般由属性和属性值两部分组成。例如:{年龄,性别,血压}。(3)属性约简:在属性集合中,选出最少的属性集合,使其对分类精度的影响等同于原属性集合,同时保留决策规则等关键信息。(4)约简盖度:是指一个属性集合中包含其他属性集合的最小数目,即能够约简的最多次数。二、基于决策能力的属性约简模型基于决策能力的属性约简模型是一种以决策能力为衡量标准的属性约简算法。这类算法基于决策表的决策规则,通过对决策表的分析和处理,计算属性之间的相关性,然后根据决策能力的大小选择最优属性子集,从而实现属性约简的目的。基本步骤如下:(1)利用决策表生成一组决策规则;(2)计算属性与决策规则之间的相对重要性;(3)按照重要性排序选择最优属性子集,并进行属性约简;(4)验证属性子集的正确性和效果。三、相关研究成果1.基于信息增益的属性约简算法信息增益是用来衡量属性对信息熵的贡献程度的一个指标。基于信息增益的属性约简算法根据计算出来的信息增益来度量属性的关键性质,从而进行属性的选择和约简。这种算法计算简单,计算量小,且结果可靠性高。但它不能处理复合属性和不连续的属性。2.基于覆盖和适宜度的属性约简算法覆盖是指属性集合对实例的刻画能力,适宜度是指属性集合对于判断目标的正确度与完整性的反映能力。这种算法主要涉及到两个重要的问题:如何选择具有代表性的样本来评价属性集合的性能;如何构建评价模型和算法来实现有效的属性约简。3.基于启发式算法的属性约简启发式算法是指通过对空间进行搜索,找到相对最适合的解来解决问题。这种算法能够快速找到最优解,但需要选择适当的搜索策略和启发函数,否则可能会导致局部最优或者无法收敛。基于启发式算法的属性约简方法主要包括遗传算法、模拟退火算法、粒子群算法等。四、总结本文对基于决策能力的属性约简模型进行了综述,介绍了属性约简的基本概念和基于决策能力的属性约简算法。不同的算法适用于不同类型的数据集

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论