决策表优化算法_第1页
决策表优化算法_第2页
决策表优化算法_第3页
决策表优化算法_第4页
决策表优化算法_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/1决策表优化算法第一部分决策表表示规范化 2第二部分条件属性约简算法 4第三部分决策规则的覆盖度分析 6第四部分动态决策表优化策略 8第五部分基于多目标的决策表排序 11第六部分决策表分类能力评估 14第七部分高维决策表降维处理 17第八部分决策表并行优化算法 19

第一部分决策表表示规范化决策表表示规范化

决策表表示规范化是一项重要的预处理技术,旨在优化决策表以提高其准确性和有效性。其过程涉及将决策表转换为规范化形式,使其满足以下条件:

条件规范化:

*每个条件属性仅包含唯一值。

*每个条件值仅出现一次。

*条件值按特定顺序排列(例如,升序或降序)。

动作规范化:

*每个动作仅出现一次。

*动作按特定顺序排列。

规范化的好处:

决策表表示规范化提供以下好处:

*简化决策表:规范化消除了冗余和不一致性,使决策表更容易读取和理解。

*提高准确性:通过唯一条件值和动作,规范化消除了歧义,增强了决策表的准确性。

*增强有效性:规范化减少了决策表的尺寸,使其更容易处理和决策。

*提高可扩展性:规范化决策表更容易维护和扩展,因为新条件或动作可以轻松添加。

规范化算法:

有几种算法用于将决策表规范化,包括:

*条件规范化算法:此算法通过按特定顺序排列条件值来归一化条件属性。最常用的顺序是升序或降序。

*动作规范化算法:此算法通过按特定顺序排列动作来归一化动作。最常用的顺序是升序或降序。

规范化步骤:

决策表表示规范化过程通常涉及以下步骤:

1.识别条件属性和动作。

2.规范化条件属性,删除重复值并按顺序排列条件值。

3.规范化动作,删除重复动作并按顺序排列动作。

4.重新构建规范化决策表。

示例:

考虑以下未规范化的决策表:

|条件1|条件2|动作|

||||

|高|低|接受|

|低|高|拒绝|

|低|低|接受|

规范化后,决策表如下:

|条件1|条件2|动作|

||||

|低|低|接受|

|高|低|接受|

|低|高|拒绝|

应用:

决策表表示规范化在各种领域都有广泛的应用,包括:

*规则发现

*决策支持系统

*机器学习

*知识工程

通过规范化决策表,可以显着提高其准确性、有效性和可扩展性,从而改善基于决策表的应用程序的性能。第二部分条件属性约简算法条件属性约简算法

条件属性约简算法旨在识别决策表中多余的条件属性,从而生成一个简约、有效且无损失的决策规则集。其核心思想是通过逐步删除条件属性,同时检查决策规则集是否仍然有效,来确定哪些条件属性是必需的。

算法步骤:

1.初始化:设决策表为D,其条件属性集合为C,决策属性为d。将D的约简属性集合R初始化为空集。

2.遍历条件属性:对于每个条件属性a∈C,执行以下步骤:

a.删除条件属性:从D中删除条件属性a,得到一个新的决策表D'。

b.生成决策规则集:使用D'生成决策规则集R'。

c.检查规则集是否等价:如果R'与R等价,则说明a是多余的。将a从C中删除,并将R更新为R'。

3.重复步骤2:重复步骤2直到C为空。

等价判定:

两个决策规则集R和R'被认为是等价的,当且仅当它们产生相同的决策结果。具体来说,对于每个决策表中的示例x:

*如果R将x分类到决策类c,则R'也必须将x分类到c。

*如果R无法将x分类到任何决策类,则R'也必须无法将x分类。

算法分析:

条件属性约简算法采用贪心策略,逐步删除条件属性。其时间复杂度为O(n*2^m),其中n是决策表中的示例数量,m是条件属性的数量。虽然算法在最坏情况下可能效率低下,但通常情况下它能够快速有效地产生约简属性集合。

优缺点:

优点:

*能够识别多余条件属性,生成简约且无损失的决策规则集。

*算法相对简单易懂。

缺点:

*在最坏情况下,时间复杂度可能很高。

*贪心算法可能无法找到全局最优解。

应用:

条件属性约简算法广泛应用于数据挖掘、机器学习和决策支持系统等领域。它可以帮助提取有价值的信息,改进分类模型的性能,并简化决策过程。第三部分决策规则的覆盖度分析关键词关键要点【决策规则的覆盖度分析】

1.覆盖度计算是指衡量决策规则覆盖输入样本的程度。

2.常用的覆盖度指标包括样本覆盖度和属性覆盖度,分别用于评估规则对样本和属性的覆盖情况。

3.提高覆盖度有助于提升决策表的泛化能力和预测准确性。

【决策规则的简化】

决策规则的覆盖度分析

决策规则覆盖度分析是决策表优化算法中评估决策规则质量的关键指标。它用于衡量决策规则对数据集的覆盖程度,即规则能够正确分类多少数据样本。

覆盖度计算

决策规则的覆盖度计算方法如下:

```

覆盖度=匹配样本数/总样本数

```

其中:

*匹配样本数:与决策规则条件匹配的数据样本数量。

*总样本数:训练数据集中的数据样本总数。

决策规则覆盖度分析的重要性

决策规则覆盖度分析具有以下重要性:

*确定最具代表性的规则:覆盖度高的规则更有可能是数据集的真实规律。

*避免冗余规则:具有相同或类似覆盖度的规则是冗余的,可以从决策表中删除。

*优化决策表:通过覆盖度分析,可以识别覆盖度较差的规则,并对决策表进行优化,提高分类精度。

如何提升决策规则覆盖度

提升决策规则覆盖度的常见方法包括:

*使用较少的条件:避免在决策规则中使用过多的条件,因为这会降低覆盖度。

*选择区分度高的条件:条件区分度越高,则规则覆盖的样本就越多。

*考虑否定条件:否定条件可以扩展决策规则的覆盖范围。

*使用简化规则:合并具有类似条件的规则,形成更通用的规则,从而提升覆盖度。

覆盖度与其他评估指标的关系

决策规则覆盖度与其他评估指标,如准确性和支持度,存在一定的关系。覆盖度高的规则通常具有较高的准确性,因为它们能正确分类更多的数据样本。然而,高覆盖度的规则不一定具有高支持度,因为它们可能适用于稀有的数据子集。因此,在评估决策规则时,需要综合考虑多个指标。第四部分动态决策表优化策略关键词关键要点决策表优化

1.介绍决策表是一种具有简单性、可扩展性和可解释性的表示方法,特别适用于离散决策问题。

2.讨论了决策表优化的重要性,包括提高决策效率、准确性和鲁棒性。

3.概述了决策表优化算法的分类,包括基于规则、基于搜索和基于学习的方法。

动态决策表优化策略

1.定义动态决策表优化策略,其特点是根据历史数据和决策表本身动态调整决策表。

2.介绍了两种常见的动态决策表优化策略:在线学习和增量学习。在线学习策略在决策过程中不断更新决策表,而增量学习策略在决策完成后添加新规则。

3.分析了动态决策表优化策略的优点,例如提高决策适应性和处理不确定性,以及缺点,例如计算成本和过度拟合风险。

基于规则的决策表优化

1.介绍基于规则的决策表优化算法的原理,其通过添加、删除或修改规则来优化决策表。

2.讨论了贪婪算法、启发式算法和基于演化的算法等基于规则的决策表优化算法的类型。

3.比较了基于规则的决策表优化算法的效率、有效性和鲁棒性。

基于搜索的决策表优化

1.介绍基于搜索的决策表优化算法的原理,其通过搜索决策表空间来找到最优决策表。

2.讨论了遗传算法、粒子群优化和模拟退火等基于搜索的决策表优化算法的类型。

3.分析了基于搜索的决策表优化算法的优点,例如全局最优解搜索能力,以及缺点,例如计算成本和收敛速度。

基于学习的决策表优化

1.介绍基于学习的决策表优化算法的原理,其通过机器学习技术来学习决策表。

2.讨论了决策树、神经网络和支持向量机等基于学习的决策表优化算法的类型。

3.比较了基于学习的决策表优化算法的泛化能力、准确性和可解释性。

决策表优化应用

1.论述决策表优化在各个领域的应用,包括医疗保健、金融、制造业和零售业。

2.举例说明决策表优化如何提高决策效率、准确性和鲁棒性。

3.讨论了决策表优化技术在未来领域的潜在应用,例如人工智能和自动化。动态决策表优化策略

动态决策表优化策略是一种基于决策表持续优化技术,以提高决策表效率和鲁棒性。该策略涉及在决策表使用过程中实时监控和调整其结构和规则。

1.结构优化

结构优化旨在提高决策条件和动作的组织和表示方式。通过以下技术实现:

*条件属性合并:合并具有高相关性的条件属性,减少决策表中的列数。

*条件属性拆分:将复杂条件属性拆分成更细粒度的属性,提高决策规则的可解释性和准确性。

*动作组合并:合并执行相似动作的规则,减少决策表中的行数。

*动作条件化:将动作细化为受条件属性影响的不同动作,提高决策表的适应性和灵活性。

2.规则优化

规则优化专注于优化决策表中的规则集,提高规则的有效性、一致性和覆盖率。通过以下技术实现:

*规则添加:添加新规则以覆盖决策表中的未处理情况,提高覆盖率。

*规则删除:删除冗余和不一致的规则,提高决策表的简洁性和可理解性。

*规则合并:合并具有相似条件和动作的规则,减少决策表的规则数量。

*规则条件化:将规则细化为受条件属性影响的不同规则,提高决策规则的适用范围。

*规则权重调整:调整规则的权重,赋予更重要的规则更高的优先级,提高决策的准确性。

3.策略评估和调整

策略评估和调整机制负责监控决策表的性能并做出相应的调整。通过以下步骤实现:

*性能监控:持续跟踪决策表的决策准确率、覆盖率和效率。

*经验值分析:分析决策表在不同输入场景下的表现,识别潜在的改进领域。

*基于规则的优化:根据性能监控和经验值分析结果,调整决策表中的规则。

*结构再组织:必要时,重新组织决策表的结构,以提高其效率和鲁棒性。

优点

*提高决策表的效率和准确性

*增强决策表的适应性和鲁棒性

*改善决策表的可解释性和可维护性

*减少决策表的大小和复杂性

应用

动态决策表优化策略广泛应用于各种领域,包括:

*专家系统

*规则库管理

*机器学习

*数据挖掘

*医疗诊断

*风险评估第五部分基于多目标的决策表排序关键词关键要点【多目标决策表排序算法】

1.基于帕累托最优性:排序过程基于帕累托最优性,即找不到任何其他可行的决策表具有更好的目标值,同时至少一个目标值保持不变。

2.多目标排序方法:常见的排序方法包括加权和法、顶点法和Tchebycheff法,这些方法通过赋予不同目标不同的权重或使用几何距离度量来确定决策表的相对优先级。

3.复杂度分析:多目标决策表排序的复杂度通常与决策表的大小、目标函数的数量和排序算法的效率有关。

【决策表归约】

基于多目标的决策表排序

引言

决策表是一种常用的决策支持工具,它通过将规则和条件组织成表格式来表示决策问题。决策表的排序对于决策制定至关重要,因为它可以帮助识别最优或首选的规则和替代方案。基于多目标的决策表排序算法考虑了多个目标,以便对规则和替代方案进行全面评估。

多目标决策表排序算法

基于多目标的决策表排序算法有多种,包括:

*加权和法:将每个目标分配一个权重,然后计算规则或替代方案在所有目标上的加权和。权重可以表示每个目标的相对重要性。

*TOPSIS(技术和偏好排序法):通过计算规则或替代方案与理想解和最差解之间的距离来确定偏好度。理想解是满足所有目标的最优解,而最差解是违反所有目标的最差解。

*ELECTRE(消除和选择翻译现实):一种基于排序和优越性的排序方法。它将规则或替代方案成对进行比较,并确定一个规则或替代方案相对于另一个规则或替代方案的优越性。

*PROMETHEE(偏好排序方法による多基準評価):一种基于优越流的排序方法。它计算每个规则或替代方案对其他规则或替代方案的正向和负向优越性,然后基于这些流来确定排序。

*VIKOR(VlseKriterijumskaOptimizacijaIKompromisnoResenje):一种基于距离和妥协解的排序方法。它计算每个规则或替代方案到理想解和妥协解的距离,然后根据这些距离确定排序。

评估指标

用于评估基于多目标的决策表排序算法的指标包括:

*准确性:算法识别最优规则或替代方案的能力。

*鲁棒性:算法对输入数据的变化的敏感性。

*计算复杂性:算法执行所需的时间和空间资源。

*可解释性:算法得出结果背后的思路的可理解性。

应用

基于多目标的决策表排序算法已广泛应用于各种决策问题,包括:

*产品设计和工程

*金融投资组合管理

*医疗诊断

*资源分配

*供应链管理

优势

基于多目标的决策表排序算法的优势包括:

*多目标考虑:同时考虑多个目标,提供全面的决策评估。

*灵活性:允许用户根据特定问题定制目标和权重。

*可视化:决策表格式使决策者能够轻松理解规则和替代方案之间的关系。

*支持性:这些算法提供决策支持,帮助决策者做出明智的决定。

局限性

基于多目标的决策表排序算法的局限性包括:

*主观性:目标、权重和决策准则的定义可能是主观的。

*数据依赖性:算法的准确性和鲁棒性取决于输入数据的质量和可靠性。

*计算复杂性:对于大型和复杂问题,某些算法可能具有很高的计算复杂性。

*结果解释:对于某些算法来说,得出结果背后的思路可能是复杂的或难以理解的。

结论

基于多目标的决策表排序算法为决策制定提供了有价值的工具。它们通过同时考虑多个目标,提供全面的规则和替代方案评估。然而,重要的是要了解算法的优势和局限性,以便在决策过程中明智地使用它们。第六部分决策表分类能力评估关键词关键要点主题名称:决策表分类准确率

1.决策表分类准确率是最直接的评估指标,反映了决策表对样本分类的正确程度。

2.通常使用留出法或交叉验证法计算分类准确率,以减少过拟合的影响。

3.高分类准确率表明决策表具有良好的分类能力,可以有效识别不同类别的样本。

主题名称:决策表泛化能力

决策表分类能力评估

概述

决策表分类能力评估是评价决策表对未知数据集分类准确性的过程。准确的评估对于选择最佳的决策表模型和识别需要改进的领域至关重要。

评估指标

最常用的决策表分类能力评估指标包括:

*准确率:正确预测的实例数与总实例数之比。

*精确率:针对某一类,正确预测的实例数与预测为该类的实例数之比。

*召回率:针对某一类,正确预测的实例数与该类实例总数之比。

*F1分数:精确率和召回率的调和平均值,综合考虑了两种指标。

评估方法

决策表分类能力评估通常使用交叉验证或留出法进行。

*交叉验证:将数据集随机分成多个子集(折数),每个子集依次用作测试集,其余子集作为训练集。

*留出法:将数据集分为两个子集:训练集和测试集。训练集用于构建决策表模型,测试集用于评估模型的分类能力。

评估步骤

决策表分类能力评估的步骤如下:

1.数据准备:将数据集划分为训练集和测试集。

2.决策表构建:使用训练集构建决策表模型。

3.分类:使用决策表模型对测试集中的实例进行分类。

4.计算指标:计算准确率、精确率、召回率和F1分数等评估指标。

5.分析结果:根据评估指标分析决策表模型的分类能力。

影响因素

影响决策表分类能力的因素包括:

*数据集特征:数据集的大小、维数和分布。

*决策表构建算法:用于构建决策表的算法(如ID3、C4.5、CART)。

*控制参数:决策表构建算法的控制参数(如最小信息增益阈值、最大树深)。

*样本不平衡:不同类别的样本数量差异过大。

*过拟合和欠拟合:决策表模型在训练集上拟合过于精细或不够精细。

优化策略

为了优化决策表分类能力,可以采取以下策略:

*调优算法参数:调整决策表构建算法的控制参数,以提高模型性能。

*处理样本不平衡:使用欠采样、过采样或代价敏感学习来应对样本不平衡问题。

*避免过拟合和欠拟合:通过正则化技术(如剪枝)和模型选择(如交叉验证)来防止过拟合和欠拟合。

*特征工程:通过选择信息量大的特征和消除冗余特征来改进数据集质量。

*集成学习:结合多个决策表模型,通过投票或加权平均来提高分类准确性。第七部分高维决策表降维处理关键词关键要点主题名称:决策变量选择

1.基于信息增益:选择具有最高信息增益的变量,即对结果属性影响最大的变量。

2.基于关联规则挖掘:寻找与结果属性具有强关联规则的变量,这些变量可能不具有高的信息增益,但与结果有明显的相关性。

3.基于特征选择算法:采用过滤式或包裹式特征选择算法,通过计算变量之间的相关性、冗余性等指标,选择最相关的变量子集。

主题名称:决策表线性化

高维决策表降维处理

高维决策表是指决策表中的条件属性和动作数量较多,导致决策表难以理解和分析。为了解决这个问题,需要对高维决策表进行降维处理,即减少条件属性和动作的数量,同时保留决策表的本质特征。

降维处理方法

常用的高维决策表降维处理方法包括:

1.属性约简

属性约简是指在不损失决策信息的情况下,删除冗余的条件属性。常用的属性约简方法有:

*确定性约简:删除那些可以由其他条件属性唯一确定的条件属性。

*相容性约简:删除那些与其他条件属性相容,不会影响决策结果的条件属性。

*逆序约简:从后往前逐步删除条件属性,直到决策表只剩下必要条件属性。

2.动作合并

动作合并是指将相似的动作合并为更通用的动作。常用的动作合并方法有:

*等价合并:合并那些在所有条件下都产生相同结果的动作。

*支配合并:合并那些在某些条件下产生相同结果,而在其他条件下产生不同结果的动作。

3.决策划分子表

决策划分子表是指将决策表划分为多个子表,每个子表只包含部分条件属性和动作。常用的决策划分子表方法有:

*基于条件属性的子表划分:根据条件属性的取值将决策表划分为多个子表。

*基于动作的子表划分:根据动作的取值将决策表划分为多个子表。

4.决策树表示

决策树是一种树形结构,其中每个结点代表一个条件属性,每个叶结点代表一个动作。决策树可以将决策表表示为一个分而治之的结构,便于理解和分析。

降维处理步骤

高维决策表降维处理的步骤通常如下:

1.确定降维目标:确定需要减少的条件属性和动作的数量。

2.选择降维方法:根据具体情况选择合适的降维方法。

3.应用降维方法:使用所选方法对决策表进行降维处理。

4.验证降维结果:检查降维后的决策表是否保留了决策表的本质特征。

5.优化降维结果:根据需要进一步优化降维结果,如合并相似的子表或减少决策树的深度。

决策表降维处理的优点

降维处理后的决策表具有以下优点:

*易于理解:条件属性和动作数量减少后,决策表更加易于理解和分析。

*决策效率提高:降维后的决策表可以减少决策时间和空间复杂度。

*鲁棒性增强:冗余属性和动作的删除可以增强决策表的鲁棒性,使其对噪声和缺失值更加敏感。

*泛化能力提高:降维后的决策表可以更好地泛化到未知数据,提高决策的准确性。

决策表降维处理的应用

高维决策表降维处理在各个领域都有广泛的应用,如:

*医疗诊断:优化医疗诊断规则,提高诊断准确性。

*信用评估:优化信用评分模型,提升贷款审批效率。

*决策支持系统:为决策者提供简明扼要的决策依据,辅助决策制定。

*数据挖掘:发现隐藏在高维数据中的模式和规律。

*知识工程:从专家知识中提取决策规则,构建知识库。第八部分决策表并行优化算法决策表并行优化算法

引言

决策表是一种广泛用于规则学习和决策支持的知识表示形式。决策表优化算法旨在通过修改决策表的规则集来提高其性能。并行决策表优化算法利用多处理器系统或分布式计算环境来加速优化过程。

并行算法的分类

根据并行化策略,决策表并行优化算法可分为以下几类:

*数据并行:将决策表划分为多个块,并行处理每个块。

*任务并行:将优化过程分解为多个独立的任务,并行执行。

*混合并行:结合数据并行和任务并行,实现更有效的并行化。

数据并行算法

数据并行算法将决策表分割成多个子块,并分配给不同的处理器。每个处理器负责优化其子块内的规则集。优化结果随后合并以获得全局最优解。

任务并行算法

任务并行算法将优化过程分解为多个相互独立的任务,例如规则评估、规则选择或规则生成。这些任务可以并行执行,以显著提高优化效率。

混合并行算法

混合并行算法结合数据并行和任务并行,以充分利用多处理器系统的优势。例如,决策表可以按行或列划分,并分配给不同的处理器进行数据并行处理。同时,规则评估或规则选择任务可以以任务并行的形式执行。

并行优化的挑战

决策表并行优化算法面临着以下挑战:

*通信开销:在并行环境中,处理器之间需要频繁地交换信息,这会产生通信开销。

*负载均衡:确保不同处理器之间的负载均衡至关重要,以最大限度地提高并行效率。

*同步和并发控制:在并行优化过程中,需要对访问共享数据和资源进行同步和并发控制,以避免冲突和死锁。

并行优化算法的评估

评估并行决策表优化算法的性能时,需要考虑以下指标:

*加速比:并行算法与串行算法运行时间的比值。

*效率:并行算法利用处理器的程度。

*可伸缩性:算法在处理器数量增加时性能提升的程度。

*鲁棒性:算法对数据集和优化参数变化的敏感性。

应用

决策表并行优化算法在各个领域都有广泛的应用,包括:

*机器学习:规则学习、决策树学习和分类任务。

*数据挖掘:知识发现和模式识别任务。

*决策支持系统:复杂决策制定和推理任务。

研究进展

决策表并行优化算法的研究领域是一个活跃的研究领域。近年来,以下方面取得了重大进展:

*并行进化算法:开发了基于进化算法的并行决策表优化算法,以提高搜索效率和鲁棒性。

*云计算:利用云计算平台的弹性计算资源,实现了大规模决策表优化。

*分布式优化:设计了分布式决策表优化算法,以在分布式计算环境中处理大型决策表。

*自适应并行:开发了自适应并行决策表优化算法,可以根据数据集和优化参数的变化动态调整并行化策略。

总结

决策表并行优化算法通过利用多处理器系统或分布式计算环境,可以显著提高决策表优化效率。通过采用各种并行策略,这些算法可以有效地降低通信开销、实现负载均衡,并提高可伸缩性。随着并行计算技术的不断发展,决策表并行优化算法在机器学习、数据挖掘和决策支持系统等领域将发挥越来越重要的作用。关键词关键要点主题名称:决策表规范化

关键要点:

1.决策表规范化是将决策表中的条件和动作属性标准化和简化的过程。

2.规范化的目的是简化决策表结构,减少冗余,提高决策表的可读性和维护性。

主题名称:决策表去重

关键要点:

1.决策表去重是指删除决策表中重复或冗余的行。

2.去重的目的是精简决策表,提高决策规则的效率和准确性。

主题名称:决策表合并

关键要点:

1.决策表合并是将具有相同条件和不同动作的决策规则合并成一条规则的过程。

2.合并可以简化决策表,减少决策规则的数量,提高决策效率。

主题名称:决策表最小化

关键要点:

1.决策表最小化是通过减少决策表中条件属性和动作属性的数量来降低决策表的复杂度。

2.最小化可以提高决策表的可读性和维护性,并促进决策规则的理解。

主题名称:决策表标准化

关键要点:

1.决策表标准化是指将决策表的条件和动作属性标准化为预定义的格式或值集。

2.标准化有助于提高决策表的可读性、可维护性和可互操作性。

主题名称:决策表优化趋势

关键要点:

1.决策表优化算法正在朝着自动化和智能化的方向发展。

2.机器学习和数据挖掘技术被用于改进决策表规范化和去重算法。关键词关键要点主题名称:条件属性约简

关键要点:

1.条件属性约简是决策表优化的一种技术,目的是减少决策表的条件属性数量,同时保持决策表的分类能力。

2.条件属性约简算法通过迭代的方式,逐步删除冗余的条件属性,直到无法再删除任何属性而不影响决策表的分类精度。

主题名称:启发式条件属性约简算法

关键要点:

1.启发式条件属性约简算法是一种贪婪算法,每次迭代从决策表中选择一个冗余度最高的条件属性删除。

2.启发式算法的优点是计算速度快,但不能保证找到最优解。

3.常用的启发式条件属性约简算法包括基于信息增益、信息增益率和对数似然比的算法。

主题名称:基于信息增益的条件属性约简

关键要点:

1.信息增益度量了条件属性对目标属性分类能力的贡献程度。

2.基于信息增益的条件属性约简算法每次迭代从决策表中选择信息增益最高的条件属性删除。

3.该算法简单有效,但对缺失值敏感。

主题名称:基于信息增益率的条件属性约简

关键要点:

1.信息增益率是对信息增益的改进,它考虑了条件属性的取值个数,从而避免了信息增益偏差。

2.基于信息增益率的条件属性约简算法每次迭代从决策表中选择信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论