中设置了几个类似置信度confidence的度量课件_第1页
中设置了几个类似置信度confidence的度量课件_第2页
中设置了几个类似置信度confidence的度量课件_第3页
中设置了几个类似置信度confidence的度量课件_第4页
中设置了几个类似置信度confidence的度量课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

什么是关联规则?WEKA中探索者界面的关联分析什么是关联规则?关联规则数据挖掘是数据挖掘领域的热点之一。关联规则反映一个对象与其他对象之间的相互依赖性,如果多个对象之间存在一定的关联关系,那么,其中一个对象就能够通过其他对象进行预测。典型问题:a.分析超市中的购物篮数据;

b.从海量商业交易记录中发现感兴趣的数据关联,以帮助商家决策。例如:商品分类设计、降价经销分析、货架摆放策略......关联规则数据挖掘是数据挖掘领域的热点之一。支持度、置信度、项集、项关联规则可以采用与分类规则相同的方式产生。由于得到的关联规则数量庞大,通常需要根据覆盖率(coverage)和准确率(accuracy)进行修剪。覆盖率:又称为支持度(support),支持度是支持度计数与实例总数的比值,支持度计数是应用规则后预测正确的实例数量;准确率:又称为置信度(confidence),表示为支持度计数与应用规则的实例数量的比值。由于仅对高覆盖量的关联规则感兴趣,因此关联只寻找能够达到预定的最小覆盖量的属性值对组合,这些组合称为项集(itemset),其中的任一个属性值对称为一个项(item)。例如:套用购物篮分析案例,项就是购物篮中的商品,需要寻找的是购物篮中商品之间的关联。支持度、置信度、项集、项关联规则可以采用与分类规则相同的方式

关联分析

定义:主要用于发现隐藏在大型数据集中的有意义的联系,这些联系可以采用关联规则或频繁项集的形式表示。关联分析可用于购物篮数据分析,还可用于医疗诊断、网页挖掘和科学数据分析等领域。Weka数据挖掘平台上的Associate标签页就是用来处理关联问题:Weka提供了Apriori、PredictiveApriori、Tertius等关联规则发掘算法;在Associate标签页中选定一个算法,进行一些必要的设置,包括支持度上界、下界,每次运算的支持度递减值,等等;其中,Apriori算法是第一个关联规则挖掘算法,而且这几个算法均不支持数值型数据,所以如果是数值型数据,则需要先对其进行离散化处理。

关联分析

定义:主要用于发现隐藏在大型数据集中的有意义的联了解Apriori算法中各个参数的解释案例1.weather.nominal.arff数据集AprioriFilteredAssociatorFPGrowth了解Apriori算法中各个参数的解释案例1.weather中设置了几个类似置信度confidence的度量课件对于设置表中各个参数的含义:1.car:如果设为true,则会挖掘类关联规则而不是全局关联规则。2.classindex:类属性索引。若设为-1,最后的属性被当做类属性。3.delta:以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。4.lowerBoundMinSupport:最小支持度下界。6.minMtric度量的最小值。7.numRules要发现的规则数。8.outputItemSets如果设置为真,会在结果中输出项集。9.removeAllMissingCols移除全部为缺省值的列。10.significanceLevel重要程度。重要性测试(仅用于置信度)。11.upperBoundMinSupport最小支持度上界。从这个值开始迭代减小最小支持度。

对于设置表中各个参数的含义:5.metricType:度量类型。设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。在Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度,它们分别是:a)Lift(提升度):P(A,B)/(P(A)P(B))Lift=1时表示A和B独立。这个数越大(>1),越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.b)Leverage

(杠杆率):P(A,B)-P(A)P(B)Leverage=0时A和B独立,Leverage越大A和B的关系越密切c)Conviction(确信度):P(A)P(!B)/P(A,!B)(!B表示B没有发生)Conviction也是用来衡量A和B的独立性。从它和lift的关系(对B取反,代入Lift公式后求倒数)可以看出,这个值越大,A、B越关联。5.metricType:度量类型。设置对规则进行排序的度量完整的实验结果输出及具体分析:===Runinformation===

//实验运行信息Scheme:weka.associations.Apriori-N10-T0-C0.9-D0.05-U1.0-M0.1-S-1.0-c-1Relation:weather.symbolic//数据的名称Instances:14

//数据的记录数Attributes:5

//属性数目及其名称outlooktemperaturehumiditywindyplay===Associatormodel(fulltrainingset)===完整的实验结果输出及具体分析:Apriori//Apriori算法的运行结果=======Minimumsupport:0.15(2instances)

//最小的支持度(最少需要两个实例)Minimummetric<confidence>:0.9//最小度量(置信度)Numberofcyclesperformed:17

//进行了17轮搜索Generatedsetsoflargeitemsets:

//生成的频繁项集SizeofsetoflargeitemsetsL(1):12//频繁1项集:12个SizeofsetoflargeitemsetsL(2):47//频繁2项集:47个SizeofsetoflargeitemsetsL(3):39SizeofsetoflargeitemsetsL(4):6AprioriBestrulesfound:前件num.1==>结论num.2

表示有多少个

表示有多少个

实例满足前件

实例满足整个规则1.outlook=overcast4==>play=yes4<conf:(1)>lift:(1.56)lev:(0.1)[1]conv:(1.43)2.temperature=cool4==>humidity=normal4<conf:(1)>lift:(2)lev:(0.14)[2]conv:(2)3.humidity=normalwindy=FALSE4==>play=yes4<conf:(1)>lift:(1.56)lev:(0.1)[1]conv:(1.43)4.outlook=sunnyplay=no3==>humidity=high3<conf:(1)>lift:(2)lev:(0.11)[1]conv:(1.5)5.outlook=sunnyhumidity=high3==>play=no3<conf:(1)>lift:(2.8)lev:(0.14)[1]conv:(1.93)6.outlook=rainyplay=yes3==>windy=FALSE3<conf:(1)>lift:(1.75)lev:(0.09)[1]conv:(1.29)7.outlook=rainywindy=FALSE3==>play=yes3<conf:(1)>lift:(1.56)lev:(0.08)[1]conv:(1.07)8.temperature=coolplay=yes3==>humidity=normal3<conf:(1)>lift:(2)lev:(0.11)[1]conv:(1.5)9.outlook=sunnytemperature=hot2==>humidity=high2<conf:(1)>lift:(2)lev:(0.07)[1]conv:(1)10.temperature=hotplay=no2==>outlook=sunny2<conf:(1)>lift:(2.8)lev:(0.09)[1]conv:(1.29)Bestrulesfound:2.vote.arff数据集(任务是基于投票模式预测所属党派)2.vote.arff数据集(任务是基于投票模式预测所属党派Bestrulesfound:(二元标称型)1.adoption-of-the-budget-resolution=yphysician-fee-freeze=n219==>Class=democrat219<conf:(1)>lift:(1.63)lev:(0.19)[84]conv:(84.58)第一条规则表明,支持“采纳预算决议”,并反对“冻结医疗费”的是“民主党”。2.adoption-of-the-budget-resolution=yphysician-fee-freeze=naid-to-nicaraguan-contras=y198==>Class=democrat198<conf:(1)>lift:(1.63)lev:(0.18)[76]conv:(76.47)第二条规则表明,支持“采纳预算决议”,反对“冻结医疗费”,并支持“援助尼加拉瓜反政府”的是“民主党”。

3.physician-fee-freeze=naid-to-nicaraguan-contras=y211==>Class=democrat210<conf:(1)>lift:(1.62)lev:(0.19)[80]conv:(40.74)第三条规则表明,反对“冻结医疗费”,并支持“援助尼加拉瓜反政府”的是“民主党”。

4.physician-fee-freeze=neducation-spending=n202==>Class=democrat201<conf:(1)>lift:(1.62)lev:(0.18)[77]conv:(39.01)第四条规则表明,反对“冻结医疗费”,并反对“教育支出”的是“民主党”。5.physician-fee-freeze=n247==>Class=democrat245<conf:(0.99)>lift:(1.62)lev:(0.21)[93]conv:(31.8)

第五条规则表明,反对“教育支出”的是“民主党”。Bestrulesfound:(二元标称型)6.

el-salvador-aid=nClass=democrat200==>aid-to-nicaraguan-contras=y197<conf:(0.99)>lift:(1.77)lev:(0.2)[85]conv:(22.18)第六条规则表明,反对“EL-萨尔瓦多援助”,并且类别为“民主党”的,会支持“援助尼加拉瓜反政府”。7.el-salvador-aid=n208==>aid-to-nicaraguan-contras=y204<conf:(0.98)>lift:(1.76)lev:(0.2)[88]conv:(18.46)第七条规则表明,反对“EL-萨尔瓦多援助”的,会支持“援助尼加拉瓜反政府”。8.adoption-of-the-budget-resolution=yaid-to-nicaraguan-contras=yClass=democrat203==>physician-fee-freeze=n198<conf:(0.98)>lift:(1.72)lev:(0.19)[82]conv:(14.62)第八条规则表明,支持“采纳预算决议”,支持“援助尼加拉瓜反政府”,并且类别为“民主党”的,会反对“冻结医疗费”。9.el-salvador-aid=naid-to-nicaraguan-contras=y204==>Class=democrat197<conf:(0.97)>lift:(1.57)lev:(0.17)[71]conv:(9.85)第九条规则表明,反对“EL-萨尔瓦多援助”,并支持“援助尼加拉瓜反政府”的是“民主党”。10.aid-to-nicaraguan-contras=yClass=democrat218==>physician-fee-freeze=n210<conf:(0.96)>lift:(1.7)lev:(0.2)[86]conv:(10.47)第十条规则表明,支持“援助尼加拉瓜反政府”,并且类别为“民主党”的,会反对“冻结医疗费”。推断出:“民主党”会支持“采纳预算决议”和“援助尼加拉瓜反政府”,反对“冻结医疗费”“教育支出”和“EL-萨尔瓦多援助”。6.el-salvador-aid=nClass=dem图中的蓝色(深色)代表民主党,红色(浅色)代表共和党。在前四行的16项属性中,有多项属性蓝色占据绝对的统治地位,基本上全是蓝色柱;而红色占据统治地位的只有很少几个属性,又因为覆盖率低而不具备竞争优势,故未能入选。在人数上民主党占优(267∶168),加上有明确的政治观点,因此前十条关联规则都打上了民主党的烙印。图中的蓝色(深色)代表民主党,红色(浅色)代表共和党。在前四3.市场购物篮分析购物篮分析将关联技术用于交易过程,特别是分析超市收银数据,找出那些以成组的形式同时出现的商品。对于大多数零售商来说,这是主要的用于数据挖掘的销售信息来源。例如,自动分析收银数据后发现:买啤酒的客户同时也买薯片,对超市管理人员来说,这个发现也许非常有意义。另一个沃尔玛的例子是,一些顾客通常星期四在买尿片的同时还买啤酒。这似乎令人惊讶,但如果仔细一想,年轻父母为了在家度周末而采购,这又非常容易理解。上述信息可以用于多种目的,如规划货架摆放位置、仅对会同时购买的商品中的一种进行打折销售、提供与单独销售的产品相匹配产品的赠券,等等。了解顾客的个人购买历史记录能够创造出巨大的附加价值。商家可以从顾客的购买行为中鉴别特殊客户,不但可以分析其历史购买模式,而且还能精确地针对潜在用户提供特殊的极有可能感兴趣的购买信息。3.市场购物篮分析supermarket.arff数据集supermarket.arff数据集Bestrulesfound:1.biscuits=tfrozenfoods=tfruit=ttotal=high788==>breadandcake=t723<conf:(0.92)>lift:(1.27)lev:(0.03)[155]conv:(3.35)饼干+冷冻食品+水果+高总额==>面包和蛋糕。2.bakingneeds=tbiscuits=tfruit=ttotal=high760==>breadandcake=t696<conf:(0.92)>lift:(1.27)lev:(0.03)[149]conv:(3.28)烘烤所需+饼干+水果+高总额==>面包和蛋糕。3.bakingneeds=tfrozenfoods=tfruit=ttotal=high770==>breadandcake=t705<conf:(0.92)>lift:(1.27)lev:(0.03)[150]conv:(3.27)烘烤所需+冷冻食品+水果+高总额==>面包和蛋糕。4.biscuits=tfruit=tvegetables=ttotal=high815==>breadandcake=t746<conf:(0.92)>lift:(1.27)lev:(0.03)[159]conv:(3.26)饼干+水果+蔬菜+高总额==>面包和蛋糕。5.partysnackfoods=tfruit=ttotal=high854==>breadandcake=t779<conf:(0.91)>lift:(1.27)lev:(0.04)[164]conv:(3.15)聚会零食+水果+高总额==>面包和蛋糕。

Bestrulesfound:6.biscuits=tfrozenfoods=tvegetables=ttotal=high797==>breadandcake=t725<conf:(0.91)>lift:(1.26)lev:(0.03)[151]conv:(3.06)饼干+冷冻食品+蔬菜+高总额==>面包和蛋糕。7.bakingneeds=tbiscuits=tvegetables=ttotal=high772==>breadandcake=t701<conf:(0.91)>lift:(1.26)lev:(0.03)[145]conv:(3.01)烘烤所需+饼干+蔬菜+高总额==>面包和蛋糕。8.biscuits=tfruit=ttotal=high954==>breadandcake=t866<conf:(0.91)>lift:(1.26)lev:(0.04)[179]conv:(3)饼干+水果+高总额==>面包和蛋糕。9.frozenfoods=tfruit=tvegetables=ttotal=high834==>breadandcake=t757<conf:(0.91)>lift:(1.26)lev:(0.03)[156]conv:(3)冷冻食品+水果+蔬菜+高总额==>面包和蛋糕。10.frozenfoods=tfruit=ttotal=high969==>breadandcake=t877<conf:(0.91)>lift:(1.26)lev:(0.04)[179]conv:(2.92)冷冻食品+水果+高总额==>面包和蛋糕。6.biscuits=tfrozenfoods=tv十条关联规则中,多项商品多次出现,而且总金额都很高。这给出了一些显而易见的信息:第一,购买饼干、冷冻食品等速食的顾客,会顺便采购些水果、蔬菜,以补充身体所需的维生素;第二,购买饼干、冷冻食品以及水果、蔬菜的顾客,会顺便购买面包和蛋糕;第三,购买上述食品的顾客,一次的采购量会很大,总金额较高;第四,总金额较高的交易,一般都会购买面包和蛋糕,等等。对于超市经理来说,这些信息非常重要,可以根据挖掘到的知识重新安排货架,重新布局超市,提供快速付款通道以及安排送货等附加服务,以期提升市场竞争力。十条关联规则中,多项商品多次出现,而且总金额都很高。这给出了

蟹蟹大家

制作者:娄曙李雪娥

什么是关联规则?WEKA中探索者界面的关联分析什么是关联规则?关联规则数据挖掘是数据挖掘领域的热点之一。关联规则反映一个对象与其他对象之间的相互依赖性,如果多个对象之间存在一定的关联关系,那么,其中一个对象就能够通过其他对象进行预测。典型问题:a.分析超市中的购物篮数据;

b.从海量商业交易记录中发现感兴趣的数据关联,以帮助商家决策。例如:商品分类设计、降价经销分析、货架摆放策略......关联规则数据挖掘是数据挖掘领域的热点之一。支持度、置信度、项集、项关联规则可以采用与分类规则相同的方式产生。由于得到的关联规则数量庞大,通常需要根据覆盖率(coverage)和准确率(accuracy)进行修剪。覆盖率:又称为支持度(support),支持度是支持度计数与实例总数的比值,支持度计数是应用规则后预测正确的实例数量;准确率:又称为置信度(confidence),表示为支持度计数与应用规则的实例数量的比值。由于仅对高覆盖量的关联规则感兴趣,因此关联只寻找能够达到预定的最小覆盖量的属性值对组合,这些组合称为项集(itemset),其中的任一个属性值对称为一个项(item)。例如:套用购物篮分析案例,项就是购物篮中的商品,需要寻找的是购物篮中商品之间的关联。支持度、置信度、项集、项关联规则可以采用与分类规则相同的方式

关联分析

定义:主要用于发现隐藏在大型数据集中的有意义的联系,这些联系可以采用关联规则或频繁项集的形式表示。关联分析可用于购物篮数据分析,还可用于医疗诊断、网页挖掘和科学数据分析等领域。Weka数据挖掘平台上的Associate标签页就是用来处理关联问题:Weka提供了Apriori、PredictiveApriori、Tertius等关联规则发掘算法;在Associate标签页中选定一个算法,进行一些必要的设置,包括支持度上界、下界,每次运算的支持度递减值,等等;其中,Apriori算法是第一个关联规则挖掘算法,而且这几个算法均不支持数值型数据,所以如果是数值型数据,则需要先对其进行离散化处理。

关联分析

定义:主要用于发现隐藏在大型数据集中的有意义的联了解Apriori算法中各个参数的解释案例1.weather.nominal.arff数据集AprioriFilteredAssociatorFPGrowth了解Apriori算法中各个参数的解释案例1.weather中设置了几个类似置信度confidence的度量课件对于设置表中各个参数的含义:1.car:如果设为true,则会挖掘类关联规则而不是全局关联规则。2.classindex:类属性索引。若设为-1,最后的属性被当做类属性。3.delta:以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。4.lowerBoundMinSupport:最小支持度下界。6.minMtric度量的最小值。7.numRules要发现的规则数。8.outputItemSets如果设置为真,会在结果中输出项集。9.removeAllMissingCols移除全部为缺省值的列。10.significanceLevel重要程度。重要性测试(仅用于置信度)。11.upperBoundMinSupport最小支持度上界。从这个值开始迭代减小最小支持度。

对于设置表中各个参数的含义:5.metricType:度量类型。设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。在Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度,它们分别是:a)Lift(提升度):P(A,B)/(P(A)P(B))Lift=1时表示A和B独立。这个数越大(>1),越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.b)Leverage

(杠杆率):P(A,B)-P(A)P(B)Leverage=0时A和B独立,Leverage越大A和B的关系越密切c)Conviction(确信度):P(A)P(!B)/P(A,!B)(!B表示B没有发生)Conviction也是用来衡量A和B的独立性。从它和lift的关系(对B取反,代入Lift公式后求倒数)可以看出,这个值越大,A、B越关联。5.metricType:度量类型。设置对规则进行排序的度量完整的实验结果输出及具体分析:===Runinformation===

//实验运行信息Scheme:weka.associations.Apriori-N10-T0-C0.9-D0.05-U1.0-M0.1-S-1.0-c-1Relation:weather.symbolic//数据的名称Instances:14

//数据的记录数Attributes:5

//属性数目及其名称outlooktemperaturehumiditywindyplay===Associatormodel(fulltrainingset)===完整的实验结果输出及具体分析:Apriori//Apriori算法的运行结果=======Minimumsupport:0.15(2instances)

//最小的支持度(最少需要两个实例)Minimummetric<confidence>:0.9//最小度量(置信度)Numberofcyclesperformed:17

//进行了17轮搜索Generatedsetsoflargeitemsets:

//生成的频繁项集SizeofsetoflargeitemsetsL(1):12//频繁1项集:12个SizeofsetoflargeitemsetsL(2):47//频繁2项集:47个SizeofsetoflargeitemsetsL(3):39SizeofsetoflargeitemsetsL(4):6AprioriBestrulesfound:前件num.1==>结论num.2

表示有多少个

表示有多少个

实例满足前件

实例满足整个规则1.outlook=overcast4==>play=yes4<conf:(1)>lift:(1.56)lev:(0.1)[1]conv:(1.43)2.temperature=cool4==>humidity=normal4<conf:(1)>lift:(2)lev:(0.14)[2]conv:(2)3.humidity=normalwindy=FALSE4==>play=yes4<conf:(1)>lift:(1.56)lev:(0.1)[1]conv:(1.43)4.outlook=sunnyplay=no3==>humidity=high3<conf:(1)>lift:(2)lev:(0.11)[1]conv:(1.5)5.outlook=sunnyhumidity=high3==>play=no3<conf:(1)>lift:(2.8)lev:(0.14)[1]conv:(1.93)6.outlook=rainyplay=yes3==>windy=FALSE3<conf:(1)>lift:(1.75)lev:(0.09)[1]conv:(1.29)7.outlook=rainywindy=FALSE3==>play=yes3<conf:(1)>lift:(1.56)lev:(0.08)[1]conv:(1.07)8.temperature=coolplay=yes3==>humidity=normal3<conf:(1)>lift:(2)lev:(0.11)[1]conv:(1.5)9.outlook=sunnytemperature=hot2==>humidity=high2<conf:(1)>lift:(2)lev:(0.07)[1]conv:(1)10.temperature=hotplay=no2==>outlook=sunny2<conf:(1)>lift:(2.8)lev:(0.09)[1]conv:(1.29)Bestrulesfound:2.vote.arff数据集(任务是基于投票模式预测所属党派)2.vote.arff数据集(任务是基于投票模式预测所属党派Bestrulesfound:(二元标称型)1.adoption-of-the-budget-resolution=yphysician-fee-freeze=n219==>Class=democrat219<conf:(1)>lift:(1.63)lev:(0.19)[84]conv:(84.58)第一条规则表明,支持“采纳预算决议”,并反对“冻结医疗费”的是“民主党”。2.adoption-of-the-budget-resolution=yphysician-fee-freeze=naid-to-nicaraguan-contras=y198==>Class=democrat198<conf:(1)>lift:(1.63)lev:(0.18)[76]conv:(76.47)第二条规则表明,支持“采纳预算决议”,反对“冻结医疗费”,并支持“援助尼加拉瓜反政府”的是“民主党”。

3.physician-fee-freeze=naid-to-nicaraguan-contras=y211==>Class=democrat210<conf:(1)>lift:(1.62)lev:(0.19)[80]conv:(40.74)第三条规则表明,反对“冻结医疗费”,并支持“援助尼加拉瓜反政府”的是“民主党”。

4.physician-fee-freeze=neducation-spending=n202==>Class=democrat201<conf:(1)>lift:(1.62)lev:(0.18)[77]conv:(39.01)第四条规则表明,反对“冻结医疗费”,并反对“教育支出”的是“民主党”。5.physician-fee-freeze=n247==>Class=democrat245<conf:(0.99)>lift:(1.62)lev:(0.21)[93]conv:(31.8)

第五条规则表明,反对“教育支出”的是“民主党”。Bestrulesfound:(二元标称型)6.

el-salvador-aid=nClass=democrat200==>aid-to-nicaraguan-contras=y197<conf:(0.99)>lift:(1.77)lev:(0.2)[85]conv:(22.18)第六条规则表明,反对“EL-萨尔瓦多援助”,并且类别为“民主党”的,会支持“援助尼加拉瓜反政府”。7.el-salvador-aid=n208==>aid-to-nicaraguan-contras=y204<conf:(0.98)>lift:(1.76)lev:(0.2)[88]conv:(18.46)第七条规则表明,反对“EL-萨尔瓦多援助”的,会支持“援助尼加拉瓜反政府”。8.adoption-of-the-budget-resolution=yaid-to-nicaraguan-contras=yClass=democrat203==>physician-fee-freeze=n198<conf:(0.98)>lift:(1.72)lev:(0.19)[82]conv:(14.62)第八条规则表明,支持“采纳预算决议”,支持“援助尼加拉瓜反政府”,并且类别为“民主党”的,会反对“冻结医疗费”。9.el-salvador-aid=naid-to-nicaraguan-contras=y204==>Class=democrat197<conf:(0.97)>lift:(1.57)lev:(0.17)[71]conv:(9.85)第九条规则表明,反对“EL-萨尔瓦多援助”,并支持“援助尼加拉瓜反政府”的是“民主党”。10.aid-to-nicaraguan-contras=yClass=democrat218==>physician-fee-freeze=n210<conf:(0.96)>lift:(1.7)lev:(0.2)[86]conv:(10.47)第十条规则表明,支持“援助尼加拉瓜反政府”,并且类别为“民主党”的,会反对“冻结医疗费”。推断出:“民主党”会支持“采纳预算决议”和“援助尼加拉瓜反政府”,反对“冻结医疗费”“教育支出”和“EL-萨尔瓦多援助”。6.el-salvador-aid=nClass=dem图中的蓝色(深色)代表民主党,红色(浅色)代表共和党。在前四行的16项属性中,有多项属性蓝色占据绝对的统治地位,基本上全是蓝色柱;而红色占据统治地位的只有很少几个属性,又因为覆盖率低而不具备竞争优势,故未能入选。在人数上民主党占优(267∶168),加上有明确的政治观点,因此前十条关联规则都打上了民主党的烙印。图中的蓝色(深色)代表民主党,红色(浅色)代表共和党。在前四3.市场购物篮分析购物篮分析将关联技术用于交易过程,特别是分析超市收银数据,找出那些以成组的形式同时出现的商品。对于大多数零售商来说,这是主要的用于数据挖掘的销售信息来源。例如,自动分析收银数据后发现:买啤酒的客户同时也买薯片,对超市管理人员来说,这个发现也许非常有意义。另一个沃尔玛的例子是,一些顾客通常星期四在买尿片的同时还买啤酒。这似乎令人惊讶,但如果仔细一想,年轻父母为了在家度周末而采购,这又非常容易理解。上述信息可以用于多种目的,如规划货架摆放位置、仅对会同时购买的商品中的一种进行打折销售、提供与单独销售的产品相匹配产品的赠券,等等。了解顾客的个人购买历史记录能够创造出巨大的附加价值。商家可以从顾客的购买行为中鉴别特殊客户,不但可以分析其历史购买模式,而且还能精确地针对潜在用户提供特殊的极有可能感兴趣的购买信息。3.市场购物篮分析supermarket.arff数据集supermarket.arff数据集Bestrulesfound:1.biscuits=tfrozenfoods=tfruit=ttotal=high788==>breadandcake=t723<conf:(0.92)>lift:(1.27)lev:(0.03)[155]conv:(3.35)饼干+冷冻食品+水果+高总额==>面包和蛋糕。2.bakingneeds=tbiscuits=tfruit=ttot

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论