数据挖掘导论第六章中文答案_第1页
数据挖掘导论第六章中文答案_第2页
数据挖掘导论第六章中文答案_第3页
数据挖掘导论第六章中文答案_第4页
数据挖掘导论第六章中文答案_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 数据挖掘导论1。对于每个下列问题,提供一个关联规则的一个例子从市场购物篮域,满足下列条件。同样,这些规则是主观地描述是否有趣。(一)一个规则,具有较高的支持和高的信心。答:牛奶面包。这种明显的规则往往是无趣的。(b)规则,有相当高的支持,但信心不足。答:牛奶金枪鱼。而出售金枪鱼和牛奶可能是高于阈值,并不是所有的事务,包含牛奶也包含金枪鱼。这种低规则往往是无趣的。(c)一个规则,低的支持和信心不足。答:食用油洗衣粉。如此低的信心规则往往是无趣的。(d)规则,低支持和高的信心。答:伏特加鱼子酱。这样的规则往往是有趣的2。考虑到数据集显示于表格6.1。(一)计算支持项集 e , b、d ,

2、b、d、e 通过治疗每个事务ID作为一个市场购物篮。答:(b) Use the results in part (a) to compute the confidence for the associationrules b, d e and e b, d. Is confidence a symmetricmeasure?c、重复部分(一)通过将每个客户ID作为一个市场购物篮。每个项目应被视为一个二进制变量(1如果一个项目出现在至少有一个交易购买的顾客,和0否则。)d e 没有明显关系s1,s2,c1和c2 所以c2有最低的置信度4、因为年代(A,B,C)年代(A,B)和max(s(一个),

3、s(B),s(C)max(s(一个),s(B), 因此( A、B )( A,B,C )。(b)因为s(A,B,C)s(A,B)和最小(s(A,B),s(A,C),s(B,C)min(s(一个),s(B),s(C)min(s(一个),s(B)、( A,B,C )可以大于或小于( A、B )。因此,这些措施是单调。(一)的最大数量,可以提取关联规则从这个数据(包括规则,零支持)?答:有六项数据集。因此总规则的数量是602。(b)什么是频繁项集的最大大小,可以提取(假设用来 0)?答:因为最长的事务包含4项,最大频繁项集的大小是4。(c)编写一个表达式最大数量的大小3项集,可以源自这个数据集。答: (d)找到itemset(大小为2或更大),拥有最大的支持。答:面包、黄油。(e)找到一双项目,a和b,这样的规则一 b 和 b 一有同样的信心。答:(啤酒,饼干)或(面包、黄油)。比例的频繁项集= 16/32 = 50.0%(包括null 设置)。修剪比率的比例是N的总数量的项目集。因为的计数N = 11,因此修剪比例是11/32 = 34.4%。误警率的比值我总数量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论