第三次作业-符家乐数据挖掘_第1页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

仅使用G和它们的计数,不能确定集A是否频繁如果A频繁,能确定A的支持度。用集A与G比较,若无匹配即穷尽k-1子集与G比较,若无再穷尽k-2子集(到最少真子集,直至找到匹配为止,最大子集匹配的支持度即A的支持度,同一层次的子集若存在多个与G匹配的集,则取匹配中子集的最A的支持度。反证法:假设对于频繁集A,存在其非空子集x不频繁,即support(A)<min_sup,集A不频繁反证法:假设对于集s,存在其非空子集s使得support(s即数据库中满足集s的元组多于满足集s的元组,即s不可能是s的非可得集s的任意非空子集s的支持度至少与s的支持度一样s(ls)confs(ls))=P((ls)|ssupport(s

s=s(l-s)

support(l)由上述(b)得support(s)≤support(ssup supsupport(s)support(s反证法:假设在事务数据库D中有频繁集X,在D中的n个分区中都不频繁,设X在每一分区中的非空子集为X1,Xi,Xni个分区事物数为ni,i属于【1,ii都存在sup_count(Xi<min_supni即sup_count(Xi)sup_count(Xi sup(X1)sup(Xn)n

n1min_supn

min_sup(X1sup(Xnnsup(Xn

<min_sup,X不是事务数据库D中的频繁用Apriori算法,对每个候选计数,因为min_sup=60%,n=5,即min_sup_count=3, 集M3O集M3O3N2K5E4Y3D1A1U1C2I1集M3O3K5E4y3集132集1322332432集33343集3集集3集3Sup(hotdogshumburgers)=40%>min_sup=25%Conf(hotdogshumburgers)=66.67%>min_conf=50%(c)置信度与支持度度量不足以过滤掉无趣的关联规则,所以可用相关性度量来扩充关联规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论