频繁项集 频繁闭项集 投影数组 长度递减支持度约束 权值约束 深度优先搜索_第1页
频繁项集 频繁闭项集 投影数组 长度递减支持度约束 权值约束 深度优先搜索_第2页
频繁项集 频繁闭项集 投影数组 长度递减支持度约束 权值约束 深度优先搜索_第3页
频繁项集 频繁闭项集 投影数组 长度递减支持度约束 权值约束 深度优先搜索_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、频繁项集论文:基于投影数组和加权FP-tree的频繁项集挖掘算法研究【中文摘要】频繁项集挖掘是数据挖掘领域中一个比较关键的问题。然而,从大型稠密数据集中挖掘频繁项集存在三个主要的瓶颈问题:第一,算法的挖掘效率不是很高;第二,产生的频繁项集的数量太多;第三,没有采用合理的约束思想,不能有效的挖掘用户兴趣模式。本文针对这些问题,将研究重点放在频繁项集挖掘算法上,其研究成果可广泛应用于客户购买行为模式预测、序列分析和软件安全分析等领域。首先,本文提出了基于投影数组的频繁项集挖掘算法MFIPA。基于垂直和水平混合数据格式,通过交集操作找到与单个频繁项共同发生的项集,产生投影数组PArray;然后,通过

2、单个频繁项与其投影的非空子集合并及深度优先搜索策略的使用,挖掘所有的频繁项集。其次,为了减少频繁项集的数量,设计了一个新颖的频繁闭项集挖掘算法FCIL-Mine。基于投影数组,首先提出了频繁闭项集框架数据结构FCIL,该框架主要是用来存储频繁闭项集的一些信息。然后,通过哈希检测和包含检测剪枝策略的使用,进而挖掘所有的频繁闭项集。最后,提出了一个基于加权FP-tree及长度递减支持度约束的加权频繁项集挖掘算法LWFI-Mine。该算法可以有效的挖掘满足用户兴趣的项集。首先通过扫.【英文摘要】Frequent itemsets mining is a crucial problem in the

3、field of data mining. But there are three main difficult problems when mining frequent itemsets from large dense database. First, the efficiency of algorithms is not very high; Second, large numbers of frequent itemsets will be generated; Third, few algorithms refer to the reasonable constraint meth

4、od, so they cant mine interesting patterns efficienctly. To resolve these problems, this paper has mainly focused on the research of algorithms for mining fre.【关键词】频繁项集 频繁闭项集 投影数组 长度递减支持度约束 权值约束 深度优先搜索【英文关键词】frequent itemsets frequent closed itemsets projection array length decreasing support constr

5、aint weight constraint depth-first search【索购全文】联系Q1:138113721 Q2:139938848【目录】基于投影数组和加权FP-tree的频繁项集挖掘算法研究摘要5-6Abstract6-7第1章 绪论10-171.1 频繁项集挖掘技术10-151.1.1 频繁项集挖掘的研究背景及意义10-111.1.2 频繁项集挖掘的国内外研究现状11-141.1.3 频繁项集挖掘存在的问题14-151.2 课题的主要研究内容15-161.3 本文的结构内容安排16-17第2章 基于投影数组的频繁项集挖掘算法17-282.1 引言17-182.2 问题描述

6、18-192.3 投影数组的设计与构造19-222.3.1 投影数组的设计192.3.2 投影数组的构造算法19-202.3.3 算法应用实例20-222.4 频繁项集挖掘算法MFIPA 的设计22-262.4.1 扩展定理22-232.4.2 MFIPA 算法23-252.4.3 算法实例分析25-262.5 算法分析262.6 本章小结26-28第3章 基于投影数组和闭项集框架的频繁闭项集挖掘算法28-393.1 引言28-293.2 问题描述29-303.3 投影数组的产生30-313.4 FCIL-Mine 算法31-373.4.1 频繁闭项集框架FCIL 的设计31-323.4.2

7、剪枝策略32-333.4.3 频繁闭项集挖掘算法FCIL-Mine 的设计33-353.4.4 算法应用实例35-373.5 算法分析37-383.6 本章小结38-39第4章 基于加权FP-tree 与约束条件的频繁项集挖掘算法39-514.1 引言39-404.2 问题定义与描述40-414.3 加权FP-tree 数据结构的设计41-444.4 基于加权最小有效扩展性质的剪枝策略44-464.4.1 基于WSVE 性质的事务剪枝454.4.2 基于WSVE 性质的结点剪枝454.4.3 基于WSVE 性质的路径剪枝45-464.5 基于约束的频繁项集挖掘算法LWFI-Mine46-494.5.1 算法LWFI-Mine 的设计46-484.5.2 算法应用实例48-494.6 算法分析49-504.7 本章小结50-51第5章 算法实现及实验分析51-605.1 数据集的来源51-525.2 实验环境及配置525.3 MFIPA 算法的性能分析52-535.3.1 在稀疏数据集上比较525.3.2 在稠密数据集上比较52-535.4 FCIL-Mine 算法的测试53-555.4.1 在稀疏数据集上比较545.4.2 在稠密数据集上比较54-555.5 L

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论