数据仓库及数据挖掘课程设计报告_第1页
数据仓库及数据挖掘课程设计报告_第2页
数据仓库及数据挖掘课程设计报告_第3页
数据仓库及数据挖掘课程设计报告_第4页
数据仓库及数据挖掘课程设计报告_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-1.绪论21.1工程背景21.2提出问题22数据库仓库与数据集的概念介绍22.1数据仓库22.2数据集23数据仓库33.1数据仓库的设计33.1.1数据仓库的概念模型设计33.1.2数据仓库的逻辑模型设计33.2数据仓库的建立33.2.1数据仓库数据集43.2.2建立维表44.数据挖掘操作54.1数据预处理54.1.1描述性数据汇总54.2决策树55、实验心得86、大总结8z.-1.绪论1.1工程背景在现在大数据时代,各行各业需要对商品及相关关节的数据进展收集处理,的市场,制定出高效的决策,给企业带来经济收益。1.2提出问题对于超市的商品的购置时期和购置数量的如何决定,才可以使销售量最大,以制定出最正确方案。2数据库仓库与数据集的概念介绍2.1数据仓库数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创立。为企业提供需要业务智能来指导业务流程改良和监视时间、本钱、质量和控制。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。2.2数据集z.-数据集是指一种由数据所组成的集合。Data是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于*一成括一个或多个成员。3数据仓库3.1数据仓库的设计仅依赖ERD,那只能对商品、销售、客户主题设计成如下图的概念模型。这种模型适合于传统的数据库设计,但不适合于数据仓库的设计。割策略、表划分和数据来源等。3.2数据仓库的建立z.-一般说来,一个数据集市是按照*一特定部门的决策支持需求而组织起来的、针对一组主题的应用系统。例如,财务部拥有自己的数据集市,用来进展财务方面的报表和分析,市场推广部、销售部等也拥有各自专用的数据集市,用来为本部门的决策支持提供辅助手段。数据集市大都采用多维数据库技术,这种技术对数据的分析而言也许是最优的,但肯定不适合于大量数据的存储,因为多维数据库换言之,数据集市中往往靠对数据的预处理来换取运行时的高速度,当业务部门提出新的问题时,如果不在原来设计的围,则需要数据库管理员对数据库作许多调整和优化处理。维是分析问题的角度,度量是要分析的问题。多维视图:用包含度量和维的表的数据构造可以创立一个多维视图,用试题和维创立的多维模型称为星型模型,星型模型生成的主要表格被称为事实表。事实表的属性值几乎都有连续值。事实表是规化的。与维表不同不是随时间的推移变化,而是不断变大。维表:星型模型也具有非常小的表,用来装载描述信息。维表是逆规化的。如果把维表置于第二式中,这样的表称为雪花模型。维表包括主键,通常对应事实表的外部键。如果维表的主键不在实事表中,这个主键字便被称作退化的维。创立维表:有3种方法:星型模型、雪花模型和星暴模型。星暴模型含有两以上的事实表。根本有些充当维事实表。星型模型:所有信息维都放在同一个维表中。维表信息包含一个唯一的标识z.-雪花模型:把信息分为3种标准格式。产品表、类别表、子类别表。把这些信息放到一起需要一定数据的连接。雪花模型比星型模型效率低,占空间少。所有的事实表都有一个与之相关的时间维表。4.数据挖掘操作4.1数据预处理对于许多数据预处理任务,希望知道关于数据的中心趋势和离中趋势特征。中心趋势度量包括均值〔mode〕和中列数〔interquartilerange,的分布。4.2决策树(1)读取文本数据使用变量文件节点读取定界文本数据。可以从选项板中添加变量文件节点,1所示。图1Clementine安装目录。翻开目标文件目录,然后选择名为sales.*ls的文件。选择从文件读取字段名,并注意已载入此对话框中的字段和值。如图2所示。z.-图2单击过滤选项,可以把用不到的信息给过滤掉。如图3所示。图34所示。图4〔2〕添加表现在已载入数据文件,可以浏览一下*些记录的值。其中一个方法就是构建将其拖放到工作区。如图5所示。图5拟鼠标中键操作,请在使用鼠标时按下Alt键。如图6所示。图6要查看表,请单击工具栏上的绿色箭头按钮执行流,或者右键单击表节点,然后选择执行。如图7所示。图7(3)创立分布图执行。如图8所示。图8300g壶瓶枣和400g沁州黄卖的最多。如图9所示。图9此外,还可以在“输出〞选项卡中找到数据审核节点。如图10所示。z.-图11所示。图(4)创立散点图相连接,然后双击该节点对其进展编辑。如图12所示。图在“散点图〞选项卡中,选择商品名称作为*字段,选择销售模式作为Y字段,并选择销售金额作为交叠字段。然后单击执行。如图13所示。图的销售模式下,销售金额明显高于零售模式下的销售金额。如图14所示。图(5)创立直方图显示数据。首先,将网络节点与您工作区中的源节点相连接。如图15所示。图在“直方图〞选项卡中,选择商品序号作为*字段,选择销售数量作为交叠字段。然后单击执行。如图16所示。图1的商品销售数量最多,序号为9的商品销售数量最少。如图17所示。图z.-5、实验心得掘中数据分析处理的根本方法有了深入的了解,特别是决策树模型应用的理解,以及利用这些与数据中的案例组相对应关系可以通过建模可详细研究这些组并描绘其特征,增强了运用决策树模型和聚类分析模型的能力。通过这次学习让我意识到,对于数据我们不仅要能利用统计来分析它的规所得到的有利信息更好的效劳于数据使用者。6、大总结收获很大,不但学习相关数据挖掘的知识,关于SPSS了解更多,操作也比原来熟练多了。虽然过程中有点折磨过,但当你克制了,耐心去一步一步操作,那些烦躁的心情就会慢慢消失,还得要有耐心,认真的态度去操作,才能有结果。以一句话来概括:最大限度地从你口袋里面掏出更多的钱买我的产品。1.通过关联规则,推出相应的促销礼包或优惠组合套装,快速帮助提高销售额。如自行车针对不同人群,来制定有效的销售方案。2.零售超市或商场,可以通过产品关联程度大小,指导产品合理摆放,方便z.-是提高销售的一个关键。3.进展相关产品推荐或者挑选相应的关联产品进展精准营销。最常见的是分。例如,穷人一般和穷人在一起,富人也喜欢和富人在一起。还有数据挖掘的人喜欢和数据挖掘的人打交道,都离不开这些鸟道理。人里面,购置A的有60人,购置B的有40A和B的有30A里面有一半的顾客会购置推而言。如果推出类似B的产品,除了向产品B的用户推荐〔因为新产品与BA寻找更多的目标客户。概率的期望值,与未来的实际收益不会完全相等。决策树法是管理人员和决策分析人员经常采用的一种行之有效的决策工具。它具有以下优点:各可行方法在各种不同状态下的期望值。z.-2.能直观地显示整个决策问题在时间和决策顺序上不同阶段的决策过程。3.在应用于复杂的多阶段决策时,阶段明显,层次清楚,便于决策机构集体研究,可以周密地思考各种因素,有利于作出正确的决策。当然,决策树法也不是十全十美的,它也有缺点,如使用围有限,无法适用于一些

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论