




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘:据可以存放在数据库,(1)学习应用域(2)目标数据创建集(3456)选择挖掘算法(7)找寻兴趣度模式(8式评估和知识展示(9概念1)2)数据区分:将目标类数据的一般特性与一个或多个可比较类进行比较;(3关联分析:发现关联规则,分类:找出能够描述和区分数据类或概念的模型,以便能够使用模型预测类标号未知的对象类,导出的模型是基于训练集的分析.导出模型的算法:.预测:,预测空缺的或不知道的数值数据集。聚类:分析数据对象,而不考虑已知的类标记。训练数据中,对象根据最大化类内的相似性和最小化类间的原则进行聚类或分组,从而产生类标号。数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。,定主题的简明视图。集成的:多个异构数据源。时变的:从历史角度提供信息,隐含时间信息.非易失的:和操作数据的分离,只提供初始装入和访问.OLAP:数据仓库系统在数据分析和决策方面为用户或‘知识工人提供服务.系统可以用不同的格式和组织提供数据是一种分析技术,具有汇总、合并和聚集功能,以及从不同的角度观察信息的能力.写读—多维数据模型:多维数据模型将数据看作数据立方体,允许从多个维度对数据建模和观察.(座模式(多个事实表共享维表).1录的透视图和实体,每个维都有一个表与之相关联,成为维表.Cuboid:Cuboid:all.ata多维数据立方体:提供数据的多维视图,度量:数值函数,通过对给定点的各维-值对聚集数据,计算该点的度量值.操作:上卷:上卷操作通过一个维的概念分层向上攀升或者通过维规约,在数据立方体上进行聚集.转轴:可视化操作,转动视角。钻过跨越多个事实表。钻透:钻到后端关系表。1.2、数据集市:3、虚拟仓库:虚拟仓库是操作数据库上视图的集合,易于建立,数据仓库的三层结构:12服务器:ROLAP:MOLAP.HOLAPMOLAP。31、分析建立企业模型并映射到数据仓库概念模型;23建模:维表设计(,(,1、2、3、数据的分割(4、表的合理划分(字段的更新频率和访问频率不一样5、(“销售总量")血统、流通,监控信息)2冰山立方体:是一个数据立方体,BUC:数据立方体允许以多维数据建模和观察,1.2.3.45位图索引:在给定属性的位图索引中,v都有一个位向量,长度为记录的总数,如10.,不连接索引:nT1(LiN概念封层,iMOLAP。,每个平面必须被排序,数据预处理:不完整的、含噪音的、不一致的1、数据清洗(缺失值((2(同数据源属性值不同))、34、数据规约((属性子集选择)53-45((层次高,义相关的属性集捆绑在一起)).噪声:被测量的变量的随机误差或方差.规范化:最小最大规范化;Zscore;数据规约技术:得到数据集的规约显示,属性子集选择:检测并删除不相关、弱相关或冗余的属性和维3维规约:使用编码机制减小数据集的规模,如压缩.离散化:概念描述:处理类型、自动化方面比较各自优缺点.description:restrictedtoauser-controlled1445、在初始工作关系上根据属性泛化阈值使用面向属性的归纳12、维相关分析(仅选择高度相关的维进一步分析,345condition(X):量化特征规则必要):T权:P—135condition(X):D权:—138,代表和对比类比有多大差别(高D概念主要从目标类导出)量化描述规则(充分必要:X,condition(X)[t:w,d:w]...condition(X)[t:w,d:w]111nnn关联规则挖掘:dataanalysis,cross—marketing,cataloglossanalysis,clustering,classification,etc.例子:form:“Bodysupport,buys“diapers”)buys[0major^takes(x,)grade,[1%,75频繁项集:频繁地在事务数据集中一起出现的项的集合,支持度:规则X&YZ的支持度,事务中包括{X、Z}置信度:在Z也在事务中的概率.两步过程:12k,kCkCkk或为空.LLk-1。1CL2kk-1C是L的超集,扫描数据库,Ckkk核心:用k瓶颈:候选项集计算量大尤其是12候选项集时数据库多次扫描,由产生频繁项集产生关联规则:由频繁项集直接产生强关联规则s-l-s,s为l1、基于散列的技术:一种基于散列的技术可以用于压缩候选keg:在2,51、2、3、提升度():B1B负相关,>1AB单维关联规则:包含单个谓词的关联规则。buys(X,“milk”)多维关联规则:维间关联规则:具有名不重复谓词。分层独立策略::61、2、3、treeoverfit7懒惰学习法:给定训练元组时,,1K2:3428溯12341、2、(的对象,3、直接密度可达:p从
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 买卖合同协议书样板
- 美业经营合同协议书范本
- 2025电器设备维修合同范本
- 2025关于航空货物运输合同的范本
- 央企公司入股合同协议书
- 2025个人贷款借款合同模板
- 装修合同协议书怎么签
- 行政组织理论中的领导角色分析试题答案
- iqc检验员考试试题及答案
- 开店合作协议书合同
- 空调风道改造技术方案
- 《卡诺循环演示》课件
- 前悬挂整秆式甘蔗收割机双刀盘切割与喂入装置设计与试验的中期报告
- 《林业科普知识》课件
- 国开电大操作系统-Linux系统使用-实验报告
- 说课IP地址课件
- 2022版消毒技术规范(护理部)
- 大班拼音活动《6个单韵母》课件
- 《小学生C++创意编程》第3单元课件 选择结构
- 《古代的村落、集镇和城市》统编版161
- KROHNE 转子流量计产品介绍 2022
评论
0/150
提交评论