




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章数据仓库应用实例
9.1数据仓库的数据加载与钻取
9.2数据挖掘模型的设计
9.3SQLServer中的数据挖掘工具
9.4数据仓库客户端界面的设计9.1数据仓库的数据加载与钻取9.1.1数据仓库的数据加载1.SQLServer的数据复制工具与应用5个有关复制的向导工具:创建和管理发布、强制其它服务器订阅、请求订阅、禁用发布和分布、配置发布、订阅服务器和分发SQLServer数据复制向导2.创建发布向导利用发布向导可以完成这样一些操作:选择发布数据库。使用发布模板。选择发布类型。选择可更新的订阅。可传送的订阅(快照复制或事务复制可使用的选项)。指定订阅服务器类型。指定要发布的数据和数据库对象项目。选择发布名称和描述。自定义发布属性,包括筛选列、筛选行、启用动态筛选器、验证订阅信息、优化同步、允许匿名订阅以及设置快照代理调度,以完成数据发布的创建。数据发布的开始需要在数据发布服务器上打开SQLServer企业管理器,展开一个服务器组,展开复制文件夹,右击发布文件夹,然后单击“新建发布”命令,按照向导提示完成数据的分布创建。3.创建强制新订阅向导在强制订阅中,集中的分发服务器将建立调度,按照此调度与远程的、偶尔连接的订阅服务器进行连接。使用强制订阅,分发代理程序(用于快照发布和事务发布)或合并代理程序(用于合并发布)可以运行于分发服务器。建立订阅时要考虑的因素是需要订阅的类型(强制、请求或匿名)以及运行复制代理程序的位置。为了创建订阅,发布服务器上必须有发布,订阅服务器上也必须有订阅数据库。可以在创建订阅之前创建订阅数据库,或在创建强制订阅向导中指定新的订阅数据库。可以为任何在发布服务器和分发服务器的属性中启用的订阅服务器创建强制订阅。3.创建强制新订阅向导4.创建请求订阅向导5.禁用发布或分布向导在SQLServer的企业管理器中的“工具”菜单中打开向导菜单项,调出“选择向导”对话框,选择其中的“复制”节点,选择“禁用发布或分布向导”菜单项。,进入“欢迎使用禁用发布或分布向导”对话框。利用该向导可以完成“除去所选服务器上的所有发布”或“除去对应已除去发布的所有订阅”这些设置不会影响到该服务器从其它发布服务器接受到的订阅。9.1.2超市数据仓库系统的数据加载数据仓库的数据导入9.1.2超市数据仓库系统的数据加载DTS数据导入/导出向导9.1.2超市市数据仓库库系统的数数据加载数据导入源源的选择9.1.2超市市数据仓库库系统的数数据加载数据导入源源的确定9.1.2超市市数据仓库库系统的数数据加载数据导入目目的库选择择9.1.2超市市数据仓库库系统的数数据加载数据导入方方式选择9.1.2超市市数据仓库库系统的数数据加载导入数据表表和视图的的选择9.1.2超市市数据仓库库系统的数数据加载数据导入源源和目的的的映射确定定9.1.2超市市数据仓库库系统的数数据加载数据导入的的转换语言言9.1.2超市市数据仓库库系统的数数据加载数据导入任任务包的保保存与调度度9.1.2超市市数据仓库库系统的数数据加载任务包的作作业调度任务包的保保存任务包完成成提示任务包的浏浏览9.1.3多维维数据集的的更新DTS调度度包的建立立处理任务框框架选择处理对对象调度任务处处理选项确确定任务的建立立任务工作流流确定任务工作流流属性设置置DTS包的的保存任务包的调调度设置任务包的运运行时间设设置9.1.4数据据仓库的钻钻取访问1.数据钻钻取的进入入2.数据钻钻取选项的的确定3.钻取数数据列的选选择4.数据钻钻取角色的的管理在进行数据据钻取前,,还需要利利用与编辑辑命令同一一菜单中的的“管理角角色”命令令确定可以以进行数据据钻取的管管理人员。。5.钻取数数据的选择择6.钻取结结果显示9.1.5数据据仓库的多多维表达式式MDX应应用MDX启动顺序:开始始→程序→→MicrosoftSQLServer→AnalysisServices→MDX示例例应用程序序。启动MDX以后后将出现Connect对话话框,在Server输入框框中输入AnalysisServices服务器名名称,Provider输入入框中输入入MSOLAP,单单击“OK”按钮后后,出现示示例应用程程序窗口MDX新查查询建立MDX查询询结果显示示MDX的立立方体旋转转显示9.2数数据挖掘掘模型的设设计9.2.1数据据挖掘对象象的分析数据挖掘项项目组成员员超市营销策策略评价主主要通过门门市、商品品、营销策策略、日期期和客户五五个维度。。要分析的的则是商品品的销售量量、销售额额、商品的的成本和商商品销售的的利润等度度量信息。。商品销售量量增长率=(实施促促销策略后后商品销售售量/实施施促销策略略前商品销销售量-1)×100%商品销售额额增长率=(实施促促销策略后后商品销售售额/实施施促销策略略前商品销销售额)××100%商品利润增增长率=((实施促销销策略后商商品利润/实施促销销策略前商商品利润))×100%商品品促促销销策策略略门门市市影影响响率率=不不同同门门市市相相同同促促销销策策略略商商品品利利润润增增长长率率之之比比商品品促促销销策策略略时时间间影影响响率率=不不同同时时间间相相同同促促销销策策略略商商品品利利润润增增长长率率之之比比等等各各种种新新的的变变量量。。数数据据挖挖掘掘模模型型与与相相关关数数据据的的准准备备1..挖挖掘掘模模型型的的确确定定在过过去去的的若若干干年年中中的的业业务务趋趋势势是是什什么么??在在业业务务的的不不同同分分类类中中有有哪哪些些最最活活跃跃的的因因素素??不不同同的的元元素素之之间间是是否否存存在在相相关关性性??最最感感兴兴趣趣的的分分类类存存在在哪哪些些地地方方??不不同同的的分分类类有有哪哪些些层层次次??客户分分成““接收收促销销”、、“不不接收收促销销”两两个分分类。。将客户户分成成三个个不同同的聚聚类,,它们们的特特征分分别有有哪些些?销销售额额前10个个商品品聚类类是什什么??它们们彼此此之间间有哪哪些不不同之之处??有时为了解解决一些较较大的业务务问题,可可能还需要要对业务问问题进行分分解,将业业务问题分分解成多个个较小的问问题。如果果这些问题题能够使用用分类、估估计、关联联分组、聚聚类、细分分或预测等等挖掘方法法来解决。。那么这一一较大的问问题也就可可以用数据据挖掘方法法解决。9.2.2数据据挖掘模型型与相关数数据的准备备将客户流失失问题分解解成这样一一些问题::①那些已已经或正在在流失的客客户具有哪哪些特征??②能否建建立一个预预测正在流流失客户的的模型,预预测客户流流失行为的的发生?③③能否建立立一个模型型,进一步步预测那些些将要流失失的客户会会在什么时时候流失??④能否建建立一个模模型解释这这些流失客客户为什么么流失?对对这些分解解以后的问问题就可以以使用不同同的数据挖挖掘方法来来解决。数数据据挖挖掘掘模模型型与与相相关关数数据据的的准准备备①可以使用聚聚类方法将流流失的客户分分成不同的组组,这就能够够很好地说明明那些流失客客户的特征。。对问题②,,则可以将所所有客户划分分到“流失””和“不流失失”两个客户户类中,这就就可以预测那那些可能流失失的客户。同同时,这种分分类也可以用用来解释问题题④。而对于于问题③则可可以变换一下下角度来考虑虑,即开发一一个预测模型型,预测客户户会在“近期期”、“中期期”、“远期期”流失,这这样就可以将将所有客户分分成“近期””、“中期””、“远期””三个流失类类。数数据据挖掘掘模型型与相相关数数据的的准备备确定挖挖掘模模型的的分析析目标标或挖挖掘成成功的的度量量值度量值值的确确定步步骤::收集集企业业的关关键战战略领领域报报表、、识别别企业业信息息量化化的度度量指指标、、对这这些度度量指指标进进行编编码、、识别别数据据挖掘掘解决决业务务问题题的度度量指指标、、对度度量指指标设设定基基线。。例如,,在超超市数数据挖挖掘中中经常常进行行度量量的指指标有有:购购买商商品的的客户户百分分比、、对促促销策策略响响应的的客户户数、、客户户购买买商品品的平平均量量、某某一时时间段段购买买商品品的总总量或或总金金额、、商品品销售售的利利润率率。在在确定定了度度量值值以后后,还还要确确定这这些度度量值值的当当前值值,以以便在在数据据挖掘掘以后后,采采取相相应对对策后后的比比较。。2.挖挖掘数数据的的准备备建立数数据挖挖掘库库:选选择业业务数数据、、转换换业务务数据据、验验证业业务数数据。。为数据据挖掘掘工作作准备备训练练数据据集与与数据据验证证集::确定定数据据质量量、准准备适适当的的数据据、为为目标标变量量确定定初值值、确确定数数据挖挖掘变变量的的格式式。数数据据挖掘掘模型型的应应用注意多多目标标变量量之间间的相相互关关系确定多多目标标变量量最终终的分分析顺顺序剔除那那些对对目标标变量量具有有强相相关性性的变变量挖掘模模型的的维护护和完完善将所获获得挖挖掘结结果存存储进进多维维数据据集9.3SQLServer中的的数据据挖掘掘工具具MSSQLServer2000中的的AnalysisServices可可以对对关系系数据据库和和多维维数据据源中中的数数据进进行挖挖掘,,因此此任何何利用用OLEDB可以以访问问的关关系数数据源源数据据以及及通过过AnalysisServices创创建的的多维维数据据集的的数据据都可可以训训
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 运动会观后感范文15篇
- 二年级数学口算题
- 一年级50以内加减法口算练习题
- 人教辽宁 九年级 下册 语文 第三单元《 词四首》习题课 课件
- 人教陕西 九年级 下册 语文 第三单元《 单元写作》习题课 课件
- 财务管理招聘
- 透析室上半年工作总结
- 新中式洋房居住区工程规划设计方案
- 东坑酒店蔬菜配送合同范例
- 军队聘用合同范例
- 2025届小米全球校园招聘启动(即将笔试)笔试参考题库附带答案详解
- 胆管癌手术护理
- 中小学生校服安全
- 2025 年小学劳动技术新课程标准(2022 版)标准试题
- 2023年宁夏回族自治区中考地理真题(原卷版)
- 2025年安全员C证考试题库及答案-
- 2025年全球及中国电子雷管芯片模组行业头部企业市场占有率及排名调研报告
- 2024年江西建设职业技术学院高职单招职业技能测验历年参考题库(频考版)含答案解析
- 小肠扭转病人护理查房
- 第二十届中央纪律检查委员会第四次全体会议公报学习解读
- 2025年国家财政部部属单位招聘47人历年高频重点提升(共500题)附带答案详解
评论
0/150
提交评论