数据仓库应用实例培训课件_第1页
数据仓库应用实例培训课件_第2页
数据仓库应用实例培训课件_第3页
数据仓库应用实例培训课件_第4页
数据仓库应用实例培训课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第9章 数据仓库应用实例 9.1数据仓库的数据加载与钻取 9.2数据挖掘模型的设计 9.3SQL Server中的数据挖掘工具 9.4数据仓库客户端界面的设计 9.1数数据据仓库的的数据加加载与钻钻取9.1.1数数据仓仓库的数数据加载载1.SQLServer的的数据复复制工具具与应用用5个有关关复制的的向导工工具:创创建和管管理发布布、强制制其它服服务器订订阅、请请求订阅阅、禁用用发布和和分布、配置发发布、订订阅服务务器和分分发SQLServer数据复复制向导导2.创建建发布向向导利用发布布向导可可以完成成这样一一些操作作:选择择发布数数据库。使用发发布模板板。选择择发布类类型。选选择可更更新

2、的订订阅。可可传送的的订阅(快照复复制或事事务复制制可使用用的选项项)。指指定订阅阅服务器器类型。指定要要发布的的数据和和数据库库对象项项目。选选择发布布名称和和描述。自定义义发布属属性,包包括筛选选列、筛筛选行、启用动动态筛选选器、验验证订阅阅信息、优化同同步、允允许匿名名订阅以以及设置置快照代代理调度度,以完完成数据据发布的的创建。数据发发布的开开始需要要在数据据发布服服务器上上打开SQLServer企业管理理器,展展开一个个服务器器组,展展开复制制文件夹夹,右击击发布文文件夹,然后单单击“新新建发布布”命令令,按照照向导提提示完成成数据的的分布创创建。3.创建建强制新新订阅向向导在强制订

3、订阅中,集中的的分发服服务器将将建立调调度,按按照此调调度与远远程的、偶尔连连接的订订阅服务务器进行行连接。使用强强制订阅阅,分发发代理程程序(用用于快照照发布和和事务发发布)或或合并代代理程序序(用于于合并发发布)可可以运行行于分发发服务器器。建立订阅阅时要考考虑的因因素是需需要订阅阅的类型型(强制制、请求求或匿名名)以及及运行复复制代理理程序的的位置。为了创建建订阅,发布服服务器上上必须有有发布,订阅服服务器上上也必须须有订阅阅数据库库。可以以在创建建订阅之之前创建建订阅数数据库,或在创创建强制制订阅向向导中指指定新的的订阅数数据库。可以为为任何在在发布服服务器和和分发服服务器的的属性中中

4、启用的的订阅服服务器创创建强制制订阅。3.创建建强制新新订阅向向导4.创建建请求订订阅向导导5.禁用用发布或或分布向向导在SQL Server的企企业管理理器中的的“工具具”菜单单中打开开向导菜菜单项,调出“选择向向导”对对话框,选择其其中的“复制”节点,选择“禁用发发布或分分布向导导”菜单单项。,进入“欢迎使使用禁用用发布或或分布向向导”对对话框。利用该该向导可可以完成成“除去去所选服服务器上上的所有有发布”或“除除去对应应已除去去发布的的所有订订阅”这这些设置置不会影影响到该该服务器器从其它它发布服服务器接接受到的的订阅。9.1.2超超市数数据仓库库系统的的数据加加载数据仓库库的数据据导入

5、9.1.2超超市数数据仓库库系统的的数据加加载DTS数数据导入入/导出出向导9.1.2超超市数数据仓库库系统的的数据加加载数据导入入源的选选择9.1.2超超市数数据仓库库系统的的数据加加载数据导入入源的确确定9.1.2超超市数数据仓库库系统的的数据加加载数据导入入目的库库选择9.1.2超超市数数据仓库库系统的的数据加加载数据导入入方式选选择9.1.2超超市数数据仓库库系统的的数据加加载导入数据据表和视视图的选选择9.1.2超超市数数据仓库库系统的的数据加加载数据导入入源和目目的的映映射确定定9.1.2超超市数数据仓库库系统的的数据加加载数据导入入的转换换语言9.1.2超超市数数据仓库库系统的的

6、数据加加载数据导入入任务包包的保存存与调度度9.1.2超超市数数据仓库库系统的的数据加加载任务包的的作业调调度任务包的的保存任务包完完成提示示任务包的的浏览9.1.3多多维数数据集的的更新DTS调调度包的的建立处理任务务框架选择处理理对象调度任务务处理选选项确定定任务的建建立任务工作作流确定定任务工作作流属性性设置DTS包包的保存存任务包的的调度设设置任务包的的运行时时间设置置9.1.4数数据仓仓库的钻钻取访问问1.数据据钻取的的进入2.数据据钻取选选项的确确定3.钻取取数据列列的选择择4.数据据钻取角角色的管管理在进行数数据钻取取前,还还需要利利用与编编辑命令令同一菜菜单中的的“管理理角色”

7、命令确确定可以以进行数数据钻取取的管理理人员。5.钻取取数据的的选择6.钻取取结果显显示9.1.5数数据仓仓库的多多维表达达式MDX应用用MDX启动顺序:开开始程序MicrosoftSQL ServerAnalysisServicesMDX示例应用用程序。启动MDX以后将出出现Connect对话框,在Server输入框中中输入AnalysisServices服务器名名称,Provider输入框中中输入MSOLAP,单击“OK”按钮后,出现示示例应用用程序窗窗口MDX新新查询建建立MDX查查询结果果显示MDX的的立方体体旋转显显示9.2数数据据挖掘模模型的设设计9.2.1数数据挖挖掘对象象的分析

8、析数据挖掘掘项目组组成员超市营销销策略评评价主要要通过门门市、商商品、营营销策略略、日期期和客户户五个维维度。要要分析的的则是商商品的销销售量、销售额额、商品品的成本本和商品品销售的的利润等等度量信信息。商品销售售量增长长率=(实施促促销策略略后商品品销售量量/实施促销销策略前前商品销销售量-1)100%商品销售售额增长长率=(实施促促销策略略后商品品销售额额/实施促销销策略前前商品销销售额)100%商品利润润增长率率=(实施促促销策略略后商品品利润/实施促销销策略前前商品利利润)100%商品促销销策略门门市影响响率=不同门市市相同促促销策略略商品利利润增长长率之比比商品促销销策略时时间影响响

9、率=不同时间间相同促促销策略略商品利利润增长长率之比比等各种种新的变变量。9.2.2数数据挖挖掘模型型与相关关数据的的准备1挖掘掘模型的的确定在过去的的若干年年中的业业务趋势势是什么么?在业业务的不不同分类类中有哪哪些最活活跃的因因素?不不同的元元素之间间是否存存在相关关性?最最感兴趣趣的分类类存在哪哪些地方方?不同同的分类类有哪些些层次?客户分成成“接收收促销”、“不不接收促促销”两两个分类类。将客户分分成三个个不同的的聚类,它们的的特征分分别有哪哪些?销销售额前前10个个商品聚聚类是什什么?它它们彼此此之间有有哪些不不同之处处?有时为了了解决一一些较大大的业务务问题,可能还还需要对对业务问

10、问题进行行分解,将业务务问题分分解成多多个较小小的问题题。如果果这些问问题能够够使用分分类、估估计、关关联分组组、聚类类、细分分或预测测等挖掘掘方法来来解决。那么这这一较大大的问题题也就可可以用数数据挖掘掘方法解解决。9.2.2数数据挖挖掘模型型与相关关数据的的准备将客户流流失问题题分解成成这样一一些问题题:那那些已经经或正在在流失的的客户具具有哪些些特征?能否否建立一一个预测测正在流流失客户户的模型型,预测测客户流流失行为为的发生生?能能否建立立一个模模型,进进一步预预测那些些将要流流失的客客户会在在什么时时候流失失?能能否建立立一个模模型解释释这些流流失客户户为什么么流失?对这些些分解以以

11、后的问问题就可可以使用用不同的的数据挖挖掘方法法来解决决。9.2.2数数据挖挖掘模型型与相关关数据的的准备可以使使用聚类类方法将将流失的的客户分分成不同同的组,这就能能够很好好地说明明那些流流失客户户的特征征。对问问题,则可以以将所有有客户划划分到“流失”和“不不流失”两个客客户类中中,这就就可以预预测那些些可能流流失的客客户。同同时,这这种分类类也可以以用来解解释问题题。而而对于问问题则则可以变变换一下下角度来来考虑,即开发发一个预预测模型型,预测测客户会会在“近近期”、“中期期”、“远期”流失,这样就就可以将将所有客客户分成成“近期期”、“中期”、“远远期”三三个流失失类。9.2.2数数据

12、挖挖掘模型型与相关关数据的的准备确定挖掘掘模型的的分析目目标或挖挖掘成功功的度量量值度量值的的确定步步骤:收收集企业业的关键键战略领领域报表表、识别别企业信信息量化化的度量量指标、对这些些度量指指标进行行编码、识别数数据挖掘掘解决业业务问题题的度量量指标、对度量量指标设设定基线线。例如,在在超市数数据挖掘掘中经常常进行度度量的指指标有:购买商商品的客客户百分分比、对对促销策策略响应应的客户户数、客客户购买买商品的的平均量量、某一一时间段段购买商商品的总总量或总总金额、商品销销售的利利润率。在确定定了度量量值以后后,还要要确定这这些度量量值的当当前值,以便在在数据挖挖掘以后后,采取取相应对对策后

13、的的比较。2挖掘掘数据的的准备建立数据据挖掘库库:选择择业务数数据、转转换业务务数据、验证业业务数据据。为数据挖挖掘工作作准备训训练数据据集与数数据验证证集:确确定数据据质量、准备适适当的数数据、为为目标变变量确定定初值、确定数数据挖掘掘变量的的格式。9.2.3数数据挖挖掘模型型的应用用注意多目目标变量量之间的的相互关关系确定多目目标变量量最终的的分析顺顺序剔除那些些对目标标变量具具有强相相关性的的变量挖掘模型型的维护护和完善善将所获得得挖掘结结果存储储进多维维数据集集9.3SQLServer中中的数据据挖掘工工具MSSQLServer2000中的的AnalysisServices可可以对关关系数据据库和多多维数据据源中的的数据进进行挖掘掘,因此此任何利利用OLEDB可以以访问的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论