版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第9章 数据仓库应用实例 9.1数据仓库的数据加载与钻取 9.2数据挖掘模型的设计 9.3SQL Server中的数据挖掘工具 9.4数据仓库客户端界面的设计 9.1 数据仓库的数据加载与钻取 9.1.1 数据仓库的数据加载 1.SQL Server的数据复制工具与应用5个有关复制的向导工具:创建和管理发布、强制其它服务器订阅、请求订阅、禁用发布和分布、配置发布、订阅服务器和分发 SQL Server数据复制向导 2.创建发布向导创建发布向导利用发布向导可以完成这样一些操作:选择发布数据库。使用发布模板。选择发布类型。选择可更新的订阅。可传送的订阅快照复制或事务复制可使用的选项)。指定订阅服务
2、器类型。指定要发布的数据和数据库对象项目。选择发布名称和描述。自定义发布属性,包括筛选列、筛选行、启用动态筛选器、验证订阅信息、优化同步、允许匿名订阅以及设置快照代理调度,以完成数据发布的创建。数据发布的开始需要在数据发布服务器上打开SQL Server企业管理器,展开一个服务器组,展开复制文件夹,右击发布文件夹,然后单击“新建发布命令,按照向导提示完成数据的分布创建。 3.创建强制新订阅向导创建强制新订阅向导在强制订阅中,集中的分发服务器将建立调度,按照此调度与远程的、偶尔连接的订阅服务器进行连接。使用强制订阅,分发代理程序用于快照发布和事务发布或合并代理程序用于合并发布可以运行于分发服务器
3、。建立订阅时要考虑的因素是需要订阅的类型强迫、请求或匿名以及运行复制代理程序的位置。为了创建订阅,发布服务器上必须有发布,订阅服务器上也必须有订阅数据库。可以在创建订阅之前创建订阅数据库,或在创建强制订阅向导中指定新的订阅数据库。可以为任何在发布服务器和分发服务器的属性中启用的订阅服务器创建强制订阅。3.创建强制新订阅向导创建强制新订阅向导4.创建请求订阅向导创建请求订阅向导5.禁用发布或分布向导禁用发布或分布向导在在SQL Server的企业管理器中的的企业管理器中的“工具菜工具菜单中打开向导菜单项,调出单中打开向导菜单项,调出“选择向导对选择向导对话框,选择其中的话框,选择其中的“复制节点
4、,选择复制节点,选择“禁禁用发布或分布向导菜单项。,进入用发布或分布向导菜单项。,进入“欢迎欢迎使用禁用发布或分布向导对话框。利用该使用禁用发布或分布向导对话框。利用该向导可以完成向导可以完成“除去所选服务器上的所有发除去所选服务器上的所有发布或布或“除去对应已除去发布的所有订阅除去对应已除去发布的所有订阅这些设置不会影响到该服务器从其它发布服这些设置不会影响到该服务器从其它发布服务器接受到的订阅。务器接受到的订阅。9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据仓库的数据导入 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载DTS数据导入/导出向导 9.1
5、.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据导入源的选择 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据导入源的确定 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据导入目的库选择 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据导入方式选择 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载导入数据表和视图的选择 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据导入源和目的的映射确定 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据导入的转换语言 9.1.2
6、超市数据仓库系统的数据加载超市数据仓库系统的数据加载数据导入任务包的保存与调度 9.1.2 超市数据仓库系统的数据加载超市数据仓库系统的数据加载任务包的作业调度 任务包的保存任务包的保存 任务包完成提示任务包完成提示 任务包的浏览任务包的浏览 9.1.3 多维数据集的更新多维数据集的更新DTS调度包的建立 处理任务框架处理任务框架 选择处理对象选择处理对象 调度任务处理选项确定调度任务处理选项确定 任务的建立任务的建立 任务工作流确定任务工作流确定 任务工作流属性设置任务工作流属性设置 DTS包的保存包的保存 任务包的调度设置任务包的调度设置 任务包的运行时间设置任务包的运行时间设置 9.1.
7、4 数据仓库的钻取访问数据仓库的钻取访问1.数数据据钻钻取取的的进进入入2.数据钻取选项的确定数据钻取选项的确定3.钻取数据列的选择钻取数据列的选择4.数据钻取角色的管理数据钻取角色的管理在进行数据钻取前,还需要利用与编辑命令同一菜单中的“管理角色命令确定可以进行数据钻取的管理人员。 5.钻取数据的选择钻取数据的选择6.钻取结果显示钻取结果显示9.1.5 数据仓库的多维表达式数据仓库的多维表达式MDX应用应用MDX启动顺序:开场程序Microsoft SQL ServerAnalysis ServicesMDX示例应用程序。启动MDX以后将出现Connect对话框,在Server输入框中输入A
8、nalysis Services服务器名称,Provider输入框中输入MSOLAP,单击“OK按钮后,出现示例应用程序窗口 MDX新查询建立新查询建立 MDX查询结果显示查询结果显示 MDX的立方体旋转显示的立方体旋转显示 9.2 数据挖掘模型的设计数据挖掘模型的设计9.2.1 数据挖掘对象的分析数据挖掘对象的分析数据挖掘项目组成员数据挖掘项目组成员 超市营销策略评价主要通过门市、商品、超市营销策略评价主要通过门市、商品、营销策略、日期和客户五个维度。要分营销策略、日期和客户五个维度。要分析的则是商品的销售量、销售额、商品析的则是商品的销售量、销售额、商品的成本和商品销售的利润等度量信息。的
9、成本和商品销售的利润等度量信息。商品销售量增长率商品销售量增长率=(实施促销策略后(实施促销策略后商品销售量商品销售量/实施促销策略前商品销售量实施促销策略前商品销售量-1)100%商品销售额增长率商品销售额增长率=(实施促销策略后(实施促销策略后商品销售额商品销售额/实施促销策略前商品销售额)实施促销策略前商品销售额)100%商品利润增长率商品利润增长率=(实施促销策略后商(实施促销策略后商品利润品利润/实施促销策略前商品利润)实施促销策略前商品利润)100%商品促销策略门市影响率商品促销策略门市影响率=不同门市相不同门市相同促销策略商品利润增长率之比同促销策略商品利润增长率之比商品促销策略
10、时间影响率商品促销策略时间影响率=不同时间相不同时间相同促销策略商品利润增长率之比等各种同促销策略商品利润增长率之比等各种新的变量。新的变量。 9.2.2 数据挖掘模型与相关数据的准备数据挖掘模型与相关数据的准备1挖掘模型的确定挖掘模型的确定在过去的若干年中的业务趋势是什么?在业务的不同在过去的若干年中的业务趋势是什么?在业务的不同分类中有哪些最活跃的因素?不同的元素之间是否存分类中有哪些最活跃的因素?不同的元素之间是否存在相关性?最感兴趣的分类存在哪些地方?不同的分在相关性?最感兴趣的分类存在哪些地方?不同的分类有哪些层次?类有哪些层次?客户分成客户分成“接收促销接收促销”、“不接收促销两个
11、分类。不接收促销两个分类。 将客户分成三个不同的聚类,它们的特征分别有哪些?将客户分成三个不同的聚类,它们的特征分别有哪些?销售额前销售额前10个商品聚类是什么?它们彼此之间有哪些个商品聚类是什么?它们彼此之间有哪些不同之处?不同之处?有时为了解决一些较大的业务问题,可能还需要对业有时为了解决一些较大的业务问题,可能还需要对业务问题进行分解,将业务问题分解成多个较小的问题。务问题进行分解,将业务问题分解成多个较小的问题。如果这些问题能够使用分类、估计、关联分组、聚类、如果这些问题能够使用分类、估计、关联分组、聚类、细分或预测等挖掘方法来解决。那么这一较大的问题细分或预测等挖掘方法来解决。那么这
12、一较大的问题也就可以用数据挖掘方法解决。也就可以用数据挖掘方法解决。 9.2.2 数据挖掘模型与相关数据的准备数据挖掘模型与相关数据的准备将客户流失问题分解成这样一些问题:将客户流失问题分解成这样一些问题:那些已经或那些已经或正在流失的客户具有哪些特征?正在流失的客户具有哪些特征?能否建立一个预测能否建立一个预测正在流失客户的模型,预测客户流失行为的发生?正在流失客户的模型,预测客户流失行为的发生?能否建立一个模型,进一步预测那些将要流失的客户能否建立一个模型,进一步预测那些将要流失的客户会在什么时候流失?会在什么时候流失?能否建立一个模型解释这些流能否建立一个模型解释这些流失客户为什么流失?
13、对这些分解以后的问题就可以使失客户为什么流失?对这些分解以后的问题就可以使用不同的数据挖掘方法来解决。用不同的数据挖掘方法来解决。9.2.2 数据挖掘模型与相关数据的准备数据挖掘模型与相关数据的准备可以使用聚类方法将流失的客户分成不同的组,这可以使用聚类方法将流失的客户分成不同的组,这就能够很好地说明那些流失客户的特征。对问题就能够很好地说明那些流失客户的特征。对问题,则可以将所有客户划分到则可以将所有客户划分到“流失和流失和“不流失两个不流失两个客户类中,这就可以预测那些可能流失的客户。同时,客户类中,这就可以预测那些可能流失的客户。同时,这种分类也可以用来解释问题这种分类也可以用来解释问题
14、。而对于问题。而对于问题则可则可以变换一下角度来考虑,即开发一个预测模型,预测以变换一下角度来考虑,即开发一个预测模型,预测客户会在客户会在“近期近期”、“中期中期”、“远期流失,这样远期流失,这样就可以将所有客户分成就可以将所有客户分成“近期近期”、“中期中期”、“远期远期三个流失类。三个流失类。 9.2.2 数据挖掘模型与相关数据的准备数据挖掘模型与相关数据的准备确定挖掘模型的分析目标或挖掘成功的度量值 度量值的确定步骤:收集企业的关键战略领域报表、识别企业信息量化的度量指标、对这些度量指标进行编码、识别数据挖掘解决业务问题的度量指标、对度量指标设定基线。例如,在超市数据挖掘中经常进行度量
15、的指标有:购买商品的客户百分比、对促销策略响应的客户数、客户购买商品的平均量、某一时间段购买商品的总量或总金额、商品销售的利润率。在确定了度量值以后,还要确定这些度量值的当前值,以便在数据挖掘以后,采取相应对策后的比较。 2挖掘数据的准备挖掘数据的准备建立数据挖掘库:选择业务数据、转换业务数据、验证业务数据。 为数据挖掘工作准备训练数据集与数据验证集:确定数据质量、准备适当的数据、为目标变量确定初值、确定数据挖掘变量的格式。9.2.3 数据挖掘模型的应用数据挖掘模型的应用注意多目标变量之间的相互关系 确定多目标变量最终的分析顺序 剔除那些对目标变量具有强相关性的变量 挖掘模型的维护和完善将所获得挖掘结果存储进多维数据集 9.3 SQL Server中的数据挖掘工具中的数据挖掘工具MS SQL Server20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 静电复印机项目营销计划书
- 扫雪机产业链招商引资的调研报告
- 创意写作行业相关项目经营管理报告
- 2024年份海鲜采购合同
- 2024年合作方:安能物流月结服务协议
- 软件开发外包协议书
- 2024年合作意向书模板:双方共同发展协议
- 2024年个人借给公司款项合同
- 医用球囊导管产业链招商引资的调研报告
- 2024年双边劳动合同范本
- 肺结节科普知识宣讲
- 网络直播营销
- 2024年节能减排培训资料
- 2024传染病预防ppt课件完整版
- 2024年华融实业投资管理有限公司招聘笔试参考题库含答案解析
- 2024年1月普通高等学校招生全国统一考试适应性测试(九省联考)历史试题(适用地区:贵州)含解析
- 《宽容待人 正确交往》班会课件
- HSK五级必过考前辅导课件
- 小儿胃肠功能紊乱护理查房课件
- 大学生职业生涯规划书铁道工程
- 2024年中国铁路国际有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论