




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章数据仓库应用实例
9.1数据仓库的数据加载与钻取
9.2数据挖掘模型的设计
9.3SQLServer中的数据挖掘工具
9.4数据仓库客户端界面的设计9.1数据仓库的数据加载与钻取9.1.1数据仓库的数据加载1.SQLServer的数据复制工具与应用5个有关复制的向导工具:创立和管理发布、强制其它效劳器订阅、请求订阅、禁用发布和分布、配置发布、订阅效劳器和分发SQLServer数据复制向导2.创立发布向导利用发布向导可以完成这样一些操作:选择发布数据库。使用发布模板。选择发布类型。选择可更新的订阅。可传送的订阅〔快照复制或事务复制可使用的选项〕。指定订阅效劳器类型。指定要发布的数据和数据库对象工程。选择发布名称和描述。自定义发布属性,包括筛选列、筛选行、启用动态筛选器、验证订阅信息、优化同步、允许匿名订阅以及设置快照代理调度,以完成数据发布的创立。数据发布的开始需要在数据发布效劳器上翻开SQLServer企业管理器,展开一个效劳器组,展开复制文件夹,右击发布文件夹,然后单击“新建发布〞命令,按照向导提示完成数据的分布创立。3.创立强制新订阅向导在强制订阅中,集中的分发效劳器将建立调度,按照此调度与远程的、偶尔连接的订阅效劳器进行连接。使用强制订阅,分发代理程序〔用于快照发布和事务发布〕或合并代理程序〔用于合并发布〕可以运行于分发效劳器。建立订阅时要考虑的因素是需要订阅的类型〔强制、请求或匿名〕以及运行复制代理程序的位置。为了创立订阅,发布效劳器上必须有发布,订阅效劳器上也必须有订阅数据库。可以在创立订阅之前创立订阅数据库,或在创立强制订阅向导中指定新的订阅数据库。可以为任何在发布效劳器和分发效劳器的属性中启用的订阅效劳器创立强制订阅。3.创立强制新订阅向导4.创立请求订阅向导5.禁用发布或分布向导在SQLServer的企业管理器中的“工具〞菜单中翻开向导菜单项,调出“选择向导〞对话框,选择其中的“复制〞节点,选择“禁用发布或分布向导〞菜单项。,进入“欢送使用禁用发布或分布向导〞对话框。利用该向导可以完成“除去所选效劳器上的所有发布〞或“除去对应已除去发布的所有订阅〞这些设置不会影响到该效劳器从其它发布效劳器接受到的订阅。9.1.2超市数据仓库系统的数据加载数据仓库的数据导入9.1.2超市数据仓库系统的数据加载DTS数据导入/导出向导9.1.2超市数据仓库系统的数据加载数据导入源的选择9.1.2超市数据仓库系统的数据加载数据导入源确实定9.1.2超市数据仓库系统的数据加载数据导入目的库选择9.1.2超市数据仓库系统的数据加载数据导入方式选择9.1.2超市数据仓库系统的数据加载导入数据表和视图的选择9.1.2超市数据仓库系统的数据加载数据导入源和目的的映射确定9.1.2超市数据仓库系统的数据加载数据导入的转换语言9.1.2超市数据仓库系统的数据加载数据导入任务包的保存与调度9.1.2超市数据仓库系统的数据加载任务包的作业调度任务包的保存
任务包完成提示
任务包的浏览
9.1.3多维数据集的更新DTS调度包的建立处理任务框架
选择处理对象
调度任务处理选项确定
任务的建立
任务工作流确定
任务工作流属性设置
DTS包的保存
任务包的调度设置
任务包的运行时间设置
9.1.4数据仓库的钻取访问1.数据钻取的进入2.数据钻取选项确实定3.钻取数据列的选择4.数据钻取角色的管理在进行数据钻取前,还需要利用与编辑命令同一菜单中的“管理角色〞命令确定可以进行数据钻取的管理人员。5.钻取数据的选择6.钻取结果显示9.1.5数据仓库的多维表达式MDX应用MDX启动顺序:开始→程序→MicrosoftSQLServer→AnalysisServices→MDX例如应用程序。启动MDX以后将出现Connect对话框,在Server输入框中输入AnalysisServices效劳器名称,Provider输入框中输入MSOLAP,单击“OK〞按钮后,出现例如应用程序窗口MDX新查询建立
MDX查询结果显示
MDX的立方体旋转显示
9.2数据挖掘模型的设计9.2.1数据挖掘对象的分析数据挖掘工程组成员超市营销策略评价主要通过门市、商品、营销策略、日期和客户五个维度。要分析的那么是商品的销售量、销售额、商品的本钱和商品销售的利润等度量信息。商品销售量增长率=〔实施促销策略后商品销售量/实施促销策略前商品销售量-1〕×100%商品销售额增长率=〔实施促销策略后商品销售额/实施促销策略前商品销售额〕×100%商品利润增长率=〔实施促销策略后商品利润/实施促销策略前商品利润〕×100%商品促销策略门市影响率=不同门市相同促销策略商品利润增长率之比商品促销策略时间影响率=不同时间相同促销策略商品利润增长率之比等各种新的变量。
9.2.2数据挖掘模型与相关数据的准备1.挖掘模型确实定在过去的假设干年中的业务趋势是什么?在业务的不同分类中有哪些最活泼的因素?不同的元素之间是否存在相关性?最感兴趣的分类存在哪些地方?不同的分类有哪些层次?客户分成“接收促销〞、“不接收促销〞两个分类。将客户分成三个不同的聚类,它们的特征分别有哪些?销售额前10个商品聚类是什么?它们彼此之间有哪些不同之处?有时为了解决一些较大的业务问题,可能还需要对业务问题进行分解,将业务问题分解成多个较小的问题。如果这些问题能够使用分类、估计、关联分组、聚类、细分或预测等挖掘方法来解决。那么这一较大的问题也就可以用数据挖掘方法解决。9.2.2数据挖掘模型与相关数据的准备将客户流失问题分解成这样一些问题:①那些已经或正在流失的客户具有哪些特征?②能否建立一个预测正在流失客户的模型,预测客户流失行为的发生?③能否建立一个模型,进一步预测那些将要流失的客户会在什么时候流失?④能否建立一个模型解释这些流失客户为什么流失?对这些分解以后的问题就可以使用不同的数据挖掘方法来解决。9.2.2数据挖掘模型与相关数据的准备①可以使用聚类方法将流失的客户分成不同的组,这就能够很好地说明那些流失客户的特征。对问题②,那么可以将所有客户划分到“流失〞和“不流失〞两个客户类中,这就可以预测那些可能流失的客户。同时,这种分类也可以用来解释问题④。而对于问题③那么可以变换一下角度来考虑,即开发一个预测模型,预测客户会在“近期〞、“中期〞、“远期〞流失,这样就可以将所有客户分成“近期〞、“中期〞、“远期〞三个流失类。
9.2.2数据挖掘模型与相关数据的准备确定挖掘模型的分析目标或挖掘成功的度量值度量值确实定步骤:收集企业的关键战略领域报表、识别企业信息量化的度量指标、对这些度量指标进行编码、识别数据挖掘解决业务问题的度量指标、对度量指标设定基线。例如,在超市数据挖掘中经常进行度量的指标有:购置商品的客户百分比、对促销策略响应的客户数、客户购置商品的平均量、某一时间段购置商品的总量或总金额、商品销售的利润率。在确定了度量值以后,还要确定这些度量值的当前值,以便在数据挖掘以后,采取相应对策后的比较。2.挖掘数据的准备建立数据挖掘库:选择业务数据、转换业务数据、验证业务数据。为数据挖掘工作准备训练数据集与数据验证集:确定数据质量、准备适当的数据、为目标变量确定初值、确定数据挖掘变量的格式。9.2.3数据挖掘模型的应用注意多目标变量之间的相互关系确定多目标变量最终的分析顺序剔除那些对目标变量具有强相关性的变量挖掘模型的维护和完善将所获得挖掘结果存储进多维数据集9.3SQLServer中的数据挖掘工具MSSQLServer2000中的AnalysisServices可以对关系数据库和多维数据源中的数据进行挖掘,因此任何利用OLEDB可以访问的关系数据源数据以及通过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广东省深圳市龙岗实验中学下学期学业水平监测期末联考初三化学试题含解析
- 丘北县2025年四下数学期末考试试题含解析
- 天津机电职业技术学院《环境风险评价与应急预案课程设计》2023-2024学年第二学期期末试卷
- 河北省衡水十三中2024-2025学年高中毕业班第一次诊断性检测试题物理试题文试题含解析
- 绩溪县2025届三下数学期末统考试题含解析
- 广东省深圳市耀华实验学校2025年高三下学期(4月)月考数学试题试卷含解析
- 山西青年职业学院《养猪学》2023-2024学年第二学期期末试卷
- 抖音直播官方课程
- 12经络知识课件
- 人教(部编版)道德与法治八下 7.1 自由平等的真谛 教学设计
- 砌墙施工班组劳务分包合同
- 2025年内蒙古自治区中考一模语文试题(原卷版+解析版)
- 合同范本之消防栓安装施工合同5篇
- 2025-2030中国药物滥用检测服务行业市场发展趋势与前景展望战略研究报告
- 生物-四川省宜宾市、乐山市、自贡市普通高中2022级(2025届)第二次诊断性测试(宜宾乐山自贡三市二诊)试题和答案
- 【初中生物】食物中营养物质课件2024-2025学年人教版生物七年级下册
- 2025-2030中国儿科用药行业深度调研及投资前景预测研究报告
- 矿产资源开发合作框架协议书范本
- 2025年宁波卫生职业技术学院单招职业技能测试题库附答案
- 2025年共青团入团积极分子考试测试试卷题库及答案
- 桩基工程技术标投标文件(技术方案)
评论
0/150
提交评论