数据仓库应用实例培训课件(ppt-50页)_第1页
数据仓库应用实例培训课件(ppt-50页)_第2页
数据仓库应用实例培训课件(ppt-50页)_第3页
数据仓库应用实例培训课件(ppt-50页)_第4页
数据仓库应用实例培训课件(ppt-50页)_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第9章 数据仓库应用实例 9.1数据仓库的数据加载与钻取 9.2数据挖掘模型的设计 9.3SQL Server中的数据挖掘工具 9.4数据仓库客户端界面的设计 9.1 数据仓库的数据加载与钻取 9.1.1 数据仓库的数据加载 1.SQL Server的数据复制工具与应用 5个有关复制的向导工具:创建和管理发布、强制其它服务器订阅、请求订阅、禁用发布和分布、配置发布、订阅服务器和分发 SQL Server数据复制向导 2.创建发布向导利用发布向导可以完成这样一些操作:选择发布数据库。使用发布模板。选择发布类型。选择可更新的订阅。可传送的订阅(快照复制或事务复制可使用的选项)。指定订阅服务器类型。

2、指定要发布的数据和数据库对象项目。选择发布名称和描述。自定义发布属性,包括筛选列、筛选行、启用动态筛选器、验证订阅信息、优化同步、允许匿名订阅以及设置快照代理调度,以完成数据发布的创建。数据发布的开始需要在数据发布服务器上打开SQL Server企业管理器,展开一个服务器组,展开复制文件夹,右击发布文件夹,然后单击“新建发布”命令,按照向导提示完成数据的分布创建。 3.创建强制新订阅向导在强制订阅中,集中的分发服务器将建立调度,按照此调度与远程的、偶尔连接的订阅服务器进行连接。使用强制订阅,分发代理程序(用于快照发布和事务发布)或合并代理程序(用于合并发布)可以运行于分发服务器。建立订阅时要考

3、虑的因素是需要订阅的类型(强制、请求或匿名)以及运行复制代理程序的位置。为了创建订阅,发布服务器上必须有发布,订阅服务器上也必须有订阅数据库。可以在创建订阅之前创建订阅数据库,或在创建强制订阅向导中指定新的订阅数据库。可以为任何在发布服务器和分发服务器的属性中启用的订阅服务器创建强制订阅。3.创建强制新订阅向导4.创建请求订阅向导5.禁用发布或分布向导在SQL Server的企业管理器中的“工具”菜单中打开向导菜单项,调出“选择向导”对话框,选择其中的“复制”节点,选择“禁用发布或分布向导”菜单项。,进入“欢迎使用禁用发布或分布向导”对话框。利用该向导可以完成“除去所选服务器上的所有发布”或“

4、除去对应已除去发布的所有订阅”这些设置不会影响到该服务器从其它发布服务器接受到的订阅。9.1.2 超市数据仓库系统的数据加载数据仓库的数据导入 9.1.2 超市数据仓库系统的数据加载DTS数据导入/导出向导 9.1.2 超市数据仓库系统的数据加载数据导入源的选择 9.1.2 超市数据仓库系统的数据加载数据导入源的确定 9.1.2 超市数据仓库系统的数据加载数据导入目的库选择 9.1.2 超市数据仓库系统的数据加载数据导入方式选择 9.1.2 超市数据仓库系统的数据加载导入数据表和视图的选择 9.1.2 超市数据仓库系统的数据加载数据导入源和目的的映射确定 9.1.2 超市数据仓库系统的数据加载

5、数据导入的转换语言 9.1.2 超市数据仓库系统的数据加载数据导入任务包的保存与调度 9.1.2 超市数据仓库系统的数据加载任务包的作业调度 任务包的保存 任务包完成提示 任务包的浏览 9.1.3 多维数据集的更新DTS调度包的建立 处理任务框架 选择处理对象 调度任务处理选项确定 任务的建立 任务工作流确定 任务工作流属性设置 DTS包的保存 任务包的调度设置 任务包的运行时间设置 9.1.4 数据仓库的钻取访问1.数据钻取的进入2.数据钻取选项的确定3.钻取数据列的选择4.数据钻取角色的管理在进行数据钻取前,还需要利用与编辑命令同一菜单中的“管理角色”命令确定可以进行数据钻取的管理人员。

6、5.钻取数据的选择6.钻取结果显示9.1.5 数据仓库的多维表达式MDX应用MDX启动顺序:开始程序Microsoft SQL ServerAnalysis ServicesMDX示例应用程序。启动MDX以后将出现Connect对话框,在Server输入框中输入Analysis Services服务器名称,Provider输入框中输入MSOLAP,单击“OK”按钮后,出现示例应用程序窗口 MDX新查询建立 MDX查询结果显示 MDX的立方体旋转显示 9.2 数据挖掘模型的设计9.2.1 数据挖掘对象的分析数据挖掘项目组成员 超市营销策略评价主要通过门市、商品、营销策略、日期和客户五个维度。要分

7、析的则是商品的销售量、销售额、商品的成本和商品销售的利润等度量信息。商品销售量增长率=(实施促销策略后商品销售量/实施促销策略前商品销售量-1)100%商品销售额增长率=(实施促销策略后商品销售额/实施促销策略前商品销售额)100%商品利润增长率=(实施促销策略后商品利润/实施促销策略前商品利润)100%商品促销策略门市影响率=不同门市相同促销策略商品利润增长率之比商品促销策略时间影响率=不同时间相同促销策略商品利润增长率之比等各种新的变量。 9.2.2 数据挖掘模型与相关数据的准备1挖掘模型的确定在过去的若干年中的业务趋势是什么?在业务的不同分类中有哪些最活跃的因素?不同的元素之间是否存在相

8、关性?最感兴趣的分类存在哪些地方?不同的分类有哪些层次?客户分成“接收促销”、“不接收促销”两个分类。 将客户分成三个不同的聚类,它们的特征分别有哪些?销售额前10个商品聚类是什么?它们彼此之间有哪些不同之处?有时为了解决一些较大的业务问题,可能还需要对业务问题进行分解,将业务问题分解成多个较小的问题。如果这些问题能够使用分类、估计、关联分组、聚类、细分或预测等挖掘方法来解决。那么这一较大的问题也就可以用数据挖掘方法解决。 9.2.2 数据挖掘模型与相关数据的准备将客户流失问题分解成这样一些问题:那些已经或正在流失的客户具有哪些特征?能否建立一个预测正在流失客户的模型,预测客户流失行为的发生?

9、能否建立一个模型,进一步预测那些将要流失的客户会在什么时候流失?能否建立一个模型解释这些流失客户为什么流失?对这些分解以后的问题就可以使用不同的数据挖掘方法来解决。9.2.2 数据挖掘模型与相关数据的准备可以使用聚类方法将流失的客户分成不同的组,这就能够很好地说明那些流失客户的特征。对问题,则可以将所有客户划分到“流失”和“不流失”两个客户类中,这就可以预测那些可能流失的客户。同时,这种分类也可以用来解释问题。而对于问题则可以变换一下角度来考虑,即开发一个预测模型,预测客户会在“近期”、“中期”、“远期”流失,这样就可以将所有客户分成“近期”、“中期”、“远期”三个流失类。 9.2.2 数据挖

10、掘模型与相关数据的准备确定挖掘模型的分析目标或挖掘成功的度量值 度量值的确定步骤:收集企业的关键战略领域报表、识别企业信息量化的度量指标、对这些度量指标进行编码、识别数据挖掘解决业务问题的度量指标、对度量指标设定基线。例如,在超市数据挖掘中经常进行度量的指标有:购买商品的客户百分比、对促销策略响应的客户数、客户购买商品的平均量、某一时间段购买商品的总量或总金额、商品销售的利润率。在确定了度量值以后,还要确定这些度量值的当前值,以便在数据挖掘以后,采取相应对策后的比较。 2挖掘数据的准备建立数据挖掘库:选择业务数据、转换业务数据、验证业务数据。 为数据挖掘工作准备训练数据集与数据验证集:确定数据

11、质量、准备适当的数据、为目标变量确定初值、确定数据挖掘变量的格式。9.2.3 数据挖掘模型的应用注意多目标变量之间的相互关系 确定多目标变量最终的分析顺序 剔除那些对目标变量具有强相关性的变量 挖掘模型的维护和完善将所获得挖掘结果存储进多维数据集 9.3 SQL Server中的数据挖掘工具MS SQL Server2000中的Analysis Services可以对关系数据库和多维数据源中的数据进行挖掘,因此任何利用OLE DB可以访问的关系数据源数据以及通过Analysis Services创建的多维数据集的数据都可以训练挖掘模型。而且SQL Server系统的可扩展性使第三方工具能够与S

12、QL Server的数据挖掘工具组装使用,提高了系统的性能与灵活性。 Analysis Services中所提供的数据挖掘模型主要是两种:Microsoft决策树模型和Microsoft数据聚集模型。(第14讲)考场作文开拓文路能力分解层次(网友来稿)江苏省镇江中学 陈乃香说明:本系列稿共24讲,20XX年1月6日开始在资源上连载【要义解说】文章主旨确立以后,就应该恰当地分解层次,使几个层次构成一个有机的整体,形成一篇完整的文章。如何分解层次主要取决于表现主旨的需要。【策略解读】一般说来,记人叙事的文章常按时间顺序分解层次,写景状物的文章常按时间顺序、空间顺序分解层次;说明文根据说明对象的特点

13、,可按时间顺序、空间顺序或逻辑顺序分解层次;议论文主要根据“提出问题分析问题解决问题”顺序来分解层次。当然,分解层次不是一层不变的固定模式,而应该富于变化。文章的层次,也常常有些外在的形式:1小标题式。即围绕话题把一篇文章划分为几个相对独立的部分,再给它们加上一个简洁、恰当的小标题。如世界改变了模样四个小标题:寿命变“长”了、世界变“小”了、劳动变“轻”了、文明变“绿”了。 2序号式。序号式作文与小标题作文有相同的特点。序号可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”从全文看,序号式干净、明快;但从题目上看,却看不出文章内容,只是标明了层次与部分。有时序号式作文,也适用于

14、叙述性文章,为故事情节的展开,提供了明晰的层次。 3总分式。如高考佳作人生也是一张答卷。开头:“人生就是一张答卷。它上面有选择题、填空题、判断题和问答题,但它又不同于一般的答卷。一般的答卷用手来书写,人生的答卷却要用行动来书写。”主体部分每段首句分别为:选择题是对人生进行正确的取舍,填空题是充实自己的人生,判断题是表明自己的人生态度,问答题是考验自己解决问题的能力。这份“试卷”设计得合理而且实在,每个人的人生都是不同的,这就意味着这份人生试卷的“答案是丰富多彩的”。分解层次,应追求作文美学的三个价值取向:一要匀称美。什么材料在前,什么材料在后,要合理安排;什么材料详写,什么材料略写,要通盘考虑

15、。自然段是构成文章的基本单位,恰当划分自然段,自然就成为分解层次的基本要求。该分段处就分段,不要老是开头、正文、结尾“三段式”,这种老套的层次显得呆板。二要波澜美。文章内容应该有张有弛,有起有伏,如波如澜。只有这样才能使文章起伏错落,一波三折,吸引读者。三要圆合美。文章的开头与结尾要遥相照应,把开头描写的事物或提出的问题,在结尾处用各种方式加以深化或回答,给人首尾圆合的感觉。【例文解剖】 话题:忙忙,不亦乐乎 忙,是人生中一个个步骤,每个人所忙的事务不同,但是不能是碌碌无为地白忙,要忙就忙得精彩,忙得不亦乐乎。 忙是问号。忙看似简单,但其中却大有学问。忙是人生中不可缺少的一部分,但是怎么才能忙

16、出精彩,忙得不亦乐乎,却并不简单。人生如同一张地图,我们一直在自己的地图上行走,时不时我们眼前就出现一个十字路口,我们该向哪儿,面对那纵轴横轴相交的十字路口,我们该怎样选择?不急,静下心来分析一下,选择适合自己的坐标轴才是最重要的。忙就是如此,选择自己该忙的才能忙得有意义。忙是问号,这个问号一直提醒我们要忙得有意义,忙得不亦乐乎。 忙是省略号。四季在有规律地进行着冷暖交替,大自然就一直按照这样的规律不停地忙,人们亦如此。为自己找一个目标,为目标而不停地忙,让这种忙一直忙下去。当目标已达成,那么再找一个目标,继续这样忙,就像省略号一样,毫无休止地忙下去,翻开历史的长卷,我们看到牛顿在忙着他的实验

17、;爱迪生在忙着思考;徐霞客在忙着记载游玩;李时珍在忙着编写本草纲目。再看那位以笔为刀枪的充满着朝气与力量的文学泰斗鲁迅,他正忙着用他独有的刀和枪在不停地奋斗。忙是省略号,确定了一个目标那么就一直忙下去吧!这样的忙一定会忙出生命灵动的色彩。 忙是惊叹号。世界上的人都在忙着自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜为回报。那么人呢?居里夫人的忙,以放射性元素的发现而得到了圆满的休止符;爱因斯坦在忙,以相对论的问世而画上了惊叹号;李白的忙,以那豪放的诗歌而有了很大的成功;张衡的忙,因为那地动仪的问世而让世人仰慕。每个人都应该有效率的忙,而不是整天碌碌无为地白忙。人生是有限的、短暂的,因此,每个人都应

18、该在有限的生命里忙出属于他的惊叹号;都应在有限的生命里忙出他的人生精彩篇章。 忙是万物、世界、人生中都不可缺少的一部分。作为这世上最高级动物的我们,我们在忙什么呢?我们要忙得有意义,有价值,我们要忙出属于我们的精彩。我们的忙不能永远是问号,而应是省略号和感叹号。忙就要忙得精彩,忙得不亦乐乎。 解剖:本文将生活中的一句口头禅“忙得不亦乐乎”机智翻新,拟作标题,亮出一道美丽的风景。并据此展开述说,让人神清气爽。文章开篇扣题,亮出观点:忙,是人生中一个个步骤,不能碌碌无为地白忙,要忙就忙得精彩,忙得不亦乐乎。然后,作者分别用问号、省略号、惊叹号巧妙设喻,抓住这三种标点符号的特征,摆实事,讲道理,入情入理,入理入心。深刻地阐明人生忙,忙要像问号一样,经常问问自己,不能盲目,不能瞎忙,要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论