




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库和决策支持系统主讲:鲁明羽大连海事大学计算机科学与技术学院研究方向:智能数据分析与数据挖掘电话mail:lumingyu@第7章数数据仓仓库开发发实例目录录7.1超市销售售数据仓仓库的规规划与分分析7.2数据仓库库开发工工具简介介7.3SQLServer的数据据仓库创创建7.4SQLServer数据仓仓库事实实表与多多维数据据集的建建立7.1超超市销销售数据据仓库的的规划与与分析某大型连连锁超市市的业务务涵盖于于3个省省范围内内的1000多多家门市市。每个门市市都有较较完整的的日用品品和食品品销售部部门,包包括百货货、杂货货、冷冻冻食品、、奶制品品、肉制制品和面面包食品品等,大大约5万万多种,,其中大大约45000种商品品来自外外部生产产厂家,,并在包包装上印印有条形形码。每每个条形形码代表表了唯一一的商品品。为该超市市建立一一个能够够提高市市场竞争争能力的的数据仓仓库,首首先需要要进行数数据仓库库的规划划分析。。这就涉涉及到对对数据仓仓库的需需求分析析、模型型构建两两个过程程。7.1..1超超市销售售数据仓仓库的需需求分析析1、超市市营销售售策略分分析超市最高高层管理理所关注注的是如如何通过过商品的的采购、、储存与与销售,,最大限限度地获获取利润润。需要通过过加强对对每种商商品的管管理,降降低商品品的采购购成本和和管理费费用,吸吸引尽可可能多的的客户。。其中最重重要的是是关于商品促销销的管理理决策。需要依依靠合适适的促销销活动,,应用适适当的促促销策略略针对合合适的客客户,以以增加超超市的销销售利润润,是超超市数据据仓库建建设的基基本需求求。超市不同同商品的的销售利利润是有有差别的的。希望望在数据据仓库中中通过对对商品的的赢利分分析,了了解不同同商品的的销售赢赢利状态态,以确确定企业业的销售售重点,,对那些些可以为为企业带带来较大大赢利的的商品加加大促销销力度。。7.1..1超超市销售售数据仓仓库的需需求分析析2、超市市商品库库存分析析超市商品品的库存存状况对对超市的的利润具具有巨大大的影响响。超市市如果能能够在合合适的时时候销售售合适的的商品,,在不出出现脱销销的情况况下尽可能减减少商品品库存的的库存成成本,是超市市商品库库存分析析的主要要目的。。在商品库库存分析析中,管管理人员员还经常常要根据据商品的的库存量量和商品品库存成成本确定定商品的的销售价价格。从超市的的商品库库存情况况来看,,库存分分析实质质上是对对超市的的价值链链进行分分析,分分析商品品库存环环节在超超市的整整个价值值链上所所发挥的的作用。。3、超市市商品采采购分析析超市在商商品采购购工作中中需要分分析哪些些商品是是热销的的商品,,尽可能采采购销售售热销商商品。热销商品品往往是是加快企企业资金金流动的的动力,,快速流流动的资资金可以以使企业业在一定定的时间间内取得得比其他他企业更更多的利利润。超市营销销管理人人员在了了解热销销商品后后,可以以大量采采购热销销商品,,重新安安排热销销商品的的货架,,向更多多的客户户推销热热销商品品,便于于更多客客户的购购买,以以进一步步加快企企业资金金的流动动。7.1..1超超市销售售数据仓仓库的需需求分析析4、超市市客户关关系分析析用80::20理理论分析析,占企企业客户户群20%左右右的客户户购买金金额往往往占据了了企业销销售金额额的80%。对客户群群体的划划分有利利于企业业了解企企业的主主要客户户群体状状况、主主要客户户群对企企业销售售服务的的需求状状况、不不同客户户群为企企业所带带来的利利润状况况。在对客户户进行类类型划分分的基础础上,可可以针对不同同客户群群体的特特点采用用不同的的营销策策略,对客户户群体的的消费进进行合理理的引导导。超市客户户的流失失,意味味着企业业赢利的的降低。。企业管管理者希希望了解解哪些客客户可能能会流失失,使企企业能够够提前设设法挽留客户户。7.1..1超超市销售售数据仓仓库的需需求分析析7.1..2超超市销售售数据仓仓库E--R模型型构造数据仓库库设计中中需首先先考虑营营销主题题的设计计,确定定超市营营销主题题模型。。雪花模型型通过对对维表的的分类细细化描述述,对于于主题的的分类详详细查询询具有良良好的响响应能力力。但是是雪花模模型的构构造在本本质上是是一种数数据模型型的规范范化处理理,会给给数据仓仓库操作作带来不不同表的的连接困困难。。在对维维度表进进行维护护时,可可能需要要对大量量重复值值进行修修改。星型模型型通过对对维表的的冗余应应用,以以牺牲维维表空间间来换取取数据仓仓库的高高性能与与易使用用的优势势。因此,拟拟采用星星型模型型,而不不采用雪雪花模型型。7.1..3超超市数据据仓库事事实表模模型需要确定定数据仓仓库中多多大的粒粒度数据据才能满满足管理理人员对对数据仓仓库营销销策划分分析的需需要。超市商品品销售主主题中,,最理想想的原子子数据是是来自POS机机上的每每个销售售事务数数据分析超市市高层管管理人员员通过哪哪些角度度,即需需要通过过那些维维度来考考察、选选择营销销方案。。一般情况况下,在在确定超超市营销销策划时时,超市市管理人人员需要要通过日日期、商商品、门门市、促促销和客客户五个个维度对对促销方方案进行行分析,,了解促促销方案案的可用用性和效效果日期商品促销客户门市商品营销超市营销销数据仓仓库事实实表模型型超市营销销数据仓仓库事实实表模型型超市营销销主题日期关键键字门市关键键字商品关键键字促销关键键字商品销售售编号商品销售售量商品销售售额商品成本本商品销售售利润日期维日期关键键字商品维商品关键键字门市维门市关键键字促销维促销关键键字客户维客户关键键字超市营销销数据仓仓库事实实表模型型从销售系系统中,,可直接接获取商商品销售售量、销销售单价价、商品品成本等等数据。。管理人员员考察超超市的营营销策略略时,需需要考虑虑营销策略略和相应的的商品销售售利润。商品销售售利润可可以直接接通过商商品销售售量、销销售单价价和商品品成本计计算获得得。商品品销售利利润具有有良好的的可加性性,管理理人员又又经常需需要查看看。将利润数数据存放放在事实实表中,,可大大大减少数数据仓库库工作时时的工作作量,还还可以保保证所有有用户在在使用商商品销售售利润这这一重要要数据时时的一致致性。超市营销销数据仓仓库事实实表模型型商品销售单价价对于计算算商品利利润十分分重要,,但将某某个商品品一段时时间内的的所有销销售单价价相加是是毫无意意义的。。管理人人员可能能只对某某一时间间段内某某个商品品的平均均销售价价感兴趣趣。平均销售售价格可以用该该时间段段内的商商品销售售额除以以商品销销售量获获取。在事实表表中可以以不用商商品销售售单价,,代之以以商品销销售额。。销售额往往是管管理人员员衡量营营销策略略好坏的的重要指指标。超市营销销数据仓仓库事实实表模型型超市管理理者还可可能对商商品销售售的利润率感兴趣,,该数据据可以用用商品销销售利润润除以销销售额获获得,该数据不不是一个个可加数数据。将将比率或或百分数数的数据据进行相相加,所所获得的的数据是是没有什什么意义义的。管管理人员员在了解解某一时时期某些些商品的的利润率率时,完完全可以以利用该该时期该该商品利利润和销销售额获获得。因此,事事实表中中确定度度量数据据为商品品销售量量、商品品销售额额、商品品成本和和商品销销售利润润。7.1..4超超市数据据仓库维维表模型型设计1.日期期维日期维模模型是许许多数据据仓库应应用中的的常用维维度,其其设计方方式与其其他多数数维模型型有差别别。具体设计计时,日日期维可可以存放放以日期表示的5-10年的数数据行,,也可以以将3--4年的的数据行行作为日日期维内内容。如如果对10年的的每一天天都进行行存储,,也只需需要3650行行。日期维的的每列由由行所代代表的特特定日期期进行定定义。“星期””列含有像““星期一一”这样样的名称称内容。。该列可可用于创创建比较较“星期期一”与与“星期期日”销销售情况况对比的的查询。。日历日期期编号从1开始始取值,,然后根根据月份份的情况况取到28、29、30或者者31。。这一列列主要用用于对每每个月的的同一天天进行比比较。同同样,可可以给出出日历的周周编号和和月编号号。7.1..4超超市数据据仓库维维表模型型设计纪元表示示法采用用从某纪纪元开始始连续对对日期进进行计数数的方法法来给出出日编号号,在表表中还可可以给出出“星期期”与““月份””的绝对对编号列列。这些些数据支支持跨年年度、跨跨月份的的简单数数据运算算。在生成报报表时,,经常要要给出像像“一月月”这样样的月份份名称。。因此,,为报表表确定一一个“年月””(YYYY-MM)列标题也有必要要。报表中很很可能需需要季度度编号((Q1,,…,Q4)或或年季季度编号号列。如如果企业业的财政政年度与与日历表表周期上上不一致致,还需需要为财政年度度给出类似似列。7.1..4超超市数据据仓库维维表模型型设计在“节假日日”列中,给出出“节假假日”或或者“非非节假日日”的内内容。维表属性性作为数数据分析析的导航航,简单单地在““节假日日”列中中给出““Y”或或者“N”对数数据分析析没有多多大用处处。例如,在在生成某某种商品品的节假假日与非非节假日日销售情情况比较较查询时时,列中中给出““节假日日”或者者“非节节假日””这样有有意义的的值要比比一个简简单的““Y”或或者“N”之类类的值有有用得多多。“星期六六”与““星期日日”要归归入“周末””列。当然可可以对多多个日期期表属性性进行共共同约束束,从而而能够实实现一些些像平日日假期销销售与周周末假期期销售进进行比较较的数据据仓库应应用。“销售时时节”列列应设置为为销售时时节的名名称,例例如,春春节、情情人节、、端午节节、五一一节、国国庆节、、中秋节节、重阳阳节、圣圣诞节、、或者标标为“不不是”。。“重大事事件”列列与“销售售时节””列情形形类似,,可以标标记为““周日大大采购””或者““中秋合合家欢””这样与与日期有有特殊联联系的促促销事件件。一般性的的促销活活动通常常不放在在日期表表中处理理,以促促销维表表的形式式进行更更加完整整的描述述。因为为促销事事件并不不是仅仅仅由日期期来定义义,通常常还需要要由日期期、商品品与商店店的组合合来定义义。7.1..4超超市数据据仓库维维表模型型设计日期维度销售事实日期关键字日期关键字星期商品关键字日历日期编号门市关键字日历周编号促销关键字日历月编号客户关键字纪元日编号POS事务编号纪元周编号销售量纪元月编号销售额财政月日编号成本额年度日历周数利润金额年度日历月数日历年月(YYYY-MM)日历季度日历年季度日历半年度日历年财政周年度财政周数财政月年度财政月数财政年月财政季度财政年季度财政半年度财政年节假日指示符星期指示符销售时节重大事件……7.1..4超超市数据据仓库维维表模型型设计2.商商品维一般超市市门市可可能存储储60000个个商品编编号,但但大型连连锁超市市保留不不再销售售的历史史商品营营销方案案情况,,商品维维度可能能至少需需要150000行,,乃至多多达百万万行。商品维度度数据主主要来源源于业务务系统的的商品主主文件。。超市总总部对所所销售商商品的主主文件进进行统一一管理。。商品主文文件的一一个重要要作用,,就是维维护每个个商品存存储标志志的许多多描述属属性。商商品维是是一组重重要的属属性。某个商品种类类包含多个个商品子类类,商品子子类包含含多个商标,商标包包含多个个商品存储储标志。还应包含含描述商品形状状或存储位置置的层次属属性,例例如商品品的包装装类型、、包装尺尺寸、包包装数量量、托盘盘中的包包装数,,以及与与商品存存储的层层次:存存储类型型、货架架结构等等维度。。3.门门市维门市维表表用于描描述超市市的各个个链锁店店。门市市维表是是基本的的地理维维度,每每个门市市可被看看成一个个位置。。这样,,可以由由门市形形成诸如如街道、、邮政编编码、县县、市、、省这样样的任意意地理属属性。对对每个门门市来说说,地理理体系与与门市地地区体系系都有良良好的定定义。在连锁超超市所使使用的门门市维表表中有建建筑面积积、金融融服务、、最早开开业时间间等描述述特定门门市的文文字描述述。描述述销售面面积的列列应该是是数字型型的,并并且在理理论上是是跨门市市可相加加的,以以表示某某一地区区的销售面积积。它是门门市的一一个不变变属性,,通常作作为报表表约束或或者行标标题使用用。而且且为了能能够分析析不同种种类商品品对超市市销售利利润的贡贡献情况况,还需需要设立立不同商商品的销销售面积积。7.1..4超超市数据据仓库维维表模型型设计4.促促销维超市的促促销方案案可能包包含:临临时降价价、柜台台展销、、报纸广广告与优优惠券发发放等。。促销维维应该可可以反映映商品促促销方案案的成效效。促销的成成效评估估因素::促销商商品的销销售是否否在促销销区间出出现增长长、是否否在促销销进行之之前或者者随后出出现减少少状况;;是否发发生促销销商品的的销售出出现增长长,而临临近货架架上的其其他商品品销售却却呈现出出相应的的降低情情况(同同类相食食);促促销类别别中所有有商品的的销售是是否都经经历了一一个实际际的总体体增长;;促销是是否赢利利。促销利润润的计算算要考虑虑促销类类别的利利润增量量与时间间过渡、、同类调调剂以及及销售底底线等各各种情况况。7.1..4超超市数据据仓库维维表模型型设计在促销维维度中,,为促销销出现的的每种组组合都建建立一行行记录是是很有意意义的。。在一年年的销售售活动中中,可能能出现1000个广告告、5000次次临时降降价和1000次柜台台展销,,但可能能只有10000个促促销组合合能影响响某一特特定商品品。例如,在在某给定定维度中中,大多多数门市市都会同同时运作作所有促促销售手手段,而而只有少少数几个个门市不不进行柜柜台展销销。在这这种情况况下,就就需要两两个单独独的促销销记录行行:一个个用于通通常的降降价并外外加广告告与柜台台展销,,而另一一个用于于降价并并外加单单纯的广广告。7.1..4超超市数据据仓库维维表模型型设计超市的主主要促销销方式是是降价、、广告、、柜台展展销与优优惠券。。超市的的促销维维度可以以包含促促销名称称、减价价类型、、促销媒媒体类型型、广告告类型和和优惠券券类型等等。如果将这这些因素素分别建建立促销销维度,,就可以以记录分分析这些些促销方方法非常常相似的的信息,,使用户户更加容容易理解解促销方方案的作作用。但是将所所有的促促销因素素合并在在一个维维表中,,则能够够方便用用户的浏浏览,能能够弄清清各种不不同的价价格降低低、广告告、展销销与优惠惠券是如如何在一一起共同同发挥促促销作用用的。7.1..4超超市数据据仓库维维表模型型设计5.客客户维超市的客客户维度度可以包包含客户户账号、、姓名、、地址、、所在地地区、邮邮政编码码、电子子信箱、、电话、、日常活活动范围围、出生生日期、、收入、、孩子数数量、住住房和汽汽车等内内容。客户维中中的地址址由于客客户可能能会给出出其家庭庭地址、、工作地地址或其其它一些些常用地地址,因因此在维维表中可可以设置置4个地地址,对对于电话话的设置置也是出出于相同同因素的的考虑。。在数据仓仓库的应应用中,,有时需需要对客客户按照照不同的的地区进进行分析析,为此此,在维维表中就就按照省省、市、、县(区区)邮政政编码进进行地区区的设置置。性别、婚婚姻状况况、家庭庭人口、、住房条条件和自自有汽车车情况均均是超市市销售管管理人员员对超市市营销策策略进行行分析的的主要依依据。出于超市市营销策策略制定定的考虑虑,还需需要了解解客户的的日常活活动范围围,以便便有针对对性地进进行促销销广告的的发送。。7.1..4超超市数据据仓库维维表模型型设计7.1..5超超市数据据仓库模模型的关关键字设设计采用代理关键键字技术术,而不是是依赖业业务系统统中的各各种关键键字(许许多业务务系统中中的各种种编码往往往具有有某种特特定的含含义)代理关键键字一般般采用填填充维度度时按需需要而顺顺序分配配的整数数值。例例如,为为第一条条商品记记录分配配一个值值为1的的商品代代理关键键字,第第二条分分配2,,第n条条分配n等。代代理关键键字仅仅仅用于维维度表到到事实表表的连接接。代理关键键字的好好处还在在于,它它能够对对数据仓仓库环境境的操作作型变化化进行缓缓冲,不不会受到到商品编编码生成成、更新新、删除除、再生生与重用用等操作作型规则则的妨碍碍。代理理关键字字允许数数据仓库库对来自自多个业业务型系系统的数数据进行行合并,,即使它它们之间间缺乏一一致的源源关键字字也无所所谓。使用代理理关键字字还可以以获得性性能上的的优势。。代理关关键字可可能只有有一个整整数所占占据的空空间大小小,却能能确保充充裕地容容纳维度度行以后后可能需需要的序序号或者者最大编编号。而而业务型型编码常常常是一一个混合合了字母母与数字字的区间间编码体体系。代理关键键字还能能够用于于记录那那些诸如如“不在在促销之之列”这这样的可可能在业业务系统统中没有有编码的的维度情情形。通通过对数数据仓库库的关键键字施加加控制,,就能够够做到不不管是否否缺少业业务型编编码,总总可以分分配一个个代理关关键字将将这类情情况标识识出来。。将代理日日期关键键字处理理成日期期序号,,可以允允许事实实表在日日期关键键字基础础上进行行物理分分区。7.1..5超超市数据据仓库模模型的关关键字设设计目前在超超市数据据仓库中中已经包包含了6个实际际的表::营销事事实表与与日期、、商品、、门市、、促销和和客户维维表。每每个维表表有一个个主关键键字,而而事实表表除了有有一个退退化的销销售事务务编号之之外,还还有由五五个外关关键字组组成的一一个复合合关键字字。如果果五个关关键字都都是进行行了紧凑凑处理的的连续整整数,那那么仅仅仅需要为为所有五五个关键键字保留留18个个字节的的小存储储空间((日期、、商品、、促销和和客户维维各用4个字节节,而门门市用2个字节节)。同同时,销销售事务务编号可可能另外外需要8个字节节。如果事实实表4类类事实((销售量量、销售售额、成成本和利利润)中中的任何何一个都都是4字字节的整整数,则则仅仅需需要再保保留另外外的16个字节节,这样样事实表表只有42个字字节宽。。对一个个10亿亿行的事事实表也也只占用用大约42GB的存储储空间,,就可以以存储所所有事实实数据。。7.1..5超超市数据据仓库模模型的关关键字设设计7.1..6超超市数据据仓库元元数据设设计销售主题题元数据据名称Sales描述整个超市中每个门市中每个POS机所记载的商品销售状况目的用于进行超市销售状况和促销情况的分析联系人各个门市销售经理维时间、商品、客户、商店、促销事实表销售事实表度量值销售成本、销售额、销售利润、销售量销售事实实元数据据名称Sales_Fact_年份描述记录每个门市每个POS机所发生的销售数据目的作为销售主题的分析事实使用状况每天平均查询次数每天平均查询返回行数每天查询平均执行时间(分钟)每天最大查询次数每天查询返回最大行数每天查询最大执行时间(分钟)存档规则每个月将前36个月的数据存档存档状况最近存档处理日期已经存档数据日期更新规则每个月将前60个月的数据从数据仓库中删除更新状况最近更新处理日期已更新数据日期数据质量要求及确认由于从各个门市POS机上所产生的数据可能会由于极少的人工输入,而使数据质量不能得到保证,但也真实地反映了销售现状,不能随意修改,应被认可。数据准确性要求必须百分之百地反映各个门市销售状况数据粒度要求能够反映每一项商品的销售状况,不对数据进行汇总表键事实表的键(关键字)是时间、商品、客户、商店和促销维中键的组合数据来源超市销售业务系统中的销售表加载周期每天一次加载状况最后加载日期加载的行数加载规则每天清晨3:00将各个超市门市中前一天的销售事实数据拷贝到本表,拷贝过程中要根据各个数据成员所定义的加载规则进行筛选和清理销售事实实元数据据维元数据据名称客户(Customer)定义从超市任何一个门市购买货物的任何个人或组织都称为客户。一个客户可以与多个销售地区发生联系(即出现在地理维的不同层次体系中)层次结构一个客户的数据可以在3个级别上进行统计:最低级别是出现在客户所在的县/区,其上为市、省更改规则新的客户位置作为新的一行插入维中。对已有位置的修改,则在原处更新加载频率每天一次加载统计数据最后加载日期加载的行数使用的统计数据每天平均查询个数每天查询返回的平均行数每天查询平均执行时间(分钟)每天最大的查询个数每天查询返回的最大行数每天查询执行的最长时间(分钟)存档规则每个月将前36个月的数据存档已存档数据日期更新规则每个月将前60个月的数据从数据仓库中删除更新状况最近更新处理日期已经更新数据日期数据质量增加一个新客户时,先检查是否已在其他地方和该客户做过交易。少数情况下,由于检查失败,会将一个客户的不同部门作为不同客户保存。地区属性并不是销售业务系统原有的,而是根据送货地址属性中的邮政编码进行区分数据的准确程度一个客户与其地理位置的关联出错的可能性在某一百分比以下,该百分比大小要根据对业务数据的研究情况确定关键字客户维的关键字是系统产生的数字维元数据据产生关键字的方法从销售业务系统中拷贝一个客户时,将检查转换表,检查该客户是否已经存在于数据仓库中。如果否,就产生一个新的关键字。然后将这个关键字和销售业务系统中的Custom~ID和地区ID插入转换表中。如果该客户和位置已经存在于转换表,则根据表中的关键字决定数据仓库中要更新的记录源表名称超市销售业务系统中的Customer表加载规则每天拷贝每个Customer表中的行。对于已存在的客户进行更新。对于新客户,确定其所在地理位置之后,产生一个关键字,然后插入一行新记录。在更新/插入操作之前,需要检查是否有重复的客户名。如果有,则在客户名后增加一个顺序号,直到名字以及名字和顺序号的组合都没有重复为止。加载规则只选择新的和发生变化的行源表名称Customer_Location表转换规则每天拷贝一次Customer_Location表。对于已存在的客户,更新其送货地址;对于新客户,则产生一个键,并插入一行。维元数据据数据成员员元数据据名称客户关键字(Customer_ID)定义用以唯一标识客户和位置的值更新规则一旦分配,就不改变数据类型数值型值域1—999,999,999产生规则由系统自动产生,将当前最大值增l来源系统自动生成名称客户名称(Customer_Name)定义客户的名称更新规则客户名称发生改变时,就在原来的记录上更新数据类型Char(30)值域保证能区分不同客户的名称。对不同而具有相同名称的客户,可在名称后依次加1来区分相同名称来源超市销售业务系统中Customer表中的Name产生规则对于零售客户,其名称由姓和名组成,或者是客户1、客户2形式。对于公司,则将公司名作为客户名称数据成员员元数据据7.2数数据据仓库开开发工具具简介7.2..1数数据仓仓库开发发工具目前已有有许多数数据仓库库开发工工具供应应商,可可以提供供各种构构建数据据仓库的的工具。。但有些些数据仓仓库开发发工具还还要结合合第三方方供应商商工具才才能完成成整个数数据仓库库的构建建。1.Oracle数据据仓库开开发工具具Oracle9i::数据仓仓库构建建体系的的核心;;OracleWarehouseBuilder::可以进进行数据据建模、、数据抽抽取、数数据转移移和装载载、聚合合及元数数据管理理;OracleDiscoverer:能能够为最最终用户户提供查查询、报报告、下下钻、旋旋转和WEB公公布工具具;OracleDarwin:提供供决策树树、神经经网络等等多种数数据挖掘掘方法,,可以对对数据仓仓库进行行数据挖挖掘,具具有简单单易用的的图形化化界面,,支持海海量数据据并行处处理,可可进行结结果分析析和系统统集成。。2.IBM数据据仓库开开发工具具基于可视视数据仓仓库的商商业智能能(BI)解决决方案,,具有集集成能力力强,面面向对象象SQL等特性性。其中中VisualWarehouse(VW)是是一个功功能很强强的集成成环境,,可用于于数据仓仓库建模模和元数数据管理理,又用用于数据据抽取、、转换、、装载和和调度。。Essbase/DB2OLAPServer支持持多维数数据库。。它是一一个(ROLAP和MOLAP)混混合的HOLAP服务务器,在在Essbase完成成数据装装载后,,数据存存放在系系统指定定的DB2UDB数数据库中中QUEST是一一个多任任务数据据挖掘系系统,提提供多种种开采功功能,其其挖掘算算法可适适用于任任意大小小的数据据库。3.Sybase数据据仓库开开发工具具Sybase数数据仓库库解决方方案能够够支持多多种关系系型数据据库,能能够同时时处理几几十个即即席查询询。其中中:Bit__Wisc技术术和垂直数数据存储储技术使使系统可可以只访访问特定定的少量量数据。。WarehouseArchitect是PowerDesigner中的一个个设计模模块。利利用该模模块,数数据集市市或数据据仓库设设计者可可以自动动地对已已有的关关系数据据库进行行目标数数据库设设计、物物理设计计和DDL设计计。PowerStage、ReplicationServer、CarletonPASSPORT是数据抽抽取与转转换工具具。AdaptiveServerIQ是专为数数据仓库库设计的的关系数数据库。。3.Sybase数据据仓库开开发工具具PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo是数据分分析与展展现工具具。WarehouseControlCenter、SybaseCentral、DistributionDirector是数据仓仓库的维维护与管管理工具具。IndustryWarehouseStudio包括相应应行业所所需的商商业智能能应用软软件和数数据分析析模型,,可以针针对不同同行业进进行业绩绩分析、、促销活活动分析析、销售售分析和和收益分分析等,,具有数数据仓库库设计、、元数据据管理等等功能、、支持广广泛的应应用软件件和报表表,并提提供WarehouseStudio的的设计计工具、、WarehouseControlCenter等工具具。4.Informix数据仓仓库开发发工具FastStart数据仓库库解决方方案,可可以快速速便捷地地设计开开发具有有可伸缩缩性的数数据仓库库或数据据集市。。采用ROLAP的星型型模式与与InformixIDS、IDS//AD紧紧密集成成,提供供预先汇汇总、抽抽样、后后台查询询等性能能优化手手段。Informix产品品还能够够集成MicrosoftIIS或NetscapeEnterprise//FastTrack服服务器,,从而支支持web访问问。MetaCubeROLAPOption为基于Informix的数数据仓库库或数据据中心提提供了全全面、简简便易用用、可扩扩展和自自动化的的商业分分析环境境。InformixInfoMover是一套集集成工具具,用于于从多个个工作资资源中抽抽取、转转换和维维护数据据。SeagateCrystalInfo是企业级级报表、、分析系系统。IDS以及AD/XP选项是是Informix数数据仓库库系统的的核心,,提供数数据仓库库数据的的存储功功能。Informix没有有提供自自己的报报表和数数据挖掘掘工具,,主要集集成第三三方产品品(例如如Brio的前前端数据据分析和和报表功功能,SAS的的数据挖挖掘功能能)。5.NCR数据据仓库开开发工具具NCR可可扩展数数据仓库库的基本本框架主主要分成成三个部部分:数数据装载载、数据据管理和和信息访访问。NCR的的Teradata是高端数数据仓库库市场最最有力的的竞争者者,主要要运行在在NCRWorldMarkSMP海量并行行服务器器的Unix操操作系统统平台上上,提供供交互分分析、标标准报告告和多维维度分析析。为了开拓拓数据集集市(DataMart))市场,,1998年该该公司也也提供了了基于WindowsNT的Teradata。6.SAS数据据仓库开开发工具具SAS公公司所提提供的工工具(例例如:智智能化的的客户机机/服务务器,多多厂商构构架等))可以帮帮助企业业实现一一个灵活活和低风风险的处处理。SAS数数据仓库库可以支支持各种种硬件平平台、支支持不同同数据库库之间数数据的存存取,它它还可对对不同格格式的数数据进行行查询、、访问和和分析,,具有与与目前许许多流行行数据库库软件和和老的数数据文件件的接口口,并可可在SAS环境境中建立立对应外外部异构构数据的的统一公公用数据据界面。。SAS提提供的工工具包括括30多个个专用模模块。其中::SAS//WA(WarehouseAdministrator))是建立立数据仓仓库的集集成管理理工具,,包括定定义主题题、数据据转换与与汇总、、更新汇汇总数据据、元数数据管理理和数据据集市的的实现等等;SAS//MDDB是SAS用于在在线分析析的多维维数据库库服务器器。7.CA数据仓仓库开发发工具CA能够够提供以以元数据据为核心心的、结结构化的的、包容容构造数数据仓库库各项技技术的全全面解决决方案。。它具有有独特的的元数据据管理与与应用特特性,具具有用三三维可视视化技术术解析处处理的功功能。CA解决决方案提提供ODBC接接口,并并将数据据存储在在第三方方关系数数据库((如Oracle、Sybase、、SQLServer、Informix和IBMDB2等)中中。Erwin是数据库库/数据据仓库模模型设计计工具;;DecisionBase是图形界界面的元元数据管管理和数数据转移移工具;;InfoPump是可编程程控制的的双向数数据转移移工具;;InfoBeacon是OLAP服务务器;Forest&&TreesDSS/EIS是开发工工具;Repository是企业环环境下元元数据的的集中管管理工具具。7.2..2SQLServer数据仓仓库开发发应用工工具SQL的的数据仓仓库开发发工具数据仓库工具名称在数据仓库中的作用关系型数据库数据转换工具数据复制工具OLEDBAnalysisServicesEnglishQueryMetaDataServicesPivotTable数据仓库的创建和维护数据仓库的数据加载分布式数据仓库的数据发布、加载应用系统与数据源的接口数据挖掘与分析数据仓库的语言查询数据仓库的元数据浏览客户端多维数据的定制与操作4.清理和转转换数据据SQLServer提供了了Transact--SQL查询、、DTS包、命命令行应应用程序序、ActiveX脚脚本等工工具完成成清理工工作,并并对数据据进行必必要的转转换。5.将数数据加载载进数据据仓库SQLServer提供的的Transact--SQL、DTS和bcp工工具实现现数据加加载。6.将数数据发布布到数据据集市SQLServer提供了了数据复复制技术术来完成成数据集集市的初初始装载载,并提提供了各各种数据据加载工工具对数数据集市市进行数数据加载载。7.SQL查询询SQLServer提供了了Transact--SQL来实现现SQL查询。。8.OLAP应应用SQLServer中的AnalysisServices可以以实现OLAP应用的的创建和和管理。。9.数据据挖掘SQLServer的AnalysisServices还提供供了数据据挖掘技技术的创创建和管管理功能能,可以以实现决决策树和和聚集两两种数据据挖掘功功能。10.Web访访问SQLServer所提供供的AnalysisServices、EnglishQuery可可以与IIS((Internet信信息服务务)一起起,用多多种方法法在Web上对对数据仓仓库进行行查询和和更新。。11.更更新数据据仓库数数据数据仓库库在实际际应用中中还需要要定期地地进行数数据更新新维护,,这些工工作可以以用SQLServer的的Transact--SQL、DTS和bcp实实用工具具完成。。7.3SQLServer的的数据仓仓库创建建7.3..1创创建物物理数据据库右键单击’数据库’,选择弹出菜单中’新建数据库’菜单项命令选择’数数据库’’,单击击单单击击建立数数据库星型按钮钮建立数数据库按按钮,,建立数数据库SQLServerEnterpriseManager数据库属属性设置置窗口7.3..2创创建表表在“表”上用鼠标右键单击,调出弹出式菜单,选择其中的“新建表”菜单项。表结构输输入窗口口7.4SQLServer数数据仓库库访问与与操纵7.4..1AnalysisManager数据据库的创创建与数数据源确确定AnalysisServer系系统是一一个管理理多维数数据集的的有力工工具,可可以用来来创建对对数据仓仓库访问问、分析析多维数数据集和和知识发发现的数数据挖掘掘模型。。在使用用AnalysisServer以前,,必须要要从SQLServer的的安装光光盘上将将其安装装到机器器上。1.AnalysisManager数数据库的的创建用户可以以利用AnalysisManager在数据据仓库中中建立起起多维数数据集合合,以有有效地访访问数据据仓库中中数据。。1.AnalysisManager数据据库的创创建5个对象象:数据源多维数据据集共享维度度挖掘模型型数据库角角色AnalysisManager2.AnalysisManager中ODBC数据源源的确定定进入“数数据链接接属性””对话框框在连接数据据源时,要求求用户给给出用户户名和口口令时,,就需要要在输入入登录服服务器的的信息部部分的““用户名名称”文文本框中中输入用用户名,,“口令令”文本本框中输输入口令令。复选选框“空空白密码码”用于于禁止输输入口令令,“允允许保存存密码””用于使使机器保保存用户户口令。。在“输入入要使用用的初始始目录””下拉列列表框中中选择相相应的位位置。完完成这些些设置后后,可以以单击““测试连连接”按按钮,测测试连接接是否成成功,测测试结果果将以对对话框方方式告知知。高级标签签页用于设置置一些连连接数据据源的高高级选项项。网络设置置:用于于设置用用户连接接网络的的网络安安全等级级;连接超时时:设定定文本框框设置连连接超时时的时间间(秒));访问权限限列表框框:设置置连接数数据源的的7种权权限:只读((Read)、、读写((ReadWrite)、、可写((Write)可共享((ShareDenyNone)、、除读以外外的共享享(ShareDenyRead))、除写以外外的共享享(ShareDenyWrite)、排他共享享(ShareExclusive)。在所有标签签页中,用一一个列表表框显示示了前面面所进行行的设置置内容,,如果对对设置不不满意,,可以单单击“编编辑值””按钮,,编辑这这里的设设置。完完成设置置后,可可以单击击“确定定”按钮钮完成数数据源指指定操作作。“高级””标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年重庆市城口县移动公司公开招聘工作人员试题带答案详解
- 2024年云南省马龙县烟草公开招聘工作人员试题带答案详解
- 小学生健康课件模板
- 2024年广西大化瑶族自治县烟草公开招聘工作人员试题带答案详解
- 2024年甘肃省卓尼县烟草公开招聘工作人员试题带答案详解
- 2024年江西省乐安县移动公司公开招聘工作人员试题带答案详解
- 2024年贵州省习水县烟草公开招聘工作人员试题带答案详解
- 小学生做菜课件大全
- 房地产企业如何利用证券市场融资
- 中国婴儿电子玩具行业市场调研分析及投资战略咨询报告
- 周至县中小学生转学证明表
- 《光伏组件功率衰减检验技术规范(征求意见稿)》
- 威图电柜空调SK3304500使用说书
- 客运驾驶员汛期安全培训
- 【1例心肌梗塞患者的PCI术后护理探究7800字(论文)】
- 干部基本信息审核认定表
- 采购管理中的创新与持续改进
- 乳腺穿刺活检术手术知情同意书
- 湖南省永州冷水滩区2021-2022学年七年级下学期期末语文试题答案
- (完整版)北京高考有机化学真题
- 威高胸腰椎微创脊柱治疗方案课件
评论
0/150
提交评论