




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章数据仓库的工具本章要点:如何选择数据仓库产品一般数据仓库产品的组成常见的数据仓库产品5.l数据仓库产品选择5.1.1数据仓库产品的组成5.1.2数据仓库产品应具备的关键技术5.1.3数据仓库的发展趋势5.1.4如何选取数据仓库工具5.l.l数据仓库产品组成数据集市关系数据库数据源数据准备区各种服务工具等等。1.数据集市数据集市是数据仓库的子集,是按主题从数据仓库中划分出来的数据集合。数据集市通常按职能部门为单位为其提供数据,例如,销售部门、财务部门、库存部门等的数据集市。由于数据集市中只包含面向某个主题的数据,因此数据量比较小,方便与各种分析工具建立连接,利于用户使用。2.关系数据库关系数据库是数据仓库中非常重要的组成部分,数据仓库要想发挥出真正的威力必须由关系数据库为其提供强大的基础引擎。在数据仓库的应用过程中关系数据库为其提供了许多必不可少的功能,如在数据准备数据库中临时储存、清理、转换传入的数据;为数据仓库提供存储引擎、快速传输和修改、以及灵活的索引机制,容纳和管理数据仓库中海量的数据并支持数据集市。3.数据源使用数据仓库的最根本目的是为了向企业决策者提供各种决策信息,因此数据仓库必须要将企业内部或外部的各种信息集中起来,合并为一致的数据集。这些数据的来源各不相同,可以来自关系型数据库中的数据,也可以来自各种电子表格,甚至是文本数据。在一个大型企业中通常会存在多个OLTP系统来捕获日常业务运作情况,这些OLTP系统由不同的部门设计并使用不同的数据结构和数据元素,虽然这些数据源的数据不能直接用于决策支持,但是也必须将它们捕获到数据仓库中,因为这些长期积累的数据是建立数据仓库的重要基础4.数据准备区数据仓库从不同的数据源抽取数据后,需要对这些数据进行清理和格式化以保证与其他保存在数据仓库中数据的一致性。数据准备区又被称为数据中间存储区,实际上数据准备区也是一个关系型数据库,数据仓库从其他数据源提出的数据首先要保存在这个关系型数据库中,在这里将数据转化为数据仓库要求的统一格式,并检查数据的一致性和引用完整性,并准备装载入数据仓库的数据库中。通常情况下,数据准备区和数据仓库是分开的,但是如果对数据的清洗和转换操作不影响到数据仓库为最终用户提供服务的性能,数据准备区和数据仓库也是可以合并在一起的。5.服务工具建设数据仓库的目的是为决策者提供必要的决策数据,因此根据决策者的要求为了提供决策者所需要的信息,数据仓库必须使用相关工具来帮助它分析和评估数据仓库中浩瀚的数据,例如在线分析处理(OLAP)、数据挖掘工具、预定义报表等等。另外,数据仓库也必须留有相关的应用程序接口(API)以支持用户开发自定义的数据仓库服务工具。5.1.2数据仓库产品应具备的关键技术1.海量数据的管理能力
数据仓库为了支持决策分析存储了海量的数据以用来分析计算,因此数据仓库产品中最关键的技术就是如何来管理这些海量的数据,通过索管理、有效溢出管理等技术能够实现对数据仓库中大量数据的管理要求,通常用户在选购数据仓库产品时首先考虑的就是数据仓库产品对海量数据的管理能力能否满足自身的要求。2.强大的索引管理功能一个高质量的数据仓库产品必须能够对数据进行方便快捷高速高效的访问,这就要求数据仓库产品能够使用索引技术建立适当的关键数据索引,如二级索引、临时索引、稀疏索引等索引技术,同时还要能够保证建立、使用和管理这些索引所付出的代价不能太高。5.1.2数据仓库产品应具备的关键技术3.对数据的监控能力如果数据仓库产品希望在大型的应用环境中使用,那么它必须具备对数据的监控能力。在数据仓库运行的过程中,数据监控组件要一直对数据仓库中的数据进行实时的监视,通过收集数据访问信息区分出那些数据是经常被使用的,那些是很少被使用的、那些索引建立的不恰当、那些数据应该进行重新的分类组合等等。而且数据监控组件还要对硬件系统资源的使用情况进行跟踪监控,如内存和cpu的使用率、硬盘空间的剩余情况、并发用户的数据、并发线程的数量等。
5.1.2数据据仓库库产品品应具具备的的关键键技术术4.对对多种种存储储介质质的管管理能能力在数据据仓库库中有有很多多因素素会影影响到到数据据存储储介质质的选选择问问题,,如数数据的的使用用率、、数据据粒度度的选选择等等等,,对于于那些些经常常使用用的数数据必必须存存放在在存取取数据据很快快的介介质上上以提提高数数据仓仓库系系统的的反映映时间间,但但通常常来说说,存存储介介质速速度的的快慢慢要与与其价价格成成正比比,这这样对对于那那些不不会被被经常常使用用到的的数据据就需需要放放在低低速介介质上上来降降低整整体成成本。。因此此数据据仓库库产品品必须须能够够提供供对多多种不不同存存储介介质的的管理理能力力,这这也是是实现现数据据仓库库存储储多样样性的的必然然要求求。在目前前常用用的存存储介介质中中价格格昂贵贵但存存取速速度非非常快快的有有系统统内存存、高高速缓缓存;;价格格较贵贵存取取速度度较快快的有有各种种硬盘盘设备备;价价格较较低但但存取取速度度也较较慢的的有光光盘和和磁带带等。。5.1.2数据据仓库库产品品应具具备的的关键键技术术5.对对元数数据的的管理理元数据据是““关于于数据据的数数据””,它它与数数据仓仓库中中数据据的生生命周周期有有关,,因此此在数数据仓仓库中中占有有非常常重要要的地地位。。数据据仓库库的开开发设设计与与实现现并不不是一一劳永永逸的的,而而是一一个不不断重重复,,逐渐渐完善善的过过程,,因此此管理理好元元数据据为今今后对对数据据仓库库的修修补、、新功功能的的添加加等提提供了了重要要的保保证。。元数数据据的的主主要要内内容容包包括括数数据据仓仓库库中中表表的的结结构构、、属属性性、、数数据据仓仓库库的的记记录录系系统统、、从从记记录录系系统统到到数数据据仓仓库库的的映映射射关关系系、、数数据据的的抽抽取取日日志志、、访访问问数数据据的的例例行行程程序序、、数数据据模模型型的的说说明明等等。。5..1..3数数据据仓仓库库的的发发展展趋趋势势1、、从从数数据据仓仓库库技技术术的的发发展展角角度度分分析析数据据仓仓库库技技术术的的发发展展包包括括数据据抽抽取取、、存存储储管管理理、、数数据据表表现现和和方方法法论论等方方面面。。在数数据据抽抽取取方方面面,,未未来来的的技技术术发发展展将将集集中中在在系统统集集成成化化方面面。。它它将将互互连连、、转转换换、、复复制制、、调调度度、、监监控控纳纳入入标标准准化化的的统统一一管管理理,,以以适适应应数数据据仓仓库库本本身身或或数数据据源源可可能能的的变变化化,,使使系系统统更更便便于于管管理理和和维维护护。。在数数据据管管理理方方面面,,未未来来的的发发展展将将使使数数据据库库厂厂商商明明确确推推出出数据据仓仓库库引引擎擎,作作为为服服务务器器产产品品与与数数据据库库服服务务器器并并驾驾齐齐驱驱。。在在这这一一方方面面,,带带有有决决策策支支持持扩扩展展的的并行行关关系系数数据据库库将最最具具发发展展潜潜力力。。在数数据据表表现现方方面面,,数理理统统计计的算算法法和和功功能能将将普普遍遍集集成成到到联联机机分分析析产产品品中中,,同同时时与与Internet/Web技技术术紧紧密密结结合合,,推推出出适适用用于于Intranet、、终终端端免免维维护护的的数数据据仓仓库库访访问问前前端端。。在在这这个个方方面面,,按按行行业业应应用用特特征征细细化化的的数数据据仓仓库库用用户户前前端端软软件件将将成成为为产产品品作作为为数数据据仓仓库库解解决决方方案案的的一一部部分分。。数数据据仓仓库库实实现现过过程程的的方方法法论论将将更更加加普普及及,,将将成成为为数数据据库库设设计计的的一一个个明明确确分分支支,,成成为为管管理理信信息息系系统统设设计计的的必必备备。。5..1..3数数据据仓仓库库的的发发展展趋趋势势2、、从从企企业业角角度度分分析析未来来的的发发展展将将是是不不提提供供完完整整解解决决方方案案的的厂厂商商可可能能被被其其他他公公司司收收购购,,例例如如从从事事数数据据抽抽取取、、提提供供专专用用工工具具的的软软件件公公司司很很可可能能并并入入大大型型数数据据库库厂厂商商而而去去构构建建完完整整的的解解决决方方案案。。能能够够持持续续发发展展的的厂厂商商大大致致有有两两类类::一一是是拥拥有有强强大大的的数数据据库库、、数数据据管管理理背背景景的的公公司司;;二二是是专专门门提提供供面面向向具具体体行行业业的的、、关关于于数数据据仓仓库库实实施施的的技技术术咨咨询询的的公公司司。。3、从用用户的角角度分析析数据管理理的传统统领域,,如金融融、保险险、电信信等行业业中的特特定应用用,如信信用分析析、风险险分析、、欺诈检检测等,,是数据据仓库的的主要市市场之外外,数据据仓库的的应用随随着现代代社会商商业模式式的变革革而进一一步普及及和深入入。大规规模的定定制不仅仅是一种种制造过过程、后后勤系统统、或者者推销策策略,它它很可能能成为下下一世纪纪企业生生产的组组织原则则,就像像成批生生产是本本世纪的的组织原原则一样样。在未未来大规规模定制制经济环环境下,,数据仓仓库将成成为企业业获得竞竞争优势势的关键键武器。。5.1..4如何何选取数数据仓库库工具1、了解解企业的的商业需需求。第一步就就是要了了解企业业对数据据仓库产品的应应用范围围,是要建建立企业业级数据据仓库、、部门级级数据仓仓库还是是个人级级数据仓仓库?接下来我我们需要要了解数数据仓库库产品的的用户群体有哪哪些、预预期的用用户数量量有多少少、用户户的地理理分布是是集中还还是分散散。然后我们要弄弄清楚企业建建立数据仓库库的用途和功能,充分了解用用户需要利用用数据仓库进进行哪些领域域的工作,需需要哪些特殊殊功能,是只只需要简单的的数据查询,,还是需要利利用多维数据据分析,甚至至是复杂的数数据挖掘。最后我们要了了解目前企业业进行数据分分析的工作流程是怎样的,目目前分析中有有哪些困难和和有哪些急需需解决的问题题等等。5.1.4如如何选取数据据仓库工具2、需要了解解数据仓库系系统的需求。。在充分了解商商业需求的基基础上我们需需要进一步了了解数据仓库库系统本身的的需求信息。。例如需要估算系统可容容纳数据的数数量,了解数据的稳定性性以及刷新的速度等。特别需要要强调的是,,在数据仓库库系统中元数据的维护护是非常重要的的,如果元数数据是由非专专业的用户来来维护,那么么系统需求就就要强调维护护工具表达的的直观性;如如元数据由专专业的技术人人员来维护则则把需求重点点放在维护工工具的效率上上面。3、对各种数数据仓库产品品做出功能评评估5.1.4如如何选取数据据仓库工具功能评估应该该包括以下几几个方面:(1)系统结结构:系统的的跨平台型、、系统的安全全性、可靠性性、系统的备备份恢复能力力等。(2)数据抽抽取能力:数数据转化功能能的强弱、定定时调度能力力、数据抽取取的速率等。。(3)数据存存取呈现能力力:支持多维维查询能力、、是否具有良良好的用户端端界面、是否否支持OLAP分析能力力等等。(4)应用支支持:系统提提供的可重用用软件成分的的多少、软件件的跨平台性性、是否有良良好的应用程程序开发语言言、数据库对对存储过程的的支持情况等等。(5)用户接接口:用户界界面的美观性性、易用性、、对WEB平平台的支持程程度等。(6)工具的的互操作性::数据库、数数据仓库、OLAP分析析、数据挖掘掘以及前端展展示工具间的的互通情况。。5.2常用数数据仓库产品品简介Oracle9iNCRTeraDataIBMDB2SASMicrosoftSQLServer2005的的数据仓库工工具5.2.1Oracle9i1、Oracle9i数据仓库的的新特性Oracle数据仓库作作为一种企业业级关系型数数据仓库管理理系统在信息息管理、企业业数据处理、、因特网及电电子商务等领领域被广泛的的应用。随着着2001年年Oracle9i系系列产品的推推出,Oracle将产产品的重心向向电子商务环环境转移并继继续关注于Internet,为此此Oracle9i提提供了许多新新功能新特性性。(1)可管理理性可管理性是Oracle9i数据据仓库产品的的关键改进方方面之一,Oracle9i采取取的管理方法法有4个方面面:改进和流线化化的数据仓库库操作管理端到端的系统统管理解决方方案简化任务和减减少管理时间间关键领域数据据库的自我管管理5.2.1Oracle9i(2)Internet内容管理Oracle9i大大大增强了Oracle8i数据仓仓库的功能,,以充当创建建、管理和传传递Internet内内容的平台,,允许客户将将所有类型的的多媒体内容容存储、管理理和聚集到单单一数据库中中,另外还包包括:支持随时可移移动的内容存储和管理所所有类型的内内容有效的搜索和和索引所有类类型的内容为协作项目组组织内容5.2.1Oracle9i(3)提供端端到端的安全全体系结构Oracle9i为用用户提供了目目前为止业界界最安全的应应用程序开发发和部署平台台,其中包括括以下几个部部分:提供强壮的三三层安全保证托管环境境的安全深层数据库保保护改进的企业用用户安全(EnterpriseUserSecurity)数据加密和标标签安全(OracleLabelSecurity)基于标准的公公共密钥体系系结构(PKI)5.2.1Oracle9i(4)点击智智能服务点击智能服务务依靠OracleClickstreamIntelligence组组件来实现,,作为Oracle9iApplicationServer的一个组件件它能够分析析网站数据和和企业数据并并用以来提高高网站效率和和企业用户忠忠诚度。它利利用Oracle数据仓仓库开发工具具的开放数据据模型来提供供一个预先建建立的、公开开的数据集,,并使用Oracle的的门户框架提提供一套预先先建立的报表表。OracleClickstreamIntelligence能够满满足电子商务务的苛刻要求求,包括快速速实施、可伸伸缩性、可操操作性、可用用性和可管理理性等等。5.2.1Oracle9i(5)实时的的个性化处理理Oracle9i可以以支持实时的的个性化处理理,它通过使使用数据挖掘技术术能够从网络上上搜集来的大大量的客户点点击、交易和和图表统计中中找出用户真真正需要的电电子商务数据据,并且它能能够在分析大大量客户信息息的同时,保保持每个客户户关系的独特特性,这就为为电子商务提提供个性化的的、一对一的的定制服务提提供了保证。。5.2.1Oracle9i(6)灵活的的可移植性Oracle9i数据据仓库可以在在不同的操作作系统上运行行,且不同的的操作系统的的Oracle应用软件件可相互移植植,更为重要要的是根据Oracle公司公布的的资料显示移移植时的代码码修改率仅为为4%,从一一种操作系统统移植到另一一种操作系统统时只需要修修改少量代码码甚至不需要要修改代码。。同时,Oracle9i支持工工业标注的操操作系统,通通过SQL*NET、NET*8、、NET8i,Oracle9iNet服服务允许不同同类型的计算算机、操作系系统通过网络络实现互联。。5.2.1Oracle9i5-1Oracle数据仓仓库的结构构框架图2.Oracle9i数据据仓库结构构框架5.2.1Oracle9i在框架中数数据仓库服服务器与展展示层之间间为C/S结构,而而数据仓库库工具则分分布于结构构中的各个个部分,其其中:OWB(OracleWarehouseBuilder))位于服务器器中,是构构建数据仓仓库的主要要工具。Express是OLAP分析工具具,核心部部分位于服服务器中,,其他部分分如ExpressObject、、ExpressAnalyzer则位于客客户机中。。Reports、Discoverer顾名思义是是位于客户户机中用于于展示的工工具集。DMS(DataMiningSuite)这是一套数数据挖掘工工具,也位位于客户机机中,另外外,在DMS之中也也具有一定定的展示功功能。5.2.2NCRTeraDataNCRTeradata是是高端数据仓仓库市场最有力的竞竞争者,主主要运行在在NCRWorldMarkSMP硬件的的Unix操作系统统平台上。。1998年,该公公司也提供供了基于WindowsNT的Teradata,试试图开拓数数据集市((DataMart)市场场。总的来来看,NCR的产品品性能很好好,Teradata数据仓仓库在100GB、、300GB、1TB和3TB级的TPC-D指标测试试中均创世世界纪录。。但是,NCR产品品的价格相相对较高,,中小企业业用户难以以接受。相相比之下下TeraData数据仓库库有如下几几大特点::TeraData数数据仓库几几大特点(1)丰富富的应用程程序接口TeraData数数据仓库提提供了非常常丰富的标标准化应用用程序接口口,其中包包括:ODBCDriverforTeradata,JDBCDriverforTeradata,theOLEDBDataProviderforTeradata,Microsoft.NETDataProviderforTeradata,theTeradataCall-LevelInterface(CLI),TS/API等等。另另外还包括括许多第三三方的应用用程序接口口,例如SybaseOpenServerandOpenClient。(2)开发发语言预处处理器TeraData内内置了多种种开发语言言预处理器器,方便用用户能够更更便捷的使使用各种开开发语言创创建自己的的应用程序序,如COBOL、、C和PL/1等等等。通过使使用这些预预处理器内内置的函数数库,开发发者们可以以开发出能能够直接操操作TeraData数据仓仓库管理系系统的增强强型客户端端程序或者者host-based类型型的应用程程序。TeraData数数据仓库几几大特点(3))强强大大的的数数据据加加载载单单元元TeraData数数据据仓仓库库不不单单支支持持一一次次性性的的数数据据加加载载更更可可以以支支持持实实时时地地加加载载要要求求。。TeraData数数据据加加载载单单元元包包括括以以下下组组件件::FastLoad,MultiLoad,FastExport,TPump,TeradataParallelTransporter,TeradataReplicationSolutionsandBasicTeradataQueryfacility(BTEQ)。。TeraData数数据据加加载载工工具具都都可可以以满满足足用用户户的的个个性性化化需需求求将将用用户户分分散散在在不不同同数数据据源源的的数数据据无无缝缝的的集集中中加加载载到到TeraData数数据据仓仓库库之之中中。。(4)全方位位的数据库管管理工具TeraData数据库库管理系统包包含了很多工工具软件来帮帮助用户来实实现对数据库库的操作管理理、用户权限限管理和数据据维护。例如如ASF/2用来实现对对数据的备份份、存档以及及数据恢复功功能;DatabaseWindow(DBW)则可以以为用户提供供数据库的性性能、运行状状态和各种统统计数据;AdministrationWorkstation(AWS))工具为拥有有相关权限的的用户提供了了对整个数据据库系统的操操作控制能力力。5.2.3IBMDB2IBMDB2数据仓库库系统是一套套基于可视数据据仓库的商业智能((BI)解决决方案,包括括:VisualWarehouse(VW)、Essbase/DB2OLAPServer5.0、、IBMDB2UDB,以及来来自第三方的的前端数据展展现工具(如如BO)和数数据挖掘工具具(如SAS)。DB2数据仓库是是IBM电子子业务软件战战略中的重要要组成部分,DB2家族族中的产品可可以运行在包包括手持设备备、Intel、UNIX、iSeries以以及大型机平平台在内的很很多机型上。。可以支持的的操作系统包包括:Linux、Windows2000/NT/XP/.NET、AIX、HP-UX、SunSolaris、、OS/400、VSE/VM和OS/390。DB2数据仓仓库产品企业服务器版版通常用于构建建电子业务应用用程序和支持大规模的部门门及大型企业业级数据仓库,它它提供了最大大程度的连通通性,并且可可以与异构平平台上的DB2数据库和和第三方厂商商的数据库产产品共享数据据资源。工作组服务器器版该版本通常用用于支持小规模的部门门级应用程序或者者支持那些不不需要存取在在OS/400、VM/VSE和OS/390平台上的远远程数据库的的应用程序。。个人版该版本通常被被单机用户使用,功能完完善但是不能能响应远程的的数据库请求求。该版本只只能运行在Linux和和Windows操作系系统上。Everyplace这是针对移动计算机环环境而设计的版本本,它允许移移动用户通过过个人数据助助理或掌上电电脑等手持移移动设备存取取企业中的DB2数据源源。DB2Everyplace可以运行在在包括PalmOS、、Linux、WindowsCE、Neutrino、PocketPC和和Symbian在内的的多种移动操操作系统上。。5.2.4SASSAS公司在在20世纪70年代以““统计分析””和“线性数数学模型”而而享誉业界,,90年代以以后,SAS公司也加入入了数据仓库库市场的竞争争,并提供了了特点鲜明的的数据仓库解解决方案,包包括30多个个专用模块。。其中,SAS/WA(WarehouseAdministrator))是建立数据仓仓库的集成管管理工具,包包括定义主题题、数据转换换与汇总、更更新汇总数据据、元数据管管理、数据集集市的实现等等;SAS/MDDB是SAS用于于在线分析的的多维数据库库服务器;SAS/AF提供了屏幕设设计功能和用用于开发的SCL(屏幕幕控制语言));SAS/ITSV(ITServiceVision)是IT服务的的性能评估和和管理的软件件,这些IT服务包括计计算机系统、、网络系统、、Web服务务器和电话系系统等。SAS系统的优优点是功能强强、性能高、、特长突出,,缺点是系统统比较复杂。。5.2.5MicrosoftSQLServer2005的数据仓库库工具MicrosoftSQLServer2005是是基于客户机/服务器(client/server)模型型的关系型数据据库管理系统统(DBMS),能够为为多种应用提提供解决方案案,如电子商商务、数据分分析、数据挖挖掘等,被各各类大中小型型企业广泛的的使用。在MicrosoftSQLServer2005系统中提供供了大量的数数据仓库设计计、建立、数数据加载、数数据使用以及及数据挖掘等等强大的工具具。其中常用用的工具有如如下几种:5.2.5MicrosoftSQLServer2005的数据仓库库工具关系型数据库库:作为数据仓仓库设计、构构造和维护的的基础。数据转换服务务(DTS)):用于向数据仓仓库中加载数数据。数据复制:用于分布式式数据仓库分分布和加载数数据。AnalysisServices:用于采集和和分析数据仓仓库中的数据据。EnglishQuery:提供使用自自然英语语言言查询数据仓仓库。OLEDB:提供应用程程序与数据源源的接口API。PivotTable服服务:用于定制操操作多维数据据的客户接口口。MetaDataServices:浏览数据仓仓库中的元数数据。5.3SQLServer数据据仓库的操作作应用SQLServer数数据仓库的框框架连接数据源建数据源视图图创建和部署多多维数据集5.3.1SQLServer数数据仓库的框框架SQLServer数数据仓库的框框架图5.3.1SQLServer数数据仓库的框框架在SQLServer上建立的数数据仓库或数数据集市通过过数据转换服服务利用OLEDB这个应用程序序接口来有效效的访问异构构数据。系统统的不同组件件之间通过微软中心库((Repository)共享元数据。。前端工具可可以使用InternetExplorer、Access、Excel、EnglishQuery等的呢呢个来通过OLEDB存取数据仓仓库的数据。。5.3.2连连接数据源源数据源是数据据仓库将要分分析的数据来来源,在每个个数据库中都都可以指定一一个或多个立立方体、数据据挖掘模型等等对象提供数数据的数据源源。在连接数数据源时我们们需要先启动动MicrosoftSQLServer2005中的SQLServerBusinessIntelligenceDevelopmentStudio工具,创建新新的数据挖掘掘项目,命名名为AdventureWorks,打开该该项目的解决方方案资源管理理器。5.3.2连连接数据源源5.3.2连连接数据源源在“数据源””上单击鼠标标右键,这时时弹出一个如如图5-4所所示的快捷菜菜单,左键单单击“新数据据源”。在“提供程序序”列表中,,确保已选中中“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”。“连接”选项项卡中的内容容根据在“OLEDB提供程序序”选择的数数据源的不同同也会有所差差异。在这里里我们的“连连接”选项卡卡由3个部分分组成:1、“选择择或输入服务务器名称”,,在这里我们可可以在下拉列列表框中指定定将要连接的的服务器名称称或者手动输输入服务器名名称。5.3.2连连接数据源源2、“登陆到到服务器”,,这里可以有2种选项供用用户选择,分分别是“使用Windows身身份验证””和“使用SQLServer身身份验证”。。如果选择“使使用Windows身身份验证”,,那么就表示示使用Windows操操作系统的的用户可以直直接登录到SQLServer系系统中而无需需再次认证。。如选择“使使用SQLServer身份验证证”则表示使使用SQLServer认证模式式,即用户在在登录SQLServer系统时时需要输入事事先设定的用用户名和密码码。这里我们们选择了“使使用Windows身身份验证”选选项。复选框框“空白密码码”表示禁止止用户输入密密码,复选框框“保存密码码”则表示允允许系统自动动保存用户密密码,当用户户再次登陆的的时候就不必必再次输入密密码。3、选择一个个数据库来连接到数据据源上,这里里可以选择““在服务器上上选择数据库库”这样我们们就可以从下下拉列表中选选择或手动输输入数据库名名称。如果用用户选择“附附加一个数据据库文件作为为数据库名””那么用户就就可以在文本本框中输入一一个数据库名名称然后在““使用文件名名”文本框中中输入将要连连接的数据库库文件名称就就可以了。5.3.2连连接数数据源源5.3.2连连接数数据源源最后我我们可可以单单击““测试试连接接”按按钮来来测试试连接接是否否成功功,如如果连连接顺顺利的的话则则会出出现如如图所所示的的对话话框。。5.3.2连连接数数据源源点击““确定定”后后,出出现““完成成向导导”,,单击击“完完成””以创创建名名为AdventureWorksDW的的新数数据源源。创创建数数据源源视图图在解决决方案案资源源管理理器中中,右右键单单击““数据据源视视图””,再再单击击“新新建数数据源源视图图创创建数数据源源视图图此时将将打开开数据据源视视图向向导在“欢欢迎使使用数数据源源视图图向导导”页页中,,单击击“下下一步步”。。创创建数数据源源视图图此时将将显示示“选选择数数据源源”页页。““关系系数据据源””下的的AdventureWorksDW数数据据源已已被选选中。。创创建数数据源源视图图单击““下一一步””。此此时时将显显示““选择择表和和视图图”页页。在在此页页中,,可以以从选选定的的数据据源提提供的的对象象列表表中选选择表表和视视图。。可以以筛选选此列列表,,为选选择表表和视视图提提供帮帮助。。在““可用用对象象”列列表中中,选选择下下列表表(同同时按按下Ctrl键键可选选择多多个表表)::DimCustomer、DimGeography、、DimProduct、、DimTime、、FactInternetSale。将将选中中的表表添加加到““包含含的对对象””列表表中。。创创建数数据源源视图图单击““下一一步””,再再单击击“完完成””以定定义AdventureWorksDW数数据源源视图图。此此时,,数据据源视视图AdventureWorksDW将将在解解决方方案资资源管管理器器的““数据据源视视图””文件件夹中中显示示。同同时,,数据据源视视图的的内容容也将将在BusinessIntelligenceDevelopmentStudio的的数据据源视视图设设计器器中显显示。。5.3.4创建和部部署多维数数据集创建多维数数据集仍然然需要解决决方案资源源管理器,,首先在树树形结构中中AdventureWorks项项目节点点下的“多多维数据集集”图标上上单击鼠标标右键,在在弹出的快快捷菜单中中选择“新新建多维数数据集”,,如图5-13所示示。5.3.4创建和部部署多维数数据集接下来会出出现“多维维数据集向向导”欢迎迎对话框,,如图5-14所示示,单击对对话框中的的“下一步步”按钮,,在“选择择生成方法法”页上,,确认已选选中“使用用数据源生生成多维数数据集”选选项和“自自动生成””选项,然然后单击““下一步””。在““选择数据据源视图””页上,确确认已选中中AdventureWorksDW数数据源视视图,然后后单击“下下一步”。。该向导扫描描在数据源源对象中定定义的数据据库中的表表,以标识识事实数据据表和维度度表。事实实数据表包包含相关的的度量值,,如售出的的部件数等等。维度表表包含有关关这些度量量值的信息息,如售出出产品、售售出该产品品的月份等等。5.3.4创建和部部署多维数数据集5.3.4创建和部部署多维数数据集5.3.4创建和部部署多维数数据集在“标识事事实数据表表和维度表表页上,将将显示该向向导所标识识的事实数数据表和维维度表。对对于本项项目,该向向导标识四四个维度表表和一个事事实数据表表。为该事事实数据表表定义了一一个度量值值组。每每个维度表表必须链接接到多维数数据集中的的一个事实实数据表。。维度表具具有下列关关系类型之之一:与与事实数据据表的直接接主键-外外键关系,,这称为““星型架构构”;通过过某个其他他表与事实实数据表的的间接主键键-外键关关系,这称称为“雪花花型架构””。需注注意,表既既可以用作作事实数据据表,又可可以用作维维度表。在“标识事事实数据表表和维度表表”页上,,还可以指指定时间维维度表,然然后将时间间属性与指指定维度表表中的列相相关联。时时间属性与与指定时间间维度表中中的列相关关联是基于于时间的多多维表达式式(MDX)计计算(如YTD和和ParallelPeriod)所必需需的,而且且时间智能能向导将使使用这一关关联定义与与时间相关关的计算成成员。5.3.4创建和部部署多维数数据集下图显示了了该向导的的“标识事事实数据表表和维度表表”页,其其中为AdventureWorks项目目选择了事事实数据表表和维度表表在“标识事事实数据表表和维度表表”页的““时间维度度表”列表表中,选择择Time,然后后单击“下下一步”。。在“选择择时间段””页上,将将时间属性性名称映射射到以指定定为“时间间”维度的的维度为基基础的维度度表中的相相应列。根根据以下列列表映射这这些属性::将Year属属性映射到到CalendarYear列。。将HalfYear属属性映射射到CalendarSemester列列。将Quarter属属性映射到到CalendarQuarter列。将将Month属属性映射到到EnglishMonthName列。。将Date属属性映射到到FullDateAlternateKey列。。5.3..4创建建和部署署多维数数据集5.3..4创建建和部署署多维数数据集下图演示示了该向向导中的的这些列列映射。。单击“下下一步””按钮进进入向导导的下一一页。随随即会会出现““选择度度量值””页,其其中显示示了该向向导所选选择的度度量值。。该向导导选择它它标识为为事实数数据表的的表中的的各数值值数据类类型列作作为度量量值。本本例只定定义了一一个度量量值组。。在“选选择度量量值”页页上,查查看在““Internet销销售””度量值值组中选选择的度度量值,,然后清清除下列列度量值值的复选选框:促促销关关键字、、货币关关键字、、销售区区域关键键字、修修订号。。该向导选选择事实实数据表表中未链链接到维维度的所所有数值值列作为为度量值值。但这这四列不不是实际际的度量量值。前前三列是是将事实实数据表表与未在在此多维维数据集集的初始始版本中中使用的的维度表表链接起起来的键键值。5.3..4创建建和部署署多维数数据集下图显示示了“选选择度量量值”页页上已清清除的复复选框和和其余选选定维度度。5.3..4创建建和部署署多维数数据集单击“下下一步””。由于于您前面面已在该该向导选选择了““自动生生成”选选项,因因此该向向导将扫扫描层次次结构。。该向向导对定定义为维维度表的的表中的的各列记记录进行行采样,,以确定定列之间间是否存存在层次次结构关关系。层层次结构构关系是是多对一一关系,,例如““市/县县”和““省/市市/自治治区”之之间的关关系。在该向导导完成对对维度的的扫描和和对层次次结构的的检测后后,请在在“检测测层次结结构”页页上单击击“下一一步”。。在““查看新新建维度度”页上上,通过过展开树树控件显显示该向向导检测测到的三三个维度度的层次次结构和和属性,,查看其其中每个个维度的的维度层层次结构构。5.3.4创创建和部署多多维数据集5.3.4创创建和部署多多维数据集下图显示了““查看新建维维度”页上的的这三个维度度。5.3.4创创建和部署多多维数据集依次展开“产产品”维度度和“属性””,然后清除除LargePhoto复选选框。单击““下一步”。。LargePhoto列在本本项目的多维维数据集中不不是很有用,,并且由于它它可能会占用用大量空间,,因此最好将将其从多维数数据集中删除除。在“完成成向导”页上上,将多维数数据集的名称称更改为AdventureWorksDW。在该页页上,也可以以查看多维数数据集的度量量值组、度量量值、维度、、层次结构和和属性。单击击“完成”按按钮以完成向向导。5.3.4创创建和部署多多维数据集5.3.4创创建和部署多多维数据集下面要对多维维数据集进行行部署,在解解决方案资源源管理器中,,右键单击““AdventureWorks”项目,,然后单击““属性”。将出现“AdventureWorks属属性页”对对话框,并显显示活动(开开发)配置的的属性。可以以定义多个配配置,每个配配置可以具有有不同的属性性。例如,不不同的开发人人员可能需要要将同一项目目配置为部署署到不同的开开发计算机,,并具有不同同的部署属性性,如不同的的数据库名称称或处理属性性。注意“输输出路径”属属性的值。该该属性指定生生成项目时保保存项目的XMLA部部署脚本的的位置。这些些脚本用于将将该项目中的的对象部署到到AnalysisServices实实例。在左窗格的““配置属性””节点中,单单击“部署””。如果您不不希望更改““服务器”属属性的值,则则单击“取消消”。否则,,单击“确定定”。5.3.4创创建和部署多多维数据集5.3.4创创建和部署多多维数据集在解决方案资资源管理器中中,右键单击击AdventureWorks项目,,再单击“部部署”,或者者在“生成””菜单上单击击“部署AdventureWorks”。。BusinessIntelligenceDevelopmentStudio将将生成AdventureWorks项项目,然后后使用部署脚脚本将其部署署到指定的实实例中。部署署进度将在下下列两个窗口口中显示:““输出”窗口口和“部署进进度–AdventureWorks””窗口。“输输出”窗口显显示部署的整整体进度。““部署进度––AdventureWorks”窗口口显示部署过过程中每个步步骤的详细信信息。5.3.4创创建和部署多多维数据集下图显示部署署AdventureWorks项目过程程中的“部署署进度-AdventureWorks”窗口和““输出”窗口口。5.3.4创创建和部署多多维数据集这样就将AdventureWorksDW多维数据据集成功部署署到本地实例例,并已对部部署的多维数数据集进行了了处理。您现现在已准备就就绪,可以浏浏览多维数据据集中的实际际数据。下面对本项目目部署之后的的结果进行浏浏览,通过单单击BusinessIntelligenceDevelopmentStudio中的的“客户”选选项卡,切换换到“客户””维度的维度度设计器,然然后单击“浏浏览器”选项项卡。“省/市/自自治区名––地域”用用户层次结构构将显示在““浏览器”选选项卡的工具具栏上的“层层次结构”列列表中;当前前级别的名称称“(全部)”将直接显显示在该工具具栏下方,而而“(全部)”级别的单单独成员将显显示在浏览器器窗格中。默默认情况下,,“(全部)”级别的唯唯一成员的名名称是“全部部”并且可见见。对于方案案维度等维度度,可以更改改或隐藏此级级别的名称。。在“级别和成成员”窗格中中,展开“(全部)”级级别的“全部部”级别成员员以显示“省省/市/自治治区名”级别别的成员。展展开此级别的的Alabama成成员以显示““地域”级别别。展开“地地域”级别的的280成成员,以在在“客户”级级别查看该成成员。使用维度设计计器的“级别别和成员”窗窗格,可以在在多维数据集集向导所设计计的用户层次次结构中轻松松查看每个级级别的成员,,因而可以确确定需要进行行的功能更改改。请注意以以下几点内容容:此层次结结构没有定义义“市/县””级别,“地地域”级别的的成员是DimGeography表键值值,“客户””级别显示客客户的电子邮邮件地址而不不是客户的姓姓名。5.3.4创创建和部署多多维数据集下图显示了““级别和成员员”窗格中的的展开层次结结构。5.3.4创创建和部署多多维数据集在“客户”维维度的维度设设计器的工具具栏上,在““层次结构””列表中选择择“英语国家家/地区区域域名”,然后后在“级别和和成员”窗格格中展开“全全部”级别成成员。随即会显示““英语国家/地区区域名名”属性的属属性层次结构构。默认情况况下,维度的的每个属性都都具有包含以以下两个级别别的层次结构构:“(全部部)”级别和和包含每个属属性成员的级级别。第二个个级别的名称称是属性名本本身。5.3.4创创建和部署多多维数据集下图显示了““英语国家/地区区域名名”属性的层层次结构。5.3.4创创建和部署多多维数据集单击AdventureWorksDW多多维数据集的的设计器选项项卡,切换到到BIDevelopmentStudio中的的多维数据集集设计器。选选择“浏览器器”选项卡,,然后在设计计器的工具栏栏上单击“重重新连接”。。也可以单击击浏览器窗格格中间显示的的“单击此处处可再次尝试试加载浏览器器”链接。该设计器的左左窗格显示了了AdventureWorksDW多多维数据集的的元数据。您您会看到“透透视”和“语语言”选项显显示在“浏览览器”选项卡卡的工具栏上上。您还会看看到“浏览器器”选项卡包包含两个位于于“元数据””窗格右侧的的窗格:上面面的窗格是““筛选器”窗窗格,下面的的窗格是“数数据”窗格。。5.3.4创创建和部署多多维数据集下图突出显示示了多维数据据集设计器中中的各个窗格格。5.3.4创创建和部署多多维数据集在“元数据””窗格中,依依次展开“度度量值”、““Internet销销售”,然后后将“销售额额”度量值拖拖到“数据””窗格的“将将合计或详细细信息字段拖拖至此处”区区域。在““元元数数据据””窗窗格格中中,,展展开开““客客户户””。。请注注意意,,““客客户户””维维度度中中的的所所有有属属性性层层次次结结构构均均显显示示在在““元元数数据据””窗窗格格中中。。““客客户户””维维度度列列表表还还包包含含““省省/市市/自自治治区区名名––地地域域””用用户户层层次次结结构构。。可可以以使使用用任任意意一一个个或或多多个个属属性性层层次次结结构构来来确确定定多多维维数数据据集集的的维维度度。。不不过过,,对对于于业业务务用用户户而而言言,,各各维维度度在在同同一一级级别别包包含含如如此此多多的的可可见见层层次次结结构构,,可可能能会会很很难难进进行行浏浏览览。。将““英英语语国国家家/地地区区区区域域名名””属属性性层层次次结结构构拖拖到到““数数据据””窗窗格格的的““将将行行字字段段拖拖至至此此处处””区区域域。。现在在便便可可查查看看按按各各客客户户所所在在国国家家/地地区区确确定定维维度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024广东依顿电子科技股份有限公司招聘第三事业部总经理拟录用人员阅读模式笔试参考题库附带答案详解
- YesNo or Maybe So绘本阅读(教学设计)-2024-2025学年人教新目标Go For It!英语八年级上册
- 4.2《炉中煤》《红烛》教案-【中职专用】高二语文同步教学(高教版2024·拓展模块下册)
- 第一章《走进信息社会》第4课时《信息技术促进社会变革与发展》教学设计 2023-2024学年粤教版(2019)高中信息技术必修2
- 11-2《与妻书》教学设计-2024-2025学年高一语文下学期同步教学设计(统编版必修下册)
- 探索1 物联网的传感技术 教学设计 2024-2025学年 苏科版(2023)初中信息科技 八年级上册
- 2024年12月国家空间科学中心太阳活动与空间天气重点实验室实验人员公开招聘2人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2025年河南省郑州市单招职业倾向性测试题库1套
- Module 2 Public Holiday Unit 2教学设计2024-2025学年外研版英语九年级上册
- 2025年船用动力堆及配套产品合作协议书
- DB45T 2364-2021 公路路基监测技术规范
- 二级WPS Office高级应用与设计计算机等级考试试题与参考答案(2024年)
- 2025年春九年级化学下册 中考综合模拟测试卷一(科学版)
- 供电所安全第一课
- 新能源汽车底盘概论课件
- 全脑血管造影术的护理查房
- 直系亲属股权无偿转让合同(2篇)
- 2025年四年级下学期语文教学计划
- 学习弘扬红船精神课件
- 消防工程施工组织设计方案
- 敦刻尔克大撤退课件
评论
0/150
提交评论