数据仓库商务智能的解决方案_第1页
数据仓库商务智能的解决方案_第2页
数据仓库商务智能的解决方案_第3页
数据仓库商务智能的解决方案_第4页
数据仓库商务智能的解决方案_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Sybase/BusinessIntelligenceSYBASE数据仓库/商务智能解决方案魏健商务智能咨询顾问SYBASE软件(中国)有限公司议程数据仓库解决方案概述数据仓库设计工具数据仓库引擎SybaseAdaptiveServerIQMultiplex“数据仓库是在企业管理和决策中面向主题的,集成的,与时间相关的和不可修改的数据集合”BillInmon数据仓库定义OLTP系统5-10年过去详细数据当前详细数据轻度汇总数据高度汇总数据数据集市用户分析网络资源分析数据仓库数据仓库/决策分析系统数据仓库是完全不同的数据库系统RDBMSSybaseSAP/ERPVSAMEXCEL操作(业务)系统特性事务处理性能是第一位的支持日常的业务事务驱动面向应用数据是当前的并在不断变化存储详细数据(每一个事件或事务)针对快速预定义的事务优化设计可预见的使用模式支持办事人员或行政人员数据仓库应用系统特点支持长远的业务战略决策分析驱动面向主题数据是历史的数据反映某个时间点或一段时间数据是静态的,除数据刷新外数据是汇总的优化是针对查询而不是更新支持管理人员和执行主管人员数据仓库解决方案解决从数据库中获取信息的问题。INFORMATION信息信息INFORMATION什么是数据仓库解决方案?应用价值时间1.日常报表2.即席查询3.分析4.数据挖掘专题应用1234数据仓库应用类型数据仓库应用数据仓库系统体系架构RelationalPackageLegacyExternalsourceDataCleanToolSourceDataDataStagingWareHouseAdmin.ToolsEnterpriseDataWarehouseDataExtraction,TransformationandloadDatamartDatamartEnterprise/CentralDataWarehouseRDBMSROLAPRDBMS

DimensionModelingConformeddimension&factIncludingatomic&aggregateArchitectedDatamartsCentralMetadataDataModelingToolEnd-UserToolEnd-UserToolMDBEnd-UserToolEnd-UserToolLocalMetadataLocalMetadata数据仓库/商务智能应用成功的关键•做什么,怎么做?•数据仓库性能Sybase&Partner专业业服务数据仓库库顾问咨咨询IndustryWarehouseStudioSybaseIWS方法法学ERDesignToolImpactAnalysisMetadataManagementSybaseIndustryWarehouseStudio打打包的数据仓库库基础平平台概述述业务模型物理模式元数据ETL工工具例子报表算法ETLToolMetadataExchangeSmartETLMaps(Future)SQLTemplatesCognosBusinessObjectsMicroStrategyBusinessModelsfocusedonKeyIndustryEventsEnterprise-wide,StarSchema-baseddesignIWS产品品介绍绍TABLETABLETABLETABLETABLEIndustry-specificDataModelsDataWarehouse“OpenRDBMS*”ORACLE,IBM,MICROSOFT,NCR,SYBASE,etc.

BIPartnersSampleApplications

AnalyticalCRMSalesAnalysisCustomerProfilingCampaignAnalysisCustomerCareAnalysisLoyaltyAnalysisBusinessPerformanceAnalysisIndustrySpecificSampleDataGeneral-RepresentativeSystemsIntegratorsGuideProjectPlansImplementationProtocole.g.InformaticaETLToolWarehouseArchitectMulti-DimensionalDesignToolSQLSampleReportsWarehouseControlCenterMetaDataManagement客户构成分析营销活动分析客户兴趣分析忠诚度分析销售分析行业相关的经营业绩分析收益率分析EVT_TYP_ID=EVT_TYP_IDPRD_ID=PRD_IDENTY_ID=ENTY_IDENTY_ID=EMP_IDGEO_ID=GEO_IDLANGUAGE_ID=LANGUAGE_IDPRODUCT_ID=PRODUCT_IDDEMO_ID=DEMO_IDENTY_ID=V_E_ENTY_IDENTY_ID=ENTY_IDENTY_ID=F_C_ENTY_IDCOR_EVT_TYP_ID=COR_EVT_TYP_IDCOR_RPT_STRC_ID=COR_RPT_STRC_IDENTY_ID=CNTC_RSOL_EMP_IDGEO_ID=GEO_IDFNCL_SCOR_ID=FNCL_SCOR_IDMEASURE_UNIT_ID=MEASURE_UNIT_IDCOR_EVT_TXN_ID=COR_EVT_TXN_IDLANGUAGE_ID=LANGUAGE_IDCOR_EVT_TXN_SEQ_NB=COR_EVT_TXN_SEQ_NBPN_BHVR_SCOR_ID=PN_BHVR_SCOR_IDPRODUCT_ID=PRODUCT_IDDEMO_ID=DEMO_IDENTY_ID=ENTY_IDFNCL_SCOR_ID=FNCL_SCOR_IDMEASURE_UNIT_ID=MEASURE_UNIT_IDDEMO_ID=DEMO_IDPRODUCT_ID=PRODUCT_IDPN_BHVR_SCOR_ID=PN_BHVR_SCOR_IDLANGUAGE_ID=LANGUAGE_IDFNCL_SCORES_ID=FNCL_SCOR_IDMEASURE_UNIT_ID=D_M_MEASURE_UNIT_IDMEASURE_UNIT_ID=MEASURE_UNIT_IDGEO_ID=GEO_IDCOR_RPT_STRC_ID=COR_RPT_STRC_IDEVT_TYP_ID=COR_EVT_TYP_IDENTY_ID=F_C_ENTY_IDGEO_ID=GEO_IDLANGUAGE_ID=LANGUAGE_IDEVT_TYP_ID=EVT_TYP_IDDV_HR_EVT_TYPEEVT_TXN_ID<pk,fk>INTEGEREVT_TYP_ID<fk>INTEGEREVT_TYP_SHRT_NMCHAREVT_TYP_FULL_NMcharEVT_TYP_CAT_SHRT_NCHAREVT_TYP_CAT_FULL_NcharF_HR_EVTV_E_ENTY_ID<fk>INTEGERV_E2_ENTY_ID<fk>INTEGEREVT_DT_PRD_IDINTEGERADMIN<pk,fk>INTEGEREVT_EMP_ID<pk,fk>INTEGEREVT_EMP_DEMO<pk,fk>INTEGEREVT_ADMIN_DEMO<pk,fk>INTEGERCORE_EXT_ID<pk,fk>INTEGERCORE_RPTG_STRUC<pk,fk>INTEGERGEO_ID<pk,fk>INTEGERMU_ID<pk>INTEGERFIN_SCORE_ID<pk,fk>INTEGERLANGUAGE_ID<pk,fk>INTEGERPB_SCORE_ID<pk>INTEGERF_C_ENTY_ID<fk>INTEGERPRODUCT_ID<pk>INTEGERDEMO_ID<pk,fk>INTEGEREMP_ID<pk,fk>INTEGERCDEX_SEQ_NO<pk>INTEGERQTYintegerF_CORE_EVTCOR_EVT_TXN_ID<pk>INTEGERCOR_EVT_TYP_ID<pk,fk>INTEGERD_M_MEASURE_UNIT_ID<fk>INTEGERCOR_RPT_STRC_ID<pk,fk>INTEGERGEO_ID<pk,fk>INTEGERMEASURE_UNIT_ID<pk,fk>INTEGERFNCL_SCOR_ID<pk,fk>INTEGERLANGUAGE_ID<pk,fk>INTEGERPN_BHVR_SCOR_ID<pk,fk>INTEGERPRODUCT_ID<pk,fk>INTEGERDEMO_ID<pk,fk>INTEGERENTY_ID<pk,fk>INTEGERV_E_ENTY_ID<fk>INTEGERCOR_EVT_TXN_SEQ_NB<pk>NUMBERPRD_ID<fk>INTEGERAMOUNTNUMBERD_CORE_EVT_TYPEVT_TYP_ID<pk>INTEGEREVT_TYP_SHRT_NAMVARCHAR(15)EVT_TYP_LONG_NAMVARCHAR(35)EVT_TYP_SUBTYP_NAMVARCHAR(15)D_CORE_RPT_STRCCOR_RPT_STRC_ID<pk>INTEGERHOLDING_COMPANYVARCHAR(35)ORG_TYPEVARCHAR(20)ORG_NAMEVARCHAR(35)REGIONVARCHAR(20)SALES_TEAM_TYPEVARCHAR(15)SALES_TEAMVARCHAR(15)SALES_PERSON_NAMEcharSALES_PERSON_GRADECHARSALES_PERSON_TYPECHARCHNL_CATEGORY1char(18)CHNL_TYPECHARCHNL_SUBCATCHARCHNL_NAMEcharCHNL_CEASED_TRD_DTDATECHNL_ENTY_IDINTEGERCHNL_CITYVARCHAR(20)CHNL_POSTCODEVARCHAR(20)BEGIN_DATE_PRD_IDINTEGEREND_DATE_PRD_IDINTEGERD_GEOGRAPHYGEO_ID<pk>INTEGERALL_ENTRIESCHARPOSTAL_CODECHARVARYING(15)CITYcharPOSTAL_CD_PFXchar(3)HZRD_WTHR_AREACHARHZD_WTHR_TYPECHARDMA_CODECHARSMSA_CODECHARST_PROV_AREACHARTV_REGIONCHARNTL_RADIO_AREACHARLCL_RADIO_AREACHARREGIONCHARCOUNTRYchar(3)CONTINENTY_ABBRchar(3)GEO_SUB_CNTNT_ABBRchar(3)SMRY_EFF_DTINTEGERSMRY_END_DTINTEGERPRISN_ADRS_INDCHARD_MSR_UNITMEASURE_UNIT_ID<pk>INTEGERSHRT_DESCchar(6)LONG_DESCchar(20)D_DEMOGRAPHICSDEMO_ID<pk>INTEGERALL_ENTRIESCHARINCOME_BANDVARCHAR(50)AGE_BANDVARCHAR(50)GNDRCHARMRTL_STATCHARHIGH_VALUE_INDICATCHARACMDTN_CTGRYCHARNBR_IN_HH_BANDVARCHAR(50)CHLD_AT_HOME_BANDVARCHAR(50)SIZE_CLSCHARLEGAL_ORG_TYPECHARNBR_EMP_BANDVARCHAR(50)SECTOR_CLSCHARMAIL_PRMSN_INDCHARTELMKT_PRMSN_INDCHARD_FNCL_SCORFNCL_SCORES_ID<pk>INTEGERINTERNAL_FNCL_SCORVARCHAR(50)EXPERIAN_SCOR_BANDVARCHAR(50)SCOR_N_BANDVARCHAR(50)PRFT_IND_BANDVARCHAR(50)DEBT_INCOME_RATIONUMBERD_LANGUAGELANGUAGE_ID<pk>INTEGERISO_LANG_CODECHARISO_LANG_NAMEcharLANG_GROUPVARCHAR(20)D_PN_BHVR_SCORPN_BHVR_SCOR_ID<pk>INTEGERSCORE1_BANDVARCHAR(20)SCORE_N_BANDVARCHAR(20)D_PRODUCTPRODUCT_ID<pk,fk>INTEGERENTY_ID<fk>INTEGERPRODUCT_LINECHARPRODUCT_GROUPCHARPRODUCT_CODECHARPRODUCT_NAMECHARPD_VARIANT_CODECHARPRODUCT_VARIANTVARCHAR(35)GRP_INDV_INDCHARPD_START_PRD_IDINTEGERPD_END_PRD_IDINTEGERF_SALES_EVENTEVT_TXN_ID<fk>INTEGEREVT_TYP_ID<fk>INTEGERRPT_STRC_ID<fk>INTEGERMEASURE_UNIT_ID<fk>INTEGERFNCL_SCOR_ID<fk>INTEGERPN_BHVR_SCOR_ID<fk>INTEGERENTY_ID<fk>INTEGEREMP_ID<fk>INTEGEREVT_TXN_SEQ_NBR<fk>INTEGERF_CUS_CNTC_EVTV_E_ENTY_ID<fk>INTEGERCUS_CNTC_ID<pk>INTEGERD_C_CTCT_RSOL_ID<fk>INTEGERLGCY_SYS_CUS_CNTCINTEGERCUS_CNTC_REFcharCUS_CNTC_EVT_IDINTEGERF_C_ENTY_ID<fk>INTEGERCUS_STSF_RT_ID<fk>INTEGERCNTC_INIT_DT_IDINTEGERHOUR_ID<fk>INTEGERMINUTE_ID<fk>INTEGERINIT_CNTC_EMP<fk>charCOR_EVT_TXN_ID<fk>INTEGERCOR_EVT_TYP_ID<fk>INTEGERCOR_RPT_STRC_ID<fk>INTEGERGEO_ID<fk>INTEGERMEASURE_UNIT_ID<fk>INTEGERFNCL_SCOR_ID<fk>INTEGERLANGUAGE_ID<fk>INTEGERPN_BHVR_SCOR_ID<fk>INTEGERPRODUCT_ID<fk>INTEGERDEMO_ID<fk>INTEGERCNTC_RSOL_EMP_ID<fk>INTEGERCUS_ID<fk>INTEGERSRSNS_CUS_CO_ID<fk>INTEGERDV_EMPENTY_ID<pk,fk>INTEGERRPT_STRC_IDINTEGERGEO_IDINTEGERADR_IDINTEGEREMP_DEMO_IDINTEGEREMP_NAME_PFXCHAREMP_SNAMEVARCHAR(15)EMP_FNAMEVARCHAR(15)EMP_MNAMEVARCHAR(15)EMP_NAME_SFXCHAREMP_NTL_INS_NBRCHAREMP_HOME_TEL_NBRCHAREMP_PRIM_FAX_NBRCHAREMP_EMAIL_IDINTEGEREMP_DOBDATEEMP_GNDRCHAREMP_MRTL_STATCHAREMP_LIFE_STATCHAREMP_PREF_LANGVARCHAR(20)F_CPGN_CNTC_EVTCCE_ID<pk>INTEGERPROMO_EPSD_ID<pk>INTEGERENTY_ID<pk,fk>INTEGERCNTC_PRD_ID<pk>integerCCH_COUNT<pk>INTEGERCORE__EVT_TYPE_ID<fk>INTEGERCOR_RPTG_STRUCT_ID<fk>INTEGERGEO_ID<fk>INTEGERMU_ID<fk>INTEGERFINANCIAL_SCORE_ID<fk>INTEGERLANGUAGE_ID<fk>INTEGERPB_SCORE_ID<fk>INTEGERPRODUCT_ID<fk>INTEGERDEMO_ID<fk>INTEGEREMP_ID<fk>INTEGERCOR_EVT_TX_SEQ_NO<fk>SMALLINTTRGT_GRPchar(3)CORE_EVENTY_TYPE_IDINTEGERCNTCT_CNTRL_GRP_INCHARCCE_RESULTCHARP_PSYCH_IDINTEGERAFFILIATION_IDintPA_IDINTEGERCC_COMM_EVT_AMTdecimal(10,2)D_TIME_PERIODPRD_ID<pk>INTEGERDT_NAchar(4)DATEDATEDAY_NAMEchar(8)DAY_ABRchar(3)DAY_IN_WEEKSMALLINTDAY_IN_MONTHSMALLINTDAY_IN_YEARSMALLINTWEEK_IN_MONTHSMALLINTWEEK_IN_YEARSMALLINTCLNT_SVC_WK_IN_YRchar(18)MONTH_NAMEchar(10)MONTH_ABRchar(3)MONTH_IN_YEARSMALLINTCALENDAR_QTRchar(6)MONTH_IN_QTRSMALLINTWEEK_IN_QTRSMALLINTDAY_IN_QTRSMALLINTFINANCIAL_QTRchar(6)COMPETITOR_FSCL_YRchar(6)MONTH_IN_FNCL_QTRSMALLINTWEEK_IN_FNCL_QTRSMALLINTDAY_IN_FNCL_QTRSMALLINTSEMI_YEARLYSMALLINTYEAR_NAMEchar(18)YEAR_ABRchar(4)SEASON_NAMEchar(18)SEASON_ABRchar(6)NBR_DAYS_SINCE_90integerHOLIDAY_INDCHARXMAS_HLDY_INDCHAREASTER_HLDY_INDCHARD_CPGN_COM_EVT_TYPEVT_TYP_ID<pk,fk>INTEGERCPGN_COMM_DESCCHAR分析型CRM经营业绩管理SybaseIndustryWarehouseStudio分析型型应用用框架架Time资源搜集需需求理解业业务线线设计模模式ETL模模板构造分分析需需求实施测试用户反反馈精练测试第二代仓仓库典型的的数据据仓库库项目从从这里里开始始SybaseIWS提提供供的时时间上上的价价值快速启启动数数据仓仓库项项目搜集需需求理解业业务线线设计模模式ETL模模板构造分分析查查询实施测试第一代仓仓库SybaseIWS从这里开始IWS节省3到6个月更多的价值=更快地访问信息SybaseIndustryWarehouseStudioValueProposition回回顾顾预先建建立的的业务务和物物理模模型优优化了了项目目进度度的安安排和和加快快了对对数据据的访访问基于经经过验验证的的实施施经验验和行行业经经验设计和和方法法论是是可扩扩展/可定定制的的安全企业范范围数据库库独立立面向行行业集成的的模型型和基基础平平台灵巧节省资资源……一一半半的投投入节省时时间……更更快快的实实施节省资资金……降降低低成本本节省数据仓仓库系系统体体系架架构RelationalPackageLegacyExternalsourceDataCleanToolSourceDataDataStagingWareHouseAdmin.ToolsEnterpriseDataWarehouseDataExtraction,TransformationandloadDatamartDatamartEnterprise/CentralDataWarehouseRDBMSROLAPRDBMSDimensionModelingConformeddimension&factIncludingatomic&aggregateArchitectedDatamartsCentralMetadataDataModelingToolEnd-UserToolEnd-UserToolMDBEnd-UserToolEnd-UserToolLocalMetadataLocalMetadataAdaptiveServer®IQMultiplex™是专门门为满满足数数据仓仓库和和商务务智能能设计计的高高性能能的关关系数数据库库系统统。IQMultiplex的主要要特点点是::•高可扩扩展性性–支持数数以千千计的的并发发用户户存取取TB级的数数据。。•突破性性的速速度–闪电般般的查查询速速度,,比传传统RDBMS快10~100倍以上上。•无限的的灵活活性–支持任任意类类型的的即席席查询询。•最低的拥有有总成本–高效的数据据压缩存储储,达到30%~60%;简单的维维护和管理理。集成的主要要产品DesignWarehouseArchitectManageSybaseASIQMIntegrateInformaticaEnterpriseConnectReplicationServerPowerMartVisualizeBo、BrioCognosSPSSAdministerWarehouseControlCenterWarehouseControlCentreSybase数据仓仓库相关产产品集的构构成RelationalPackageLegacyExternalsourceDataCleanToolSourceDataDataStagingWareHouseAdmin.ToolsEnterpriseDataWarehouseDataExtraction,TransformationandloadDatamartDatamartEnterprise/CentralDataWarehouseRDBMSROLAPRDBMSRDBMS,StarSchemaArchitectedDatamartsCentralMetadataDataModelingToolEnd-UserToolEnd-UserToolMDBEnd-UserToolEnd-UserToolLocalMetadataLocalMetadataPowerCenterPowerMartSybaseIQMSybaseIQMBrio/BOPowerMartWarehouseArchitectWCCCognos设计:成成功的关键键数据库的设设计对数据据仓库系统统的整体性性能、装载载和建立索引的的时间以及及数据量的的增长等的的影响超过过任何其它方方面。数据仓库设设计在支持分析析和决策的的查询环境境中,使业业务用户可可以访问,理解解和利用数数据以业务用户户理解和运运用信息的的方式组织织数据可预见的查查询方式基于时间的的汇总的数据据向下/上的的钻取(Drill-down/drill-up)多维模型设设计传统的数据据建模方法法(如ER模型)可能能非常复杂杂且不易理理解按照最终用用户的想法法定义信息息(以查查询为中心心建模)Star(星型),Snowflake(雪雪花型),,Constellation(星座座型),Snowstorm(雪暴型型)Facts(事实实)::可可度度量量数数据据,,如如数数量量、、价价格格Dimensions(维维)::用用于于分分类类Fact的的详详细细数数据据GroceryTransactionStoreNumberTransactionDateCustomerProductQuantityAmountCustomerCustomerFromDateToDateFirstNameLastNameAddress1Address2Address3CityStateCountryPostalCodeTimeTransactionDateStoreStoreNumberStoreNameCityStateCountryTelephoneProductProductDescriptionCategoryFactTableDimensionTablesDimensionTables多维模型:星星型模式GroceryTransactionStoreNumberTransactionDateCustomerProductQuantityAmountCustomerCustomerFirstNameLastNameAddress1Address2Address3CityStateCountryPostalCodeCustomerCategoryTimeTransactionDateStoreStoreNumberStoreNameCityStateCountryTelephoneRegionProductProductDescriptionCategoryProductCategoryProductCategoryDescriptionRegionRegionDescriptionSalesPeriodPeriodIdentifierSalesPeriodFromDateToDateCustomerCategoryCategoryCustomerCategory为了避免数据据冗余,用用多张表来描描述一个复杂杂维在星型模式的的基础上,构构造维表的的多层结构多维模型:雪雪花模式GroceryTransactionStoreNumberTransactionDateCustomerProductPurchaseQuantityAmountCustomerCustomerFirstNameLastNameAddress1Address2Address3CityStateCountryPostalCodeCustomerCategoryTimeTransactionDateStoreStoreNumberStoreNameCityStateCountryTelephoneRegionProductProductDescriptionCategoryProductLineSalesPeriodPeriodIdentifierSalesPeriodFromDateToDateCustomerCategoryCategoryCustomerCategoryProductPurchasesProductPurchaseDateSupplyingVendorPurchaseOrderUnitQuantityPurchaseCostVendorVendorVendorNameAddress1Address2Address3CityStateCountryPostalCodeProductInventoryProductWarehouseLocationQuantityOnHandQuantityBackOrderedWarehouseWarehouseAddress1Address2Address3CityStateCountryPostalCode具有多个事实实表多维模型:星星座模式GroceryTransactionStoreNumberTransactionDateCustomerProductPurchaseQuantityAmountCustomerCustomerFirstNameLastNameAddress1Address2Address3CityStateCountryPostalCodeCustomerCategoryTimeTransactionDateStoreStoreNumberStoreNameCityStateCountryTelephoneRegionProductProductDescriptionCategoryProductLineProductCategoryProductCategoryDescriptionRegionRegionDescriptionSalesPeriodPeriodIdentifierSalesPeriodFromDateToDateCustomerCategoryCategoryCustomerCategoryPromotionPeriodPromotionIdPromotionFromDateToDateProductLineProductLineIDDescriptionProductPurchasesProductPurchaseDateSupplyingVendorPurchaseOrderUnitQuantityPurchaseCostVendorVendorVendorNameAddress1Address2Address3CityStateCountryPostalCodeProductInventoryProductWarehouseLocationQuantityOnHandQuantityBackOrderedWarehouseWarehouseAddress1Address2Address3CityStateCountryPostalCode具有多多个事事实表表与多多层维维表多维模模型:雪雪暴模模式数据模模型中中的事事实和和维度度事实和和维的的概念念对应应于:数据仓仓库数数据库库中的的数据据模型型对象象星型模模式((Starschema))DSS/OLAP系系统统中的的数据据模型型对象象多维模模型((Multidimensionalmodel)SalesfactSalesmeasuresTimedimensionAttributesofthe

timedimension星型模模式-StarSchemaSalesCubeSalesmeasures(Metrics)TimedimensionAttributesofthe

timedimension多维模模型-MultidimensionalModel数据仓仓库设设计工工具WarehouseArchitect为数据据仓库库的设设计提提供三三大功功能::多维建建模度量、、维、、属性性事实表表,维维表维层次次表,,事实实层次次表设计向向导聚合((AggregationWizard)分片((PartitioningWizard))逆向工工程数数据源源优化代代码生生成目标数数据仓仓库引引擎((IQM,,RDBMS)OLAP分析环环境Timeidentifier=TimeidentifierProductidentifier=ProductidentifierCustomeridentifier=CustomeridentifierStoreidentifier=StoreidentifierCustomerCustomeridentifier<pk>doubleCustomernamechar(30)SalesFactProductidentifier<pk,fk>doubleTimeidentifier<pk,fk>doubleCustomeridentifier<pk,fk>doubleStoreidentifier<pk,fk>doubleSalestotalrealProfitsrealStoreStoreidentifier<pk>doubleStorenamechar(50)TimeTimeidentifier<pk>doubleDatetimestampMonthchar(50)QuarterdoubleYeardoubleProductProductidentifier<pk>doubleProductdescriptionchar(80)WarehouseArchitectWarehouseArchitectDataWarehouseorDataMartDatabaseOperationalSourceOLAPEngineInterfaceExternalObjectsDecisionSupport/OLAPModel

(WAMultidimensionalHierarchy)DimensionalAnalysisTransformationRelationaland/orDimensionalAnalysisDataWarehouseModel(WAM)WarehouseArchitect的的支持持范围围数据据仓仓库库设设计计-小小结结WarehouseArchitect对数数据据仓仓库库设设计计过过程程的的每每一一步步都都提提供供支支持持::数据据源源中中的的元元数数据据导导入入。。设计计和和优优化化数数据据仓仓库库的的数数据据模模型型((星星型型模模式式/多多维维模模型型))。。与抽抽取取、、转转换换工工具具对对接接,,实实施施数数据据移移动动。。基于于数数据据仓仓库库模模型型,,为为前前端端DSS/OLAP工具具生生成成所所需需的的数数据据立立方方体体。。为设设计计过过程程的的每每一一步步生生成成文文档档和和报报告告。。数据据存存储储、、管管理理挑战战数据据规规模模查询询性性能能装载载速速度度易于于管管理理存取取访访问问成功功的的关关键键快速速,,高高效效数数据据存存储储技技术术出色的查查询性能能-特特殊的的索引技术,并并行查询询可伸缩性性-GB到到TB级级易于管理理-方方便,,灵活,,GUI存取访问问-数数据随随时可用用数据管理理解决的方方案通用的关关系数据据库系统统专门的数数据仓库库服务器器SybaseIQM专门为数数据仓库库/数据据集市设设计的关关系型数数据库专门针对对OLAP/DSS而而优化的的索引和和查询处处理技术术AdaptiveServerIQM数据存储储:AdaptiveServerIQM垂直存储储技术(VerticalPartitioning)无处不索索引(IndexEVERYWHERE)专利的BitWise索引技术跨跨越Bitmap的限制制多种索引类型型:FP,LF,HNG,HG,CMP,WD低级数的限制制从100扩扩充到1000数据压缩(通通常达到原始始数据的70-75%)预连接的索引引提供额外的的显著提高性性能手段(JoinIndex)支持任意设计计模式星型、雪花、、雪暴、星座座模式普通关系模式式支持任意加载载方式文件、内部数数据、外部数数据库直接加加载开放的接口Index传统RDBMSRelationalTableTypicalRDBMS数据按行存储储数据与索引分分开存放很少的索引类类型-B-树普通关系数据据库为OLTP系统进行优化化B-treeIndexbestforretrievingonerowatatime计算“NY””州A类商店的平均销售额当表的记录数数从几万条变变为千万和上上亿条时,传统RDBMS技术面对对的问题:表扫描的性能能极端低下冗余设计代价价高昂、查询询读取的无效效字段过多低级数类型数数据上索引的的失效普通索引加载载和空间代价价,造成不能能任意建造即席查询的SQL顺序对对性能有显著著影响数值型比较和和运算,无恰恰当手段加速速处理传统RDBMS不适合数数据仓库IQM的特殊殊存储方式-垂直存储((按列存储))SybaseIQM:数据是按列存存储的,而不不是按行存储储好处:只存取查询所所需的数据数据类型是一一致的,因而而可以很容易易被压缩数据库易于修修改和管理SybaseIQM:只读完成查询询所涉及到到的列计算在纽约约的“A””类商店的平均销售售额好处:

无须使用其他的技术,SybaseIQM就可以减少I/O超过90%IQM的特特殊存储方方式-垂直直存储(按按列存储))“HowmanyMALESareNOTINSUREDinCALIFORNIA?GenderMMFMM-800Bytes/Row10MROWSStateNYCACTMACA-RDBMSInsuredYYNYNM Y CAM N CAF Y NYM N CA1243GenderInsuredState++11011101010110MBits10MBitsx3col/816KPage=235I/Os800Bytesx10M16KPage=500,000I/Os基本本上上只只能能使使用用表表扫扫描描查询询过过程程读读取取了了太太多多的的无无效效数数据据IQMExample:I/O的的明明显显减减少少IQM的的索索引引特特点点索引引即即是是数数据据没有有索索引引和和数数据据的的分分别别任何何一一列列可可以以建建立立多多个个索索引引系统统保保证证至至少少会会存存在在一一个个索索引引((FP))索引引的的选选择择和和设设计计主主要要基基于于::数据据的的级级数数((离离散散值值的的个个数数))在查查询询中中的的使使用用方方式式和SQL语语句句的的顺顺序序无无关关索引引的的种种类类FastProjection(FP)数据据压压缩缩存存储储根据据数数据据的的特特点点会会自自动动使使用用三三种种方方式式中中的的一一种种LowFast(LF)Bitmap索索引引HighNonGroup(HNG)Bit-wise索索引引HighGroup(HG)G-Array(包包括括一一个个改改进进的的B-tree)Compare(CMP)列比比较较Word(WD)字符符串串查查找找FP索索引引有有三三种种内内部部形形态态根据据数数据据级级数数特特征征,,IQ自自动动选选择择FP中中最最合合适适的的一一种种表表现现形形式式If级级数数>65536FPindexIf级级数数<256FFPIndex(Fast-FastProjection)If级级数数Between256and65536FFFPIndex(Fast-Fast-FastProjection)FP形形式式1::FPIndex该列列的的级级数数超超过过65536原始始数数据据在在磁磁盘盘上上压压缩缩存存储储alphaalphabetagammabetabetaFP形形式式2::FFPIndex列级级数数<256内部部生生成成一一个个单单字字节节的的lookup表表不仅仅拥拥有有较较好好查查询询效效率率,,同同时时得得到到高高效效压压缩缩DataValuesRedBlueGreenRedColorRedBlueGreen12311123332LookupTableDataFP形形式式3::FFFPIndex列的的级级数数界界于于256和和65536之之间间系统统内内建建一一个个双双字字节节的的lookup表表DataValuesRedBlueGreenRedColorRedBlueGreen12311123

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论