数据仓库与数据挖掘综述_第1页
数据仓库与数据挖掘综述_第2页
数据仓库与数据挖掘综述_第3页
数据仓库与数据挖掘综述_第4页
数据仓库与数据挖掘综述_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SourceDatabasesData Extraction,Transformation, loadWarehouseAdmin.ToolsExtract, Transformand LoadDataModelingToolCentralMetadataArchitectedData MartsData Accessand AnalysisEnd-UserDW ToolsCentral DataWarehouseCentral DataWarehouseMid-TierMid-TierDataMartDataMartLocal MetadataLocal MetadataLocal Meta

2、dataMetadataExchangeMDBDataCleansingToolRelationalAppl. PackageLegacyExternalRDBMSRDBMSSourceDatabasesHub - Data Extraction,Transformation, loadWarehouseAdmin.ToolsExtract, Transformand LoadDataModelingToolCentralMetadataArchitectedData MartsData Accessand AnalysisCentral Data Ware-house and ODSCent

3、ral DataWarehouseMid-TierRDBMSDataMartMid-TierRDBMSDataMartLocal MetadataLocal MetadataLocal MetadataMetadataExchangeODSOLTPToolsDataCleansingToolRelationalAppl. PackageLegacyExternalMDBEnd-UserDW ToolsRelationalPackageLegacyExternalsourceDataCleanToolDataStagingEnterprise DataWarehouse DatamartData

4、martRDBMSROLAPRDBMSEnd-UserToolEnd-UserToolMDBEnd-UserToolEnd-UserToolvBuild Enterprise data warehouseHCommon central data modelHData re-engineering performed onceHMinimize redundancy and inconsistencyHDetailed and history data; global data discoveryvBuild datamarts from the Enterprise Data Warehous

5、e (EDW)HSubset of EDW relevant to departmentHMostly summarized dataHDirect dependency on EDW data availabilityExternal DataLocal Data MartOperational DataEnterprise Warehouse创建部门的数据集市创建部门的数据集市n范围局限于一个主题区域n快速的 ROI - 局部的商业需求得到满足H本部门自治 - 设计上具有灵活性H对其他部门数据集市是一个好的指导H容易复制到其他部门 H需要为每个部门做数据重建H有一定级别的冗余和不一致性H一

6、个切实可行的方法一个切实可行的方法v扩大到企业数据仓库扩大到企业数据仓库n创建EDB作为一个长期的目标局部数据集市局部数据集市外部数据外部数据操作型数据操作型数据 (全部全部)操作型数据操作型数据(局部局部)操作型数据操作型数据(局部局部)局部数据集市局部数据集市企业数据仓库企业数据仓库EDBDateMonthYearDateCustIdCustNameCustCityCustCountryCustSales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_salesMeasurementsProductNo

7、ProdNameProdDescCategoryQOHProductStoreIDCityStateCountryRegionStoreDateMonthDateCustIdCustNameCustCityCustCountryCustSales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_salesMeasurementsProductNoProdNameProdDescCategoryQOHProductMonthYearMonthYearYearCityStateCityCountryRegionC

8、ountryStateCountryStateStoreIDCityStore时间维时间维事实表事实表事实事实度量度量(Metrics)时间维时间维时间维的属性时间维的属性500-100016%100014%100-50036% 1 TB40%50GB12%50-250GB19%250-500GB8%500GB-1TB21%DW规模的调查规模的调查最近一年最近一年Meta Group Survey调查对象:调查对象:3000+ 用户或意向用户用户或意向用户Data MiningDatabase TechnologyStatisticsOtherDisciplinesInformationSci

9、enceMachineLearning (AI)Visualization关联规则、序列模式、分类、聚集、神经元网络、偏差分析关联规则、序列模式、分类、聚集、神经元网络、偏差分析数据挖掘算法层产品推荐、客户细分、客户流失、欺诈甄别、特征分析产品推荐、客户细分、客户流失、欺诈甄别、特征分析商业逻辑层基因(基因(DNA)分析、银行、保险、电信、证券、零售业分析、银行、保险、电信、证券、零售业行业应用层数据挖掘应用平台数据挖掘应用平台数据挖掘应用平台数据挖掘应用平台数据挖掘应用平台数据挖掘应用平台MISERPCRME_Business数据挖掘应用平台数据挖掘应用平台数据挖掘应用平台数据挖掘应用平台数

10、据挖掘应用平台数据挖掘应用平台探索数据仓库数据挖掘算法库模型库组件库产品推荐客户细分客户流失欺诈甄别特征分析序列分析 行业应用知识数据挖掘应用服务器数据挖掘应用服务器数据挖掘应用服务器数据挖掘应用服务器数据挖掘应用服务器数据挖掘应用服务器信息系统信息系统信息系统信息系统信息系统信息系统行业客户端行业客户端行业客户端行业客户端行业客户端行业客户端数据挖掘应用服务器管理平台其他行业分析平台银行数据挖掘分析平台基因(DNA)序列分析平台数据挖掘数据挖掘应用服务器应用服务器信息系统数据源针对行业的数据挖掘应用模型使用信息系统数据源软件产品:MIS、ERP、CRM模型使用原来的软件产品增加数据挖掘决策支持模块数据挖掘应用服务器应用服务器管理平台行业应用1了解掌握研究动态2 商业模型研究3 数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论