版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Module 1Introduction to Data WarehousingModule Overview数据仓库概述考虑数据仓库解决方案Lesson 1: 数据仓库概述商业难题什么是数据仓库?数据仓库架构数据仓库解决方案组件数据仓库项目数据仓库项目角色SQL Server 作为数据仓库平台业务难题关键业务数据分布在多个业务系统找到业务决策的信息是耗时的和容易出错的基本的业务问题很难回答?What Is a Data Warehouse?一个集中存放用于报表和数据的信息容器通常,一个数据仓库:包含大量的历史数据优化了数据查询 (而不是插入和更新)定期加载新的业务数据为企业商务智能解决方案提
2、供依据Data Warehouse ArchitecturesCentralized Data WarehouseDepartmental Data MartHub and SpokeComponents of a Data Warehousing Solution从业务系统和其他数据源抽取数据加载数据通常最终加载到数据仓库数据清洗和重复数据的删除,确保数据仓库中数据的质量MDM 提供确切的业务数据实体Data WarehouseStaging DatabaseETL Load ProcessETL Staging ProcessMaster Data Management1011000110
3、Data CleansingReporting and AnalysisData SourcesData Warehousing Projects1.首先确定数据仓库需要解决的业务问题2.确定回答这些问题所需的数据3.识别所需数据的数据源4.评估关键业务目标价值可行性,从现在的数据回答每个问题对大量数据的项目, 使用增量更新比较有效:把项目分解为多个子项目每个子项目处理一个特定的主题Data Warehousing Project RolesProject managerSolution architectData modelerDatabase administratorInfrastruc
4、ture specialistETL developerBusiness users/analystTestersData stewardsSQL Server As a Data Warehousing PlatformSQL ServerAnalysis ServicesSQL Server Database EngineMicrosoft SQL Server Integration ServicesSQL Server Master Data Services1011000110SQL Server Data Quality ServicesMicrosoft SQL Azureand
5、 the Windows Azure MarketplaceMicrosoft SharePoint ServerMicrosoft PowerPivot TechnologiesMicrosoft ExcelData Mining Add-InPowerPivot Add-InMDS Add-InPower ViewSQL ServerReporting ServicesReports, KPIs, and DashboardsInteractive data visualizationsInteractive data analysisData WarehousingBusiness In
6、telligenceLesson 2: Considerations for a Data Warehouse SolutionData Warehouse Database and StorageData SourcesExtract, Transform, and Load ProcessesData Quality and Master Data ManagementData Warehouse Database and Storage考虑数据仓库包括:Database schema Logical: typically denormalized for optimal read per
7、formancePhysical: often partitioned for performance and managementHardwareQuery processing and memoryStorageNetworkHigh availability and disaster recoveryHardware redundancyBackup strategySecurityServer accessData permissionsData Sources数据源连接类型凭证和权限数据格式数据采集窗口Extract, Transform, and Load Processes临时表
8、:存放临时数据所需的转换:提取数据时所需的数据转换和清洗增量 ETL:数据的变化加载Data Quality and Master Data ManagementData quality:Cleansing data:Validating data valuesEnsuring data consistencyIdentifying missing valuesDeduplicating dataMaster data management:Ensuring consistent business entity definitions across multiple systemsApplying business rules to ensure data validity1011000110Module Review and TakeawaysWhy might you consider including a staging area in your ETL solution?What options might you consider for performing data transf
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年知识产权许可合同许可使用条件
- 2024年高级信息安全服务外包合同
- 2025年度数据中心布线施工与环保验收服务协议3篇
- 2025年度数据中心厂房股权转让及运维服务合同样本3篇
- 2024版大坝整改施工项目施工质量管理合同3篇
- 2024年货车共享平台租赁合同
- 2024年高速路路基建设土石方工程承包协议一
- 2024年车展保险服务合同
- 2024细胞研究及产业化应用技术服务合同版B版
- 2024年限定商品代理经销权协议书版
- 内蒙古自治区巴彦淖尔市各县区乡镇行政村村庄村名居民村民委员会明细及行政区划代码
- 餐票模板合集
- 私募基金管理公司资产托管制度
- 三年级语文下册教案-14 蜜蜂3-部编版
- 数字信号处理:第一章 数字信号处理概述
- 中国风中国武术武术介绍PPT模板课件
- 兖州一中“循环大课堂教学模式”
- 药理治疗中枢神经系统退行性疾病药.pptx
- 胶原蛋白行业报告
- 养老机构安全隐患排查清单、自查表、治理整改台账
- 压力管道氩电联焊作业指导书
评论
0/150
提交评论