版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
BI基础知识第一页,共三十二页。
BI各概念关系
商业智能
数据仓库OLAP技术DSS产品
数据挖掘
商业智能工具主题第二页,共三十二页。各种概念之间的关系DataWarehouseArtificialIntelligenceDataMartOLAPDecisionSupportSystemDataMiningOperationDatabaseBusinessIntelligentSystemDatabaseSystem第三页,共三十二页。
BI各概念关系
商业智能
数据仓库OLAP技术DSS产品
数据挖掘
商业智能工具主题第四页,共三十二页。BI是将数据转换成信息的过程,然后通过发现将信息转化为知识。
-GartnerGroupBI是将数据转换成知识并将知识应用到商业行为上的一个过程。
-DataWarehouseInstitute商业智能领域:DSS、OLAP、数据仓库、ETL、数据集市、数据挖掘、商业建模...为提高企业运营性能而采用的一系列方法、技术和软件的总和商业智能BusinessIntelligence第五页,共三十二页。
BI各概念关系
商业智能
数据仓库OLAP技术DSS产品
数据挖掘
商业智能工具主题第六页,共三十二页。企业数据仓库EDW企业数据仓库定义:详细交易及相关业务数据的集合包含必要的内部与外部信息来自于多个数据源/业务操作系统保存一定的时间周期按照企业内业务规则所决定的模型来存储企业数据仓库作用:基于数据/信息来回答相关的业务问题和提供决策支持,并确保:一致、集成的数据存储任意的数据粒度在整个企业的业务范围保持企业内一致的信息视图企业内一致的信息视图(SingleVersionoftheTruth)>集成的企业信息(Integratedcorporateinformation)>不针对特定应用(Applicationneutral)>无冗余(Nonredundant)>用于报表和决策支持(Reportinganddecisionmaking)最详细的数据和信息(DetailedData)任何时候,针对任意数据,提出任意业务问题(Askanyquestion,anydata,anytime)第七页,共三十二页。数据仓库的特点第八页,共三十二页。数据仓库领域的两位大师BillInmon数据仓库之父,数据仓库概念的创始人理论:CorporateInformationFactory(CIF)主要著作:《数据仓库》、《企业信息工厂》RalphKimball数据仓库方面的知名学者理论:MutildimensionalArchitecture(MD)
第九页,共三十二页。企业信息工厂第十页,共三十二页。数据仓库总线第十一页,共三十二页。企业总线第十二页,共三十二页。总线架构矩阵第十三页,共三十二页。数据架构形态第十四页,共三十二页。各数据架构比较第十五页,共三十二页。InmonvsKimballInmonKimballOverallapproach
Top-down
Bottom-upComplexityofthemethod
QuitecomplexFairlysimpleDataOrientationDataderivedProcessorientedPrimaryaudienceITaudienceEnduserTool3NFDimensionalModelingArchitecturalstructureEnterprisewide,DatawarehousefeedsdepartmentdatabasesDatamartmodelasinglebusinessprocessEnterpriseconsistencyachievedthroughbus第十六页,共三十二页。
BI各概念关系
商业智能
数据仓库OLAP技术DSS产品
数据挖掘
商业智能工具主题第十七页,共三十二页。OLTP与OLAP针对特定问题的联机数据访问和数据分析技术满足对数据进行多角度、快速、一致、交互、深入观察使用预定义的多维数据视图对数据进行分析处理,支持对数据的切片、切块、钻取。多维数据库是一种以多维数据存储形式来组织数据的数据管理系统,在使用时需要将数据从关系数据库中转载到多维数据库中方可访问。也称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果。这样做的最大优点是可以即时地处理输入的数据,及时地回答。也称为实时系统(RealtimeSystem)。衡量联机事务处理系统的一个重要性能指标是系统性能,具体体现为实时响应时间(ResponseTime),即用户在终端上送入数据之后,到计算机对这个请求给出答复所需要的时间。
OLTP数据库旨在使事务应用程序仅写入所需的数据,以便尽快处理单个事务。On-LineAnalyticalProcessingOn-LineTransactionProcessing第十八页,共三十二页。OLTP与OLAPOLTPOLAP用户操作人员,低层管理人员决策人员,高级管理人员功能日常操作处理分析决策DB设计面向应用面向主题数据当前的,最新的细节的,二维的历史的,聚集的,多维的集成的,统一的存取读/写数十条记录读上百万条记录工作单位简单的事务复杂的查询用户数上千个上百个DB大小100MB-GB100GB-TBROLAP表示基于关系数据库的OLAP实现(RelationalOLAP)MOLAP表示基于多维数据组织的OLAP实现(MultidimensionalOLAP)第十九页,共三十二页。ROLAPMOLAP沿用现有关系数据库技术专用技术响应速度相对molap要慢性能好,响应速度快数据转载计算速度快数据转载速度慢存储空间耗费小,维数没有限制需要进行预计算,可能导致数据爆炸,维数有限,无法支持维的动态变化借助rdbms对数据存储,无文件大小限制受操作系统平台文件大小限制,难以达到tb级可以通过sql语句实现详细数据和概要数据的存储缺乏数据模型和数据访问的标准不支持预计算的读写操作无法完成维之间的运算无法完成多行计算支持高性能的决策支持计算复杂的跨维计算多用户读写操作行级计算ROLAP
vsMOLAP第二十页,共三十二页。
BI各概念关系
商业智能
数据仓库OLAP技术DSS产品
数据挖掘
商业智能工具主题第二十一页,共三十二页。DSS产品产品名称产品内容方法论数据仓库项目组织步骤、人员角色、建设放方案等一系列方法的集合,指导方针数据仓库数据模型的建模方法;统一的概念模型、逻辑模型;数据库中对应的组织(物理化)技术组件与功能ETL功能组件;前端门户组件、模版;元数据管理;用户与组织;权限组织;应用分析集合面向业务的分析;面向问题的专题;固定报表;即席查询分析;KPI;分析、互动流程数据组织过程与个性应用实现数据的加载、清洗、组织规划的过程;用户本地的需求整理与实现;与开发者的经验、技能相关第二十二页,共三十二页。
BI各概念关系
商业智能
数据仓库OLAP技术DSS产品
数据挖掘
商业智能工具主题第二十三页,共三十二页。数据挖掘改变未来世界的十大新兴技术机器与人脑的接口塑胶晶体管数据挖掘(DataMining)数字权利管理生物测定学(Biometrics)语言识别处理微光学技术(Microphotonics)解开程序代码(UntanglingCode)机器人设计微应用流体学(Microfluidics)
资料来源:《TechnologyReview》(麻省理工学院2002年1月出刊)第二十四页,共三十二页。什么是数据挖掘?定义: 从海量的数据库中选择、探索、识别出有效的、新颖的、具有潜在效用的乃至最终可理解的模式以获取商业利益的非平凡的过程
-Fayyad,Piatetsky-Shapiro特征:处理海量的数据;揭示企业运作中的内在规律;为企业运作提供直接决策分析,并为企业带来巨大经济效益。DataInformationKnowledgeWisdomData+contextInformation+rulesKnowledge+experience第二十五页,共三十二页。数据挖掘涉及领域神经计算数据库知识发现数据挖掘统计学模式识别机器学习人工智能第二十六页,共三十二页。数据挖掘基本概念模型(Model)vs模式(Pattern)数据挖掘的根本目的就是把样本数据中隐含的结构泛化(Generalize)到总体(Population)上去模型:对数据集的一种全局性的整体特征的描述或概括,适用于数据空间中的所有点,例如聚类分析模式:对数据集的一种局部性的有限特征的描述或概括,适用于数据空间的一个子集,例如关联分析算法(Algorithm):一个定义完备(well-defined)的过程,它以数据作为输入并产生模型或模式形式的输出描述型挖掘(Descriptive)vs预测型挖掘(Predictive)描述型挖掘:对数据进行概括,以方便的形式呈现数据的重要特征预测型挖掘:根据观察到的对象特征值来预测它的其他特征值描述型挖掘可以是目的,也可以是手段第二十七页,共三十二页。几类基本的挖掘算法关联规则(模式、描述型)发现数据集中的频繁模式例如:buy(x,”diapers”)buy(x,”beers”)[0.5%,60%]分类与预测(模型、预测型)发现能够区分或预测目标变量(唯一的)的规则或者函数分类的目标变量一般是范畴型的,而预测则是数量型的,并不必然带有任何时间延续型的暗示例如:股票市值的预测,病人病情的判断聚类(模型、描述型)对数据分组以形成新类,类标记是未知的例如:市场细分孤立点探测(OutlierDetection)(模式、预测型)分析异常或噪声数据的行为模式例如:欺诈检测第二十八页,共三十二页。
BI各概念关系
商业智能
数据仓库OLAP技术DSS产品
数据挖掘
商业智能工具主题第二十九页,共三十二页。工具分类建模工具:Powerdesigner、ErwinETL工具:用于数据的集成和处理Datastage、Infomatic、Automation数据质量工具:一般集成在ETL工具中分析工具:报表工具:BO、COGNOS、OBIEE、MicroStrategyOLAP工具:COGNOS、BO、OBIEE
(Hyperion)BI分析门户:一般集成在分析工具中数据挖掘工具:SASEnterpriseMiner、SPSSClementine元数据管理工具:metacenter、CA、Infomatic第三十页,共三十二页。第三十一页,共三十二页。内容总结BI基础知识。BI是将数据转换成信息的过程,然后通过发现将信息转化为知识。BI是将数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 难忘金秋作文
- 抖音甜蜜爱情文案
- 谈恋爱反思检讨书
- 2024年垂直电梯项目资金申请报告代可行性研究报告
- 世界哮喘日儿童哮喘诊断评估治疗长期教育与管理课件
- 实验室资源管理课件
- 《左侧睾丸鞘膜积液》课件
- 《等比数列定义》课件
- 《汽车轮辋培训》课件
- 【初中数学课件】分解因式复习课件
- 干眼症病人护理课件
- (完整)《生活中的数学》校本课程
- NBT47013.4-2015承压设备无损检测第4部分:磁粉检测
- FTTR 技术白皮书说明
- 社会稳定风险评估业务档案管理制度
- 论西方骑士文学和中国武侠文学中的“情”
- 2024甘肃中级电工考试题库高压电工考试(全国版)
- 人教版六年级数学上册第五单元《圆》单元分层作业设计
- 经济思想史智慧树知到期末考试答案2024年
- 统计学计算题及统计学计算题例题
- 水中嗜肺军团菌检验方法 酶底物定量法
评论
0/150
提交评论