版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据模型的基本概念
及建模方法论数据模型的基本概念
及建模方法论2内容安排数据模型相关术语什么是数据模型建模注意事项数据模型方法论2内容安排数据模型相关术语什么是数据模型建模注意事项数据什么是数据模型?以数学的方式对现实事物的一种抽象表达,…特征:内容:描述了数据、及其之间的关系形式:反映了数据的组织与管理形式用途:(数据仓库)系统建设中的数据信息的蓝图(数据仓库)系统建设的核心业务人员与IT人员沟通的语言和工具 3什么是数据模型?以数学的方式对现实事物的一种抽象表达,…数据模型的分类数据仓库项目中数据模型可以分为以下几种:ConceptualDataModel(CDM)概念数据模型LogicalDataModel(LDM)逻辑数据模型PhysicalDataModel(PDM)物理数据模型ApplicationDataModel(ADM)应用数据模型4数据模型的分类数据仓库项目中数据模型可以分为以下几种:4概念数据模型ConceptualDataModel(CDM)概念数据模型从全局上、宏观上介绍模型设计思路、范围和内容。主要组成元素主题主题间关系主题中的重要实体实体间的相互关系目标与用途圈定建模的范围划分建设主题理清主要业务关系构造逻辑数据模型的框架5概念数据模型ConceptualDataModel(CD逻辑数据模型定义:使用逻辑建模语言定义数据与数据之间的逻辑关系以图形化的形式反映客户的业务规则达到数据组织的设计目标6符号体系设计内容表现形式反映内容设计目标逻辑数据模型定义:6符号体系逻辑数据模型LogicalDataModel(LDM)逻辑数据模型设计人员:业务人员、IT人员设计目标设计蓝图,指导整个数据仓库系统的建设业务语言,业务人员与技术人员沟通的手段和方法业务视图,独立于数据库技术实现设计内容:实体、关系和属性建模方法:3NF的设计方法后续工作:物理数据模型的输入7逻辑数据模型LogicalDataModel(LDM)物理数据模型PhysicalDataModel(PDM)物理数据模型设计目标:面向物理实施的具体细节输入条件继承于逻辑数据模型依赖于所选择的数据库决定于业务需求和性能之间的平衡设计内容数据库、表和字段、索引需要作非正则化处理后续工作:ETL、元数据管理和前端应用输入8物理数据模型PhysicalDataModel(PDM)应用数据模型ApplicationDataModel(ADM)应用数据模型设计目标满足最终用户对数据的访问(内容、形式要求)满足应用系统对数据的存取(性能、存储要求)主要特征面向PowerUser和业务人员与具体的应用相关多维分析时一般采用星型结构或者雪花状结构的设计方法是事实表和维度表的组合9应用数据模型ApplicationDataModel(A逻辑数据模型与物理数据模型比较
逻辑数据模型物理数据模型包含内容实体、属性表、字段定位记录主键主索引使用名称业务名称物理名称(受限于DBMS)正则化3NF建设可能会按照性能、空间要求进行非正则化冗余数据无冗余数据含冗余数据派生数据无派生数据包含派生数据开发人员业务人员与建模人员物理数据库设计人员10逻辑数据模型与物理数据模型比较
逻辑数据模型物理数据模型包含逻辑数据模型在数据仓库中的定位11存储和管理采集回答业务问题
析取清洗
条件
剔除家庭关系
加载
业务系统
业务系统
业务数据
外部数据
关系数据库管理系统聚集统计人工智能神经网络多维可视化EIS/DSS电子表对象语言
开发企业数据仓库从属数据集市业务人员IT用户数据导入知识发现数据挖掘信息存取工具源数据逻辑数据模型应用数据模型逻辑数据模型在数据仓库中的定位11存储采集回答析取清洗条12内容安排数据模型相关术语什么是数据模型建模注意事项数据模型方法论12内容安排数据模型相关术语什么是数据模型建模注意事项数13逻辑数据模型基本术语(一)模型结构
第三范式(3NF)结构
星型结构(多星型结构)雪花型结构
模型分类概念数据模型逻辑数据模型物理数据模型应用数据模型3NF基础数据模型StarSchema汇总数据/已知应用模型Snowflake星型结构的演变13逻辑数据模型基本术语(一)模型结构模型分类3NFS14实体
独立型实体
依赖型实体
子类实体
主题域层面核心实体关系实体特征实体分类实体逻辑数据模型基本术语(二)14实体主题域核心实体逻辑数据模型基本术语(二)15属性:(描述真实或抽象事物相关联的特征或性质)
主键 (识别实体实例唯一性的属性、属性组)
可选键 (能识别实体实例唯一性的其他属性、属性组)外键 (通过父实体到子实体关系转移到子实体的属性)非键属性(不是实体主键属性的其他属性)
基础名 (外键的原来名称)角色名 (外键的新名称,表明取值是父实体属性的子集)鉴别器(取值决定父实体实例属于哪个子类的属性)逻辑数据模型基本术语(三)15属性:(描述真实或抽象事物相关联的特征或性质)逻辑数16关系二元关系父实体的一个实例严格关系子实体的0,1或多个实例的这种关系是二元关系基数父、子实体实例的比例,如1:1,1:M识别(型)关系子实体实例唯一性的识别与父实体相关联,父实体的主键属性成为子实体的主键属性非识别(型)关系子实体不需要与父实体的关系就可以确定实例唯一性,父实体的主键属性成为子实体的非键属性逻辑数据模型基本术语(四)16关系逻辑数据模型基本术语(四)17关系确定关系父实体的一个实例对应子实体的0、1或多个实例,并且子实体的一个实例对应0或1个父实体的实例非确定关系
多对多关系子类关系子类实体和所属父实体的关系完全子类群
所属父实体的每个实例都能够与子类群的一个实体实例相关联不完全子类群
所属父实体的每个实例不一定都有子类相关联逻辑数据模型基本术语(五)17关系逻辑数据模型基本术语(五)LogicalDataModel(LDM) Example18
EntityKeyAttributeNonkeyAttributeRelationshipCardinalityOne-to-many1:MBusinessRule:onecustomerinvoiceatleastcontainsoneinvoiceitem逻辑数据模型基本术语(示例)LogicalDataModel(LDM)18E范式理论NormalForm关系数据库:原子性第一范式:每个属性的值唯一第二范式:键值依赖非键属性依赖所有的主键属性。(不存在部分键属性就决定的非键属性)第三范式:完全键值依赖非键属性完全依赖且只依赖与键属性。(不存在非主键属性依赖其他非主键属性的情况)BCNF第四范式第五范式19关系数据库理论中对于实体划分、实例(记录)设计的规则TheKEY-1stNormalForm(1NF)
TheWHOLEKey-SecondNormalForm(2NF)
AndNOTHINGBUTtheKey-ThirdNormalForm(3NF)
--E.F.Codd范式理论NormalForm关系数据库:原子性19关系违反第一范式20如果数Quantity属性被定义为“不是与Order相关,就是与Part相关”例如:在OLTP系统中常见的字段复用现象,属此类问题110152违反第一范式20如果数Quantity属性被定义为“不是与O违反第二范式21依赖了复合主键的一部分客户经理/地域客户经理编号违反第二范式21依赖了复合主键的一部分客户经理/地域违反第三范式22依赖了非主键属性(不参与主键的外键属性)违反第三范式22依赖了非主键属性(不参与主键的外键属性)正则化LDM对数据库物理实现的优势保留了更多的业务关系
更多的主索引选择
最佳的数据分布
更少的全表扫描更多的连接选择增强优化器使用更有利于提高性能的合并、聚合连接方法
最佳的数据分离(耦合度)
最佳的底层模型与用户分离
最佳的数据控制
每行更少的字段
最佳的与应用分离
更小的行
最佳的数据块大小
减少临时与永久日志空间减少物理I/O23要考虑正则化对数据库性能的要求正则化LDM对数据库物理实现的优势保留了更多的业务关系2324内容安排数据模型相关术语什么是数据模型建模注意事项数据模型方法论24内容安排数据模型相关术语什么是数据模型建模注意事项数NCR数据仓库实施方法论25?规划解决方案支持数据仓库管理(处理流程与操作)物理数据库设计数据转换应用开发数据挖掘服务设计与实现支持与增强解决方案体系结构设计元数据管理数据仓库评估应用增强逻辑数据模型回顾物理数据库回顾性能调整容量规划解决方案集成定制解决方案规划详细数据分析解决方案准备就绪解决方案实施建议现成解决方案规划数据仓库策略开发业务探索业务探索解决方案定义逻辑数据模型设计修改逻辑数据模型验证解决方案数据仓库的循环过程NCR数据仓库实施方法论25?规划解决方案支持数据仓库管理物逻辑数据模型设计步骤26Step1:定义业务需求与范围Step2:定义实体Step3:定义关系Step4:定义非键属性Step5:确认模型逻辑数据模型设计步骤26Step1:定义业务需求与范围Step1:定义业务需求与范围27确认已经理解全部业务需求什么困难或问题需要解决?一般情况下这些问题主要关系到增加收入或降低成本等模型必须能够回答哪些业务问题?有哪些业务功能必须处理?有哪些业务限制存在?是否每一个参与人员都可以共享他们的业务需求?决定搜集需求的方法回顾已经存在的资料(例如现存的报表)新的业务需求访谈以上两种混合的方法Step1:定义业务需求与范围27确认已经理解全部业务需Step2:定义实体28制定初始的实体池(不加区分的实体集合)为每一个实体进行定义删除超出项目范围的实体为剩下的每一个实体定义主键为可用的实体编写文档可选:使用带样本数据的表格形式与用户进行确认必须:使用ER图制定最终版本的交付材料Step2:定义实体28制定初始的实体池(不加区分的实体Step3:定义关系29识别实体间的关系对于每一个关系删除超出项目范围的关系删除间接的关系为每一个剩余的关系进行定义识别每一个可用的关系的基数(1:1,1:M,M:M)
参照完整性确保每一个关系(PK/FK参照)是完整的、有效的为模型中可用的关系编写文档,使用FK定义关系可选:使用带样本数据的表格形式与用户进行确认必须:使用ER图制定最终版本的交付材料Step3:定义关系29识别实体间的关系Step4:定义非键属性30识别并定义相关的非键属性删除超出项目范围的属性
根据直觉或经验将剩余的可用属性放入一个表中逐一验证每一个可用属性的摆放位置为模型中的每一个可用属性编写文档可选:使用带样本数据的表格形式与用户进行确认必须:使用ER图制定最终版本的交付材料在模型的最终交付文档中添加业务限制条件Step4:定义非键属性30识别并定义相关的非键属性Step5:确认模型
(1)31根据需要重复以上步骤多次反复经常是必须的(需求、业务规则、操作的复杂性决定)模型中的任何变更都会带来连锁反应,因此需要非常认真的回顾与评审:
实体的变更经常影响关系的定义和属性的位置摆放关系的变更经常影响属性的位置摆放属性的位置的变更可能影响其他属性的摆放Step5:确认模型(1)31根据需要重复以上步骤Step5:确认模型
(2)32通过回答以下问题,持续地对模型的范围进行验证:
这一模型组件的含义、与业务的关系是什么?这一模型组件驱动的业务需求是什么?对模型是否已经满足所有业务需求、业务问题及限制条件等,进行验证绝对不要考虑任何与物理实施相关的问题!当所有回答业务需求所必须的数据已经齐备时,停止对模型进行优化Step5:确认模型(2)32通过回答以下问题,持续地主要任务:转换逻辑数据模型(LDM)为物理数据模型定义主索引、次索引非正规化处理(demoralizations)数据库建立设计优化数据库功能测试使用工具:ERWin交付项目:
物理数据模型(PDM)《物理数据模型说明书》《数据库描述语言DDL》33物理数据库设计数据仓库管理物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成主要任务:33物理数据库设计数据仓库管理物理数据数据转换应用物理数据模型命名规范
序号主题缩写中文1PARTYPAR参与人2OFFEROFR产品策划3FINANCEFIN账务4LOCATIONLOC地理区域5ADVERTISEMENTADT市场营销6EVENTEVT事件7NETWORKNET网络资源8REFERENCECODECDE代码表34物理数据模型命名规范序号主题缩写中文1PARTYPAR参与35内容安排数据模型相关术语什么是数据模型建模注意事项数据模型方法论35内容安排数据模型相关术语什么是数据模型建模注意事项数建模注意事项划分相应的主题(客户、产品、账户、事件、行销活动、渠道、地理区域)确定主题与主题之间的关系客户购买产品产生账户、使用产品触发事件运营商通过各种渠道、在不同地理区域进行个性化的行销活动确定每个主题中关键的实体和实体间的关系客户主题中:如参与人、个人、组织等实体、以及实体间的关系,参与人由个人和组织组成进入逻辑数据模型,细化概念数据模型设计36建模注意事项划分相应的主题36建模注意事项定义数据模型的命名规则命名规范意义统一命名,减少歧义防止冗余的实体或属性的产生良好的命名规范有助于业务人员与技术人员间的沟通便于使用逻辑模型实体和属性命名方法实体名:PAR_Party:主题域大写+实体描述词采用全称属性名:AccountNbr:词采用全称,首字母大写,词与词之间使用空格连接37建模注意事项定义数据模型的命名规则3738LDM与PDM的区别逻辑数据模型(LDM)内容业务模型记录业务规则和关系,与数据库无关用途:与业务人员进行沟通和理解的工具用来确认可以回答业务问题物理数据模型(PDM)内容数据库模型表现物理数据属性–数据类型,长度,索引与数据库相关用途:支持业务系统运行解决数据存储问题解决应用处理性能问题38LDM与PDM的区别逻辑数据模型(LDM)物理数据模型39LDM实现为PDM的条件LDM业务规则PDM软、硬件平台特性应用开发策略进行PDM设计必须考虑的因素、缺一不可:核心业务规则软、硬件平台个性化用户、开发商个性化70%10%20%主要考虑因素输入内容影响程度39LDM实现为PDM的条件LDMPDM软、硬件应用开发策略40LDM业务规则PDM业务规则继承PDM不应违反LDM中界定的业务规则包括:业务概念相同业务关系相同核心业务要素相同LDM->PDM40LDMPDM业务规则继承PDM不应违反LDM中界定的业务41业务规则继承(举例)客户编码ABC…用户编码客户编码XY…业务规则:客户的定义是XXX(实体定义)鉴别客户唯一性的标识为客户编码(主键)客户核心属性包括:A,B,C…(属性)一个客户可以拥有多个用户(关系)识别用户所属客户的标识为客户编码(外键)客户用户CUST_IDABC…USER_IDCUST_IDXY…CUSTUSER41业务规则继承(举例)客户编码用户编码业务规则:客户用户42软、硬件平台特性考虑平台特色PDM应考虑实际数据库平台的特色包括:不同数据库的数据类型、长度不同不同数据库的索引机制不同不同的数据库处理性能不同不同的硬件平台、配置处理性能不同PDMLDM->PDM42软、硬件考虑平台特色PDM应考虑实际数据库平台的特色PD43考虑平台特色(举例)客户编码客户姓名BC…用户编码客户编码XY…客户用户CUST_IDChar(8)Cust_NameChar(8)BC…USER_IDCUST_IDXY…CUSTUSERCust_IDLongintGuest_NameChar(12)BC…USER_IDCUST_IDXY…CUSTUSER例如:数据类型、长度不同等43考虑平台特色(举例)客户编码用户编码客户用户CUST_44应用开发策略考虑应用开发策略PDM应考虑应用系统的实施策略包括:表的横向分割;表的纵向分割;创建汇总表、临时表;属性冗余;创建主索引(可能与LDM主键不同);PDMLDM->PDM44应用开发策略考虑应用开发策略PDM应考虑应用系统的实施策45考虑应用开发策略(举例)客户编码客户姓名BC…用户编码客户编码XY…客户用户CUST_IDCust_NameBUSER_IDCUST_IDXY…CUST_BUSERCUST_IDCCUST_C横向分表CUST_IDABC…USER_IDCUST_IDXYACUST1USERCUST_IDABC…CUST2CUST_IDABC…CUST3…1类(前1000条)2类(中2000条)3类(后1000条)共3000条例如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年视角下的《窦娥冤》深度解读
- 2024年QE工程师培训教材:专业知识和实践技能双重提升
- 煤炭化验流程
- 人教版小学一年级音乐教学计划
- 东南大学考研备考手册:机械设计及理论
- 四年级语文楚才杯学得最好的VS玩得最棒的16
- 2025届中考历史一轮复习考点强化练28第二次工业革命和近代科学文化
- excel-在一个界面中如何同时画出频次直方图和正态分布图
- 2021年生物名师工作室个人工作总结
- 第五讲-盈亏问题
- GA 1800.1-2021电力系统治安反恐防范要求第1部分:电网企业
- 企业如何利用新媒体做好宣传工作课件
- 如何培养孩子的自信心课件
- 中医药膳学全套课件
- 颈脊髓损伤-汇总课件
- 齿轮故障诊断完美课课件
- 2023年中国盐业集团有限公司校园招聘笔试题库及答案解析
- 大班社会《特殊的车辆》课件
- 野生动物保护知识讲座课件
- 早教托育园招商加盟商业计划书
- 光色变奏-色彩基础知识与应用课件-高中美术人美版(2019)选修绘画
评论
0/150
提交评论