


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据模型分析的方法从目前的数据库及 HYPERLINK /s/?w=%E6%95%B0%E6%8D%AE%E4%BB%93%E5%BA%93&ch=ww.xqy.chain t _blank 数据仓库建模方法来说,主要分为四类。 第一类是大家最为熟悉的 HYPERLINK /s/?w=%E5%85%B3%E7%B3%BB%E6%95%B0%E6%8D%AE%E5%BA%93&ch=ww.xqy.chain t _blank 关系数据库的三范式建模,通常我们将三范式建模方法用于建立各种操作型 HYPERLINK /s/?w=%E6%95%B0%E6%8D%AE%E5%BA%93%E7%B3%BB
2、%E7%BB%9F&ch=ww.xqy.chain t _blank 数据库系统。 第二类是Inmon提倡的三范式数据仓库建模,它和操作型数据库系统的三范式建模在侧重点上有些不同。Inmon的数据仓库建模方法分为三层,第一层是实体关系层,也即企业的业务数据模型层,在这一层上和企业的操作型数据库系统建模方法是相同的;第二层是 HYPERLINK /s/?w=%E6%95%B0%E6%8D%AE%E9%A1%B9&ch=ww.xqy.chain t _blank 数据项集层,在这一层的建模方法根据数据的产生频率及访问频率等因素与企业的操作型数据库系统的建模方法产生了不同;第三层 HYPERLINK
3、 /s/?w=%E7%89%A9%E7%90%86%E5%B1%82&ch=ww.xqy.chain t _blank 物理层是第二层的具体实现。 第三类是Kimball提倡的数据仓库的 HYPERLINK /s/?w=%E7%BB%B4%E5%BA%A6%E5%BB%BA%E6%A8%A1&ch=ww.xqy.chain t _blank 维度建模,我们一般也称之为星型结构建模,有时也加入一些雪花模型在里面。维度建模是一种面向用户需求的、容易理解的、访问效率高的建模方法,也是笔者比较喜欢的一种建模方式。 HYPERLINK /s/?w=%E7%AC%AC%E5%9B%9B%E7%B1%BB&
4、ch=ww.xqy.chain t _blank 第四类是更为灵活的一种建模方式,通常用于后台的数据准备区,建模的方式不拘一格,以能满足需要为目的,建好的表不对用户提供接口,多为 HYPERLINK /s/?w=%E4%B8%B4%E6%97%B6%E8%A1%A8&ch=ww.xqy.chain t _blank 临时表。 下面简单谈谈第四类建模方法的一些的经验。 数据准备区有一个最大的特点,就是不会直接面对用户,所以对数据准备区中的表进行操作的人只有ETL工程师。ETL工程师可以自己来决定表中数据的范围和数据的生命周期。下面举两个例子: 1)数据范围小的临时表 当需要整合或清洗的数据量过大
5、时,我们可以建立同样结构的临时表,在临时表中只保留我们需要处理的部分数据。这样,不论是更新还是 HYPERLINK /s/?w=%E5%AF%B9%E8%A1%A8&ch=ww.xqy.chain t _blank 对表中某些项的计算都会效率提高很多。处理好的数据发送入准备加载到数据仓库中的表中,最后一次性加载入数据仓库。 2)带有冗余字段的临时表 由于数据准备区中的表只有自己使用,所以建立冗余字段可以起到很好的作用而不用承担风险。 举例来说,笔者在项目中曾遇到这样的需求,客户表客户ID,客户净扣值,债项表债项ID,客户ID,债项余额,债项净扣值,即客户和债项是 HYPERLINK /s/?w
6、=%E4%B8%80%E5%AF%B9%E5%A4%9A&ch=ww.xqy.chain t _blank 一对多的关系。其中,客户净扣值和债项余额已知,需要计算债项净扣值。计算的规则是按债项余额的比例分配客户的净扣值。这时,我们可以给两个表增加几个冗余字段,如客户表客户ID,客户净扣值,客户余额,债项表债项ID,客户ID,债项余额,债项净扣值,客户余额,客户净扣值。这样通过三条SQL就可以直接完成整个计算过程。将债项余额汇总到客户余额,将客户余额和客户净扣值冗余到债项表中,在债项表中通过(债项余额客户净扣值/客户余额)公式即可直接计算处债项净扣值。 另外还有很多大家可以发挥的建表方式,如不需要 HYPERLINK /s/?w=%E4%B8%BB%E9%94%AE&ch=ww.xqy
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 组织领导力的多维度研究计划
- 如何有效管理生活部的日常事务计划
- 准确预测仓库需求的方法计划
- 保安工作总结计划金融行业保安工作的技术改进
- 社区个人工作计划改善社区停车设施
- 《贵州新恒基矿业有限公司兴仁市太平洞金矿(新建)矿产资源绿色开发利用方案(三合一)》评审意见
- 《贵州毕节百矿大能煤业有限责任公司水城县玉舍乡中寨煤矿(变更)矿产资源绿色开发利用方案(三合一)》评审意见
- 脑梗死静脉溶栓护理后护理
- 统编版小学语文二年级下册第9课《枫树上的喜鹊》精美课件
- 2025年长春货运员初级考试题库
- 腮腺肿瘤(小讲课)
- 西师大版四年级数学下册 (平均数)教学课件
- (二级)农业经理人复习备考题库及答案(含理论和实操)
- 毕业设计(论文)-汽车多向调节电动座椅设计
- 六年级下册综合实践活动教学设计-志愿服务我能行 全国通用
- 肾康注射液+栓课件
- 医院检验科迎检汇报课件
- 全民族抗战山西记忆教学课件
- 青蛙卖泥塘话剧稿子
- 化学中常用的实验方法(第一课时物质的制备)课件 【核心知识精讲精研】 上学期高一沪科版(2020)必修第一册
- 江西省宜春市高职单招2022-2023学年医学综合真题及答案
评论
0/150
提交评论