数据仓库规范_第1页
数据仓库规范_第2页
数据仓库规范_第3页
数据仓库规范_第4页
数据仓库规范_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库规范一、数据仓库层次结构规范1.1基本分层结构系统的信息模型可以从存储内容的角度分为五个层次:STAGE接口信息模型、ODS/DWD信息模型、MID信息模型、DM信息模型和元数据信息模型。1)SRC接口层信息模型:提供业务系统数据文件的临时存储,数据稽核,数据质量保证,屏蔽对业务系统的干扰。对于主动数据采集方式,以文件的方式描述系统与各个专业子系统之间数据接口的内容、格式等信息。与该模型对应的数据是各个专业系统按照该模型的定义传送来的数据文件。STAGE是生产系统数据源的直接拷贝,由ETL过程对数据源进行直接抽取,在格式和数据定义上不作任何改变。与生产系统数据的唯一不同是,STAGE层数据具有时间戳。STAGE层存在的意义在于两点:(1)对数据源作统一的一次性获取,数据仓库中其他部分都依赖于STAGE层的数据,不再重复进行抽取,也不在生产系统上作运算,减小生产系统的压力;(2)在生产系统数据已经刷新的情况下,保存一定量的生产系统的历史数据,以便在二次抽取过程中运算出错的情况下可以进行回溯。2)ODS/DWD层信息模型:简称DWD层是数据仓库的细节数据层,是对STAGE层数据进行沉淀,减少了抽取的复杂性。同时ODS/DWD的信息模型组织主要遵循企业业务事务处理的形式,将各个专业数据进行集中。为企业进行经营数据的分析,系统将数据按分析的主题的形式存放,跟STAGE层的粒度一致,属于分析的公共资源。3)MID信息模型:轻度综合层是新模型增加的数据仓库中DWD层和DM层之间的一个过渡层次,是对DWD层的生产数据进行轻度综合和汇总统计。轻度综合层与DWD的主要区别在于二者的应用领域不同,DWD的数据来源于生产型系统,并为满足一些不可预见的需求而进行沉淀;轻度综合层则面向分析型应用进行细粒度的统计和沉淀。4)DM信息模型:为专题经营分析服务,系统将数据按分析的专题组织成多维库表的形式存放,属于分析目标范畴的数据组织与汇总,属于分析的专有资源。其信息主要来源于DWD和MID层汇总,反映实时的经营状况,时间维度为天。而历史经营状况的分析,时间维度一般为月,同时也具有季度、年这样的维度。5)MDW元数据信息模型:描述数据及其环境的数据,即是对数据资源的描述,是信息共享和交换的基础。元数据是用于描述数据集的内容、质量、表示方式、空间参考、管理方式以及其他特征的信息。它有两个主要用途。首先,元数据能够提供基于用户的信息,例如记录数据项的业务描述信息的元数据能够帮助用户使用数据。其次,元数据能够支持系统对数据的管理和维护。元数据机制主要支持以下五类系统管理功能:描述哪些数据在数据仓库中;定义要进入数据仓库中的数据和从数据仓库中产生的数据;记录根据业务事件发生而随之进行的数据抽取工作时间安排;记录并检测系统数据一致性的要求和执行情况;衡量数据质量。在构建数据仓库时,至少应该具备以下物理几层:联通数据模型规范要求的层次数据中心物理模型层次名称和物理表前缀。维度数据层的物理表前缀是DIM_。数据集市层(DM)的物理表前缀是DM_。主题域的物理表前缀是DW_F_。轻度汇总层(MID)的物理表前缀是DW_M_。细节数据层(ODS/DWD)的物理表前缀是DW_V_。接口层的物理表前缀是SRC_。所有数据库对象名称都应该使用26个大写英文字母、下划线或数字来命名,并且不得以下划线开头。用户应该采用与系统应用相似的英文字符或字符缩写来命名用户名和表空间的名称。表空间所对应的一个或多个物理文件名也应该有相关性。用户创建的数据索引最好和数据文件分开存放在不同表空间,以减少数据争用和提高响应速度。各数据层应当在数据库中实现其分离。接口层的用户物理表名是SRC。沉淀数据层的用户物理表名是DW_V、DW_M和DW_F。数据集市层的用户物理表名是DM。元数据层的用户物理表名是DW,但目前未设计。维度数据层的用户物理表名是DIM。数据库表空间命名应该以数据仓库的基本分层结构为准,以TBS_作前缀。为避免单个表空间数据量过大,带来管理上的不便或者引起I/O瓶颈,对于STAG和ODS/DWD数据量比较大的层,可采用多个表空间存储数据,单表空间容量不要太大,以便于业务划分和存储管理为原则,建议单表空间容量控制在800G之内,表空间数据文件建议值为4G。数据表空间应该按照数据仓库分层结构来命名,使用用户表空间名和数据文件/裸设备。STAG的用户表空间名是TBS_STAG,数据文件/裸设备名为TBS_STAG001至TBS_STAGXXX,单设备文件大小应该在2G至8G之间,建议值为4G。DWD的用户表空间名是TBS_DWV,数据文件/裸设备名为TBS_DWV001至TBS_DWVXXX,单设备文件大小应该在2G至8G之间,建议值为4G。规范化设计数据库结构,包括表结构设计、索引设计、键值设计、字段命名规范等。(3)开发按照设计规范开发数据库应用程序,包括存储过程、函数、触发器等。(4)测试对数据库应用程序进行测试,确保程序的正确性和稳定性。(5)实施按照实施计划进行数据库应用程序的上线和部署。(6)维护对数据库应用程序进行维护和优化,包括定期备份、性能优化等。3.6.2.会话情况查询:从dba_data_files表中选取tablespace_name和bytes,使用sum函数计算总字节数,并将结果转换为GB。然后按tablespace_name分组,得到表b。最后将表a和表b按照tablespace_name进行连接。3.6.3.AIX操作系统中杀掉进程的脚本:从v$session表和v$process表中选取spid和sid,使用kill命令杀掉进程,其中sid为54且username不为空。3.6.4.查看JOB:从User_Jobs表中选取所有列。3.6.5.分区操作:查看表DW_V_USER_MOBILEUSER的分区和子分区,使用ALL_TAB_PARTITIONS和ALL_TAB_SUBPARTITIONS表。增加分区使用altertable命令,删除分区使用droppartition命令。3.6.6.无效索引查询:无效索引是指不再使用的索引,可以通过查询v$object_usage视图来查找无效索引。3.6.7数据库的无效对象需要查看数据库中是否存在无效对象,主要是针对脚本。无效对象会占用空间并影响数据库性能。3.6.8数据库表分区是否达到限额需要查看表分区是否满足需求。此项监控需要根据具体需求来进行。3.6.9数据库内存占用情况需要查看数据库内存的占用情况,以便及时调整内存大小以提高数据库性能。3.6.10DDL语句的监控需要查看各种DDL语句的使用情况,并记录操作者的IP、时间、用户名等信息,以便进行追踪和管理。3.6.11特定DML语句的监控需要对某些特定的重要数据库对象记录DML操作的历史,以便进行审计和管理。3.7数据库审计3.7.1语句审计(StatementAuditing)需要对预先指定的某些SQL语句进行审计,从SQL语句的角度出发进行指定。审计只关心执行的语句,而不管这个语句是否针对某个对象的操作。例如,auditCREATETABLE;命令就表示对“createtable”语句的执行进行记录。3.7.2权限审计(PrivilegeAuditing)需要对涉及某些权限的操作进行审计,强调“涉及权限”。例如,auditCREATETABLE;命令又可以表明对涉及“CREATETABLE”权限的操作进行审计。在这种情况下,既产生了一个语句审计,又产生了一个权限审计。有时候“语句审计”和“权限审计”会相互重复。3.7.3对象审计(ObjectAuditing)需要记录作用在指定对象上的操作。四.管理说明4.1关于数据模型和数据仓库的管理为了使数据仓库安全、层次清晰、版本稳定以及与总部模型一致,规定数据经理全权负责数据仓库和数据模型的管理。具体包括:1.所有关于数据库结构的更改都必须由数据经理完成,包括对控制文件、参数文件、日志文件、表空间等的修改。2.删除原模型中的表、向模型中增加表或向原有表中增加字段都需要经过数据经理的批准和记录,并及时提交到总部的SVN服务器。修改记录应包括修改时间、表名称、更改说明和修改人等信息。本文介绍了几个数据仓库中需要进行字段修改或增加的需求。首先,需要将入网年度字段IINNET_YEAR改为入网年月,对应的数据仓库表为DW_F_DEV_M_ONNET_USERINNET_MONTH。其次,需要删除在网时长分档字段INNET_MONTH_LEVEL,对应的数据仓库表为DIM_USER_STATUS。同时,需要增加停机类型字段。第三,需要将DW_V_US

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论