版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
文档编号:DN002中国银监会数据仓库项目
分类:设计
项目编号:CBRC-DW-BRS-001
密级:保密
数据仓库详细设计说明书
(元数据模型分册)
VI.0
中软融鑫计算机系统有限公司
国际商业机器中国有限公司
版本1.0第1页共18页
本文档由中软融鑫公司银监会数据仓库项目组撰写,于2005-09-15完成初稿,于
2005-09-28完成终稿。本文档由中软融鑫公司银监会数据仓库项目组负责解释及执行。
文档描述信息:
文件名:中国银监会数据仓库详细设计(元数据模型分册)
版本:VI.0
文档创建者:中软融鑫公司银监会数据仓库项目组
国际商业机器中国有限公司
文档维护者:中软融鑫公司银监会数据仓库项目组
文档评审者:银监会数据仓库项目组、中软融鑫公司银监会数据仓库项目组、国际
商业机器中国有限公司
定稿日期:2005-09-28
文档目标:
文档修改摘要:
版本日期修改描述
VI.02002-09-28定稿发行
第1章概述......................................................................4
第2章逻辑设计..................................................................5
2.1需求概述...................................................................5
2.2设计思想..................................................................5
2.3逻辑设计..................................................................6
2.3.1采集层..................................................................................................................................6
基础采集类..............................................................6
特殊采集类_非银.........................................................7
特殊采集类一银行.........................................................7
2.3.2转换层...................................................................................................................................7
通用加工类..............................................................7
2.3.3目标层...................................................................................................................................8
监控指标类..............................................................8
预警指标类..............................................................9
生成报表类..............................................................10
2.3.4属性层................................................................................................................................11
报表属性................................................................11
机构属性................................................................13
权限属性................................................................15
第3章物理设计.................................................................17
3.1数据特点分析.............................................................17
3.2数据的物理设计...........................................................17
3.2.1表空间.................................................................................................................................18
3.2.2分区.....................................................................................................................................18
3.2.3索引.....................................................................................................................................18
3.2.4约束....................................................................................................................................18
第1章概述
数据仓库系统的数据模型设计要同时遵循两大方面的原则,一方面要遵循满足目前和未
来可能的业务需求的原则,另一方面要遵循满足数据仓库系统应用特点的原则。因此,从目
前和未来可能的业务需求来看,数据仓库模型需要包含银行业金融机构监管因素的全部信息
及按照规范的结构组织。
数据仓库系统的数据模型设计包括下列两个阶段:
■逻辑设计:以满足业务需求,以及符合数据仓库系统的应用特点为设计原则,达到
使系统易于扩展的目的。逻辑模型设计与最后决定的技术平台是独立的。
■物理设计:数据的物理模型是逻辑模型的延伸。我们会根据DB2的特点进行数据
的物理设计,达到优化数据存储和访问性能的目的。
第2章逻辑设计
2.1需求概述
银监会对银行业金融机构的非现场监管,主要通过定期从被监管机构收集的报表来进
行。但是,被监管机构提供的报表仅仅是基本的数据罗列,根据监管业务的特点,银监会需
要将收集的数据进行必要的计算、重组、建模,构建监管数据仓库,以适应监管业务需求。
监管数据仓库的数据来源是被监管机构,根据银监会的监管要求,定期提交的报表数据。
数据提交的方式为Excel或XML格式文件,既可以在线提交,也可以离线工作。提交的报表
数据,通过采集系统,将数据放入数据仓库,再根据各部门的需求,对数据进行必要的计算、
转换等处理,建立面向个业务部门的数据集市,用于生成日常监管报表和分析模型。
本阶段银监会数据仓库将实现1104报表体系,该报表体系是建立在被监管机构报送的报
表数据基础之上的,通过数据处理加工和分析,有效地实现对各金融机构的非现场稽核和监
管。
2.2设计思想
按照数据处理流程,把数据仓库数据划分为四个层次:采集层、转换层、目标层、属性
层。各层次关系如图所示:
>采集层:提供采集报表接口,按照散点方式存储采集报表数据。
>转换层:采集表到目标表的中间过程转换表及临时表。
>目标层:存储监管指标、预警指标和生成报表数据。
A属性层:存储报表属性和机构属性,其中包括描述采集报表和生成报表数据的统一
元数据和描述机构的元数据。
2.3逻辑设计
数据模型的设计必须满足系统要求的各种业务分析需求和报表需求。通过对业务需求和
报表需求的分析,本阶段,数据仓库系统采用批量处理和即席查询来满足监管报表分析和查
询需求。
基于数据仓库主题域设计思想,在上述数据层次上总共划分为10个主题域,描述如下:
2.3.1采集层
基础采集类
基本采集类采用报表属性表和数据表来存储采集报表数据。通过报表分析,大部分报表
的为定长报表,其指标项可以采用通用的数据结构来存储,即采用事实表结构,根据报表日
期、机构、地区、币种、单元格、子报表、数据范围可以确定指定报表指定单元格的数据。
报表属性描述参见属性层。
基本采集数据表
「报表日期单元格项表
机构ID单元格项ID
子
报表子报表
地区ID(FK)(DFK
版
本号ID)
币种ID(FK)1
类
数据
型
(F称K
单元格项ID(FK)
格
单元
子报表ID(FK)名
数据范围ID(FK)行号
列号
填报值
填报值2
单元格公册照表
数据范围类别「数据范围ID(FK)
数据范围ID单元格公式ID(FK)
数据范围描述产单元格项ID(FK)
开始日期
结束日期
单元格公式描述表
单元格公式ID
单元格计算公式
公式类型
特殊采集类一非银
特殊采集类_非银报表属于变长报表,不适合采用通用数据结构存储,因此,采用一张
报表对应一张物理表的方式进行数据存储。详细关系结构参见ERWin模型。
特殊采集类一银行
特殊采集类—银行报表属于变长报表,不适合采用通用数据结构存储,因此,采用一张
报表对应一张物理表的方式进行数据存储。详细关系结构参见ERWin模型。
2.3.2转换层
通用加工类
通用加工类主要针对变长报表中的衍生指标,比如合计、平均等指标,通过SQL模板
和参数计算并存储该类指标。其主要实体描述如下:
■加工指标项表:存储变长报表衍生指标的的SQL模板和参数。
■通用加工数据表:采用事实表结构按照数据日期、机构、子报表、数据范围、指标
项维度存储变长报表衍生指标的数据。
主要实体间关系的描述
加工指标项表通过指标项ID与通用加工数据表一对多关联。
2.3.3目标层
监控指标类
监控指标类报表存储监管指标数据,由数据表和指标项描述类表构成。其主要实体描述
如下:
■监控指标数据表:采用事实表结构按照数据日期、机构、数据范围、指标项维度
存储监控指标数据。
■监控指标项表:描述监控指标项编码、定义、属性。
■监控指标计算公式表:定义监控指标项计算公式。
■指标使用范围表:定义不同虚拟机构下监控指标项。
■指标类别表:包括主要指标、辅助指标、特色指标、合规指标。
■业务类别表:包括信用风险、流动性风险、市场风险、资本充足、盈利性、其他。
主要实体间关系的描述如下:
监控指标项表通过指标项ID与监控指标数据表一对多关联。
监控指标项表通过指标项ID与指标使用范围表一对多关联。
监控指标项表通过指标项ID与监控指标计算公式表一对多关联。
监控指标项表通过指标项ID与指标类别表一对多关联。
监控指标项表通过指标项ID与业务类别表一对多关联。
监控指标数据表
数据日期
机构ID(FK)
数据范围ID(FK)
指标项ID(FK)
指标值
监控指标项表监控指标计算公式表
指标项ID指标项ID(FK)
指
标名称
指标项公式-
指标类别表指标
定义-
数据
指标类别来源
法规
指标类别名称t依据
备注
类别
业务fzFK
类别x
指标FK
业务类别
业务类别名称
预警指标类
预警指标类针对基本采集类报表和监控指标类中需要预警的指标项,其主要实体描述如
下:
■预警指标表:描述预警指标的定义、编码。
■预警规则表:定义预警指标的规则属性,包括上限、下限、比较属性。
■预警数据表:采用事实表结构按照数据时间、比较属性、机构、预警指标维度存储
预警指标数据。
■分析项定义表:描述预警指标的处理规则。
•主要实体间关系的描述如下:
预警指标表通过预警指标ID与预警规则表一对多关联。
预警指标表通过预警指标ID与预警数据表一对多关联。
分析项定义表通过分析项ID与预警指标表一对多关联。
预警规则表通过机构ID与预警数据表一对多关联。
预警规则表
预警指标表
机构ID
预警指标ID
上限
预警名称下限
数据来源比较属性
分析项ID(FK)预警类别
预警指标ID(FK)
预警盛表
分析项定义
数据时间
分析项ID比较属性
机构ID(FK)
处理语句
预警指标ID(FK)
分析项名称
时间属性数值
生成报表类
生成报表的数据分为指标项、分析项两类,其相关实体描述如下:
■生成指标项表:描述生成指标项的编码、有效时间、报表属性。
■生成指标数据表:采用事实表结构存储指标项数据。
■生成指标项和计算公式对照表:指标项ID与单元格公式ID关联。
■生成分析指标项表:描述生成分析指标的编码、有效时间、报表属性。
■生成分析指标项数据表:采用事实表结构存储分析项数据。
■分析项定义:存储分析项处理语句。
■分析模式:定义分析模式类型。
主要实体间关系的描述如下:
生成指标项表通过指标项ID与生成指标数据表一对多关联。
生成指标项表通过指标项ID与生成指标项和计算公式对照表一对多关联。
生成指标项表通过指标项ID与生成分析项表一对多关联。
生成分析项表通过分析指标项ID与生成分析项指标数据表一对多关联。
分析项定义表通过分析项ID与生成分析项表一对多关联。
分析项定义表通过分析项ID与分析模式表一对多关联。
子报表通过子报表ID与生成指标项表一对多关联。
子报表通过子报表ID与生成分析项表一对多关联。
子报表通过子报表ID与生成指标数据表一对多关联。
子报表通过子报表ID与生成分析项指标数据表一对多关联。
数据睡包n
数羯粒图ID
聂拘箍国描述fI
T多成绘标勃法发
‘机构ID~~生成分析项摄标数掘茯
数据日期
切据拊国ID(FK)
数据日期
报标项ID(F©分析投标项ID(FE)|
干板浅IDim
数据箍困ID(FK)
投标值干他及ID,欣|
生成投标项和并算公式对暧及,理暨==J
电元格公式ID(FK)
摄标项ID(W
划羯数国ID(F©
开始日期
生成分析项不
分析投标项ID
生成指标项去
推标类别
檄林项ID分析项定义
行号
开始日期*列号分析项ID
林束日期开始日期3度语句
敛元格公式犒述我
干根爱ID(FK)—0K然束日期分析项名称
被元裕公KID楂林项IDm时的属性
机的ID(FK)
被元格计算公式于根农ID(W
公衣类曳分析项ID(FK)
分析截衣
于根及ID分析假KID
文
名称
中烟农名称机拘装分折粮另名称
文
名称
奥格去程根ID机恂ID分析项ID(FD
吊
故位
货
胭爱
美和上胭栽ID(ED机构名麻
机狗类理
T是同法人
1一一用箍国用
>1R^ID(FI)
,机构ID(FI)
2.3.4属性层
报表属性
报表属性模型中包含的实体描述如下:
■主报表:每一种独立的报表称为主报表,主报表具有独立的表头、填报机构、报表
日期和货币单位。每张主报表包含的不同格式的子报表在格式报表中定义。主报表
表中主要包括中文名称、英文名称、货币单位、报表类别等内容,其中中文名称对
应报表表头中的报表名称,英文名称对应报表的编号(如G01等)。
■子报表:每张主报表中不同的格式的部分分别定义为不同的子报表。
■实际报表:每张子报表根据并表数据范围的不同分为不同的实际报表,如境内汇总
报表、法人汇总(含境外分行)报表、合并报表(含附属公司)。
■数据范围类别:境内汇总数据、法人汇总数据(含境外分行)、合并报表数据(含
附属公司)
■数据适用范围:不同的机构类别报送的报表种类不同,数据适用范围表为每类型机
构和每种实际报表建立对应关系。
■数据上报情况:描述各机构每期实际报表的报送情况,包括期数、上报日期、填表
人、复核人、负责人等信息。
■报表类别:描述报表的分类,如上报基础报表分为:基本财务、信用风险、流动性
风险、市场风险、资本充足、其他六种报表类别。
■单元格项:描述子报表中单元格的位置、数据类型。
■报表版本:针对采集报表的重报,设定相应得历史版本,可以追溯历史数据。
■单元格公式描述:定义单元格数据的平衡校验公式。
■单元格公式对照:描述单元格项和单元格公式项的关联关系。
•主要实体间的关系描述如下:
单元格项表通过单元格项ID与基本采集数据表一对多关联。
单元格项表通过单元格项ID与单元格公式对照表一对多关联。
单元格公式描述表通过单元格公式ID与单元格公式对照表一对多关联。
主报表通过主报表ID与子报表一对多关联。
子报表通过子报表ID与单元格项表一对多关联。
主报表通过主报表ID与子报表一对多关联。
子报表通过子报表ID与数据适用范围表一对多关联。
子报表通过子报表ID与实际报表表一对多关联。
报表类别表通过保表类别ID与主报表一对多关联。
主报表通过主报表ID与数据上报情况表一对多关联。
数据范围类别表通过数据范围ID与数据上报情况表一对多关联。
数据范围类别表通过数据范围ID与单元格公式对照表一对多关联。
数据范围类别表通过数据范围ID与实际报表表一对多关联。
实际报表表通过子报表ID、数据范围ID与基本采集数据表一对多关联。
•编码方案
参见附件。
.本与第划据我
范元格项我r
□艮与日期版近号
干根段
机构IDID(W
地区ID(W开始日期
而种ID(E0穗束日期
干胭茯ID(Wu____________
数据起用ID(FK)
单元格项ID(F©
埴极值
埃根值2机构ID
机检名称
而种ID机构类理
是同法人
击种名称
《际胆装
效期通用箱用茂
干胆装ID(FK)干祖及ID
数据检用ID(TO根我名称
上胆蛭度格衣模板ID
恐后时回士相乘ID(FD
.我上限情况及
「一我箍国ID[国、
限及日期士胭茯
数掂粒园类别士极农ID(FD上板或ID
数据超国ID机构ID(W
数中文名称
*期
很
日期
数据他国描述上英文名称
爱
填人货而单位
根
复人限汞类别ID(FK)
击
负人'::;::■:■::::;■:■:::.F'”:::;■:■:■:::::,
承元格公忒轩照农Q
渔元格公式描述及4匕
数据抗图ID(W
港元裕公忒ID(W范元格公忒ID他我类别
电元格项ID(FK)范元格计算公或胆乘美剂ID
公衣类型
开始日期根或类别名称
结束日期
机构属性
机构属性模型中包含的实体描述如下:
■机构表:定义所有的真实机构和虚拟机构,用机构类型区分。
■真实机构类别:定义真实机构类型。
■机构编码:对所有地区的机构进行统一编码。
■上报机构表:描述上报机构相关信息。
■虚拟机构表:描述虚拟机构相关信息。虚拟机构是针对汇总的机构进行编码定义。
■监管机构表:描述监管机构相关信息。
■虚拟机构分类表:定义虚拟机构类型。
■虚拟机构关系表:描述虚拟机构和实际机构的汇总关系及有效时间。
■地区表:定义所有的虚拟地区和实际地区,用地区类型区分。
■金融机构表:描述金融机构编码信息。
•主要实体间的关系描述如下:
机构表包括上报机构、虚拟机构、监管机构,通过机构类型区分。
真实机构类别表通过真实机构类型ID与上报机构表一对多关联。
上报机构表通过机构ID与虚拟机构关系表一对多关联,虚拟机构表通过虚拟机构ID与
虚拟机构关系表一对多关联,上报机构表与虚拟机构表通过虚拟机构关系表形成对照关
联。
虚拟机构分类表通过虚拟机构分类ID与虚拟机构表一对多关联。
机构表通过机构ID与机构编码表一对多关联,地区表通过地区ID与机构编码表一对多
关联,机构表与地区表通过机构编码表对照关联。
•编码方案
机构表机构编码
机构编码
真实机构类别------------0K地区ID(FK)
真实机构类型ID1机构ID(FK)
机构名称
真实机构类型名到
-、机构类型
6
S地区表
监管机构:
X地区ID+
机构ID(FK)监管机构ID(FK)
i地区类型i
真实机构类型ID(FK)监管机构名称
机构名称J茗称I
起始日期等拟机构表
终止日期‘虚拟机构ID(FK)虚拟机构分类表
许可证号
虚拟机构名称虚拟机构分类ID
起始日期
将-------畀虚拟机构名称
终止日期
虚拟机构分类ID(FK)
虚拟机构关系表
金融机构
虚拟机构ID(FK)
金融机构代码
机构ID(FK)
汇总属性将金融机构名称
开始日期
结束日期
权限属性
采用用户角色的方式控制权限,其中用户隶属用户组和角色,用户组对应于数据权限,
角色对应于功能权限。主要实体描述如下:
■用户表:描述用户编码信息。
■用户组用户对照表:描述用户与用户组的关联关系。
■用户组表:描述用户组表编码信息。
■权限表:描述用户组与机构、实际报表的关联关系。
■用户角色对照表:描述用户与角色的关联关系。
■角色表:描述角色的编码信息。
■角色功能对照表:描述角色与功能菜单的关联关系。
■功能菜单表:描述功能菜单的编码信息。
主要实体间的关系描述如下:
用户表通过用户ID与用户组用户对照表、用户角色对照表一对多关联。
用户组表通过用户组ID与用户组用户对照表一对多关联。
角色表通过角色ID与用户角色对照表一对多关联。
用户组表通过用户组ID与权限表一对多关联。
角色表通过角色ID与角色功能对照表一对多关联。
上报机构表表通过机构ID与权限表一对多关联.
功能菜单表通过功能菜单ID与角色功能对照表一对多关联。
实际报表通过子报表旧、数据范围ID与权限表一对多关联。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 购销合同范例样本
- 资产评估服务合同合作策略
- 趣味小学语文阅读教学策略分享
- 车辆质押贷款担保协议模版
- 轻松应对地理题目
- 进口锂电池采购合同
- 退伍军人的专业承诺
- 违规保证书的规范发展
- 酒店家具采购合同格式
- 醉驾反省与觉醒
- 桂花大道延伸段道路工程第一标段施工用电规划方案样本
- 甲状腺消融术护理查房
- 人工智能大学生生涯规划
- 研发部门未来五年发展规划方案
- 2023年亏损企业扭亏专项治理方案
- 人教版小学三年级语文课外阅读理解精练试题全册
- 六年级上册道德与法治《第9课知法守法依法维权》课件
- 胃结构及其功能课件
- 中国电力建设协会-热控调试工程师题库2022
- 企业后勤人员安全培训试卷(附答案)
- 产前诊断(筛查)技术服务申请
评论
0/150
提交评论