




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2013年06月数据架构设计指导书(版本号V1.0)Lon§Shine朗新科技(中国)有限公司更改履历版本号修改编号更改时间更改的图表和章节号更改简要描述更改人批准人V1.02013-6-15王全义郑德炳注:更改人除形成初稿,以后每次修改在未批准确认前均需采用修订的方式进行修改。目录1编写目的3332适用范围3333数据架构设计原则3334数据架构设计4444.1 企业业务数据分类4444.1.1 按数据格式划分4444.1.2 按数据参照程度划分4444.1.3 按数据采集频道划分5554.1.4 按使用性质划分5554.2 数据主题域5554.2.1 数据主题域视图5554.2.
2、2 数据主题域关系视图6664.3 概念数据模型概念数据模型主要由最佳实践和业务需求作为驱动因素高阶的数据模型,定义了重要的业务领域概念(即数据主题域)和彼此的关系,由核心的数据实体或其集合,以及实体间的关联关系组成。概念数据模型独立于信息系统存在,不涉及信息在系统中的表示。7774.3.1 概念模型视图8884.3.2 数据流转视图9994.4 逻辑数据模型1010104.4.1 逻辑数据模型视图1010104.4.2 数据分布视图1111114.5 物理数据模型1212124.5.1 物理模型视图1313134.6 数据库详细设计1313134.6.1 数据基础设计1313134.6.2
3、常用参数1414144.6.3 主要模式1414144.6.4 表空间规划及存储容量估算1414144.6.5 历史表1515154.6.6 表分区1616164.6.7 DBLINK1818184.6.8 同义词1919194.6.9 主键1919194.6.10 索引2020204.6.11 约束2020204.6.12 修改标志时间戳2020204.6.13 LOB字段202020编写目的为了提高数据架构设计能力、规范软件设计流程、加强架构管控力度,提高软件安全特制定本规范。此文档描述了数据架构设计等。适用范围适用于数据架构设计人员。数据架构设计原则数据资产化原则:将数据作为公司具有价值
4、的无形资产来管理,统一认识,加强数据资产认责管理,保障数据资产的价值发挥。数据共享性原则:避免数据孤岛的建设和数据私有化,加强数据在公司各级单位、各个业务领域间的共享。营造及时、准确的共享数据环境,完善数据管控机制,确保数据共享符合信息安全要求。数据可用性原则:建立标准化、多样化的数据资产获取渠道和访问方式。加强数据质量管理,增强用户使用数据的信心,有效支撑各类分析应用建设。数据认责原则:针对不同的数据资产指定权威的数据拥有者、质量责任者、日常管理维护者等角色,建立配套的数据管控机制和评价考核体系,确保数据认责工作的有效开展。数据标准化原则:在公司全局范围内建立通用的数据标准,包括业务数据标准
5、,主数据标准,元数据标准等,避免数据的二义性,促进数据共享和利用数据安全性原则:定义数据安全级别,建立数据安全控制过程,保证数据被合理的访问、共享和发布,避免未经授权的数据操作,满足监管单位和公司业务经营对数据安全的要求。数据架构设计数据架构设计主要解决:存在哪些数据资源、如何管理数据资源、解析业务信息的数据模型是什么、面向交易、交换和分析的数据模型是什么、信息在流程间、数据在功能间如何流转等问题。数据架构设计主要内容:数据主题域设计、概念数据模型设计、逻辑数据模型设计、物理数据模型设计等。企业业务数据分类按数据格式划分结构化数据:方便用数据库的二维表结构来逻辑表达实现的数据,数据结构字段含义
6、确定,清晰。例如:客户信息、用电记录等。是挖掘数据价值的主要对象。非结构化数据:很难按照一个概念去处理的无结构性的数据。例如文本、多媒体数据等。其数据利用技术相对于结构化数据起步晚,是未来数据应用的一个发展方向。按数据参照程度划分主数据:用于描述企业核心业务实体/对象的基本业务数据,它在企业内长期存在并且被重复应用于多个业务部门和信息系统,是最容易产生数据一致性问题的一类数据,需要单独的管控机制对其进行管理。非主数据:相对于主数据,其它的参照度低的、存在周期短的非核心实体/对象数据可认为是非主数据。按数据采集频道划分非实时数据:相对于实时数据,其它的企业经营过程中产生的,由业务人员通过应用系统
7、输入的数据都可认为是非实时数据实时数据:主要是由一些传感器设备以自动化的方式采集的秒级、毫秒级的数据,例如电网运行数据、设备状态数据等。这些数据的特点是数据内容简单,但数据量很大。按使用性质划分分析性数据:用于支持日常报表、查询、分析等决策需求的数据。共享数据:来自某个业务系统,在业务部门之间、业务系统之间重复使用的数据数据主题域数据主题域由业务信息按照其业务耦合程度聚合而成的高阶数据主题群,一般与业务域有着紧密的对应关系。例如:财务、物资、生产等。数据主题域通过数据主题域视图和数据主题域关系视图来体现。数据主题域视图展现数据域和数据主题,弁定义数据主题对业务域的支撑关系。例图如下:H蚪卸理瓯
8、怕加骷1M肛陲侬鼻虹t的啕01一断牌硼W1培触事w«退居售眦mo器惟崛MI比骈蝌aE成£1贬S脸酬.谴翻18A或雕Sill叫赭罪能sr期*时1月蛙期翔蹄蹿1阳段数据主题域关系视图展现数据主题域之间的逻辑关系。一般分为一级数据主题域关系视图和二级数据主题域关系视图,二级是一级的细化。一级数据主题域关系视图如下:二级数据主题域关系视图如下:物资物资配送营销账务F_J充值卡配送充值卡客户档案4电能产品产品1资产台账tI资产)电动汽车服务电动汽车I三营J电池管上能效网站服务客户费用查询重要客户服重要客户'服务,服务跟踪客户服务互动服务/概念数据模型概念数据模型主要由最佳实践
9、和业务需求作为驱动因素高阶的数据模型,定义了重要的业务领域概念(即数据主题域)和彼此的关系,由核心的数据实体或其集合,以及实体间的关联关系组成。概念数据模型独立于信息系统存在,不涉及信息在系统中的表7Ko概念模型应该抓住一个重点,即表达重要业务概念及业务概念之间的关系;解决并只解决需要在全国范围内统一规范的核心的业务问题;只是反映了业务对数据的需求,包容多种物理实现方式,除非该种物理实现方式不满足业务的需求。概念数据模型一般由概念数据模型视图和数据流转视图组成。概念模型视图展现数据主题域之下的数据实体,并展现数据实体之间的关联关系。广工瞿桐尊匚宜购的II*c1间中LC星隹!金交昼总本中足月H说
10、-X+*<上数第SuClta数据流转视图展现数据实体所分布到的应用,弁展示数据在应用间的流转例图如下:逻辑数据模型逻辑数据模型对概念数据模型的进一步分解和细化,描述实体、属性以及实体关系,通用的字段类型、长度和主外键关系等做了定义,设计时一般遵从“第三范式”以达到最小的数据冗余。逻辑模型的设计由最佳实践和业务需求、数据资源规划、现有业务应用数据模型等作为驱动因素逻辑数据模型由逻辑数据模型视图和数据分布视图组成逻辑数据模型视图对数据实体的分解细化,对数据实体的属性、属性类型、长度和主外键关系等做了定义,遵从“第三范式”以达到最小的数据冗余。LETPfJjg户寻电LDTPfWCltfAptn
11、UCfe鼻吟而啰工nrud*'日口Geo11Tgi£产cz-Mia,HHeFtlg:trlrqmtepBajkame3>lilngOMMirnift:51rlpSrtreateusefls:Eigpednsifirum百口用Arid后Ig匚EaPF-updatcCslE.D-steflFMrnpan/id13&D«iEil/d=arTn=UdBllgC-sc-Irnall,=IeUiIFU日叫fir-l5J>B:EK3DEdnai,值口白色空sme8口二怛eta口.BlgcrraIwrpr二)cc»3St-Ing&prejfiw
12、-jjrit.Str时住pcJeEyptD匹B2命Wwlrgln-&igD*cii*mWiypG>E畛H叫racl4斗卑与|匕%EcIeaI4叩jCQtldiBqDwlESlpacakayeIdEDlg£-eJntil8srailorChin:Scrng暗仁zsTHtlorlR壬utStiIrK;*#grnOp«ratonDar>Srhcvs?«reUfre«idBQDecmai事白。aDa«Dw巧uKHQde;口后口2E«免LrKS=D,LUCi3S*界frxihc:日电此32%cqn«iiYld-库防
13、Dei与士SrircO3iye.aigpeoiiai,RL加94雷酊炉JirLil田r&PrmtlBfF:印1/:Ek?匚eUTHl餐务PrraAjflfrb。电cmai修kDrajH-orxiJEir,日写T0F=WktFTCjsciF:日与DsctnaJ命32卬*口+仲制en-®S-en±5tyi±:S-trlntKiUdlteDdlfestfllSjyEncCalB:DateSrprirJecOcsQmteDstRprrjejOp*fGM*-DmaprrJedCpcrEfidDatsd=4&prejtaEeDsK.On*鼻憾QdU*:口fir
14、白上TcLHa:Date:ftl!rtman-string身归I节MtiesrIng&N邙径HM中'Stingft-HT-r-r'nrnpany巧中ft-*hx:StrlncStwt-bBII3Sfig命anirasm:slrrgifrarxuncentrFileIcBearrai号ooTm-nrFleld:吕aDectnai一不明|&3BlgDecineiSt-grrnrqoettomg-EEj受>ItisEumatjeEIc口EdmslAMiRae.fitriL-fifeTait.cicpama5启引者$廿旭.btgjecima号be刘。君£
15、:匚引aU0对打仃端atDMlnsIft中间9a&sccCroo'Tipzn-Ic:Elcp-dimEdftseaort-ri&rtkiEh&口eeEi,舅皿IT却L-JU餐迎口忙口:ECectnK屏ji-Iu:国Qke>J9ra_dttsdld'SIEHaz-lmal工卜工口耀号txu/目g3Fd*4WH*omStimg*EDE3aufne.EngpcinidiiWOfirdCT5«1U剧g口一别Il琢BE4WDSte:31式总AmAUbM!BDDecfnal事ujp4MHe:arc-口at用A=crrparyd:migpcFai事.p
16、BElkH口.Sy&wU,0,布staked.gD&ctinaJEMLeJrridlgU<K/妈r幻BgDECEglJfid-laRfegtadralscildrBgSfirraiMi-k3:SDebIrnai什内nOfptanaj*Kts:Slrlrg*Th1£:BgOWiTB院znEMELrEefidHoCecimai备g=©匕«»匕=看4b>sf>31BigDQcmsJ。牛gm:一-£-/giTpiru日串出=7隼r巨凶匚rrk11口.bichE92I-tuh胃!:«!:sgteaiaiLL
17、39;Kuy数据分布视图展现数据实体所分布到的功能,弁定义在功能中的操作(CRUD数据分布视图如下:中间数据存储区结构化数据存储业务数据存储区非结构化数据存储公司总部95598流程数据评价数据可第三方调查数据分析指标轻度汇总数据数据因子数据指标数据分析数据(各类文本式报告/报表各类知识类文档h.fT省(市)公司流程数据(95598、业扩)分析指标数据轻度汇总数据各类文本式报告/报表、_.一/各类知识类文档CRUtJ口下:数据实体应用/C应用/R应用/U应用/D可信数据数据应用应用,ERP-PM应用应用用标准化作业范本生产管理应用生产V理应孙ERF-PMT产管理应用卞产管理应用生产看理应用备品番
18、件ERP生产管理成MbERP-PM生产管理2用生产隹,理,"用ERP物料需求申请单ERP中产n理应用:ERF-PM生产管理应用生产管理应用ERP物理数据模型物理数据模型描述数据模型的细节,需要考虑所使用的数据库产品、对应的字段类型、长度、索引等因素,弁对数据冗余与性能进行平衡,必须确定数据库平台和应用程序的架构。物理数据模型的设计由数据库/数据仓库系统平台和性能调整优化要求作为驱动因素。物理模型视图描述数据模型的细节,需要考虑所使用的数据库产品、对应的字段类型、长度、索引等因素,弁对数据冗余与性能进行平衡。物理模型视图例图如下:XJL攵H.JO内零,神口京¥国长,Ll
19、65;眠RUS>的AVARCHAR:(ZOT.七二-一UISUHBCT:!雷3PCnF*C_L9TS*lS_SUS_R=F6P_lBJT_SMSFK_SWS_&0K3_rAk_Ft£FE_lS_T_SU$A*IDNUMBER/印gA<fkz>FK_SMS_BOK5_SUCCtSB._W_T_5MSLETVARCMAR2t205VMCHAR2tgjVAAO4AR2(2QQ)VARCHA2:2W)NUMBgRd).LiilLlD-EOiSMSSQXSEDEWii在京冽看】SM$_BCK£tNZINO:与:工产立:咬SENDERRECEIVERDNTth
20、iTMOOUtEJORTTIMEamtduVARCHAR2(20)VARCHAR2(2G)VAHCI-AR2?SS;VARCHAR212OJVARCHAR2(?VLL;4n,rW里SENDERFTFCEIVtHcohireHTENDTIMEILSEA-IS'=LcIcmvnuECNOUSER必VAHCHAR:(20VARGHAi=r2<20VARCHAR2OJVAHCHAflTfJQjkuhides数据库详细设计数据基础设计数据库类型:Oracle数据库版本:11.2.0.3或11.2.0.4数据库SID:sqadb1、sqadb2数据库名:sqldb语言:AMERICAN_AM
21、ERICA数据库字符集(NLS_CHARACTERSETUTF8国家区域字符集(NLS_NCHAR_CHARACTERSETTF8常用参数NLS_LENGTH_SEMANTICS=CHAR说明:此参数需要设置后重启方可生效。主要模式设计规划数据库schemas,主要用于客户端或外部系统访问数据库。具体设计例子如下:模式名英文内容描述权限需求对象类型默认空间默认索引表空间工作流用户sotower用于保存工作流数据由普华提供由普华提供DATA_SOOWERTIDX_SOTOWER权限、组织bpm用于保存权限组织由普华提供由普华提供DATA_BMPIDX_BPM表空间规划及存储容量估算根据业务情况与
22、各物理表设计字段长度,评估运行周期1年内产生的数据量数据域数据表空容量估算索引表空间容量估算间(GB)(GB)客户档案DATA_CUS70280IDX_CUS105-420服务体系/用能分析/营销市场/系统支持DATA_EESMP140IDX_EESMF,60用能采集DATA_EIC7300IDX_EIC14600工作流DATA_SOTCWER)0.5IDX_SOTOWR田.5组织、权限DATA_BPM0.5IDX_BPM0.5接口用户DATA_API0.5IDX_API0.5历史表所有非档案数据表在系统设计之初就需要考滤历史数据的使用。历史表设计必须在需求分析阶段确定下来,弁在数据模型设计得
23、以体现。在线数据保留在在线系统中的当前表中,保留业务经常使用的数据。历史数据保留在历史系统中的历史表中,保留当前业务不被使用的数据,将这部数据从在线系统中迁出可以在线系统库维持在稳定的大小,提高在线库的性能和可靠性,提高当前表中的查询速度。对于有时间特征的流水业务数据必须进行归档,归档周期由具体业务需求决定。如果数据量巨大,可根据业务需求缩短归档时间周期。对于没有明显时间特征的旧数据,可按业务需要标准进行判断之后加以归档,如果数据状态、标识等,归档实体表中尽可能增加时间属性。本系统中对于流程已走完的工单数据,在呼叫接入平台、呼叫服务业务支持系统数据库中,咨询、报修类数据保留3个月,其它数据保留
24、6个月,咨询、报修类数据保留3个月以前的数据和其它6个月以前的数据将迁移历史库中。呼叫接入平台与呼叫服务业务支持系统共用同一个历史库。历史表结构必须为时间分区结构(特殊情况除外),字段结构与在线表相同,历史表名与在线表名保持一致。序号主题域历史表实体名称历史表表名(与基表表名相同)历史表分区方案历史表数模变更需求表分区尽可能不采用二级分区;每个分区的记录数应对于数据量较大的表,为提高系统性能,方便业务数据管理必须进行相应的分区处理,分区策略可选择一级、二级分区,分区字段由相应的数据分布特征或业务需求来定。1 .分区的依据记录数超过2000万的表需要考滤为该表做分区;2 .分区字段的选择分区字段
25、优先考滤最有可能作为查询条件的字段;尽可能不要使用TIMESTAM类型的字段,这在我们当前的营销业务的其它系统中最常出现,并且已经被证明,非常影响性能,如果需要这类字段作为分区条件,那么需要在表中添加一个新的字段,作为前面的TIMESTAM类型的字段的冗余,字段类型为varchar2型,并以这个新的字段作为分区字段;3 .分区数量的考滤表的分区数据不宜太多,以住在营销系统中我们常采用二级分区的方法,导致表的分区数据太多,一保持在100-500万之间;4 .禁止使用pmax分区在创建分区表时不可以创建pmax分区,创建pmax分区将导致后续分区扩展变得非常困难,在营销系统中我们吃尽了这方面的苦头
26、,不能再犯这类的错;5 .数据归档或迁移的考滤表分区的创建还要充份考滤便于后续数据的归档和迁移,如某张表在线数据只保留6个月,归档表只保留6个月前至1年前之间的数据,历史表保留1年以前的数据。那么在表分区规划时就要考滤这张表的数据归档迁移方式,要能以最快速度,最小代价,最低影响在线系统的方式将数据归当、迁移出去。6 .对于数据量巨大且无明显数据分布特征可采用HAS的区。7 .制定分区表需要开发设计与开发DBA共同讨论,分区命名遵循P$区值的原则。子分区遵循P+主分区值+''+P仔分区值的原则。如:单位分区P3340101、年月分区P201001、单位年月组合分区P3340101_P201001注意:范围分区时分区名应大于分区值上界。在总部系统中由于数据较小暂不考虑分区。DBLINK由于目标客户使用的硬件资源各不相同,要求我们在设计之时,不得不考虑未来多种部署模式,多种部署模式中,有存在跨数据库访问的情况,因此规划数据链。注意:尽量不要使用DBLINK来访问外部数据库。主库目标库数据库链名用途属主连接帐号权限说明9559895598DL_TO_EESMPH_A而EESMIPAPI待服务服务史定业务业务数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机井承包合同协议书(2025版)
- 合伙协议书(2025版)
- 股份代持协议书范本正规范本2025年
- 会员卡储值协议范本(2025版)
- 四年级数学(四则混合运算带括号)计算题专项练习与答案
- 食品加工行业2025年节能减排技术改造项目实施过程中的成本效益分析
- 2025版特色小镇项目房地产收购框架协议
- 2025年度金融科技代理服务合同范本大全
- 二零二五年度水利工程补充协议设计变更及注意事项
- 二零二五年度纺织品行业联盟销售合作协议范本
- 2025年公开招聘事业编制教师公共基础知识考试题库及答案
- 2025年摄影师职业技能考核试题及答案
- DG-TJ08-2120-2025 集体土地所有权调查技术标准
- 2024年安徽省濉溪县人民医院公开招聘医务工作人员试题带答案详解
- 2025年浙江省宁海县事业单位公开招聘辅警考试题带答案分析
- 中国PET再生料市场供需格局及未来发展趋势报告
- 消化内科重点专科申报
- 2025年低空经济试题及答案
- 四川省广安市(武胜、岳池、华蓥)2024-2025学年八年级下学期期末考试物理试卷(含答案)
- 华为海外税务管理办法
- 2024年新人教版化学九年级上册全册课件(新版教材)
评论
0/150
提交评论