




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、v1.0可编辑可修改1数据架构设计(数据架构组)概述总体描述相对于业务架构和应用架构,数据架构在总体架构中处于基础和核心地位。因为信息系统支撑下的海关业务运作状况,是通过信息系统中的数据反映出来的,数据信息系统管理的重要资源。因此构建海关的IT总体架构时,首先要考虑数据架构对当前业务的支持。理想的IT总体架构规划逻辑上是数据驱动的, 即:首先根据业务架构分析定义数据架构; 然后根据数据架构结合业务功能定义 应用架构;最后根据应用架构与数据架构的定义,来设计技术架构。数据架构蓝图逻辑蓝图拈据定义数据 睢分片,路由.结晶集处理.接入劭态扩展,故障切模,数据同步服交OLTP. OL4P,她掘同步数据
2、分布技术实现共享交换融府共事交候机制故融事交擦内容MapReduce海计算统_艇K成数振计算CETL)怆握QLAP统一存储New SQLOLTP/OLAP 列与MPP 只读在线分析Old SQLOLTP/OLAP 商用开源关军数据庵 悟心交曷非精心管理No SQL大娓校,非驰化Kadoop stormMapRduc流处理数据治理僖息重募目最元数据 主数据做据标准规范教揖度呈鼓檐安全数据生命周期v1.0可编辑可修改图:数据架构总体逻辑蓝图数据架构的六个统一,即统一数据规划、统一存储、统一计算、统一服务、 统一接入、统一数据治理。物理蓝图图 4-1-1通过万兆连接核心交换区,实现网络高速交换,确保
3、可靠性v1.0可编辑可修改各服务器均双线连接数据区核心交换机,消除单点故障结构清晰,层次分明设计原则1、整体性原则共享服务平台必须根据统一的总体方案的统筹规划,按总署、直属海关、隶 属海关的功能划分实行多级部署,同时按照职责分工进行建设和管理,保证三个 层级的部署构成一个整体,各部分通信畅顺,信息共享,形成一个全国性的共享 服务平台。2、标准化原则总署统一制定信息资源共享服务的技术标准、通信协议标准、数据交换报文 标准,提供数据访问功能、基本业务逻辑处理功能的标准组件。系统的开发、集 成按照规定的标准进行,保证海关共享服务平台的结构一致性和技术规范性。3、安全与效率并重原则总结和汲取超大业务量
4、海关的成功经验,采取充分足够的技术手段和管理制 度,在保证共享服务平台与海关业务应用系统之间高速的数据交换,在保证共享服务平台良好运行效率的同时,保证海关业务运行网和业务管理网的信息安全和 运行安全。系统设计方面要充分考虑共享服务平台数据量大、负荷高等因素,严格控制 程序流程设计、严把程序编制质量、同步制定配套的系统运行管理办法,确保共 享服务平台运行的高效性和稳定性。4、系统功能与职责分工相适应原则平台多方共建,发挥各方面的积极性,信息系统、业务系统与业务管理或操 作运行的主体之间的关系和分工必须明确。v1.0可编辑可修改5、一致性原则共享服务平台在体系架构上必须与金关业务解决方案的框架保持
5、一致, 在系 统开发建设的设备选型、开发技术、认证授权、门户框架、数据定义、参数管理、 通信协议、网络结构、安全运维等方面必须与金关总体技术方案保持一致, 保证 共享服务平台成为现代海关综合管理系统的有机组成部分。注:整体统筹原则数据层和应用层解耦数据的高可靠服务的高可用设计目标“信息资源体系建设”是一项长期工程,是支撑海关各个业务条线之间实现 充分协作信息共享基础架构。将确保金关工程二期在海关信息资源开发利用方面 抓住数据一致性、规范性等数据质量源头建设 ,形成统一顶层设计,做到海关信 息资源一盘棋,数据统一管控,统一开发利用,促进海关信息共享、业务协作效 率和科学决策水平的更高提升。总体目
6、标主要包括以下五个方面内容:1、实现信息资源整合信息资源规划的一项很重要的目标就是要解决目前信息系统建设中的重复 建设问题,达到信息系统的整合和集约,信息资源规划是信息系统顶层设计的一 部分,能够从整体上对信息资源进行设计, 并能够提供信息系统建设的标准和规 范,这样信息系统就能够以此为标准,进行适时、适度、逐步整合,最终达到消 除冗余,集约良性发展的效果。2、提高技术响应速度v1.0可编辑可修改业务需求的变化和技术的响应速度之间一直是一对矛盾,信息资源规划通 过对信息系统,尤其是信息资源架构进行科学设计,可以增强信息资源架构的稳 定性,当业务需求变化时,可以通过很少的数据结构和程序变动就能够
7、满足业务 需求,这样不但提高了技术响应速度,而且能够增强系统的稳定性,降低故障率。3、实现信息共享信息资源规划通过建设信息共享服务平台,实现了数据的集中存储和计算, 并实现了对外统一的服务接口,不论是对于海关内部的信息共享需求, 还是外部 的数据共享需求;不论是直接面向用户的共享查询,还是面向应用系统的数据服 务,都可以通过数据服务共享平台解决。4、实现大数据分析海关要实现智能海关,必须实现海关信息系统的物联化、互联化、智能化, 而最重要的就是智能化,即通过大数据分析,为海关准确决策提供信息支持。 信 息资源规划通过设计和实现数据共享服务平台,引入并行数据库、分布式数据库 等大数据存储和计算技
8、术,能够解决海关的大数据分析问题,达到数据用得好、 决策准的业务目标。5、提升数据质量信息资源规划通过设定标准规范、业务管理流程,能够规范数据的定义、存 储、使用、传输、交换,使得数据采集更加规范、数据传输更加准确高效,数据 使用更加安全方便,通过各种管理流程和规范,能够大幅提升数据质量。数据定义总体描述数据的基本结构分三个层次,反映了观察数据的三种不同角度。(1)概念数据层。它是数据的整体逻辑表示。指出了每个数据的逻辑定义及 5v1.0可编辑可修改数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据所有对象的逻辑关系, 而不是它们的物理情况。(2)物理数据层。它是物理存贮设备上实际存储的数据
9、的集合。这些数据是 原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位用、 字符和 字组成。(3)逻辑数据层。它是用户所看到和使用的数据,表示了一个或一些特定用 户使用的数据集合,即逻辑记录的集合。数据建模业务域根据目前海关不同的网络,运行网、管理网和接入网以及总署和直属的这种 物理关系,梳理出每个域中业务情况和相互的关联关系划分出不同的业务域。海关目前的现状梳理出来的业务域有:公共域、首长决策域、公共办公域、业务管理域、综合保障域和内部监控公共域:1)公共时间域2)公共金融域v1.0可编辑可修改3)公共位置域4)公共人员域5)公共机构域6)公共参数域首长决策:1)署长办公公共办公:
10、1)办公2)国际事务业务管理:1)政法2)关税3)监管4)物流5)加贸6)稽查7)缉私8)统计综合保障:1)科技2)财务v1.0可编辑可修改3)关务保障4)人事内部监控1)督查审计2)监察根据业务划分核心数据和非核心数据。概念模型设计概念数据模型是最终用户对数据存储的看法,反映了最终用户综合性的信息 需求,它以数据类的方式描述企业级的数据需求, 数据类代表了在业务环境中自 然聚集成的几个主要类别数据。概念数据模型的内容包括重要的实体及实体之间的关系。 在概念数据模型中 不包括实体的属性,也不用定义实体的主键。这是概念数据模型和逻辑数据模型 的主要区别。概念数据模型的目标是统一业务概念, 作为业
11、务人员和技术人员之 间沟通的桥梁,确定不同实体之间的最高层次的关系。根据业务域的划分,梳理跨业务域的端到端的业务流程, 从而梳理出大的对 象之间的关系和小的业务流程。例如,用户(user) E R图v1.0可编辑可修改逻辑模型设计逻辑数据模型反映的是系统分析设计人员对数据存储的观点,是对概念数据模型进一步的分解和细化。逻辑数据模型是根据业务规则确定的, 关于业务对象、业务对象的数据项及 业务对象之间关系的基本蓝图。逻辑数据模型的内容包括所有的实体和关系,确定每个实体的属性,定义每个实体的主键,指定实体的外键,需要进行范式化 处理。逻辑数据模型的目标是尽可能详细的描述数据, 但并不考虑数据在物理
12、上如 何来实现。逻辑数据建模不仅会影响数据库设计的方向, 还间接影响最终数据库 的性能和管理。如果在实现逻辑数据模型时投入得足够多,那么在物理数据模型 设计时就可以有许多可供选择的方法。解决端到端的业务流程梳理出大量的小流程和对象关系,进一步梳理出各个业务域的业务对象及其行为和属性。物理模型设计物理数据模型是在逻辑数据模型的基础上,考虑各种具体的技术实现因素,v1.0可编辑可修改进行数据库体系结构设计,真正实现数据在数据库中的存放。物理数据模型的内容包括确定所有的表和列,定义外键用于确定表之间的关系,基于用户的需求可能进行发范式化等内容。在物理实现上的考虑,可能会导致物理数据模型和逻辑数据模型
13、有较大的不同。物理数据模型的目标是指定如何用数据库模式来实现逻辑数据模型,以及真正的保存数据。常用的设计范式,以及对于数据量大的业务,在数据模型层面不处理表之间 的主外键之间的关系。主要将逻辑模型的各个业务对象及之间的关系,以表、主外键及关联表的方 式表示。针对各个逻辑模型勾勒出各个域的 ER模型。数据分布总体描述将数据物理分布式处理方式逐步转为集中式处理方式,本节主要描述数据在各个业务子系统之间的逻辑分布,以及数据物理分布。逻辑分布10v1.0可编辑可修改析全 国 HG 监 控 指 挥 系 统风 险 管 理 分 系 统风险监控子系统实时性要求不高的OLTP风险处置子系统实时性要求不高的OLT
14、P应 急 指 挥 分 系 统应急监控预警子系统实时性要求不高的OLTP应急指挥调度子系统实时性要求不高的OLTP决策分析分系统决策分析分系统OLAP值班管值班管理分系统实时性要求不高的OLTP11v1.0可编辑可修改理分系统预 案 管 理 分 系 统预案管理子系统实时性要求不高的OLTP演练管理子系统实时性要求不高的OLTP缉 私 作 战 指 挥 分 系 统实战管理子系统实时性要求不高的OLTP信息支持子系统实时性要求不高的OLTP地理信息子系统实时性要求不高的OLTP移动应用移动客户端框架子系统实时性要求不高的OLTP移动端统一入口子系统实时性要求不高的OLTP12v1.0可编辑可修改分系统
15、移动应用服务中间件子系统实时性要求不高的OLTP移动应用管理子系统实时性要求不高的OLTP移动设备管理子系统实时性要求不高的OLTP业务应用插件子系统实时性要求不高的OLTP地 理 信 息 系 统 应 用 分 系 统地理信息系统应用分系统实时性要求不高的OLTP进出口企业企业诚信守法申报子系统实时性要求不高的OLTP企业资格管理子系统实时性要求不高的OLTP报关员管理子实时性要求不13v1.0可编辑可修改诚 信 管 理系 统系统高的OLTP企业稽(核)查子系统实时性要求不高的OLTP企业诚信守法信息采集子系统实时性要求不高的OLTP企业诚信守法规则管理子系统实时性要求不高的OLTP企业诚信守法
16、差别化应用子系统实时性要求高的 OLTP企业诚信守法信息指标统计子系统OLAP企业诚信守法评估子系统OLAP企业诚信守法绩效评估子系统OLAP加工和保加工贸易加工贸易手册申报子系统实时性要求高的 OLTP加工贸易手册实时性要求高14v1.0可编辑可修改税 货 物 管 理系 统手 册 管 理 分 系 统审批管理子系统的 OLTP加 工 贸 易 账 册 管 理 分 系 统加工贸易账册申报子系统实时性要求高的 OLTP加工贸易账册审批管理子系统实时性要求高的 OLTPH G 特 殊 监 管 区 域HG特殊监管区域管理申报子系统实时性要求高的 OLTPHG特殊监管区域审批管理子系统实时性要求高的 OL
17、TP15v1.0可编辑可修改管 理 分 系 统保税保税监管场所申报子系统实时性要求高的 OLTP监 管 场 所 管 理 分 系 统保税监管场所审批管理子系统实时性要求高的 OLTP保税保税业务监控分析子系统OLAP综 合 管 理 分 系 统单耗管理子系统实时性要求不高的OLTP16v1.0可编辑可修改H物流链数据收实时性要求高G物集子系统的 OLTP物流链信息展实时性要求高流示子系统的 OLTP链物流链分析预实时性要求高可警作业子系统的 OLTP视化物流连信息预实时性要求高管警处置子系统的 OLTPH理分物流可视化预G警参数管理子实时性要求高系物系统的 OLTP流统监智前端集成子系实时性要求高
18、控系能卡统的 OLTP现场服务子系实时性要求高统口统的 OLTP分系后台核放子系实时性要求高统统的 OLTP机检查验管理实时性要求高查子系统的 OLTP验业人工查验管理实时性要求高务子系统的 OLTP管知识产权自动实时性要求高17v1.0可编辑可修改理分系统识别子系统的 OLTP辅助管理子系统实时性要求高的 OLTP统计查询子系统实时性要求高的 OLTP机 动 巡 查 管 理 分 系 统机动巡查作业管理子系统实时性要求高的 OLTP机动巡查查询统计子系统实时性要求高的 OLTP通 关 管 理系 统报 关 单 通 关 无 纸 化 分 系 统通关电子数据申报子系统实时性要求高的 OLTP通关事务/
19、行政许可审批子系统实时性要求高的 OLTP报关单无纸化审单子系统实时性要求高的 OLTP报关单无纸化放行子系统实时性要求高的 OLTP18v1.0可编辑可修改非 报 关 单 管 理 分 系 统快件管理子系统实时性要求高的 OLTP旅客行李物品监管子系统实时性要求高的 OLTP邮政总包监管子系统实时性要求高的 OLTP邮件通关监管子系统实时性要求高的 OLTP特殊人员及机 构进出境公自用物品通关子 系统实时性要求高的 OLTP免税店及商品监管子系统实时性要求高的 OLTP电 子 随 附 单 据 管 理 分通关电子随附单据管理子系统实时性要求高的 OLTP执法电子随附单据管理子系统实时性要求高的
20、OLTP通关电子随附单据归档管理子系统实时性要求高的 OLTP19v1.0可编辑可修改系执法电子随附实时性要求高统单据归档管理的 OLTP子系统接公共服务子系实时性要求高单统的 OLTP环现场作业子系实时性要求高节统的 OLTP派挂号管理子系实时性要求高单统的 OLTP叫号分查询统计子系实时性要求高系统的 OLTP统关税电子数据实时性要求高申报子系统的 OLTP减免税管理子实时性要求高关系统的 OLTP税管原产地管理子实时性要求高理系统的 OLTP系归类风险监控统子系统OLAP价格管理子系实时性要求不统高的OLTP20v1.0可编辑可修改报关单批量复审子系统实时性要求不高的OLTP审单辅助支持
21、子系统实时性要求不高的OLTP远程专家在线会诊/审单子系统实时性要求高的 OLTP商品条码信息管理子系统实时性要求不高的OLTP征税管理子系统OLAP征税分析子系统实时性要求高的 OLTPH G 基 础 数 据 管 理 系 统数 据 分 析 管 理 分 系 统数据抽取分发子系统实时性要求不高的OLTP动态数据仓库子系统OLAPHG数据质量监控子系统实时性要求不高的OLTP21v1.0可编辑可修改业 务 数 据 管 理 分 系 统业务数据管理子系统实时性要求不高的OLTP数据信息管理子系统OLAP统一数据加工子系统OLAP缉 私 管 理系 统执 法 规 范 分 系 统刑事执法子系统实时性要求不高
22、的OLTP行政执法子系统实时性要求不高的OLTP辅助办案子系统实时性要求不高的OLTP证据管理子系统实时性要求不高的OLTP协查管理子系统实时性要求不高的OLTP职 能 管 理督察管理子系统实时性要求不高的OLTP绩效管理子系统实时性要求不高的OLTP22v1.0可编辑可修改分要案管理子系实时性要求不系统统高的OLTP综合应用子系OLAP统情报信息采集实时性要求高子系统的 OLTP情情报线索办理实时性要求不报作子系统高的OLTP境外执法合作实时性要求不业子系统高的OLTP分系情报产品生产实时性要求不统子系统高的OLTP情报预警监测实时性要求高子系统的 OLTP情报信息智能OLAP情检索子系统报
23、情报专题研判研子系统OLAP判分常用研判工具OLAP系集子系统统图形视频研判OLAP子系统23v1.0可编辑可修改情报研判模型管理子系统OLAP情 报 管 理 分 系 统情报监督子系统实时性要求不高的OLTP绩效评估子系统实时性要求不高的OLTP情报培训子系统实时性要求不高的OLTP情报应用积分子系统实时性要求不高的OLTP业务数据监测与处理子系统OLAP情 报 服 务 分 系 统缉私办案离线支持子系统实时性要求不高的OLTP缉私信息决策支持子系统实时性要求不高的OLTP情报布控及协查子系统实时性要求高的 OLTPHG监管支持子系统实时性要求高的 OLTP情报共享交换子系统实时性要求高的 OL
24、TP24v1.0可编辑可修改联企业综合资信库数据采集子系统实时性要求不高的OLTP网数联网核查证件实时性要求不数据采集子系据采统高的OLTP情报公安数据实时性要求不集采集子系统高的OLTP分对系外单位数据采实时性要求不外统集子系统高的OLTP联互联网公开数实时性要求不网据采集子系统高的OLTP应用数企业综合资信系据数据处理子系OLAP统转统换处理联网核查证件实时性要求不分数据处理子系高的OLTP系统统联自动进口许可实时性要求高网证联网核查子的 OLTP核系统25v1.0可编辑可修改查 通 关 处 理 分 系 统密码产品和含 有密码技术设 备进出口许可 证联网核查子 系统实时性要求高的 OLTP
25、濒危物种允许 进出口证明书 联网核销子系 统实时性要求高的 OLTP进口药品通关单联网核销子系统实时性要求高的 OLTP进口兽药通关单联网核查子系统实时性要求高的 OLTP原产地证书联网共享子系统实时性要求高的 OLTP关库联网核销子系统实时性要求高的 OLTP加工贸易多方联网管理子系统实时性要求高的 OLTP数据联网数据企业服务子系统实时性要求不高的OLTP26v1.0可编辑可修改对外服务联网核查国家(地区)、部委数据服务子 系统实时性要求不高的OLTP分企业综合资信系数据政务服务实时性要求不统高的OLTP子系统缉私案件数据实时性要求不服务子系统高的OLTP物理分布数据存放:集中存放+灾备分
26、布式主从模式分布式无中心化数据:核心交易:商用关系 DB处机集群分析:newSQL+机集群低价值密 度的大规模数据:No SQL吠规模普通机器集群据地理分布:交易数据集中存放+灾备;其他管理支持类应用数据可三中心 分别存放27v1.0可编辑可修改数据分类总体描述数据分类是企业数据的组成部分,其目的是为了满足各种数据需求对数据组 织的要求,根据数据内容的属性或特征,将信息按一定的原则和方法进行区分和 归类,并建立起一定的分类体系,为数据的合理分布提供决策依据,以便管理和 使用数据信息。分类原则在数据分类时遵循以下原则:数据分类需要满足各种数据需求对数据组织的要求,即数据分类应该独立于具体的数据模
27、型;数据分类应有利于数据的维护和扩充。28v1.0可编辑可修改分类内容金关工程二期综合考虑海关应用系统所产生的数据属性、应用性质、处理方式、使用范围等因素对数据进行分类,同时考虑对数据进行生命周期管理和数据 质量管理;海关数据可以从业务、生命周期及数据特点进行分类。1、按照业务,海关的数据分为数据管理类(N)、业务基础类(Y)、业务处 理类(Y)、业务管理类(N)、业务应用类(N)、业务分析类(N)六类数据。29v1.0可编辑可修改数据管理类月Kt5庐IH务数疑怵口博盘据MLL改不曲 M的邮W光.其它为断断业务数据分类核心和非核心数据与上面业务域数据之间的对应关系数据管理类数据,此类数据包含动
28、态数据仓库、数据抽取分发、数据质 量监控、统一数据加工、数据生命周期管理中的数据。30v1.0可编辑可修改业务基础类数据,此类数据包含商品条码、企业信息基础、多维、公安 信息资源、案件信息服务资源、自动许可证联网核查、联网核销、原产地证书联网共享、加工贸易多方联网、 GIS应用、核心系统参数、海关 情报信息采集、海关情报移动支持的数据。业务处理类数据,此类数据包含报关单、免税品、行邮、关税电子、外单位信息资源、加贸手册、加贸账册、互联网信息资源、智能卡口、核 心系统基本通关、核心系统辅助通关、核心系统备案的数据。业务管理类数据,此类数据包含减免税管理、原产地管理、价格管理、业务数据管理、机动巡
29、查、值班、预案、移动应用、海关特殊监控区域、保税监管场所、保税综合管理、批量复审、海关情报业务管理、海关情 报境外执法合作、执法规范化业务执法、执法规范化辅助办案、执法规 范化职能管理的数据。业务应用类数据,此类数据包括缉私监控指挥、企业信息应用、归类风 险监控、审单执法、企业综合资信、数据交换、应急指挥、海关情报预 警监测的数据。业务分析类数据,此类数据包含决策分析、风险数据、物流链监控分析、 专家会诊审单、数据信息管理的数据。2、按照数据来源以及服务对象,海关数据可分为对外交换数据、 生产数据、 共享数据、决策支持数据、元数据五类。对外交换数据,此类数据包括物流舱单、国外海关、电商订单、互
30、联网 舆情、政务公开等数据。生产数据,此类数据包括报关单、证件核销、税收、减免税、证件监管、 加贸手册、加贸合同、加贸单耗、风险布控、风险查验、行政办公等数据。共享数据,此类数据包括企业主数据、商品主数据、公共业务通关、公 共业务企管数据。决策支持数据,此类数据包括数据仓库、数据集市、业务报表、分析报31v1.0可编辑可修改告等数据。元数据,此类数据包括技术元数据、数据模型、指标体系、标准化等数 据。3、按照生命周期,海关数据可以分为“生产数据(核心,非核心)”、“分析 数据”、“归档数据”三类。4、按照数据本身的特点,海关数据可以分为结构化数据和非结构化数据, 结构化数据主要是应用系统生成的
31、存储在关系数据库中的数据,数据具有明显的共性结构特点。非结构化数据主要指一些文本、图片、图像、视频、音频等数据。对于某一种数据(维度中的1个格子)对应一种存储技术。数据接入总体描述数据统一接入层主要目的是解耦应用系统和数据存储之间的关系,本部分主要描述应用系统和关系型数据库之间的解耦,应用与其他类型的存储之间的关系 在本章的其他小节来描述。其整体架构如下图所示:32v1.0可编辑可修改应用系统代理访问统一访问服务处理引擎结果集处理备份管理Sql的解析数据扩容数据路由数据分片数据驱动数据节点池故障切换故障备份MysqlOracleSQL Server统一接入 管理平台 配置数据管理逻辑节点管理物
32、理节点管理 路由规则管理扩容迁移管理 备份管理数据MySql存储上层为应用系统;下层为关系数据存储。中间层为统一接入平台。一般的应 用开发,应用层直接通过数据的驱动直接访问关系数据库进行数据的存取。 在我 们的数据架构中增加了一层统一接入层,其目的主要解决:提供统一的访问服务。对应用来说,屏蔽了数据库本身的差异,数据库对应用来说只是服务。提供了服务的高可用,上层应用无需关心下层存储的可用性问题,33v1.0可编辑可修改JDS层会做自动的主备切换,防止单点故障。提供了数据的高可靠,上层应用无需关心下层存储数据的可靠性问题,存储层会自动做好数据的自动全量及增量备份工作。并在需要 的时候可以快速从备
33、份恢复数据。支持数据的自动拆分,可应对海量数据的存储及高性能访问场景,对上层应用拆分逻辑完全透明,应用使用标准客户端即可使用。数据存储自动扩容,应用无需关心底层存储的容量问题,一键进行数据的迁移及扩容工作。整体系统运维的自动化智能化管理,运维成本低。统一访问服务统一访问服务主要是为上层应用提供一个透明访问代理层,应用无需关心底 层存储细节及产品类型,统一访问服务层帮助应用抽象出了一个统一入口,屏蔽掉了底层的不同存储产品带来的复杂性。 并同时实现了高性能具备过载保护及容 灾功能的接入服务,应用通过软负载均衡设备来接入服务, 软负载均衡设备会实 现多个接入节点的状态监测,故障剔除等工作。同时接入服
34、务层提供了过载熔断 等保护功能,保护后端代理的存储节点的稳定和安全。处理引擎SQL解析模块处理引擎会进行SQL请求的拦截和处理,并根据路由信息对SQL语句进行修改或 拆分,如果涉及多个节点,则会将拆分后的SQL青求并行发送到不同的物理实例 上,并等待结果返回,在查询结果返回后,接入层会进行结果集的合并和计算, 最终返回给客户端,整个过程对客户端完全透明。34v1.0可编辑可修改数据分片数据分片模块可以将数据按照应用指定的规则进行水平切分,解决容量和访问量 的问题,即可以不使用任何高端存储设备,只用普通x86机器完成很多高端存储 才能达到的存储能力和访问能力。 降低海关业务整体的硬件成本。数据可
35、以根据 海关各子业务的访问规则进行灵活配置,灵活扩展。数据路由海关各业务针对各自访问规则进行了数据水平切分和分片后,引擎层逻辑会通过具体的访问规则将实际的访问请求路由到指定分片。路由规则的存储是在元数据管理模块中,并推送给逻辑处理引擎。逻辑处理引擎会本地存储路由规则, 正常 的访问流程在逻辑引擎本地查询相关规则即可,无需访问远端的元数据管理模 块。结果集处理数据进行了分片并路由到指定后端存储节点后,会在远端的存储节点执行,并将数据返回给逻辑引擎,由于数据可能已经被水平拆分过,所以有可能会涉及到多 个远端的存储节点,即多个远端节点的数据需要进行结果集的汇总和再计算工 作,比如order by或者
36、group by等语句的执行,需要在逻辑引擎中进行结果的 缓存和计算工作,这部分逻辑集成在了逻辑引擎内部,对业务端是完全无感知的。数据扩容虽然我们可以按照业务类型预先对数据的容量和访问量做好规划并进行数据的水平切分和路由,但是通常我们预先规划的容量是未必完全合适的,这个时候我们可能需要对数据进行再次水平切分进行扩容迁移等操作,这个过程需要统一接 入管理平台与逻辑引擎共同完成,逻辑引擎负责线上路由切换的一部分,并通过一些手段完成多个逻辑处理引擎节点之间的同步问题,保障数据的可靠性和一致 35v1.0可编辑可修改性。备份管理备份管理主要保障数据的高可靠。数据的高可靠是通过系统后台自动定时全量及 增
37、量备份数据到云存储端来完成的。全量备份及增量备份的间隔时间通过管理系 统可以灵活配置,全量备份采用快照机制不会对线上访问造成任何影响,增量备份通过数据库binlog完成。数据驱动层数据驱动层会对涉及的所有物理节点进行管理,能够方便灵活的配置物理节点信 息,动态增减机器规模。并对节点进行实时监控和检测,剔除故障节点,保障业 务使用的稳定性.故障切换故障切换模块保障服务的高可用性,这是通过底层存储数据库的主备切换来完成,系统会监控所有管理的数据库实例, 发现某个实例异常或故障后,会自动将 访问切换到从库上,并通过数据库的半同步机制来保障数据在切换过程中是完全 没有任何数据丢失的。协议适配由于海关业
38、务可能会涉及不同种类的数据库存储节点, 针对这种情况可以通过单 独的协议适配模块进行协议的转换。对上层业务使用标准SQL 语句或者其它具体 某种数据库方言均可正常访问。36v1.0可编辑可修改统一接入管理平台统一接入管理平台主要进行整体接入系统的一些管理工作,比如元数据的存储, 监控检测机制,自动化运维模块等。配置数据管理配置数据管理主要存储整体接入系统的一些配置信息,比如集群数据库的一些参 数组配置,安全组配置等信息,可以方便的完成集群中部分机器的一些特殊定制 配置等需求,给整体系统带来比较大的灵活型。应用系统管理应用系统管理模块对接入的应用和业务进行统一管理。主要包括应用具体的一些 接入信
39、息配置,包括应用独立的一些配置数据, 注册信息,访问用户权限和角色 等。逻辑与物理节点管理统一管理模块会对整个集群的所有物理节点和逻辑节点进行管理,物理节点涉及所有机器的配置信息,运行中的动态负载信息,状态信息等。逻辑节点是暴露给 业务使用的一些抽象的逻辑库和逻辑表,并对此进行具体的逻辑到物理节点的映 射工作。该模块也是配合路由规则管理模块协同工作的。路由规则管理路由规则即具体分片规则信息,该信息通过统一接入管理平台来进行存储和管理,并通过统一管理平台与逻辑引擎进行交互。业务的路由规则录入与变更首先 会通过统一管理平台的管理端界面进行录入和修改,统一管理平台会将变更信息推送给所有的逻辑引擎。并
40、通过内部加锁等机制完成各逻辑节点更新的一致性问 题。37v1.0可编辑可修改扩容迁移管理扩容迁移功能是通过统一接入平台来完成的和发起的,监控系统会检测所有物理 节点的使用情况,包含数据量和访问量的信息,根据系统当前负载情况判断是否 需要进行迁移和扩容工作。当需要进行此项工作时,统一平台会发起迁移任务, 迁移任务交由一个工作节点进行线下的物理数据迁移,待到达指定阈值时会通知 逻辑引擎进行相关路由的锁定与切换工作,完成迁移和扩容的过程。备份管理备份管理模块会统一调度和进行所管理物理节点的数据全量备份与增量备份工作,具体备份的时间与间隔通过统一平台的管理界面进行配置。全量备份通过操作系统的块设备的快
41、照机制完成,对业务访问无任何感知和影响。增量备份通过 数据库的binlog来完成。所有备份文件统一上传至统一存储模块。需要时可以 完成快速恢复和容灾。接入层节点的水平扩展与容灾接入层本身单个节点可以提供每秒10W级的高性能访问,可以根据业务访问量的 需求或者容灾的考虑来动态增减节点,由于接入层节点是完全无状态的所以动态 增减并不会影响上面的应用,上面的应用可以通过类似LVS或者HA的方式来统一访问接入层节点,HA软件会自动对接入层节点进行状态检测,并剔除故障的 接入层节点对上层应用无感知。加入新的接入节点对上层应用同样是无感知的。存储层存储层主要解决下列问题:.服务的高可用.数据的高可靠.自动
42、化运维管理38v1.0可编辑可修改自动化运维平台提供灵活方便的用户管理操作入口,系统基本无需专人运维,大部分的工作是自动化的,一小部分工作通过人员确认一键完成。配置数据管理集群路由和分配以及扩容迁移等信息全部存储在中心节点 Manager中,所有路由 变更等配置信息统一通过Manager来完成,Manager节点会自动同步路由变更信 息给所有的接入节点,并保障接入节点对变更信息的一致性问题,即所有接入节 点在任意时刻看到的路由信息都是完全一致的,Manager与接入节点之间通过路 由版本号信息来保障这一点。元数据管理通过主备方式来进行容灾,主节点故障,从节点自动接管工作,对应用完全无影响。数据
43、无缝迁移扩容数据达到一定容量后,通过 Transfer模块可以进行自动无缝扩容和迁移工作, 迁移模块会分成线上和线下两部分完成,首先进行线下的全量数据及部分增量数 据的迁移,待线下数据迁移达到指定阈值后,会进行线上的最后一部分数据追赶 及路由切换等工作,应用的访问最终会自动被切换到新的实例上。迁移过程中会多次对数据进行校验,保障数据迁移的准确性。分布式缓存分布式缓存出于如下考虑,首先是缓存本身的水平线性扩展问题, 其次是缓 存大并发下的本身的性能问题,再次避免缓存的单点故障问题(多副本和副本一致性)。分布式缓存的核心技术包括首先是内存本身的管理问题,包括了内存的 分配,管理和回收机制。其次是分
44、布式管理和分布式算法,其次是缓存键值管理和路由。39v1.0可编辑可修改技术架构线程管理内存管理持久化处理DB文件系统LinuxBSDMACWindows分布式缓存系统引擎集群管理通讯管理支持数据类型提供如下形式的数据:Key/Value、Set、List、Map Object数据之间支持排序和集合运算缓存服务主要包括可分为以下几类:页面缓存应用对象缓存状态缓存分析计算缓存5)事务处理40v1.0可编辑可修改数据存储总体描述本章描述对核心数据,非核心数据等各类不同种类数据的数据处理系统,以及数据存储系统的架构实现。根据下列数据分类以及各类数据特点制定数据存储的架构方式。图4-6-1 :各种分类
45、维度下的数据分类技术实现按照不同数据分类下的数据特征(包括数据量,数据价值,以及结构化特征), 使用不同的数据存储架构实现数据这些数据的存储和管理。图4-6-2 :各种数据存储架构总览41v1.0可编辑可修改业男摩统您心鼓摩博(明心我W)即口都氏百目(升畅 泄握)ILMPP分出故S辟笫即兄话打圜军,昏 分布式蟾行数用分析系统. 一仲明(喻*核心数据存储架构1)数据库管理系统在采用Oracle11g RAC的基础上,对需要加速的数据处理,通过内存数据库 技术融合,以提高系统对核心数据的处理性能。2)数据存储系统磁盘阵列:采用SASa,支持 SAN交换机:采用FC协议,SANOS 8Gbps/4G
46、bps 的带宽。图4-6-3 :核心数据存储架构42v1.0可编辑可修改敷胃管理系统(DBMSOracle RACDSMnriemory(白工:1AlHbas& orTimesTen)文件系统(File System)ASMSM*OCi-MemDB网络存储层SANfNA5网络存铝FC协MTCP/P办议本地存睹层tRAlDW*URAIDS)SAS表4-6-1 SAN与NAS#储服务的比较43v1.0可编辑可修改NAS酋间艾什方式只住也过与之迷搂的主机事过X件系装的箕力比臂3t行声同理初尊真见何嫁父件专指系辄戌水装名就低事甄兔杂程度甚低票焚性能奸位学于网务环南泰晁#易性好一谯数整保挣更装好系辄灵活
47、性婚护应用版制元木文件至畸存储层在修改一下,再细分层,各种技术之间的优势(比如 SAN NAS的选 择的分析比较)。非核心数据存储架构1 )数据库管理系统采用MySql Cluster的开源集群数据库处理技术。2)数据存储系统磁盘阵列:采用SASa,支持 SAN交换机:采用FC协议,SANS用 8Gbps/4Gbps 的带宽。存储技术:通过分层关系描述44v1.0可编辑可修改开源分布式装存(ex: Redis .me)图4-6-4 :非核心数据存储架构开源OLTP集用用据M(&x:My$ql Cluster)文件系统招储引擎fFile Sys (jam/SM)可扩展存储引军(e)c:Mysql
48、 NDBnSchoonef)3AN/NAS网络存储 网络存储层.!IFC 击MCfV尸协议 RAJ烟盘阵列 (RAID 1 OK RAID 5) 本地存睹层JSAS磁盘一I分析型数据存储架构)数据库管理系统采用商用的MP吩布数据库(如Gbase),和Hadoop开源并行数据处理平 台的混搭技术。)数据存储系统x86 PC服务器上本地磁盘:采用SAS盘,支持24个磁盘(6000 , MPP 网络:采用基于万兆以太网或Infiniband 的高速网络。图4-6-5 :分析数据存储架构45v1.0可编辑可修改数寤管理事流(DSMS)商用MPP分布式分析理Hadoop/Hine文件祭统(File 声悟 m)分片列式存储在线副本HFDS分布文件裁统万兆阳或分布存储展一致性出与h数据分片Infiniband基于蝇碓)PC Servgr本的磁盘存储RAID磁矗眸列本地存储层CRAID10 和 RAID5J非结构化数据存储架构)数据库管理系统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 存量房买卖居间合同书
- 地坪夯实施工方案
- 活动预算及支出明细报表
- 中介房屋买卖三方合同
- 慈溪车库地坪施工方案
- 防机械伤害专项排查实施方案
- 重庆专业固锈底漆施工方案
- 成人专升本课程数学试卷
- 填埋场总体施工方案范本
- 地形地貌修复工程施工方案
- 计算机一级考试WPS试题及答案
- DB44/T 1047-2012 物业服务 清洁检查规范
- 快乐读书吧《孤独的小螃蟹》整本书阅读指导课教学设计-2023-2024学年语文二年级上册统编版
- 生猪屠宰兽医卫生检验人员理论考试题库及答案
- 五、完成课题的可行性分析
- 全科医生题库附有答案
- DL∕T 5765-2018 20kV及以下配电网工程工程量清单计价规范
- 高中化学-离子反应教学设计学情分析教材分析课后反思
- 2024年衡水市安平县小升初数学高频考点检测卷含解析
- Unit2 Special days 单元整体教学设计(1.2) 人教版新起点(一年级起点)五年级下册
- 内审员培训班考核试题
评论
0/150
提交评论