大数据平台描述_第1页
大数据平台描述_第2页
大数据平台描述_第3页
大数据平台描述_第4页
大数据平台描述_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图:大数据平台系统构造大数据平台在系统构造上包括数据采集系统、数据库治理系统、图:大数据平台系统构造数据融合系统、资源效劳治理系统、平台治理系统、任务调度治理系统、数据分析系统、数据可视化系统,如下图:数据采集系统系统概述数据采集子系统通过多种方式和途径,把政府和企业各个部门的数据、物联网的数据、互联网的数据会聚到大数据中心。基于大容量、消息和大事的数据导入,面对不同格式的构造化、非构造化和流形式的城市数据,供给易于运营的多种数据源治理和格式转换以及原始数据的临时存储。系统构造数据采集子系统通过丰富多样可供选择的采集方式,包括系统直采填写、数据导入、数据交换、网络抓取、API接口调用、感知设备图:数据采集总体架构对接等多种方式把政府和企业各个部门的数据会聚到数据效劳中心。数据格式包括传统的构造化数据,或视频、录音、图片、文本等非构造化的数据,并可实现采集自动归类和预处理。其根本原理如以下图所示:图:数据采集总体架构数据采集子系统通过不同数据节点,通过数据的推拉,将政府和企业各部门的数据会聚到数据效劳中心,形成数据效劳中心的根底数据资源库。系统功能数据采集系统的功能包括数据源治理、指标项治理、集群治理、流程治理、流程日志、效劳日志、插件治理。数据源治理:数据源治理主要解决政府各个部门、互联网爬取站点和物联网设备的数据源注册和治理,目前系统支持数据源包括:MySQL数据库、Oracle数据库、Hbase、Hive、NoSQL数据、云数据库、大文件系统、小文件系统等各种关系性数据库和非关系数据库。数据源中存储了全部建立数据库连接的信息,就象通过指定文件名可以在文件系统中找到文件一样,通过供给正确的数据源名称,用户可以找到相应的数据库连接;能够实现多类型数据源的注册、查询和治理等功能。指标项注册:包括采集指标项注册,下发指标项注册,对需要做共享交换的数据进展登记,配置好交换数据的源和目标,这个功能就是对全部指标项做统一的治理。集群治理:集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以治理。一个客户与集群相互作用时,集群像是一个独立的效劳器;集群配置是用于提高可用性和可缩放性;集群治理就是对全部的节点机的治理,包括节点机的激活,禁用,并对激活的节点机进展监控。流程治理:包括规章定制,流程定制,任务定制,流程监听和任务监听等模块。流程治理是在多个参与者之间依据某种预定义的规章流程传递信息,或让任务的过程自动进展,从而实现预期的业务目标实现。流程治理是业务整合的关键掌握链,是业务协同处理的中心集成者和治理者。规章定制解决交换过程中库之间格式不能正常交换等问题,在流程定制时依据需求选择规章来定制流程;流程定制完全是拖拽方式,可定制化流程配置即可实现数据传输;添加,启动任务调度流程运行,可设置任务执行的生效时间,频率;可分别对流程和任务做监听。监控治理:主要是对各种不同的数据源采集过程进展监控,能监控到每一批数据采集的结果,能统计到每天数据采集的结果,通良好的运维支撑。日志治理:包括,流程日志和效劳日志,流程日志用于流程运行监控;效劳日志,用于系统运行监控。FTPServer、Windows远程共享、Linux远程共享名目、CloudFile。数据库治理系统系统概述数据库治理子系统为城市数据采集的构造化数据、非构造化数据的供给云存储和治理效劳,存储和丰富日常操作数据的数据库系统和集中整合不同行业的历史和当前数据的数据仓库,实现各类数据依据约束条件进展会聚,并供给数据访问的安全策略执行,并依据数据安全效劳协议供给数据信息效劳,实现对城市信息资源的统一会聚和监控。系统构造数据效劳中心对采集后的数据进展统一的存储,由计算节点的本地磁盘、存储阵列、分布式文件系统〔HDFS、CFS、GLUSTERFS等〕、NAS等组成。具体数据存储包括但不限于分布式文件系统、分布式缓存、分布式数据库和分布式索引等多种方式存储,既实现数据调用的敏捷性和准时性,又保证数据的会聚和融合的高效性。数据库治理子系统依据数据类型和特征承受分层建模,便利数据图:数据库治理构造模型图:数据库治理构造模型系统功能数据库治理系统的功能包括仪表盘、数据库治理、索引治理、数据导入导出、数据备份治理、文件存储治理、文件导入导出、文件备份治理。仪表盘:数据源表统计;数据库治理:数据存储配置、表治理、数据扫瞄;索引治理:索引库治理、索引表治理、索引规章定制、索引数据扫瞄;数据导入导出:数据导入、数据导出;数据备份治理:备份规章、备份任务、备份日志;文件存储治理:文件存储配置、存储路径配置、文件数据扫瞄;文件备份治理:备份规章、备份任务、备份日志。数据融合系统系统概述数据融合子系统通过对采集的海量数据进展清洗、格式转换、时空化处理、关联、重组等操作,实现政务数据、互联网数据、物联网数据和互联网地图数据的依据“时间、空间、属性”三个维度进展融合,构建公共信息资源次序,形成根底库、主题分析库,满足各业务系统基于地图进展处理和分析的需求,最终为治理和决策供给数据支撑。系统构造数据融合通过连接所需多源数据库并猎取相关数据,争论和理解所获得的数据,梳理和清理数据,数据转换和建立构造,数据组合 ,建立以产生决策智能为目标将多种数据源中的相关数据提取、融合、梳理整合成一个分析数据集,通过效劳公布,满足数据效劳和数据应用需求,数据融合的总体架构如以下图所示:数据朦务A

才智应用JI务计算节点 计真节点 计算节点JR务系统功能

图:数据融合系统架构数据源治理:数据源治理主要解决政府各个部门、互联网爬取站点和物联网设备的数据源注册和治理,系统支持数据源包括:MySQL数据库、Oracle数据库、Hbase、Hive、NoSQL数据、 云数据库、大文件系统、小文件系统等各种关系性数据库和非关系数据库。数据源中存储了全部建立数据库连接的信息,就像通过指定文件名可以在文件系统中找到文件一样,通过供给正确的数据源名称,用户可以找到相应的数据库连接;能够实现多类型数据源的注册、查询和治理等功能。流程定制治理:包括规章定制、流程定制、任务定制等模块。流程治理是在多个参与者之间依据某种预定义的规章流程传递信息,或让任务的过程自动进展,从而实现预期的业务目标实现。流程治理是业务整合的关键掌握链,是业务协同处理的中心集成者和治理者。规章定制解决交换过程中库之间格式不能正常交换等问题,在流程定制时依据需求选择规章来定制流程;流程定制完全是拖拽方式,可定制化流程配置即可实现数据传输;添加,启动任务调度流程运行,可设置任务执行的生效时间,频率。云节点治理:云几点治理就是对全部的节点机的治理,基本信息如节点名称,节点IP,节点端口,web端口,包括节点机的激活,禁用,并对激活的节点机进展监控。日志治理:日志治理包括流程日志和操作日志两个板块;流程日志显示流程的执行状态,开头时间,完毕时间并可查看本流程中全部插件的执行状况,包括插件名称,输入总数,输出总数,错误总数并记录运行时间;操作日志对每个使用系统的人员操作进展记录,显示操作结果和操作内容。1.4资源效劳治理系统系统概述资源效劳治理系统对数据资源全生命周期的治理,对数据资源进行编目、公布、以效劳的方式对外供给数据效劳。资源效劳治理子系统作为数据效劳中心SOA架构的基石,供给效劳注册、应用适配、协议适配、消息转换、格式转换、智能路由、效劳治理、效劳编排、实时监控、多级互联、安全传输、安全验证、日志等功能,将分散的各应用系统以标准效劳的形式联通为一个有机的整体,有效实现系统间的信息解耦,进而促进各应用系统之间的协作、以及信息的互联互通,解决阻碍才智城市建设快速进展的信息孤岛问题。系统构造资源效劳治理系统作为全部接入效劳的开关,为城市的整合应用供给资源效劳,对数据效劳中心的各类效劳进展统一接入、统一治理、统一授权公布和效劳安全治理。系统总体架构如以下图所示:对外效劳治理效劳中心 效劳编排-效劳授权-效劳公布数据中心AlM CJIH WzA图:资源效劳治理系统架构资源效劳治理承受基于动态可插拔组件的系统架构,供给开放的、有针对性的二次开发API接口/SDK,使资源效劳更简洁与现有业务系统融合,为用户供给更高效、更稳定的效劳。同时,建立统一的资源效劳体系,实现城市根底资源多级联动的互联互通。系统功能资源效劳治理系统包括大数据中心和资源效劳治理。大数据效劳中心:包括数据集市、效劳集市、个人中心、开发者中心。资源效劳治理:包括数据采集治理〔采集名目注册、指标项治理、采集过程监控〕、数据融合治理〔规章定义、清洗比对规章、清洗比对结果、人工审计〕、数据中心治理〔数据名目定义、数据血缘分析、数据关联分析、数据中心数据监控〕、资源公布治理〔数据公布名目、效劳公布名目〕、资源审批治理〔资源申请审批、资源共享审批〕、资源使用统计〔数据使用统计、效劳使用统计〕。1.5平台治理系统系统概述平台治理系统作为数据效劳中心的治理掌握中心,为平台治理和平台运行供给系统支撑。治理平台子系统是以各类硬件设备、应用平台、应用系统等云资源以及数据中心的效劳对象作为治理对象,实现IT资源的全生命周期一站式效劳,支持跨异构系统部署和应用,包括数据效劳中心的调度、治理、监控、效劳和运营。系统构造平台治理系统依据不同的用户需求,动态配置、调度各类软、硬件资源,实现用户应用环境的动态弹性扩展,满足客户的效劳需求。为用户供给高安全、高性能、可扩展、可治理和可伸缩的全面保障 IT资源保障。通过平台治理为数据效劳中心的监管部门、监管人员、治理部门、治理人员、使用部门、使用人员等相关组织和人员,进展严格的分级、分类授权治理。通过平台运行支持,建立平台快速高效的运维治理体系。系统总体架构如以下图所示:效劳消费者 效劳治理者 效劳供给者云治理平台云效劳供给 用户注册 0g务产品喻 强务产品申请 效劳供给申请 效劳产品订阅 效劳生贵省理效劳产品曾理

运营治理

商业分析产品蝴

研抬田

运营分析

鬣为贫量分析Jg表效劳台治理 安全治理云服善 理

JSJS管故隘处理

效劳受18

问理

解先支持治理asea

安全.计资源修理

I

运维网用平台调试

运维豳务重应 震务公布各■包理

备份治理

J9装资源

至源差合/资源池化/资源虚拟化 应用平台安亲 应用平台菸整® Q 闲效劳器 存储

应用平台

治理软件图:平台治理系统架构系统功能平台治理系统包括用户权限、组织机构、菜单授权、应用的快速部署等功能模块。自助效劳:为各类用户供给一站式自助效劳门户,满足不同用户的应用需求。通过自助效劳门户可以实现云效劳产品查询、云效劳申请等效劳功能。资源治理:实现各类云效劳资源的治理,包括物理机资源、虚拟机资源、应用平台和应用系统的治理。应用治理:实现对云资源的统一监控、性能治理、预警治理、故障报警等。运营治理:实现IT效劳的订单治理、计量治理、计费治理等,满足企业IT运营治理的需求。效劳产品治理:用户供给的资源和资源集合的效劳模版,用户可以依据自己的需求对这些效劳模版进展配置订购。安全治理:实现对系统用户的身份认证、访问掌握、综合防护等功能。效劳台治理:以ITILV3为基准,标准化数据中心的IT运维治理流程。1.6任务调度治理系统系统概述任务调度治理系统应用于数据效劳中心全部数据处理工作的统一执行调度,基于元数据的数据关系和资源感知,实现零配置的调度任务生产;调度平台与开发平台是统一的,开发平台形成数据流形成实时的元数据信息,开发完成后上线无需在进展调度配置,从而充分发挥元数据治理的优势,为数据、程序、模型、系统的优化工作供给真实牢靠的信息。系统构造利用任务调度可视化界面创立任务,支持基于内部调度任务,也支持基于外部接口的任务,在此根底上可将任务进展细分成多个任务,形成调度任务线程池。如以下图所示:TCP/IP客户湍任务,并等待执TCP/IP承受执彳诧果和日志,图:任务调度治理系统架构系统功能任务调度治理系统包括采集任务调度、资源调度、优先级设定等 ,任务调度力量包括任务调度配置、任务调度运行、资源掌握、调度策略、调度监控等功能。任务治理:相关功能依据所配置的任务驱动条件启动调度任务,对调度流程的增、修改、删除,调度任务安排执行,并向执行代理客户端发送任务,代理执行完成后返回任务执行结果和日志。跨平台任务调度:能够跨平台的统一任务作业调度力量。任务调度配置:通过对图形化组件进展拖拽、流程连接等页面操作,完成调度配置。智能调度运行:传统的调度平台需要人工去配置作业流程、运行时间窗口,调度系统能够对资源状况智

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论