基于大数据的能力开放平台解决及方案_第1页
基于大数据的能力开放平台解决及方案_第2页
基于大数据的能力开放平台解决及方案_第3页
基于大数据的能力开放平台解决及方案_第4页
基于大数据的能力开放平台解决及方案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、毕业设计基于大数据的能力开放平台解决案摘要关键字:大数据经分统一调度能力开放运营商经过多年的系统建立和演进,部系统间存在一些壁垒,通过在运营商的各个部系统,如经分、VGOP、大数据平台、集团集市等中构建基于ESB的能力开放平台,解决了系统间调度、封闭式开发、数据孤岛等系统问题,使得运营商营销能力和效率大大提高。问题分析背景分析随着市场开展,传统的开发模式已经无法满足业务开发敏捷性的要求。2021年以来,某省运营商经营分析需求量激增,开发时限要求缩短,业务迭代优化需求频繁,原有的“工单-开发模式平均开发期为4.5天,支撑负荷已到达极限。能力开放使业务人员可以更便捷的接触和使用到数据,释放业务部门

2、的开发能力。由于历史原因,业务支撑系统存在经分、VGOP、大数据平台、集团集市等多套独立的运维系统,缺乏统一的运维管理,造成系统与系统之间的数据交付复杂,无法最大化的利用系统资源。统一调度的出现能够充分整合现有调度系统,减少运维工作量,提升维护质量。驱动力一:程序调度管理混乱,系统资源使用不充分经分、大数据平台、VGOP、集团集市平台各自拥有独立的调度管理,平台程序根本是串行执行,以经分日处理为例,每日运行时间为20个小时,已经重影响到了指标的汇总展示。驱动力二:传统开发模式响应慢,不能满足敏捷开发需求大数据平台已成为一个数据宝库,已有趋势说明,只依赖集成商与业务支撑人员的传统开发模式已经无法

3、快速响应业务部门需求,提升数据价值。驱动力三:大数据平台丰富了经分的数据源,业务部门急待数据开放某省运营商建立了面向企业部所有部门的大数据平台,大数据平台整合了接入B、。域、互联网域数据,近100余个数据接口,共计820T的数据逐步投入生产。大数据平台增强了传统经分的数据处理的能力,成为公司重要的资产,但是传统经分数据仓库的用户主要面向业支部人员,限制了数据的使用人员围和数据的使用频度,已经无法满足公司日益开展的业务需求,数据的开放迫在眉睫。问题详解基于背景情况分析,我们认为主要问题有三个:1、缺乏统一的调度管理,维护效率低下目前经分系统的日处理一般是使用SHELL脚本开发的,按照串行调度的思

4、路执行。进展能力开放后,目前的系统架构无法满足开发者提交的大量程序执行调度的运维需求。如果采用统一调度的设计思路那么基于任务的数据表依赖进展任务解耦及调度,将大大简化调度配置工作和提高系统的并发度;2、需求期长,导致开发期长现行的开发模式是由业务部门提出需求,业务支撑中心进展需求分析,然后再转派给开发厂商。厂商除了需要与业支沟通需求以外,有时候还需要与业务部门进展二次沟通,最终才能明确需求,开发期比拟长;3、数据管理分散,存在数据冗余,营销效果欠佳经分系统对外提供数据,目前采用的是传统的文件接口形式,这样会造成经分和外围系统存在至少2份的数据,随着经分的按天支撑模式,造成传统的营销效果欠佳,外

5、围系统的存储浪费。解决案介绍业务目标将大数据平台及经分数据仓库平台的数据和系统处理能力进展标准化封装,按需进展开放,满足各业务部门数据使用的需求,并在经历成熟的情况下逐渐开放给外部众多的合作伙伴使用。统一调度:作为大数据开放根底平台,通过消息总线将大数据平台、经分、集市、VGOP、业务部门的应用进展统一的系统调度管控,提供跨平台调度、分发、解析等根底功能,实现大数据平台、经分数据仓库等多类型底层平台的能力互补,形成融合平台的协作效应;通过多租户技术,解决生产任务与数据开放能力争用的问题,实现系统资源对生产任务与临时任务的合理分配及高效调度。统一开发:集成图形化的开发界面,通过统一封装的函数库提

6、供类SQL的开发语言,以屏蔽底层平台差异,降低业务人员的开发门槛,实现快速的业务开发及数据测试。通过元数据的数据模型抽象,逐步将Hadoop、DB2的后台数据资源高效、平安并可控可管的开放给前端进展访问。数据共享:大数据平台将用户标签、营销目标、用户套餐剩余量等信息通过统一的数据效劳式开放给其他系统或者在线使用,确保数据的唯一性和数据响应的及时性。案容及亮点图为基于大数据的能力开放体系架构,我们在原有大数据平台上进展整合,使得大数据的成果能够有效的被外部系统调用,并具备标准的效劳能力供后续的系统对接。能力开放平台由统一调度、统一开-发、数据共享三大平台组成:统一调度平台将原大数据平台、经分数据

7、仓库、VGOP平台等关联度高的独立应用系统的任务进展统一管理、执行调度及监控,提升整体的执行效率并简化运维。统一开发平台搭建于统一调度的根底之上,开发者可以通过IDE使用封装后的函数,以SQL脚本进展图形化的数据处理程序设计及开发。通过多租户的式,对开发者分配独立的大数据平台及数据仓库的存储、计算资源,确保开发者在共享数据、系统能力的同时,不影响生产系统的正常运行。数据共享平台提供标准API封装,提供应外部系统进展数据查询和调用,实现经分系统对外数据效劳标准化,同时保障数据平安性并降低外部系统数据存储压力。统一调度统一调度由控制中心和AGENT两局部组成,如下列图所示:大徵握平白经分柒画市前台

8、W0b台敌据分生擢口1控制中心:控制中心接收来自部的消息,通过规那么引擎判断任务是否满足触发条件并分发给Agent进展处理,并对任务执行情况进展监控及消息生成。消息接收:支持各种事件触发消息,如文件到达、接口装载、表生成;规那么引擎:根据人工定义、系统资源情况、租户定义等设置制定任务的执行条件及前后依赖关系;任务触发:根据消息总线传递的消息,判断任务是否具备执行条件,并将满足触发条件的任务分发至各平台Agent端执行;任务监控:接收来自Agent的程序执行状态及资源状态并产生新的消息。2AGENT:部署到参与调度的执行平台,负责任务执行及系统资源、任务状态收集报告。任务监听:轮询扫描控制中心发

9、出的任务;任务执行:支持td、shellpython、java等程序,可以手工设置各个执行平台进程数,支持多进程并发处理;资源状态及心跳报告:支持分钟级和主动资源收集报告,将资源信息进展反应。控制中心实时监控Agent运行状态,并进展短信告警,防止Agent挂死。统一开发统一开发提供图形化的开发能力以及统一元数据管理:IDE图形化的开发界面及统一封装函数库的集成,如下列图所示:满足业务部门自助开发的需求,集成图形化的开发界面,通过拖拽的式实现快速数据处理逻辑设计及开发;通过JAVA包对SQL命令、Hadoop、DB2执行平台的系统命令、时间函数、字符串函数、聚合函数等根底函数库进展统一封装,屏

10、蔽底层执行平台的系统差异,实现类SQL开发语言支持,降低系统的技术门槛;前台提供图形化开发界面、拖拽式开发式、统一封装的函数库、灵活的脚本编辑能力对开发过程进展支撑。包含以下功能:查看元数据、数据模型注册、数据模型导入、设计、开发、测试、上线、优化;数据处理过程API分为7大类:数据输入(Reader)、数据输出(Writer)、行集处理(Process)字段级处理、流程控制类、数据检查类、数据交换类,并提供了一套可扩展的机制;函数编排支持条件分支、循环、异常控制等,支持变量读取、定义,能够实现复杂场景下的开发;数据同步采用开源的Sqoop来实现大数据平台和DB2、HBASE的高效数据同步(2

11、)统一的元数据开放共享与实时更新为实现公司部模型及数据的复用,并实现数据资产的编目管理、共享及分级存储,同时实现数据平安的可控可管,能力开放平台搭建了元数据管理模块。包含全局数据字典、程序逻辑等元数据,提供元数据维护、权限控制等工具实现元数据整个生命期的管理。元数据的管理界面如下列图所示:3嗡辑给删除维度名称:查询范围:所有维度成员名称O维度名成员编码O维度名成员编码成员名称OAPPJJEVTYPE应用开发方式陋数据层次ODSDDS接口OM_DATACCLE数据周期数据层次WA基础汇忠层囱DMJJATALEVEL数据层次口数据层次WDW基础数据层OM_DATASTATE表状态0数据层次STST

12、应用层OM_DATASTORE表存储类型口数据层次WdW分析模型层OM_DBJUSER数据库用户数据层次REP报表OM_DQ.ALERTLE.告警分级口数据层次KPIKPIOM_DQJKLERTRE.告警原因类型数据层次ATAIINDER数据挎掘OM_DQ.ALERTST.告警状态口数据层次DLW3DLAPOM_DQJKLERTIYPE告警分层0数据层次MM模型HDMDQCHKCYCLE质量规则维元数据的自动更新:通过统一开发平台开发的程序,相关元数据表、字段、数据流图、触发条件将自动纳入元数据管理,实现元数据的自动更新,并为统一调度平台提供程序调度触发消息;元数据的可控开放:为了保障开放数据

13、的平安性,平安管理员要对即将开放的根底元数据进展逐个审批,只有得到平安管理员审批的根底数据才能对外开放,从而保障开放数据的平安性。数据共享为发挥大数据的价值,通过标准API封装的式为企业各种实时的业务运营提供信息支撑,并对外部系统提供统一的数据调用接口,具有实时、动态的信息交-互能力。标准的数据开放接口实现数据和应用的解耦、应用和UI的解耦,有利于各应用系统功能集成。大S岬台二曰蛔弼/disI! LFIPI 双聒共享开放AP调用门户网站丽将1数据层为实现快速的数据查询,数据共享平台采用了HBASE及Redis作为数据层。HBASE:作为分布式的、面向列的开源数据库,HBASE在Hadoop之上

14、提供了大数据的存储和快速查询能力。Redis:作为基于存亦可才J久化的日志型、Key-Value数据库,并提供多种语言的API。其查询速度比HBASE更高。2封装层基于Restful架构实现API封装,使用Nginx的代理功能,整合后端多个Tomcat效劳器,实现高并发的查询能力。部构造如下:眼外耽控-噩管理H志伊理效劳注册:效劳属性配置:如效劳标识、效劳名称、效劳描述、效劳发布地址等信息的配置;效劳参数配置:包括输入参数、输出参数、输出容等配置。效劳平安管理:效劳认证鉴权是用于鉴别效劳请否有效劳调用权限;数据交换平安是用于保证效劳请求-响应过程中的数据平安;权限管理是用于确定效劳请求可调用的

15、效劳权限。认证鉴权:确定效劳请否有访问效劳提供提供的具体效劳的功能权限;对于有功能权限的效劳请求,还需要再确定其可访问的具体效劳的数据围权限。效劳运维:效劳监控对数据效劳的运行状况提供实时的监控和分析,帮助运维人员及时了解数据效劳的安康情况。查询响应:负责处理数据和各类数据源进展交互,获取查询结果。数据获取处理主要包含:连接相应的数据源,执行经过模型映射解析的可执行SQL语旬,获取结果数据。通信协议:通信协议采用全球公认的WEBSERVICE标准协议。需求更容易平安接入系统3.3案效果统一调度案效果:统一调度集中整合了运营商经分系统、大数据平台、集团集市、VGOP等应用系统的调度管理,提高了各个平台程序的并发度,减少重复建立,节约本钱近百万;统一开发案效果:目前互联网中心和信安部已经开场进展客户体验工作,统一开发平台上线之后,需求的开发速度由原来的数十天量级提升到小时量级实现,数据变现能力得到数倍的增强;数据共享案效果:目前某省运营商已部署基于Redis的“用户剩余流量实时查询系统,采用Redis存数据库作为存存储单元;每天分流500万以上的查询需求,同步数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论