金融大数据中心建设规划_第1页
金融大数据中心建设规划_第2页
金融大数据中心建设规划_第3页
金融大数据中心建设规划_第4页
金融大数据中心建设规划_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融大数据中心建设规划Page7金融大数据中心建设规划全文共7页,当前为第1页。金融大数据中心建设规划全文共7页,当前为第1页。金融大数据中心建设规划

金融大数据中心建设规划全文共7页,当前为第2页。目录金融大数据中心建设规划全文共7页,当前为第2页。1、数据中心数据现状 31.1数据中心核心信息数据情况 31.2数据中心与外部系统信息交互情况 41.3数据中心目前的数据存储情况 42、数据中心系统现状 52.1系统架构 52.2功能描述 52.3面临的问题 63、项目建设目标 63.1业务目标 63.1.1.建立数据模型分析平台,开展持卡人交易行为分析 63.1.2.建立基于大数据平台的海量数据统计平台 73.1.3.能满足对海量历史数据进行快速查询的要求 73.2技术目标 7金融大数据中心建设规划全文共7页,当前为第3页。1、数据中心数据现状金融大数据中心建设规划全文共7页,当前为第3页。1.1数据中心核心信息数据情况数据中心对外展示功能主要基于业务数据查询平台,其主要功能包括:关键指标展示、多维分析、专题明细查询、常用数据浏览、静态报表下载以及部分业务参数管理和维护。数据中心保存的数据主要包含三大类:交易流水类数据、商户档案类数据和汇总统计类数据,均为结构化数据。金融大数据中心建设规划全文共7页,当前为第4页。1.2数据中心与外部系统信息交互情况金融大数据中心建设规划全文共7页,当前为第4页。1.3数据中心目前的数据存储情况数据中心目前数据量情况为全库18T,其中流水类数据为10T包括综合流水(90亿条记录),新一代增值流水(FJNL),清分流水。每日增量流水约1200万条记录。商户信息数据按天保存,商户数约为300万,终端数约为480万。每天数据量约为10G。金融大数据中心建设规划全文共7页,当前为第5页。2、数据中心系统现状金融大数据中心建设规划全文共7页,当前为第5页。2.1系统架构2.2功能描述新一代流水、清分流水、结算流水和BMS商户数据分别以文本和oracledmp格式通过ftp方式传输到数据中心服务器上,每天定时由批处理服务器通过批量框架(C++)调用批量过程按分支机构并发地将文件或DMP包导入数据库中。并通过调用存储过程完成数据的清洗、关联、数据补齐工作。批量过程完成元数据加工工作后,按各种业务维度按天、按月汇总交易数交易金额和收益等数据并生成关键指标数据。目前数据中有各种维度的汇总统计表80余张。完成汇总后,批量框架服务会根据关键指标数据生成cognoscube,并刷新cognos服务;同时报表生成程序会根据中间汇总表生成预定的报表文件。终端用户以web访问方式通过查询平台可以查询定制的报表或者通过cognos组金融大数据中心建设规划全文共7页,当前为第6页。件以仪表盘方式查询各动态报表。用户亦可通过拖拉拽方式自由组合维度和度量生成报表表格,通过cube可以实现数据的多维分析和动态钻取。金融大数据中心建设规划全文共7页,当前为第6页。2.3面临的问题1.单库查询方式的数据存储容量有限,很难做到数据的长期保存和查询。2.新增中间统计汇总需求或者中间统计汇总口径发生变化时,对存量数据的重新汇总需要耗费很漫长的时间。3.无法满足海量历史数据随机查询的需求。4.数据备份困难,超大容量数据库在备份和恢复方面存在很大困难,成本极高。5.数据分析处理能力有限,仅能按日进行数据统计,无法进行海量数据抽取运算。3、项目建设目标3.1业务目标大数据建设工作主要包括:3.1.1.建立数据模型分析平台,开展持卡人交易行为分析持卡人交易行为分析是已交易流水中的卡号为对象,根据持卡人历史消费情况进行数据拟合,根据一笔实际消费信息快速计算出该持卡人下一笔可能的消费目的,为精准营销提供支持。持卡人行为分析除了分析模型建立外,还包含了商圈的识别,目前我们已对部分商户地址进行了坐标化(百度坐标)。该行为分析的时限要求是1秒内且在1000TPS的情况下延时不超过5秒。金融大数据中心建设规划全文共7页,当前为第7页。金融大数据中心建设规划全文共7页,当前为第7页。3.1.2.建立基于大数据平台的海量数据统计平台海量历史数据统计要求是非实时的,是针对一定统计口径进行汇总的批处理要求。例如一定统计口径下针对90亿条流水按天生成汇总的中间结果,速度要求是小时级。3.1.3.能满足对海量历史数据进行快速查询的要求海量历史数据快速查询要求对海量历史流水按一定条件进行快速查询,需实现分页技术。此需求要求搜索的数据量大,响应速度快,要求能在分钟级内从大数据平台返回数据集给前端应用。3.2技术目标1.具备强大计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论