版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 Page * MERGEFORMAT 7金融大数据中心建设规划目录 TOC o 1-3 h z u HYPERLINK l _Toc504504726 1、数据中心数据现状 PAGEREF _Toc504504726 h 3 HYPERLINK l _Toc504504727 1.1 数据中心核心信息数据情况 PAGEREF _Toc504504727 h 3 HYPERLINK l _Toc504504728 1.2 数据中心与外部系统信息交互情况 PAGEREF _Toc504504728 h 4 HYPERLINK l _Toc504504729 1.3数据中心目前的数据存储情况 PA
2、GEREF _Toc504504729 h 4 HYPERLINK l _Toc504504730 2、数据中心系统现状 PAGEREF _Toc504504730 h 5 HYPERLINK l _Toc504504731 2.1 系统架构 PAGEREF _Toc504504731 h 5 HYPERLINK l _Toc504504732 2.2 功能描述 PAGEREF _Toc504504732 h 5 HYPERLINK l _Toc504504733 2.3面临的问题 PAGEREF _Toc504504733 h 6 HYPERLINK l _Toc504504734 3、项目
3、建设目标 PAGEREF _Toc504504734 h 6 HYPERLINK l _Toc504504735 3.1 业务目标 PAGEREF _Toc504504735 h 6 HYPERLINK l _Toc504504736 3.1.1.建立数据模型分析平台,开展持卡人交易行为分析 PAGEREF _Toc504504736 h 6 HYPERLINK l _Toc504504737 3.1.2.建立基于大数据平台的海量数据统计平台 PAGEREF _Toc504504737 h 7 HYPERLINK l _Toc504504738 3.1.3.能满足对海量历史数据进行快速查询的要
4、求 PAGEREF _Toc504504738 h 7 HYPERLINK l _Toc504504739 3.2 技术目标 PAGEREF _Toc504504739 h 71、数据中心数据现状1.1 数据中心核心信息数据情况数据中心对外展示功能主要基于业务数据查询平台,其主要功能包括:关键指标展示、多维分析、专题明细查询、常用数据浏览、静态报表下载以及部分业务参数管理和维护。数据中心保存的数据主要包含三大类:交易流水类数据、商户档案类数据和汇总统计类数据,均为结构化数据。1.2 数据中心与外部系统信息交互情况1.3数据中心目前的数据存储情况数据中心目前数据量情况为全库18T,其中流水类数据
5、为10T包括综合流水(90亿条记录),新一代增值流水(FJNL),清分流水。每日增量流水约1200万条记录。商户信息数据按天保存,商户数约为300万,终端数约为480万。每天数据量约为10G。2、数据中心系统现状2.1 系统架构2.2 功能描述新一代流水、清分流水、结算流水和BMS商户数据分别以文本和oracle dmp格式通过ftp方式传输到数据中心服务器上,每天定时由批处理服务器通过批量框架(C+)调用批量过程按分支机构并发地将文件或DMP包导入数据库中。并通过调用存储过程完成数据的清洗、关联、数据补齐工作。批量过程完成元数据加工工作后,按各种业务维度按天、按月汇总交易数交易金额和收益等数
6、据并生成关键指标数据。目前数据中有各种维度的汇总统计表80余张。完成汇总后,批量框架服务会根据关键指标数据生成cognos cube,并刷新cognos服务;同时报表生成程序会根据中间汇总表生成预定的报表文件。终端用户以web访问方式通过查询平台可以查询定制的报表或者通过cognos组件以仪表盘方式查询各动态报表。用户亦可通过拖拉拽方式自由组合维度和度量生成报表表格,通过cube可以实现数据的多维分析和动态钻取。2.3面临的问题1. 单库查询方式的数据存储容量有限,很难做到数据的长期保存和查询。2新增中间统计汇总需求或者中间统计汇总口径发生变化时,对存量数据的重新汇总需要耗费很漫长的时间。3无
7、法满足海量历史数据随机查询的需求。4数据备份困难,超大容量数据库在备份和恢复方面存在很大困难,成本极高。5. 数据分析处理能力有限,仅能按日进行数据统计,无法进行海量数据抽取运算。3、项目建设目标3.1 业务目标 大数据建设工作主要包括:3.1.1.建立数据模型分析平台,开展持卡人交易行为分析持卡人交易行为分析是已交易流水中的卡号为对象,根据持卡人历史消费情况进行数据拟合,根据一笔实际消费信息快速计算出该持卡人下一笔可能的消费目的,为精准营销提供支持。持卡人行为分析除了分析模型建立外,还包含了商圈的识别,目前我们已对部分商户地址进行了坐标化(百度坐标)。该行为分析的时限要求是1秒内且在1000TPS的情况下延时不超过5秒。3.1.2.建立基于大数据平台的海量数据统计平台海量历史数据统计要求是非实时的,是针对一定统计口径进行汇总的批处理要求。例如一定统计口径下针对90亿条流水按天生成汇总的中间结果,速度要求是小时级。3.1.3.能满足对海量历史数据进行快速查询的要求海量历史数据快速查询要求对海量历史流水按一定条件进行快速查询,需实现分页技术。此需求要求搜索的数据量大,响应速度快,要求能在分钟级内从大数据平台返回数据集给前端应用。3.2 技术目标1.具备强大计算处理能力和存储能力。2.采用X86框架服务
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小区路灯厂家供货合同范例
- 2024年汽车维修中心驾驶员技能培训及聘用合同2篇
- 2024年水产买卖合同样本
- 陕西服装工程学院《焊接方法与设备》2023-2024学年第一学期期末试卷
- 山西职业技术学院《资源环境分析(包括实验)》2023-2024学年第一学期期末试卷
- 山西应用科技学院《民航客舱服务与管理》2023-2024学年第一学期期末试卷
- 2024年度食品生产过程环境友好型工艺协议3篇
- 2024体育场馆租赁合同范本暨赛事场地使用协议3篇
- 2024年度商务担保信用评估合同范本3篇
- 山西职业技术学院《合唱团排练5》2023-2024学年第一学期期末试卷
- 原发性肝癌诊疗规范
- 交房维稳预案
- 《亲子活动设计与指导》课件-13-18个月婴儿亲子活动设计与指导(下)
- 新一代公安信息网安全方案设计方案
- 2024新人教版初中英语单词表汇总(七-九年级)中考复习必背
- 科技馆科普活动方案设计
- 面对困难永不退缩主题班会课件
- 加强能源革命的推进实施方案
- 工厂无线网络覆盖方案
- 2023-2024学年深圳市南科大附中高二上学期期末英语试卷及答案
- 养老培训市场分析报告
评论
0/150
提交评论