银行业图数据库选型实践_第1页
银行业图数据库选型实践_第2页
银行业图数据库选型实践_第3页
银行业图数据库选型实践_第4页
银行业图数据库选型实践_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2018银行业图数据库分析、选型与实践Agenda图的概念图数据库技术分析图数据库在光大银行的实践现实世界的图图是相互连接的事物及其关系的一种结构化表达。信息读取是顺序的 过程,要求阅读者在大 脑中将信息串联形成理 解,而图能够即时传达 信息,易于揭示复杂的 模式。在社交网络、交 通网络、通讯网络、 资金网络等展现场景 下,都有比较直观的 展现效果。数学世界的图无向图有向图多重图G=(V,E)V Vertexes (Node) E Edges(Arcs, Links)环平行边多重图:一个允许有多重边的图, 也就是有至少二个边的二个顶点完 全相同,至少有二个顶点可以由二 个边相连接。在工程实践中

2、多为有向多重图有向边无向边工业界的图RDF更加繁琐,不支持属性,同等 情况下规模比LGP更大。Freebase 边数量在31亿左右Label = Type, Class标签数量在不同的产品中存在差异RDFProperty Graph (Labeled)Hypergraph一条边连接多个顶点Resource Description Framework历史悠久,伴随着语义万维网、知 识图谱的发展。主谓宾三元组是基本组成单位objectsubjectpredicate在工程实践中产生,为了处理高度 连接数据的存储和查询,一般为有 向多重图。缺少统一的元模型表述语言示例 RDF & PGRDFRDFp

3、roperties with edgeProperty Graph知识图谱与图存储技术图存储技术是支持知识图谱应用的关键技术之一。知识图谱(知识引擎)是多种技术的综合应用,包括自然语言识别(NLP)、机器 学习及图存储技术等,其大量知识来源于非结构化数据。知识图谱的整体使用过程包括知识获取、知识融合、知识存储、知识推理、知识应 用等步骤,典型应用场景包括搜索引擎、问答系统等。Agenda图的概念图数据库技术分析图数据库在光大银行的实践“高成长”的图数据库图数据库的使用价值1. 优秀的查询性能相对关系型数据库,图数据库产品一般在设计上避免大量的Join操 作,提供快速的查询。2. 灵活的数据建模

4、, Schema-less多数图数据库没有预设的schema,借助底层的存储机制,能够更加灵活的变更结构。3. 易于理解,更加敏捷相对于关系数据库的表格,图的组织形式更接近与现实世界,易 于理解。4. 基于图算法提供强大分析能力PageRank/社区发现算法等图数据库产品Graph Data & RDF Store图数据库的定义与分类图数据库分类OperationSemantic/textAnalyticUnificationTherefore a graph database remains “a database that uses graph structures for semanti

5、c queries with nodes, edges and properties to represent and store data” independent of the way the data is stored internally.部分图数据库产品DataStax Enterprise Graph(Titan)Neo4jOrientDBArangoDBIBM Graph (JanusGraphPerson2 RocksDB - Badger(SSD)大幅提升数据更新及查询能力单机存储与计算Graph Database1.0并行计算Graph Database2.0分布式存储与

6、并行计算Graph Database3.0Agenda图的概念图数据库技术分析图数据在光大银行的实践银行业的应用场景信贷管理流程集团客户供应链亲属回避制度以客户为顶点,客户间的担保关系、控股关系、交易关系等为边。反洗钱业务资金网络以帐号为顶点,以资金流转活动,转账、支付等为边。审计分析系统逻辑数据模型账户对公客户对私 客户资金往来担保关系紧密关系(控制、雇佣等)担保关系贷款 合同紧密关系(股权、供应链)员工紧密关系(亲属、同事)归属归属签订签订附属抵质 押物关联关联管理管理10亿顶点30亿边(汇总) 待增加设备等节点HDFS/Hive系统架构数据源层平台层服务层应用层数仓文件文本数据加载图谱数据处Titan图谱查证模型管理系统管理ElasticSearchSpark MLlibSpark GraphXHBaseRe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论