版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS35.020
CCSL70/84
团体标准
T/CESAXXXXX—2023
图数据库系统技术要求
Technicalrequirementsforgraphdatabasesystem
(征求意见稿)
在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。
XXXX-XX-XX发布XXXX-XX-XX实施
中国电子工业标准化技术协会发布
T/CESAXXXXX—2023
图数据库系统技术要求
1范围
本文件确立了图数据库系统的技术架构,规定了技术功能、技术特性、安全技术等要求。
本文件适用于图数据库系统的设计、开发、测试、评估等。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T20273—2019信息安全技术数据库管理系统安全技术要求
GB/T37722—2019信息技术大数据存储与处理系统功能要求
3术语和定义
下列术语和定义适用于本文件。
3.1
数据库系统databasesystem
储存、管理、处理和维护数据的软件系统,主要由数据库、数据库管理系统和数据库管理员组成。
[来源:GB/T28821—2012,3.1]
3.2
数据库管理系统databasemanagementsystem
用于建立、使用和维护数据库的软件。
[来源:GB/T28821—2012,3.3]
3.3
图数据库graphdatabase
使用图形结构进行语义查询的数据库。
3.4
图数据库系统graphdatabasesystem
储存、管理、处理和维护图数据库的软件系统。
4缩略语
下列缩略语适用于本文件:
DBMS数据库管理系统(DatabaseManagementSystem)
5技术架构
架构图
图数据库系统的技术架构图,见图1:
1
T/CESAXXXXX—2023
图1图数据库系统架构图
a)图数据库系统主要分为应用层、工具层、接口层、计算层和存储层。
b)存储层由图存储引擎构成,其中包括分片管理器和若干个存储数据的分片,实现图数据的存储
功能。
c)计算层由高可用服务引擎、图查询引擎、图分析引擎、数据加载引擎构成,实现图数据库的高
可用服务、图查询计算、数据加载、图分析等功能。
d)接口层由主流查询接口和主流算法接口组成,提供二次开发能力。
e)工具层由用户操作界面、图形化查询工具和数据导入导出工具组成。
f)应用层主要包括应用程序,基于图数据库的计算层和存储层的功能,来提供上层应用,比如社
交网络、安全风控、知识图谱等。
存储层
存储层用于基于分片来存储图数据,主要包括若干个分片,和分片管理器:
a)分片用于实现图数据的分布式存储。
b)分片管理器用于实现对分片的管理,包括寻址、负载均衡、集群管理等。
2
T/CESAXXXXX—2023
计算层
5.3.1概述
计算层应提供图数据的加载、查询、处理、分析等功能,包括高可用服务引擎、图查询引擎、数据
加载引擎、图分析引擎。
5.3.2高可用服务引擎
高可用服务引擎应提供图数据库的高可用服务,可包括心跳监控器、配置监控器、状态监控器、统
计管理器等功能组件。
a)心跳监控器用于监控图数据库系统的心跳,并进行自动容错恢复。
b)配置监控器用于监控图数据库系统的配置情况,及时发现系统配置上的问题。
c)状态监控器用于监控图数据库系统的运行状态,及时发现系统运行状态的异常。
d)统计管理器用于统计图数据库系统的性能指标,并进行可视化展示。
5.3.3图查询引擎
图查询引擎应提供图数据库的查询、计算等功能,包括查询解析器、查询优化器、查询处理器、更
新处理器等功能组件。
a)查询解析器用于解析接收到的查询指令。
b)查询优化器,用于对查询活动进行执行计划的优化。
c)查询处理器用于执行解析后的查询指令,根据不同的操作,调用不同的执行器。
d)更新处理器用于执行对图数据的更新操作,包括新增、修改、删除等操作。
5.3.4数据加载引擎
数据加载引擎应提供数据加载功能,包括批量生成、增量加载、实时更新等方式,可包括快速队列、
实时更新器、块加载器、批量更新器等功能组件。
a)快速队列用于缓存流数据源的实时数据更新请求,调用相应的实时更新器,来更新这些数据。
b)实时更新器用于处理流数据源的实时数据更新。
c)块加载器用于实现数据块的增量加载。
d)批量更新器用于实现图数据的批量生成和更新。
e)说明:数据加载引擎的实现可以不限于上述功能组件。
5.3.5图分析引擎
图分析引擎应提供图指标、基础图论算法、图优化、图推理、图深度学习等不同算法模块。
a)图指标模块负责计算指标,表征图的基本状态。
b)基础图论算法模块负责执行基于经典图论的算法,包含路径计算和子图挖掘相关算法等。
c)图优化模块使用图论算法进行组合优化。
d)图推理模块提供支持知识图谱推理的能力。
e)图深度学习模块提供支持图的特征抽取能力。
接口层
接口层应提供主流软件的查询接口和主流算法接口,提供面向应用的二次开发能力。
a)查询接口用于与外部接口,接收来自于外部的查询指令。
b)主流查询接口一般适配具有较强生态开源框架如Gremlin、OpenCypher和SPARQL等查询语言,
接收来自于外部的查询指令。
c)主流算法接口一般适配如Pregel、GAS等图算法迭代框架,接收来自于外部的算法命令。
工具层
3
T/CESAXXXXX—2023
工具层应提供用户操作界面工具、图形化查询工具、数据导入导出工具。
应用层
应用层应基于图数据库的计算层、存储层、工具层的功能,来提供上层应用程序。
6技术功能要求
基本要求
图数据库系统宜符合GB/T37722-2019中6.5节”分布式图数据库”的要求。
图数据库系统应符合GB/T37722-2019中7.4节”图计算”的要求。
存储功能要求
图数据库系统应具备如下的存储功能要求:
a)宜具备图数据的分片存储功能;
b)应基于有向属性图或以主谓宾的三元组的数据模型对图数据进行存储。
c)应实现存储数据的一致性管理。
计算功能要求
6.3.1高可用服务功能要求
图数据库系统应具备如下的高可用服务功能要求:
a)应支持对系统心跳的监控,和自动容错恢复。
b)宜支持对系统配置的监控,并及时发现系统配置上的问题。
c)应支持对系统状态的监控,及时发现系统运行状态的异常。
d)应支持对系统性能指标的统计,并进行可视化展示。
e)宜支持系统动态伸缩、弹性扩容等。
6.3.2图查询功能要求
图数据库系统应具备如下的图查询功能要求:
a)应支持如下的功能操作:增删改查、连接、排序、聚合。
b)应支持数值函数、字符函数、时间日期函数、类型转换、条件表达式、正则表达式、循环函数、
聚合函数等多种函数。
c)应支持添加新的操作符和自定义函数,来扩展图查询语言的功能。
d)应支持对单个节点和边,以及其属性的精准查询。
e)应支持建立范围查询的索引。
f)应支持对图查询结果的可视化展现。
g)应支持单节点、多节点多层关系扩展查询,支持最短路径、最优路径遍历搜索。
h)宜支持图上的子图匹配查询。
i)宜支持主流图查询语言,如Gremlin、OpenCypher和SPARQL等。
6.3.3图分析功能要求
图数据库系统具备如下的图分析功能要求:
a)应支持常用的图指标算法,如直径半径、三角计数、计算图的中心度等;应支持常用的路径计
算算法,如单源最短路径、两点最短路径、全最短路径等;应支持常用的子图挖掘算法。
b)应支持常用的图优化方式,如旅行商问题(TSP)、车队路径规划问题(VRP)、图着色等。
c)宜支持实体关系推理、知识消歧等知识图谱推理方式。
4
T/CESAXXXXX—2023
d)应支持节点嵌入、子图嵌入等图深度学习的特征抽取方式。
e)宜支持主流图算法迭代框架,如GAS、Pregel等。
f)应支持分析结果的可视化展现,宜支持分析结果的分页展示。
g)宜具备可扩展多种图切分模式和调度方法的能力,宜支持多图之间的分析和访问。
h)宜支持复杂图分析和图计算,宜支持分析算法的用户可介入的中断和恢复。
6.3.4数据加载功能要求
图数据库系统宜具备如下的数据加载功能要求:
a)宜支持快速队列,对流数据源的实时数据更新请求进行缓存。
b)可支持对来自流数据源的数据进行实时更新。
c)宜支持对数据块的增量加载。
d)宜支持对图数据的批量生成和更新。
工具功能要求
图数据库系统应具备如下的工具功能要求:
a)应提供用户操作界面Shell工具,用于接收用户的命令,并调用相应的应用程序。
b)应提供图形化查询工具,便于用户对图数据库系统进行可视化查询。
c)应提供数据导入导出工具,便于用户对数据的导入导出操作。
7技术特性要求
容灾能力要求
图数据库系统应具备如下的灾备能力要求:
a)应具备在出现故障(比如服务器故障、硬盘故障、网络故障、关机、重启等)后系统进行自动
容灾恢复的能力,包括数据备份和恢复、各组件的主备节点切换等。
b)应基于去中心化设计,且具备多机房容灾能力。
c)应具备多备份共同服务能力。
兼容性要求
图数据库系统应具备如下的兼容性要求:
a)应能在主流服务器和主流操作系统上正常运行。
b)应支持多数据源的批量数据导入与更新。
c)应支持异构硬件平台和不同的操作系统。
可扩展性要求
图数据库系统应具备如下的可扩展性要求:
a)应支持水平线性扩展,按需扩容缩容。
b)应具备将接入图数据库的计算压力进行平衡的能力。
c)应支持在不停止服务的情况下,进行功能扩容。
d)应支持实时、增量、批量更新数据。
运维管理能力要求
图数据库系统应具备如下的运维管理能力要求:
a)应具备将数据分散地存储于多台独立的机器设备的分布式部署能力。
5
T/CESAXXXXX—2023
b)应具备对系统运行的重要事件、异常事件、异常状态进行自动告警的能力,并对告警信息进行
实时展示。
c)应具备对系统的运行状态进行统计分析的能力。
d)应具备对图数据库系统资源进行分组配置的能力。
e)应具备对全局范围内的图数据库配置参数进行在线管理的能力。
f)应具备在线状态下,进行组件升级和版本升级的能力。
g)应具备对图数据库系统的各类日志进行查看和处理的能力。
h)应具备对数据进行导入和导出的能力。
i)应具备对主备系统之间保持数据同步,并保持强一致性的能力。
性能要求
图数据库系统应具备如下的性能要求:
a)查询延迟应在毫秒级。
b)应支持对亿级的节点和边的图存储、图查询和图计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年监护权变更法律援助合同3篇
- 2024设备租赁合同设备租赁合同
- 2024消防工程消防水源保障服务合同范本3篇
- 2025年度港口设施行车维修及航道安全保障合同3篇
- 二零二五年度企业员工考勤合同样本及奖惩制度3篇
- 二零二五年度摩托车租赁合同免责条款2篇
- 2025年度树木培育基地与园林企业供应合同3篇
- 2025年度废弃矿山拆除生态修复劳务承包合同全新版3篇
- 二零二五年度建筑工程合同策划与建筑废弃物无害化处理3篇
- 二零二五年度企业内部审计与合规管理合同2篇
- 【苏教版】2022-2023学年六年级数学上册期末试卷(及答案)
- 2023-2024学年连云港市灌云县四年级数学第一学期期末学业水平测试模拟试题含答案
- 湖南省怀化市鹤城区2023年数学三下期末监测试题含解析
- 项目工程安全管理责任区域划分表
- 2023年学校食堂审计发现问题整改报告3篇
- 教育培训学校(机构)课堂教学反馈表
- 2023年全国测绘生产成本费用定额
- GB/T 6480-2002凿岩用硬质合金钎头
- GB/T 5447-1997烟煤粘结指数测定方法
- GB/T 2820.5-2009往复式内燃机驱动的交流发电机组第5部分:发电机组
- GB/T 17684-2008贵金属及其合金术语
评论
0/150
提交评论