CESA-2023-069《标准信息服务平台 数据库建设要求》团体标准_第1页
CESA-2023-069《标准信息服务平台 数据库建设要求》团体标准_第2页
CESA-2023-069《标准信息服务平台 数据库建设要求》团体标准_第3页
CESA-2023-069《标准信息服务平台 数据库建设要求》团体标准_第4页
CESA-2023-069《标准信息服务平台 数据库建设要求》团体标准_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS01.140.20

CCSA14

团体标准

T/CESAXXXX—202X

标准信息服务平台数据库建设要求

Standardinformationserviceplatform——Databaseconstructionrequirements

征求意见稿

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申请

证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利申请

号和申请日期。

202X-XX-XX发布202X-XX-XX实施

中国电子工业标准化技术协会发布

T/CESAXXXX—202X

标准信息服务平台数据库建设要求

1范围

本文件规定了标准信息服务平台数据库的构成、总体要求以及标准管理数据库、标准内容数据库、

产业链数据库、标准评价数据库的具体构建要求。

本文件适用于标准信息服务平台数据库的设计和建设。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T1.1标准化工作导则第1部分:标准化文件的结构和起草规则

GB/T16733国家标准制定程序的阶段划分及代码

GB/T20273信息安全技术数据库管理系统安全技术要求

GB/T22373标准文献元数据

3术语和定义

下列术语和定义适用于本文件。

3.1

标准信息服务平台standardinformationserviceplatform

运用高性能计算、大数据、区块链、知识计算技术,提供标准智能检索、标准对比分析、产业链用

标情况分析等功能,满足标准推广与应用、标准实施效果分析与评价、产业链用标分析与决策等标准数

字化应用的服务平台。

3.2

标准主题词standardsubjectterm

描述标准内容的关键词。

4数据库构成

图1给出了标准信息服务平台的数据库构成,其主要组成部分为标准管理数据库、标准内容数据库、

产业链数据库、标准评价数据库。

1

T/CESAXXXX—202X

图1标准信息服务平台数据库构成

——标准管理数据库:包含标准文件管理数据和标准制修订过程数据,支撑标准信息服务平台标准

文件的更新管理、上传下载和标准制修订过程信息及文件的查看、下载等基础功能。

——标准内容数据库:包含标准结构化内容和标准知识数据,支撑标准信息服务平台对于标准全文

内容的检索、智能问答、图谱探索等功能。

——产业链数据库:包含产业链及用标数据,支撑标准信息服务平台的产业链数据查询、用标分析

等功能。

——标准评价数据库:包含标准评价相关数据,支撑标准信息服务平台的标准成熟度评价、标准实

施效果评价等功能。

5总体要求

5.1系统要求

5.1.1应面向业务主题建设独立于应用程序的数据库,根据需要支持不同语言及文字、符号、公式、

图形、图像等多种形式数据的存储。

5.1.2应具备安全可靠的基础设施与环境,包括服务器、存储硬件设备、软件环境、网络环境等。

5.1.3应具备支持元数据管理、数据管理、安全管理、数据交换等功能的数据库管理系统。

5.1.4数据库系统的建设应遵循GB/T20273中对信息系统建设的安全技术规定。

5.1.5数据库系统应具备易维护性、可扩展性,能够根据需求的变化维护、修改或扩充系统功能。

5.2命名要求

5.2.1数据库名称应体现数据库的数据内容,名称宜由大写英文字母、下划线组成;

5.2.2数据表名称应体现表中的数据内容,命名简短、明确,名称宜由大写英文字母、下划线组成;

5.2.3字段名应作为表中该字段的唯一标识并体现字段的含义,名称宜由大写英文字母、0-9数字、

下划线组成,字段名称不宜超过四个英文单词。

6标准管理数据库

6.1构建过程

标准管理数据库构建过程见图2,输入的标准相关原始文件上传后形成文件管理数据,标准制修订

信息通过文件上传处理或外部接口接入数据,经制修订管理形成制修订过程数据。

2

T/CESAXXXX—202X

图2标准管理数据库构建过程

6.2数据表设计

6.2.1标准文件管理数据

标准文件管理数据主要数据表应包括:

a)标准文件基本信息表,记录标准原始电子文件信息;

b)标准文件页表,记录标准文件的分页信息。

数据表具体字段设计参考附录A.1至A.2。

6.2.2制修订过程数据

制修订过程数据主要数据表应包括:

a)制修订过程流转信息表:记录标准的制修订阶段状态、各阶段对应的时间段、专家等相关信息;

b)标准状态信息表:记录发布标准的当前状态,以及与其他标准之间的代替关系。

c)标准化技术组织信息表:记录组织基本信息、秘书处信息等技术组织基本信息;

d)标准化专家信息表:记录专家基本信息;

e)标准体系信息表:记录标准体系对应的基本信息、体系结构。

各数据表具体字段设计参考附录A.3至A.7。

7标准内容数据库

7.1构建过程

标准内容数据构建过程见图3,标准电子文件经过结构化处理,形成标准结构化的内容数据,基于

结构化内容数据进一步做知识抽取、标注和图谱构建等,形成标准知识数据。

3

T/CESAXXXX—202X

图3标准内容数据库构建过程

7.2数据表设计

7.2.1标准结构化内容数据

标准结构化内容数据应包括:

a)标准结构化基本信息数据,其主要数据表应包括:

1)标准基本信息表:记录标准文献基本属性信息,应至少包括GB/T22373-2021中定义的

标准文献核心元数据,宜包括较常用的标准文献公共元数据;

2)图片基本信息表:记录标准中图片的基本信息、段落位置信息、存储信息等;

3)表格基本信息表:记录标准中表格的基本信息、段落位置信息、存储信息等;

4)公式基本信息表:记录标准中公式的基本信息、段落位置信息、存储信息等。

b)标准结构化加工后的内容数据,其主要数据表应包括:

1)标准全文内容表:记录标准按照标准编写要素以及章节结构划分的全文内容,数据表设

计应考虑GB/T1.1-20206.2.2.2中阐述的标准构成要素,包括必备要素和可选要素。

2)术语定义表:记录结构化加工后的术语及定义内容;

3)标准引用关系表:记录结构化加工后的标准引用其他标准的情况;

4)表格内容表:记录结构化加工后的表格的数据内容。

各数据表具体字段设计参考附录A.8至A.15。

7.2.2标准知识数据

标准知识数据是由标准内容进一步处理形成的知识化数据,应包括知识图谱数据。图谱数据一般由

图谱的基本信息、本体层数据和实例层数据组成,其中图谱基本信息和本体层数据宜采用关系型数据库

存储,主要数据表应包括:

4

T/CESAXXXX—202X

a)图谱基本信息表:记录标准图谱信息;

b)实体类型信息表:记录标准知识图谱本体模型中实体类型的基本信息;

c)实体类型属性表:记录标准知识图谱本体模型中实体类型的属性信息;

d)实体类型关系表:记录标准知识图谱本体模型中实体类型之间的关系信息。

各数据表具体字段设计参考附录A.16至A.19。

图谱实例层数据宜采用图数据库或多种数据库混合存储,满足图谱数据的高效存储和查询需求。若

使用关系型数据库,其数据表应参照本体层,设计对应的实体表、实体关系表、实体属性表等。

面向标准信息服务平台的信息查询和知识分析需要,宜包括标准主题词信息表、标准问答系统(FAQ)

信息表、标准文本主谓宾(SPO)信息表等标准知识数据表。

8产业链数据库

8.1构建过程

产业链数据库构建过程见图4,产业链、企业、标准基础信息经过数据收集、关系梳理后形成产业

链及用标数据。

图4产业链数据库构建过程

8.2数据表设计

产业链数据主要数据表应包括:

a)产业链基本信息表:记录产业名称、描述、对应的产业链图谱编号等基础信息;

b)产业链产品信息表:记录产业链中各环节和产品的树形层级关系;

c)产品相关企业表:记录产品对应的企业清单;

d)产品相关标准表:记录产品对应的标准清单。

各数据表具体字段设计参考附录A.20至A.23。

宜包括企业基本信息表:记录产业链相关业的企业概况、经营情况等基本信息。

9标准评价数据库

9.1构建过程

5

T/CESAXXXX—202X

标准评价数据库构建过程见图5,基于标准基本信息和评价参考信息进行指标设计和评价数据采集,

形成标准评价指标和评价结果等标准评价数据。

图5标准评价数据库构建过程

9.2数据表设计

标准评价数据应包括但不限于:

a)标准评价指标表:记录每个标准与评价指标的对应关系;

b)评价指标体系表:记录多级指标体系之间的从属关系;

c)标准评价结果表:记录标准评价的结果数据。

各数据表具体字段设计参考附录A.24至A.26.

6

T/CESAXXXX—202X

附录A

(规范性附录)

标准信息服务平台数据库表结构设计

标准文件基本信息表字段设计如表A.1所示,数据表设计时应考虑以下方面:

a)考虑标准文件大小和数量,有较高存储、性能要求时宜采用文件系统服务存储文件原件;

b)标准文件在磁盘或文件系统的存储采用标准文件唯一ID命名;

c)根据使用需求考虑是否采用加密方法;

d)当存在同时修改同一文件信息时,考虑使用文件锁。

表A.1STANDARDS_FILE_INFO标准文件基本信息表

字段名称数据类型约束/条件字段说明

FILE_UUID字符型必选标准文件唯一ID

FILE_VERSION字符型必选标准文件版本

ORIGINAL_NAME字符型必选标准文件名

CONTENT_TYPE字符型必选标准文件类型

STANDARD_NO字符型必选标准编号

STORE_TYPE数值型必选存储类型(0:本地磁盘,1:DFS文件系统)

STORE_PATH字符型必选标准文件存储位置

LENGTH数值型可选标准文件实际大小(单位:字节)

STORE_IP字符型可选标准文件存储节点IP

LAST_MODIFIED_TIME日期型可选标准文件最后修改时间

FROM_IP字符型可选标准文件来源IP

标准文件中页表字段设计如表A.2所示,其中页内容根据使用需求考虑是否采用加密方法。

表A.2STANDARDS_MATERIAL_PAGE标准文件页表

字段名称数据类型约束/条件字段说明

FILE_UUID字符型必选标准文件唯一ID

FILE_VERSION字符型必选标准文件版本

PAGE_UUID字符型必选本页内容唯一标识

PAGE_NO数值型必选页号

CONTENT_TEXT字符型可选页内容

CONTENT_WORD_COUNT数值型可选页字数

CONTENT_SENTENCE_COUNT数值型可选页句子的数量

7

T/CESAXXXX—202X

制修订过程流转信息表字段设计如表A.3所示:

表A.3STANDARDS_REVERSION_PROCESS_INFO制修订过程流转信息表

字段名称数据类型约束/条件字段说明

FILE_UUID字符型必选标准文件唯一ID

FILE_VERSION字符型必选标准文件版本

STANDARD_NO字符型必选标准编号

PRESENT_REVERSION_NO字符型必选当前所处制修订阶段编号

PRESENT_REVERSION_NAME字符型必选当前所处制修订阶段名称

REVERSION_NO字符型必选制修订阶段编号

REVERSION_NAME字符型必选制修订阶段名称

START_DATE日期型可选开始时间

END_DATE日期型可选结束时间

EXPERT_LIST字符型可选制修订过程对应专家列表

根据GB/T16733-1997,国家标准的制修订阶段编号和名称对应数据字典如下:

表A.3.1国家标准制修订阶段数据字典

制修订阶段编号制修订阶段名称

00预阶段

10立项阶段

20起草阶段

30征求意见阶段

40审查阶段

50批准阶段

60出版阶段

90复审阶段

95废止阶段

标准状态信息表字段设计如表A.4所示:

表A.4STANDARDS_STATUS_INFO标准状态信息表

字段名称数据类型约束/条件字段说明

FILE_UUID字符型必选标准文件唯一ID

FILE_VERSION字符型必选标准文件版本

STANDARD_NO字符型必选标准编号

STANDARD_STATUS_NO字符型必选标准状态编号

STANDARD_STATUS_NAME字符型必选标准状态名称

IS_REPLACE逻辑型必选是否代替其他标准

REPLACED_STANDARD_NO字符型可选被代替标准的标准编号

标准技术组织信息表字段设计如表A.5所示:

8

T/CESAXXXX—202X

表A.5STANDARDS_TC_INFO标准化技术组织信息表

字段名称数据类型约束/条件字段说明

TC_UUID字符型必选技术组织唯一ID

TC_NO字符型必选技术组织编号

TC_NAME字符型必选技术组织名称

TC_NAME_EN字符型可选技术组织英文名称

TC_NAME_SHORT字符型可选技术组织简称

TC_SCOPE字符型必选负责专业范围

BUILD_UNIT字符型必选筹建单位

GUIDANCE_UNIT字符型必选业务指导单位

SESSION_NO数值型可选本届届号

SECRETARY_GENERAL字符型可选现任秘书长

CONTACT_PEOPLE字符型可选联系人

CONTACT_PHONE字符型可选联系电话

CONTACT_EMAIL字符型可选联系邮箱

SECRETARIAT_UNIT字符型必选秘书处所在单位

CONTACT_ADDRESS字符型可选通讯地址

CONTACT_POSTCODE字符型可选邮编

标准专家信息表字段设计如表A.6所示:

表A.6STANDARDS_EXPERT_INFO标准专家信息表

字段名称数据类型约束/条件字段说明

EXPERT_UUID字符型必选专家唯一ID

EXPERT_NAME字符型必选专家名称

WORK_UNIT字符型必选工作单位

POSITION_TITLE字符型必选职务

PROFESSIONAL_TITLE字符型必选职称

WORK_FIELD字符型必选从事领域类别

TC_UUID字符型必选所属技术组织ID

WORK_UNIT_TYPE字符型可选工作单位类型

CONTACT_ADDRESS字符型可选工作单位通讯地址

CONTACT_PHONE字符型可选联系电话

CONTACT_EMAIL字符型可选联系邮箱

标准体系信息表字段设计如表A.7所示

表A.7STANDARDS_SYSTEM_INFO标准体系信息表

字段名称数据类型约束/条件字段说明

STANDARD_SYSTEM_UUID字符型必选标准体系唯一ID

9

T/CESAXXXX—202X

表A.7(续)

字段名称数据类型约束/条件字段说明

STANDARD_SYSTEM_NAME字符型必选标准体系名称

LEVEL字符型必选层级

NODE_CODE字符型必选体系节点编码

NODE_NAME字符型必选体系节点名称

P_NODE_CODE字符型必选父级节点编码

IS_FINAL_NODE字符型可选是否末级节点

标准基本信息表字段设计如表A.8所示:

表A.8STANDARDS_BASE_INFO标准基本信息表

字段名称数据类型约束/条件字段说明

FILE_UUID字符型必选标准文件唯一ID

FIELD_CODE字符型必选基本信息字段编码

FIELD_NAME字符型必选基本信息字段名称

FIELD_VALUE字符型必选基本信息取值

START_PAGE数值型可选起始页

START_POSITION数值型可选开始位置

END_PAGE数值型可选结束页

END_POSITION数值型可选结束位置

其中基本信息字段编码及名称参考GB/T22373—2021设计,数据字典见表A.8.1。

表A.8.1标准题录信息字段内容数据字典

基本信息类型基本信息字段编码基本信息字段名称

100标准号

101发布日期

102发布机构

200标准状态

205实施或试行日期

207确认日期

核心元数据

298中文标准名称

301原文标准名称

302英文标准名称

462被代替标准

820修改件

823补充件

825中国标准分类号

826国际标准分类号

其他公共元数据

209起草单位

204批准单位

10

T/CESAXXXX—202X

表A.8.1(续)

基本信息类型基本信息字段编码基本信息字段名称

304出版单位

850标准类型

835中文主题词

390英文主题词

409附注

其他公共元数据

502引用文件

870提出单位

871归口单位

861卷期号

891标准历史

图片基本信息表字段设计如表A.9所示,在磁盘或者文件系统存储时,命名应采用图片唯一编号。

表A.9STANDARS_PICTURE_INFO图片基本信息表

字段名称数据类型约束/条件字段说明

PIC_OSS_UUID字符型必选图片唯一编号

FILE_UUID字符型必选标准文件唯一ID

FILE_VERSION字符型必选标准文件版本

PAGE_NO数值型可选所在页号

PIC_PAGE_NO数值型可选图片在页的位置

PIC_START_PAGE数值型可选图片开始页

PIC_START_POSITION数值型可选图片开始位置

PIC_END_PAGE数值型可选图片结束页

PIC_END_POSITION数值型可选图片结束位置

PIC_NAME字符型必选图片标题名称

PIC_PATH字符型必选图片存储路径

PIC_TYPE字符型可选图片类型

PIC_SIZE数值型可选图片的大小(单位:KB)

PIC_DESCRIBE字符型可选图片内容

PIC_CHAPTER字符型必选图片所属章节

表格基本信息字段设计如表A.10所示,设计应考虑以下方面:

a)标准文件中表格有时是图片形式存在的;

b)当表格是图片,在磁盘或者文件系统存储时,命名应采用表格唯一编号。

表A.10STANDARDS_TABLE_INFO表格基本信息表

字段名称数据类型约束/条件字段说明

TABLE_UUID字符型必选表格ID

FILE_UUID字符型必选标准文件唯一ID

11

T/CESAXXXX—202X

表A.10(续)

字段名称数据类型约束/条件字段说明

FILE_VERSION字符型必选标准文件版本

PAGE_NO数值型可选表格所在页号

TABLE_PAGE_NO数值型可选表格在所在页的位置

TABLE_START_PAGE数值型可选表格开始所在页号

TABLE_START_POSITION数值型可选表格开始位置

TABLE_END_PAGE数值型可选表格结束所在页号

TABLE_END_POSITION数值型可选表格结束位置

TABLE_TITLE_NAME字符型必选表格标题名称

TABLE_TITLE_LOC字符型可选表格标题所在位置

TABLE_PIC_PATH字符型可选表格图片存储路径

TABLE_PIC_TYPE字符型可选表格图片类型

TABLE_PIC_SIZE数值型可选文件的大小,单位是KB

TABLE_PIC_OSS_UUID字符型必选图片唯一编号

TABLE_PIC_DESCRIBE字符型可选表格图片描述

TABLE_HTML字符型可选表格类HTML格式内容(HTML/XML/MD等)

TABLE_CHAPTER字符型可选表格所属章节

公式基本信息表字段设计如表A.11所示,公式在磁盘或文件系统中的存储应该采用唯一编号命名。

表A.11STANDARDS_FORMULA_INFO公式基本信息表

字段名称数据类型约束/条件字段说明

FILE_UUID字符型必选标准文件唯一ID

FILE_VERSION字符型必选标准文件版本

FORMULA_PIC_OSS_UUID字符型必选公式的唯一编号

PAGE_NO数值型可选所在页号

FORMULA_PAGE_NO数值型可选公式在页的位置

FORMULA_START_PAGE数值型可选公式开始页

FORMULA_START_POSITION数值型可选公式开始位置

FORMULA_END_PAGE数值型可选公式结束页

FORMULA_END_POSITION数值型可选公式结束位置

FORMULA_NAME字符型可选公式名称

FORMULA_PIC_PATH字符型必选公式图片存储路径

FORMULA_PIC_TYPE字符型可选公式图片类型

FORMULA_PIC_SIZE数值型可选文件的大小(单位是KB)

FORMULA_PIC_DESCRIBE字符型可选公式图片描述

FORMULA_LATEX字符型可选公式LATEX格式

FORMULA_CHAPTER字符型可选公式所属章节

12

T/CESAXXXX—202X

标准全文内容表字段设计如表A.12所示:

表A.12STANDARDS_CONTENT标准全文内容表

字段名称数据类型约束/条件字段说明

FILE_UUID字符型必选标准文件唯一编号

ELEMENT_ID字符型必选要素内容唯一标识

LEVEL数值型必选层级

PARENT_ID数值型必选父级ID

TITLE_NO字符型可选标题号

TITLE_CONTENT字符型可选标题内容

ELEMENT_TYPE字符型必选要素类型编码

TEXT字符型必选要素内容

TEXT_HTML字符型必选要素内容类HTML格式(HTML/XML/MD等)

TITLE_START_PAGE数值型可选标题起始页

TITLE_START_POSITION数值型可选标题起始位置

TITLE_END_PAGE数值型可选标题结束页

TITLE_END_POSITION数值型可选标题结束位置

TEXT_START_PAGE数值型可选内容起始页

TEXT_START_POSITION数值型可选内容开始位置

TEXT_END_PAGE数值型可选内容结束页

TEXT_END_POSITION数值型可选内容结束位置

SORT_NO数值型可选排序

其中要素类型数据字典如表A12.1所示:

表A.12.1要素类型数据字典

要素类型编码要素类型名称

COVER封面

CATEGORY目次

FOREWORD前言

INTRO介绍

TEXT正文

MODIFICATION修订信息

REFERENCE参考信息

BACK_COVER

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论