数据开放平台技术规范_第1页
数据开放平台技术规范_第2页
数据开放平台技术规范_第3页
数据开放平台技术规范_第4页
数据开放平台技术规范_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DB36/TXXXX—XXXX范围本标准规定了江西省政务信息资源开放数据的分类组织方式、开放元数据、数据开放流程、开放内容要求及开放管理制度。本标准适用于江西省各级政府部门开放各类政务数据,并为各相关部门政务数据资源开放提供实操性指导。规范性引用文件下列文件对于本文件的引用是必不可少的。凡是已经标注日期的引用文件,仅所注明日期的版本适用于本规范。凡是未标注日期的引用文件,其最新版本(包括所有的修改版)适用于本规范。GB/T7027信息分类编码的基本原则和方法GB/T21063.1政务信息资源目录体系第1部分:总体框架GB/T21063.1政务信息资源目录体系第3部分:核心元数据GB/T21063.1政务信息资源目录体系第4部分:政务信息资源分类GB/T21063.1政务信息资源目录体系第6部分:技术管理要求《国务院关于批转发展改革委等部门法人和其他组织统一社会信用代码制度建设总体方案的通知》(国发〔2015〕33号)《江西省政务信息资源目录编制规范(试行)》(赣发改高技〔2017〕965号)术语和定义GB/T7027、GB/T21063.1确定的术语和定义适用于本规范。元数据元数据是描述信息资源特征的数据。一般包括信息资源的分类、名称、开放属性、提供方、发布日期等。元数据元素元数据的基本单元,用以描述信息资源的某个特性。元数据实体一组说明数据相同特性的元数据元素。政务信息资源政务信息资源是指政务部门在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表和数据等各类信息资源,包括政务部门直接或通过第三方依法采集的、依法授权管理和因履行职责需要依托政务信息系统形成的信息资源等。政务信息资源目录政务信息资源目录是通过对各政务信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用以描述各个政务信息资源的特征,以便于对政务信息资源进行检索、定位与获取。分类组织方式政务信息资源开放的数据分类组织方式遵循《江西省政务信息资源目录编制规范(试行)》(赣发改高技〔2017〕965号)。开放元数据概述本规范对开放数据的政务信息资源目录元数据进行定义和描述,内容包括的属性见表1。元数据内容元数据实体元数据元素类型信息资源基本信息信息资源名称核心元数据信息资源代码核心元数据信息资源分类核心元数据信息资源摘要核心元数据信息资源格式核心元数据更新周期核心元数据发布日期核心元数据信息资源提供方资源提供方核心元数据资源提供方代码核心元数据信息资源开放属性是否向社会开放核心元数据开放条件核心元数据信息项描述信息项名称核心元数据数据类型核心元数据数据长度开放属性信息项描述元数据描述5.2.1信息资源名称定义:开放数据集的名称数据类型:字符串型最大出现次数:1备注:必选项5.2.2信息资源代码定义:开放数据集的唯一标识代码。信息资源代码的编码遵循《江西省政务信息资源目录编制规范(试行)》中的编码规则。数据类型:字符串型最大出现次数:1备注:必选项5.2.3信息资源分类定义:开放数据集的分类信息,具体分类详见4.分类组织方式数据类型:字符串型最大出现次数:1备注:必选项5.2.4信息资源摘要定义:对信息资源内容的概要描述信息数据类型:字符串型最大出现次数:1备注:必选项5.2.5信息资源格式定义:描述信息资源的存在方式。信息资源提供方应尽可能提供可机读的电子格式及相关软件版本信息,如只有纸质介质应尽量提供电子扫描格式。电子格式的信息资源,可采用但不限于:电子文件的存储格式为OFD、wps、xml、txt、doc、docx、html、pdf、ppt等;电子表格的存储格式为et、xls、xlsx等;数据库类的存储格式为DM、KingbaseES、Access、Mysql、DBase、Sybase、Oracle、SqlServer、DB2等;图形图像类的存储格式为jpg、gif、bmp、png等;流媒体类的存储格式为swf、rm、mpg等;自描述格式,由提供方提出其特殊行业领域的通用格式,如气象部门采用的“表格驱动码”格式。数据类型:字符串型最大出现次数:1备注:必选项5.2.6更新周期定义:信息资源的更新频率。分为实时、每日、每周、每月、每季度、每年等数据类型:字符串型最大出现次数:1备注:必选项5.2.7发布日期定义:资源提供方发布开放数据集的日期数据类型:字符串型,格式为CCYY-MM-DD最大出现次数:1备注:必选项5.2.8资源提供方定义:提供开放数据集的政务部门数据类型:字符串型最大出现次数:1备注:必选项5.2.9资源提供方代码定义:提供开放数据集的政务部门代码。代码采用《国务院关于批转发展改革委等部门法人和其他组织统一社会信用代码制度建设总体方案的通知》的法人和其他组织统一社会信用代码结构。数据类型:字符串型最大出现次数:1备注:必选项5.2.10是否向社会开放定义:信息资源面向社会公众开放的属性,包括“是”和“否”,对应取值分别为1和0。数据类型:数值型最大出现次数:1备注:必选项5.2.11开放条件定义:对社会开放资源的条件描述,当“是否向社会开放”取值为1时,描述开放条件。数据类型:字符串型最大出现次数:1备注:必选项5.2.12信息项名称定义:描述开放数据集中具体信息项的中文标题。数据类型:字符串型最大出现次数:1备注:必选项5.2.13数据类型定义:标明该信息项的数据类型。其中,结构化数据(数据库类、电子表格类)的,应标明数据类型及数据长度,包括:字符串型C、数值型N、货币型Y、日期型D、日期时间型T、逻辑型L、备注型M、通用型G、双精度型B、整形I、浮点型F、二进制型blob、文本型text。数据类型:字符串型最大出现次数:1备注:可选项;当信息资源为结构化数据集时,为必选项。5.2.14数据长度定义:标明该信息项在计算机中存储时占用的字节数,适用于结构化数据(数据库类、电子表格类)。属于数据库类的,数据长度即该信息项对应的字段在数据库中的指定长度或默认长度;属于电子表格类的,估算该信息项内容字数的上限,并折算成字节数,该字节数即为数据长度。数据类型:字符串型最大出现次数:1备注:必选项5.2.15开放属性定义:对该信息项是否向社会开放的描述,包括“是”和“否”,对应取值分别1和0。数据类型:数值型最大出现次数:1备注:必选项5.2.16信息项描述定义:对该信息项的内容进行简要描述数据类型:字符串型最大出现次数:1备注:可选项;当信息资源为结构化数据集时,为必选项。数据开放平台技术架构数据开放平台应采用“数据+服务+应用”的模式,通过信息资源编目,融合各类数据,形成数据管理体系,统一提供据数据开放、共享服务,逐步形成数据资源中心。需要开放共享的数据,都通过数据资源中心进行统一的管理。总体框架如图1所示:开放平台总体框架图

开放门户主要功能6.1.1首页展示首页的展示,根据时政热点和群众所关心的领域、话题,精挑细选出对应的数据,进行统计分析后,将主要的内容进行直观的展示。主要包括热门数据图表展示、数据主题列表、最新数据提示、最热门数据提示以及数据下载排行榜等。对于用户所关心的数据信息,在前台数据目录页面显著位置展现,方便社会公众和数据使用者了解数据结构和所包含的原始信息。6.1.2数据目录数据目录是一个开放数据的信息集合,也可以称为数据集。数据目录中包含了该数据的元数据基础信息、历史数据信息、关联数据信息、以及下载地址或数据API接口地址等内容。建立数据目录,可以更好的进行数据管理工作,提高数据开放平台的数据全文检索能力。6.1.3数据指数数据指数,通过设置一些衡量指标参数以一定的规则计算出分析结果,为社会公众提供一种直观的数据可视化展现形式,数据指数可以包括部门开放指数、主题开放指数、热搜指数等。6.1.4数据服务数据服务模块允许数据分析人员、专业数据公司以及数据主管部门利用数据开放平台中开放的数据进行移动应用和第三方数据服务的开发。数据开放平台为社会公众、软件开发公司和人员、数据主管部门等提供上传的入口,让数据发挥其应有的价值。6.1.5数据预览数据预览功能可以至少提供前5条样例数据进行预览,为数据使用者提供一个数据概貌,方便数据使用者快速判断数据内容是否符合要求,提高平台页面响应速度,提高数据使用者对数据的理解。6.1.6关联数据推荐和数据图谱描述数据与数据之间存在的多种关联关系,比如:强关联关系或弱关联关系等。数据图谱提供了从"关系"的角度去分析问题的能力,结合图数据库技术将各种不同类型的信息联系在一起,形成一张数据关系网络。6.1.7数据互动数据开放平台为社会公众提供数据互动功能,互动内容包括允许数据使用者将开放的数据页面链接分享到社交网络,如分享给QQ好友、QQ空间、微信和微博等。“收藏”功能支持将感兴趣的数据目录进行收藏。“纠错”功能实现将社会公众发现数据错误的问题及时反馈给该数据目录的系统管理员、数据管理员、数据提供单位或机构人员,积极发挥社会公众的力量,帮助数据开放平台完善数据质量。6.1.8交流与反馈完善数据开放主管部门、数据提供部门和社会公众之间的沟通交流机制,通过该功能可以快速了解社会公众对数据的需求、咨询和建议,通过设置一些常见问题查询,也可以让社会公众清晰地知道数据开放平台是什么、对外提供什么服务、数据开放的政策以及他们所拥有的权益,为数据开放平台增添活力,提高数据开放的透明度。开放平台部署架构6.2.1部署架构数据开放平台的数据来源均是从政务外网发审核流程后,再按需求整理数据资源推送到互联网区,供互联网用户使用。考虑到安全性和可靠性,开放平台的数据流向由政务外网单向流出到互联网区。对于互联网区产生的日志数据或用户数据,通过网闸,定时导入政务外网。部署架构参考示意图,如图2所示:开放平台部署架构参考示意图6.2.2访问策略根据图2所示,互联网区和政务外网区服务器之间,以及用户与服务器之间的访问策略如表2、表3所示:互联网区服务器访问策略所在区域源IP/服务器名称方向目标IP/服务器名称目标端口所在区域互联网区数据开放门户应用服务器--à数据开放数据库服务器自行定义互联网区数据库互联网用户--à数据开放门户应用服务器80政务外网区服务器访问策略所在区域源IP方向目标IP目标端口所在区域政务外网区数据开放后台--à数据开放数据库服务器自行定义互联网区政务外网区政务外网用户--à数据开放后台80政务外网区数据开放流程根据《江西省政务信息资源目录编制规范》,数据资源的共享和开放可分为无条件共享、有条件共享、不予共享、是否向社会开放等几种类型,数据开放的流程需遵循完成数据采集、入库、开放,数据提供方需负责维护和更新本部门和开放数据资源目录,保证上述信息的真实性、准确性、完整性、及时性和有效性。如图3所示:政务数据资源开放流程开放内容要求政务信息资源的开放范围政务信息资源的开放范围应重点包括信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、能源、农业、环境、经济、金融、安全、统计、气象、企业登记监管等民生保障服务相关领域,将可开放的政府数据集中向社会开放。开放数据资源的提供形式数据开放平台尽可能的提高开放数据资源的机器可读率,尽量不以PDF文件、网页或图片等格式发布,而应以标准的结构化文件发布,如CSV、XML、JSON、XLS、XLSX等。同时,进一步建立完善的数据发布审核流程,结合系统自动化检查和人工审查的方式,对发布的数据格式进行检查,确保所发布的数据满足数据格式的开放性要求。

附录1开放管理制度法律法规制定地方政府通过立法和出台相关政策,规范政府数据在“聚、通、用”各个环节的合法性、合规性。对政府数据实行动态管理,在部门职责、平台

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论