2023数据产品登记信息描述规范_第1页
2023数据产品登记信息描述规范_第2页
2023数据产品登记信息描述规范_第3页
2023数据产品登记信息描述规范_第4页
2023数据产品登记信息描述规范_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据产品登记信息描述规范II目 次前言 II范围 1规范性引用文件 1术语和定义 1缩略语 2代码集 2描述属性 3登记信息 3信息扩展 7附录A(资料性)数据类型说明表 8附录B(资料性)描述示例 9参考文献 14PAGEPAGE14数据产品登记信息描述规范范围本文件规定了数据产品的代码集、描述属性、登记信息、信息扩展等内容。规范性引用文件(包括所有的修改单适用于本文件。GB/T4754-2017国民经济行业分类GB/T5271.1-2000信息技术词汇第1部分:基本术语GB/T18391.1-2009信息技术元数据注册系统(MDR)第1部分:框架GB/T40094.2-2021电子商务数据交易第2部分:数据描述规范术语和定义下列术语和定义适用于本文件。3.1数据data信息的可再解释的形式化表示,以适用于通信、解释或处理。[来源:GB/T5271.1-2000,01.01.02]3.2数据产品dataproduct有价值的数据,或基于数据提供的有价值的内容或服务。3.3源数据sourcedata本文所指源数据是作为原材料用来生产、提供数据产品的数据。3.4原始取得originalacquisition源数据的获取方式之一,是指组织在开展自身业务活动的过程中获取源数据。3.5收集取得collectionacquisition源数据的获取方式之一,是指从互联网爬取或问卷调查等方式从组织外部获取源数据。3.6交易取得transactionacquisition源数据的获取方式之一,是指通过交易的方式从组织外部获取源数据。3.7即时供应providenow当前就能提供该数据产品。3.8延时供应providelater在未来的某一时间点才能提供该数据产品。3.9实体entity任何现存﹑曾经存在的或可能存在的具体的或抽象的事物,包括事物间的关联。示例:一个人,对象(物体)、事件、观念、过程等。注:实体的存在不依赖于是否有关于它的可用数据。[出自GB/T18391.1-2009,定义3.2.10]3.10属性attribute一个对象或实体的特征。[出自GB/T18391.1-2009,定义3.1.1]3.11信息元素informationelement信息的基本单元。例如:中文名称、描述、数据类型、数据格式、值域等。注:信息元素在信息实体中是唯一的。[出自GB/T40094.2-2021,定义3.1.4]3.12信息实体informationentity一组说明数据相同特性的信息元素。例如:登记编号、名称、关键词、所属行业、提供形式等。注:可以包含一个或一个以上信息实体。[出自GB/T40094.2-2021,定义3.1.5]缩略语下列缩略语适用于本文件。API:应用程序编程接口(ApplicationProgrammingInterface)代码集数据产品提供形式数据产品提供形式代码集如下表1所示。表1数据产品提供形式代码集代码代码名称说明1数据集2数据报告3数据接口4数据应用9其他产品使用对象限制代码集使用对象限制代码集如下表2所示。表2使用对象限制代码集代码代码名称说明1政府用户2企业用户3个人用户9无限制源数据取得方式代码集源数据取得方式代码集如下表3所示。表3源数据取得方式代码集代码代码名称说明1原始取得2收集取得3交易取得9其他描述属性本文件中使用五个属性对数据产品的信息元素进行描述,见表4所示。表4信息元素描述属性及说明序号描述属性定义及说明1中文名称信息元素的中文名称。2描述对信息元素含义的解释。3数据类型对信息元素的有效值域的规定。数据类型说明见附录A。4数据格式对允许信息元素该值域内的值进行有效操作的规定。数据格式见附录A。5值域信息元素所允许值的集合登记信息数据产品的登记信息按适用范围分为:——通用信息:适用于所有数据产品的信息;——个性信息:仅适用于某些类别的数据产品。数据产品的登记信息按登记的必要性分为:——必选信息:保证能够充分了解该数据产品的必要信息;——可选信息:为能更好地了解该数据产品的信息。1图1登记信息框架图登记信息数据产品登记信息表如下表5所示。表5数据产品登记信息表序号中文名称描述数据类型数据格式值域备注1登记编号登记机构为数据产品分配的唯一字符型C17SDDR+8位登记日期+5YYYYMMDD必选信息2名称突出数据产品的内容、特点等字符型C..50自由文本必选信息,涉及版本更新的,应同时注明版本号3关键词用来描述数据产品信息的关键词语,可有多个字符型C..16自由文本必选信息4所属行业数据产品所属的国民经济行业的行业名称字符型C..ul采用4754-2017《国民经名称必选信息5提供形式数据产品的提供形式枚举型E应用、其他必选信息6简介方面字符型C..500自由文本必选信息7适用场景件、范围等字符型C..150自由文本必选信息8禁用场景件、范围等字符型C..500自由文本必选信息9使用对象数据产品限制为仅供哪些类型的对象使用,可多选枚举型E政府用户、企业用制必选信息10即时供应否已经具备对外提供该数据产品的条件布尔型B是、否必选信息11授权使用数据产品使用时是否需要被查询对象授权布尔型B是、否必选信息12共有数据产品申请登记的数据产品是否与其他体参与单位共同协商确定一名申意一方在不损害其他方利益的前方布尔型B是、否必选信息表5(续)数据产品登记信息表序号中文名称描述数据类型数据格式值域备注13数据来源源数据名称数据产品源数据的名称,如社保数据、微博数据、纳税数据。应按照源数据的内容及来源进行命名字符型C..ul自由文本必选信息取得方式获取该源数据的具体方式枚举型E他方式必选信息来源渠道该源数据的获取渠道,如本单位、某电信运营商、某互联网公司或某委办局等字符型C..ul自由文本必选信息证明材料用来证明源数据来源渠道的材料,如跟来源渠道的合作协议或来源渠道的授权证明等二进制型无要求文件必选信息更新周期源数据更新的时间间隔,如每天更新一次。一般是以天、周、月等为单位的时间间隔,也可以是实时更新,或不更新字符型C..ul自由文本必选信息14时间跨度申请登记的数据产品中数据采集始末的时间段,如数据集产品中数据采集时间为2018年1月至2019年1月字符型C..ul数据产品供方自定义必选信息15详细信息数据产品的详细描述信息。不同类型的数据报告可描述报告的摘要等;数据集可描述数据样例等;数据接口可描述接口功能、接口参数、请求示例等;数据应用可描述使用说明、应用案例等。必要时可上传相关附件字符型C..ul自由文本必选信息16延时供应时间当数据产品不能即时供应时,需要填写在什么时间能够提供,即延时供应时间日期时间型YYYY-MM-DD大于当前时间可选信息17名称申请登记的数据产品由多家单位共同合作生产时,其他共有方的名称字符型C..ul自由文本可选信息18脱敏方式对数据产品中所包含的敏感信息是如何脱敏的字符型C..ul自由文本可选信息19数据规模用来生产数据产品所使用的源数据的规模,可从字段数量、记录条数、所占存储空间等多个方面来描述字符型C..ul自由文本可选信息20失效时间数据产品不再提供的时间日期时间型YYYY-MM-DD大于当前时间可选信息21相关附件数据产品登记信息的证明材料、补充说明等其他申请材料。如数据报告的报告样例文件等;数据接口的相关指导文档等无要求无要求文件可选信息22数据产品示例数据产品的典型例子,可展示产品的部分具体内容字符型或二进制型无要求无要求可选信息表5(续)数据产品登记信息表序号中文名称描述数据类型数据格式值域备注23数据集文件格式Excelxmlcsvjson字符型C..ul自由文本B字段信息字段类型、字段说明等字符型C..ul自由文本24数据报告报告更新周期可以是不更新字符型C..ul自由文本B报告形成日期产品需方定制时间周期字符型C..ul自由文本25数据接口接口地址求地址,如/api/字符型C..ul自由文本B请求参数参数名称、类型、参数说明等字符型C..ul自由文本返回参数等字符型C..ul自由文本返回类型数据接口的返回值的表示形式,如JSON、XML字符型C..ul自由文本请求方式数据接口的请求方式,如GETPOST等字符型C..ul自由文本26用应用版本号数据应用类产品的版本号字符型C..ul自由文本B试用链接数据应用的试用网址或下载可试用的数据应用的链接字符型C..ul自由文本信息扩展可增加新的信息实体;可在每类信息实体中增加信息元素,并对信息元素中的属性进行描述;扩展信息元素中的属性取值:在扩展信息元素属性取值时,不应改变本文件中规定的信息元素的中文名称、描述、数据类型、数据格式、值域、备注等属性名称,可对值域属性采用比本文件更严格的限制,可增加值域属性的取值,建立新的代码表,补充或代替现有值域中的代码表。数据类型说明表如下表A.1

附录 A(资料性)表A.1数据类型说明表数据类型说明数据格式字符型一切能显示打印的字符,包括汉字、字母、数字、各种符号、空格等,不具有计算能力。以大写字母“C”代表字符型:CX:表示定长为“X”的字符型数据值;C..X:C..ul:表示长度不确定的字符型数据值。数值型能进行数学运算的数据。以大写字母“N”代表数值型:N..X:N..X,y:表示总长度为“X”位、其中小数点后为“y”位的数值型数据值。日期时间型用以表示日期及时间的数据。采用GB/T7408《数据元和交换格式信息交换日期和时间表示法》的规定。布尔型只有两个表明条件的值,如是/否、True/False。以大写字母“B”代表布尔型。二进制型图像、音频、视频等二进制数据。以大写字母“BY”代表二进制型:BY-X:表示媒体格式为“X”的二进制型数据值。枚举型对一些标识符进行描述的集合,集合中的元素称为枚举成员,是一些命名的整型常量。以大写字母“E”代表枚举型。B.1

附录 B(资料性)描述示例表B.1数据集描述示例登记编号SDDR2020052800120名称汽车行业产业链数据集关键词汽车、产业链所属行业互联网和相关服务行业提供形式数据集简介业链图谱及相关企业信息,106+产业链专题,7千+标准产品。适用场景适合产业招商、信贷风控、投资研究等场景。禁用场景不可用于数据三方转发,不得将数据传输至境外。使用对象无限制即时供应是延时供应时间/授权使用否共有数据产品是共有数据产品方名称数据产品示例A股份有限公司数据来源源数据取得方式收集、交易源数据名称汽车行业数据来源渠道通过互联网爬取、汽车企业获取证明材料与汽车企业的合作协议.pdf,公司互联网爬取制度.pdf数据源更新周期周期性更新,1季度文件格式sql文件采集时间实时采集字段信息产业链名称、产业链上下游、产品名称、产品分类编码、企业名称、注册资本。数据规模1.2亿条数据脱敏方式此数据产品不涉及敏感信息,无脱敏方式详细信息包括产品自身信息及其相关企业的信息。相关附件数据产品详情介绍.pdf数据产品示例数据产品截图.jpg失效时间2022.05.28B.2表B.2数据报告描述示例登记编号SDDR2021110900111名称网络零售分析报告关键词主流电商平台、一站式、主题数据所属行业互联网和相关服务行业提供形式数据报告简介通过采集主流电商平台的公开数据,提供网络零售、农村电商、生活服务电商、跨境电商、电商企业等一站式数据分析报告服务。适用场景适用于电商整体情况掌握、区域发展结构洞察、地区发展绩效评价、农村电商精准扶贫等禁用场景禁止用于任何违法违规场景使用对象供政府用户使用即时供应否延时供应时间2022.01.21授权使用否共有数据产品否称/数据来源源数据取得方式收集源数据名称主流电商平台数据来源渠道通过主流电商平台爬取证明材料公司互联网爬取制度.pdf,数据产品供方承诺书.pdf数据源更新周期周期性更新,1个月报告形成日期可定制时间周期报告更新周期按月更新数据规模1.1亿条数据,18个字段脱敏方式将每种商品具体的销售额数值概括为10001000200020003000元这种形式。详细信息监测平台:聚焦各细分领域主流电商平台,目前监测80+个,根据市场发展情况持续扩充。数据种类:7大类主题数据,支持按品类和地区提供,支持企业、品牌、商品明细数据。相关附件脱敏后的源数据.xls数据产品示例数据产品截图.jpg失效时间长期有效B.3表B.3数据接口描述示例登记编号SDDR2021102900110名称手机三要素验证关键词姓名、手机号、证件号、三要素所属行业互联网和相关服务提供形式数据接口简介验证用户姓名、手机号、证件号三要素是否一致。适用场景客户申办信用卡、保单等环节对其号码进行验证禁用场景无使用对象供企业用户使用即时供应是延时供应时间/授权使用是共有数据产品是共有数据产品方名称A有限公司、B大数据局、张三数据来源源数据取得方式原始取得源数据名称运营商数据来源渠道通过运营商获取证明材料数据产品供方承诺书.pdf数据源更新周期实时更新(T3)接口地址/api/cde请求方式GET请求参数说明手机号、证件号码、用户姓名返回类型JSON返回参数说明00:手机号、证件号、姓名均一致;01:手机号一致,证件号和姓名不一致;02:手机号和证件号一致,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论