DB13-T2351-1-2016标准文献结构化数据规范第1部分:全文元数据_第1页
DB13-T2351-1-2016标准文献结构化数据规范第1部分:全文元数据_第2页
DB13-T2351-1-2016标准文献结构化数据规范第1部分:全文元数据_第3页
DB13-T2351-1-2016标准文献结构化数据规范第1部分:全文元数据_第4页
DB13-T2351-1-2016标准文献结构化数据规范第1部分:全文元数据_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ICS01.140.20A 14河 北省 地DB13方 标 准DB3/T 2351.12016数据规范specificationsofstandarddocumentsPart1:Full-text Metadata河 北省 质量技术监 督局 发 布IDBT.12016 HYPERLINK l _bookmark2 HYPERLINK l _bookmark3 HYPERLINK l _bookmark4 HYPERLINK l _bookmark1 HYPERLINK l _bookmark1 HYPERLINK l _bookmark5 HYPERLINK l _bookmark6 HYP

2、ERLINK l _bookmark7 4 HYPERLINK l _bookmark8 HYPERLINK l _bookmark9 HYPERLINK l _bookmark10 HYPERLINK l _bookmark11 DBT.12016前 言GBT1.1-2009给出的规则起草。DBT351标准文献结构化数据规范包括了3部分:分:全文元数据;分:指标元数据;分:元数据著录规则。分,本部分与第3部分配套使用。北省标准化研究院提出并归口。位:河北省标准化研究院。 DBT51.12016引 言 化文档方能解决上述问题。 之,标准结构化加工抽取出的数据是哪些数据?2) 对抽取出来的数据进

3、行加工应符合什么样的数据规 方能满足与原始标准文本内容的一致性的需求。第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现;二个问题,需要建立数据的著录规则,实现数据的规范性。 析研究、归纳总结后,按UML思想确定了标准结构化数据模型,并在工程上对4000余项强制性国家标准 要求,形成了标准文献结构化数据规范。GBT针对标准文献题录的元数据标 息资源的开发利用。1DBT51.12016标准文献结构化数据规范 第 1 部分:全文元数据术语、图像、表格和公式) 的术语和定义、 述以及扩展原则和方法。于标准文献结构化数据的处理。范性引用文件 引用文件,其最新版本 (包括所有的修改单) 适用

4、于本文件。GB/T 18391.3-2009 信息技术 元数据注册系统(MDR) 第3部分:注册系统元模型与基本属性 (ISO/IEC 11179-3:2003,IDT)GBT0-2005 地理信息 元数据 (ISO 19115-2003,MOD)GBT6816-2011 信息资源核心元数据定义分。informationresource、经济和社会等各领域产生和使用、具有各种载体形式的信息内容。ta据。ataelement。据元素在元数据实体中是唯一的。ataentity源相关特性的元数据元素。包含一个或一个以上元数据实体。 core metadata2DBT51.12016基本属性的元数据元

5、素和元数据实体。4 全文元数据的属性4.1 中文名称元数据实体的中文名称,用本部分第6章中各条的标题来表达。4.2 英文名称英文名称,一般用小写英文全称,英文单词之间用空格分隔。,英文单词之间用空格分隔。4.3 缩写名GBT6816-2011中4.6的要求。4.4 定义GBT6816-2011中4.2的要求。4.5 数据类型GBT6816-2011中4.4的要求。4.6 值域GBT6816-2011中4.5的要求。4.7 约束/条件GBT6816-2011中4.7的要求,约束/条件代码见附录A 表A.1。4.8 最大出现次数GBT6816-2011中4.8的要求。 全文元数据模型化全文元数据模

6、型见图1。3DBT.12016元数据描述 全文元数据 标识符lltextMetadatalTxtMdata准中全文数据的元数据。M14 .3 全文 标准号 标准名称 篇章条编号 篇章条名称DBT51.12016唯一标识符。UIDM1lTxtM1reference 1 个空格+顺序号+1 个连字符-+4 位发布年份M1nameinChinese称M1umber标准内容中篇章条按一定规则的顺序编号(篇章条编号定义说明见附录 B.1.1)。 见附录 B.1.2O1me5 篇章条内容 篇章条类型 篇章条所在页码 篇章条父章节 篇章条顺序号DBT.12016的标题名称。M1rpterContentCon

7、t的段落内容。M1pe。ONpagenumberM1arentchapternumberChpNoC16 3 文字 14 表格 15 表号 16 表名 表格图像路径中文名称:英文名称:DBT.12016ordernumberM1wordwrdO1leONr标准内容中表格按特定规则的顺序编号。(表号定义说明见附录 B.2.1)。 见附录 B.2.2O1e名称。M1表格图像路径table image path7缩写名:定义:数据类型:值域:约束/条件: 最大出现次数:注 表格所在页码 同一表格顺序号 6.22 图像DBT.12016tabImgPath表格图像文件存储的路径。字符串本M1的注释。O

8、1页码number一表格首次出现所在页码。M1dernumber文件的顺序号。M1LcodeC18 6.23 图号 6.24 图名 图像路径 注 图像所在页码DBT.12016ImageONimage number标准内容中图像按特定规则的顺序编号。(图号定义说明见附录 B.3.1)。 见附录 B.3.2O1image name名称。M1image pathM1image note的注释。O19 同一图像顺序号 9 公式 公式名称 公式所在页码 公式图像路径DBT.12016image page number同一图像首次出现的页码。M1same image order numberM1rmul

9、alaOName名称。M1pagenumber一公式首次出现所在页码。M1 3 公式注 术语 术语中文名称 术语英文名称 术语内容DBT.12016formula image paththM1oteO1需要规范的用词。ONinChinese。M1inEnglish。O1 术语缩略语 术语同义词 术语禁用词 术语注 术语所在页码DBT.12016ition。M1iation ONm相同或相近,但是表达形式不同的词汇。ON术语。ON。O1 版本信息 更新时间 记录状态 6 版本 加工单位DBT51.12016umber该术语首次出现所在页码。M1Version InformationInfo产生、

10、更新的一组信息。M1pdatetimeTime改更新的时间。M1ordstatusSta AM1sionnumbero新的版本编号。M1DBT51.12016ocessunitUnit文数据加工单位的信息。M1据字典描述构化全文元数据字典描述见附录C,表C.1中带“*”的元数据为核心元数据。全文元数据扩展原则和方法 GBT26816-2011第6章的要求。DBT51.12016A(规范性附录)标准文献全文结构化元数据代码集A.1 约束/条件代码A。A代码M素或元数据实体必须选择。O 体,可指导部门元数据标准制定人员充分说明其信息。 有必选元素,但只当可选实体被选用时才成为必选。C条件必选用于以

11、下三种可能性之一:a) 当在多个选项中进行选择时,至少一个选项必选,且必须使用;b) 当另一个元数据元素已经使用时,选用一个元数据实体或元数据元素;c) 当另一个元数据元素已经选择了一个特定值时,选用一个元数据元素。A.2 篇章条类型代码A.2。A型代码Q容为强制性。T容为推荐性。A.3 记录状态代码见表A.3。A代码AA-AmendDDeleteNN-NewDBT51.12016(规范性附录)、表号和图号说明B章条编号说明B章条编号定义说明标准内容一般包括三个层次:篇、 B章条编号值域以下几种形式:a) 篇层级的篇章条编号值域为:“第”+篇编号+“篇”。 示例:“第一篇”、“第二篇”b) 章

12、层级的篇章条编号值域为:的篇章条编号值域:章编号。 示例:“1”、“5”2) 附录中的篇章条编号值域:“附录”+章编号。 A录 B”c) 条层级的篇章条编号值域为: 示例:“A.1”、“B.1.1”B号说明B号定义说明 分隔符 ”。B号值域域按有无续表有以下两种形式:d) 无续表的表号值域:1) 自引言开始连续到附录之前的标准正文中的表号值域:“表”+表编号。 2” A表 B.1”e) 有续表的表号值域:1) 自引言开始连续到附录之前的标准正文中的表号值域:“表”+表编号+“ (续) ”。、“表 2 (续) ”DBT51.12016 A”、“表 B.1 (续) ”B号说明B号定义说明 分隔符

13、”。B号值域f) 无续图的图号值域:1) 自引言开始连续到附录之前的标准正文中的图号值域:“图”+图编号。 2” A图 B.1”g) 有续图的图号值域:开始连续到附录之前的标准正文中的图号值域:“图”+图编号+“ (续) ”。 、“表 2 (续) ” A 、“图 B.1 (续) ”DBT51.12016(资料性附录)准文献结构化全文元数据-字典描述C 标准文献结构化全文元数据-字典描述见表C.1。C献结构化全文元数据-字典描述0全文元数 据FulltextadataTxtMdata描述结构化标准中全文 型M11identifier名称空间中对象的唯一 串UIDM1*2lTxt 型M1ntere

14、ncedocRef由有关标准化机构给定 的用于唯一识别某一标 准的注册号或登记号, 标准号由标准代号、顺 序号、发布年份及有关 串 个空格+顺序 号+1 个连字 符-+4 位发 M1*umentname ChineseN 串M1*篇章条编 号ernumber标准内容中篇章条按一 定规则的顺序编号 (篇 章条编号定义说明见附 串O1*篇章条名 称ternamem标准中篇章条的标题名 串M1* 容pterentont标准中篇章条的段落内 型M1*d以文字形式描述的标准 O1*以表格形式描述的标准 型ONDBT51.12016table numberbNo标准内容中表格按特定 定 义 说 明 见 附

15、 录 串B2O1*tablenamebNm。 串M1*表格图像 ablepathImgPath表格图像文件存储的路 串M1*tablenoteabNote 串O1*表格所在 table pagenumberabPNo标准内容中同一表格首 型M1同一表格 same table rnumberabOrdNo跨页表格图像文件的顺 型M1表 格 HTML 格 式table HTML HTML 串C1以图形式描述的标准内 型ONumber标准内容中图像按特定 定 义 说 明 见 附 录 串B2O1*ename。 串M1*athath 串M1*notee 串O1*图像所在 numberpageNo标准内容

16、中同一图像首 型M1同一图像 same image rnumbero同一图号的图像在不同 型M1mula以公式形式描述的标准 型ONaname 串M1*公式所在 numberpage标准内容中同一公式首 型M1DBT51.12016公式图像 formula image pathPath公式图像文件存储的路 串M1*ulanotee 串O1*在本标准中需要规范的 型ON术语中文 term name inesemNmCN 串M1*术语英文 term name in lishmNmEN 串O1*termdefinitiontermDef 串M1*术语缩略 语ermviationmAbbr为了使用方便

17、,使术语 称谓中的成分进行有规 律的节缩或者省略形成 串ON术语同义 词termsynonymmSyn表达意义相同或相近, 但是表达形式不同的词 串ON术语禁用 词mstopStp 串ONrmnotermNote 串O1术语所在 term pagenumbermPNo标准内容中该术语首次 型M1篇章条类 型rtype 串字典(篇章条 类型代码见 附 录 表 A。ON篇章条所 charpter pagenumberNo同一标准篇章条首次出 型M1篇章条父 parent chapter numberparChpNo当前篇章条的上一级章 串条层级最多4 C1篇章条顺 charpter order numberdNo 型M13rmationVInfo描述全文数据产生、更 型M1DBT51.12016update tim

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论