DB44-T 1888-2016 标准文献全文XML 解析规范_第1页
DB44-T 1888-2016 标准文献全文XML 解析规范_第2页
DB44-T 1888-2016 标准文献全文XML 解析规范_第3页
DB44-T 1888-2016 标准文献全文XML 解析规范_第4页
DB44-T 1888-2016 标准文献全文XML 解析规范_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

14备案号:53121—2017

DB44 DB44/T

标准文献全文

XML

解析规范

广东省质量技术监督局

发布DB44/T

目 次前言……………………………引言……………………………

文件结构………………………

文件结构………………………

文件结构………………………14

文件…………………28

文件…………………31

文件…………………33DB44/T

前 言

DB44/T

引言图1

标准信息挖掘

XMLDB44/T

2016标准文献全文

XML

解析规范

范围本标准规定了标准信息挖掘过程中的标准文献全文结构化解析模型,以及半结构化和全结构化标本标准适用于半结构化和全结构化标准文献全文格式和存储格式的定义,支持不同的数字化标准

规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本

GB

13000-2010

信息技术

GB/T

18793-2002

术语和定义

标准文献经过数字化、结构化的信息加工,实现多途径多维度的信息检索,以及全方位和细粒度

image

document

text

extensible

markup

DB44/T

标准通用置标语言(SGML)的子集,是一种用于标记电子文件使其具有结构性的标记语言,它为

在诸如HTML和SGML之类的标记语言中,一组标记、标记之间的内容以及标记所含的所有属性的组

semi-structured

full-text

standard

标准全文结构化解析模型标准按照不同分类方法,可分为不同种类。如分类方法i是按照法律的约束性划分,标准分为强制性标准和推荐性标准;分类方法j是按照涉及的内容划分,标准分为产品标准、过程标准、服务标准、接口标准和信息技图1

标准全文结构化解析模型

标准的可选元素,以标准类,(

第一个标准类型的扩展元素

第二个标准类型的扩展元素

DB44/T

2016

5.1

结构划分方法5.1.1

标准全文分类方法

Schema

1。

DB44/T

表1

5.1.2

创建标准全文分类方法

XML

a)

b) 元素的

Id、名称、是否必须著录、是否多值等属性应进行设定,这些设置决定结构化标准全

XML

5.2

元素说明

5.2.2

StructTextDocument/NormalStandard5.2.3

StructTextDocument/SpecialStandard

DB44/T

20165.2.4

xs:string

DB44/T

5.2.5

5.2.6

5.2.7

5.2.8

StructTextDocument/NormalStandard/Section/Define

DB44/T

20165.2.9

5.2.10

6.1

结构划分方法

Section

DB44/T

6.2

元素说明

元素

DB44/T

2016

DB44/T

DB44/T

2016

DB44/T

DB44/T

2016

DB44/T

7.1

结构划分方法7.1.1

标准文献按照内容和表现形式分为文档元素和页面元素。7.1.2 7.1.3

页面元素分为:标题、条文、图、表、注、脚注。7.1.4

文档元素的属性、约束与页面元素的关系见表

3。

DB44/T

2016表3

文档元素的属性、约束与页面元素的关系表

DB44/T

7.2

元素说明

元素

文档

DB44/T

2016中文名称

英文名称

标准号

被替代标准号

采用标准号

ICS

CCS

备案号

布日期

DB44/T

元素

封面

DB44/T

2016

元素

目次

元素

前言

DB44/T

元素

引言

DB44/T

2016

元素

范围7.2.7

元素

DB44/T

7.2.8

元素

DB44/T

2016

元素

附录7.2.10 元素

DB44/T

元素

索引元素

修改单

DB44/T

2016

元素

元素

DB44/T

元素

DB44/T

2016 元素

条文DB44/T

<xs:schema

xmlns:xs="/2001/XMLSchema"

elementFormDefault="qualified"><xs:element

type="xs:string"/><xs:element

type="xs:string"/>

name="NormalStandard"><xs:complexType><xs:sequence><xs:element

</xs:sequence></xs:complexType></xs:element>

type="xs:string"/>

<xs:complexType><xs:sequence><xs:element

maxOccurs="unbounded"/></xs:sequence></xs:complexType></xs:element><xs:element

name="Section"><xs:complexType><xs:sequence><xs:element

minOccurs="0"/>

ref="Define"

minOccurs="0"/>

</xs:sequence>

type="xs:string"

<xs:attribute

<xs:simpleType><xs:restriction

base="xs:string"><xs:enumeration

value="True"/><xs:enumeration

</xs:restriction>DB44/T

2016</xs:attribute><xs:attribute

<xs:simpleType><xs:restriction

base="xs:string"><xs:enumeration

<xs:enumeration

<xs:enumeration

<xs:enumeration

</xs:restriction></xs:attribute><xs:attribute

default="False"><xs:simpleType><xs:restriction

base="xs:string"><xs:enumeration

value="True"/><xs:enumeration

</xs:restriction></xs:attribute><xs:attribute

<xs:simpleType><xs:restriction

base="xs:string"><xs:enumeration

<xs:enumeration

<xs:enumeration

</xs:restriction></xs:attribute></xs:complexType></xs:element><xs:element

<xs:complexType><xs:sequence><xs:element

</xs:sequence>

type="xs:string"

</xs:complexType></xs:element>

<xs:complexType><xs:sequence>

ref="NormalStandard"/><xs:element

minOccurs="0"

maxOccurs="unbounded"/>DB44/T

</xs:sequence><xs:attribute

<xs:attribute

type="xs:string"/></xs:complexType></xs:element>

type="xs:string"/>DB44/T

2016

<xs:schema

xmlns:xs="/2001/XMLSchema"

elementFormDefault="qualified"><xs:element

type="xs:string"/>

type="xs:string"/><xs:element

type="xs:string"/><xs:element

<xs:complexType><xs:sequence><xs:element

ref="Title"/><xs:element

</xs:sequence>

type="xs:string"

</xs:complexType></xs:element><xs:element

<xs:complexType><xs:sequence><xs:element

ref="Title"/><xs:element

</xs:sequence>

type="xs:string"/></xs:complexType></xs:element><xs:element

name="Section"><xs:complexType

<xs:choice><xs:element

ref="Text"/><xs:element

<xs:element

maxOccurs="unbounded"/><xs:element

maxOccurs="unbounded"/></xs:choice>

type="xs:string"

type="xs:string"

use="required">DB44/T

<xs:simpleType><xs:restriction

base="xs:string"><xs:enumeration

<xs:enumeration

<xs:enumeration

<xs:enumeration

</xs:restriction></xs:attribute></xs:complexType></xs:element>

<xs:complexType><xs:sequence><xs:element

</xs:sequence>

type="xs:string"

type="xs:string"

</xs:complexType></xs:element><xs:element

<xs:complexType><xs:sequence><xs:element

ref="Title"/>

ref="Content"/></xs:sequence>

type="xs:string"

</xs:complexType></xs:element><xs:element

<xs:complexType

type="xs:string"

</xs:complexType></xs:element></xs:schema>DB44/T

2016

<?xml

version="1.0"

encoding="utf-8"?><!--

edited

with

XMLSpy

v2009

()

by

Albert

(EMBRACE)

--><xs:schema

xmlns:xs="/2001/XMLSchema"

elementFormDefault="qualified"attributeFormDefault="unqualified"><xs:element

name="<xs:annotation>

describing

your

element</xs:documentation></xs:annotation><xs:complexType><xs:sequence><xs:element

name="<xs:complexType><xs:sequence><xs:element

<xs:element

<xs:element

<xs:element

<xs:element

minOccurs="0"

/><xs:element

/><xs:element

/><xs:element

/><xs:element

<xs:element

<xs:element

<xs:attribute

default="

</xs:complexType><xs:element

name="

<xs:complexType><xs:sequence><xs:element

<xs:attribute

/></xs:complexType>DB44/T

<xs:element

name="<xs:complexType><xs:sequence><xs:element

/><xs:attribute

/></xs:complexType><xs:element

name="

<xs:complexType><xs:sequence><xs:element

/><xs:element

<xs:element

<xs:element

<xs:attribute

default="

</xs:complexType><xs:element

name="<xs:complexType><xs:sequence><xs:element

/><xs:attribute

/></xs:complexType><xs:element

name="

<xs:complexType><xs:sequence><xs:element

<xs:attribute

default="

</xs:complexType><xs:element

name="

<xs:complexType><xs:sequence><xs:element

/><xs:element

<xs:element

<xs:element

DB44/T

2016<xs:attribute

default="

</xs:complexType><xs:element

name="

minOccurs="0"

<xs:complexType><xs:sequence><xs:element

minOccurs="0"

/><xs:element

<xs:element

<xs:element

<xs:attribute

/></xs:complexType><xs:element

name="

<xs:complexType><xs:sequence><xs:element

<xs:attribute

default="

</xs:complexType><xs:element

name="

minOccurs="0"

<xs:complexType><xs:sequence><xs:element

/><xs:attribute

/></xs:complexType><xs:element

name="

minOccurs="0"

maxOccurs="unbounded"><xs:complexType><xs:sequence><xs:element

/><xs:element

<xs:element

<xs:element

<xs:attribute

/></xs:complexType></xs:sequence><xs:attribute

name="id"

type="xs:ID"

/>DB44/T

<xs:attribute

name="language"

type="xs:language"

use="required"

/>

name="updatetime"

type="xs:dateTime"

/>

name="updateuser"

use="optional"

/></xs:complexType><xs:element

name=""><xs:complexType><xs:sequence><xs:element

name="title"

/><xs:element

name="content"

type="xs:string"

/><xs:element

/></xs:sequence><xs:attribute

/><xs:attribute

name="forewordID"

/><xs:attribute

name="page"

type="xs:string"

use="optional"

/><xs:attribute

name="path"

type="xs:string"

use="optional"

/></xs:complexType><xs:element

name=""><xs:complexType><xs:sequence><xs:element

name="

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论