标准解读

《GB/T 36338-2018 信息处理用藏文文献文本信息标记规范》是一项国家标准,旨在为藏文文献的数字化处理提供一套统一的信息标记规则。该标准主要针对藏文电子文档中的文字、段落、标题等元素如何进行结构化和语义化的标注给出指导,以便于这些文献能够在不同的软件系统间被正确解析与利用。

在具体内容上,《GB/T 36338-2018》定义了一系列标签(或称为元素),每个标签都有其特定用途,用来描述文本的不同部分或属性。例如,可能会有专门用于标识文章标题、作者姓名、出版日期等信息的标签。通过使用这些预定义好的标签来包裹相应的内容,可以使得计算机程序更容易识别并处理藏语文献中的关键信息。

此外,该标准还可能涵盖了关于如何表示特殊字符、音标符号以及非标准写法等方面的指南,这对于确保藏文内容在网络环境下的准确传输非常重要。同时,它也可能包含了对XML或其他标记语言语法的具体要求,因为这类语言常被用来实现复杂的文档结构标记。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 2018-06-07 颁布
  • 2019-01-01 实施
©正版授权
GB/T 36338-2018信息处理用藏文文献文本信息标记规范_第1页
GB/T 36338-2018信息处理用藏文文献文本信息标记规范_第2页
GB/T 36338-2018信息处理用藏文文献文本信息标记规范_第3页
GB/T 36338-2018信息处理用藏文文献文本信息标记规范_第4页
免费预览已结束,剩余20页可下载查看

下载本文档

GB/T 36338-2018信息处理用藏文文献文本信息标记规范-免费下载试读页

文档简介

ICS3524001

L70..

中华人民共和国国家标准

GB/T36338—2018

信息处理用藏文文献文本信息标记规范

SpecificationonTibetanliteraturetextmarkupforinformationprocessing

2018-06-07发布2019-01-01实施

国家市场监督管理总局发布

中国国家标准化管理委员会

GB/T36338—2018

目次

前言

…………………………Ⅰ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

藏文文献的标记框架

4……………………1

藏文文献文本基本属性的标记

5…………2

藏文文献文本结构信息的标记

6…………4

藏文文献文本标记规范

7…………………8

附录资料性附录更敦群培文集的标记范例

A()《》TEI……………18

GB/T36338—2018

前言

本标准按照给出的规则起草

GB/T1.1—2009。

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别这些专利的责任

。。

本标准由全国信息技术标准化技术委员会提出并归口

(SAC/TC28)。

本标准起草单位中国电子技术标准化研究院西北民族大学西藏自治区藏语文工作委员会办公

:、、

室西藏大学青海师范大学西藏自治区工业与信息化厅中国标准化研究院中国科学院软件研究所

、,、、、、

青海民族大学中国藏学研究中心民族出版社北京北大方正电子有限公司潍坊北大青鸟华光照排有

、、、、

限公司

本标准主要起草人多拉扎西加熊涛尼玛才让杨本加多杰卓玛索南才让冷本扎西刘汇丹

:、、、、、、、、、

仁青卓么项见措格桑多吉黄鹤鸣才让加

、、、、。

GB/T36338—2018

信息处理用藏文文献文本信息标记规范

1范围

本标准规定了藏文数字文献的文本信息标记

本标准适用于藏文语料库建设及藏文各种文献的数字化标记

2规范性引用文件

下列文件对于本文件的应用是必不可少的凡是注日期的引用文件仅注日期的版本适用于本文

。,

件凡是不注日期的引用文件其最新版本包括所有的修改单适用于本文件

。,()。

信息处理文本和办公系统标准通用置标语言

GB/T14814—1993(SGML)

3术语和定义

下列术语和定义适用于本文件

31

.

藏文文献Tibetanliterature

由藏文包括古藏文及梵文转写构成的各种文献

()。

32

.

文本置标语言textencodinginitiativeTEI

;

一种定义电子文档结构和描述其内容的国际标准语言

注1目前在信息处理界电子图书馆相关计划中普遍使用的置标语言适用于对电子形式的全文的编码和描述

:,。

注2元数据标准同时也规定了可供数据交换的标准编码格式采用文件格式

:TEI,SGML。

33

.

班智达Bantita

梵语意为学识渊博的学者专指参与经典翻译的印度等地学者

,,。

注班智达和译师分为藏文文献厘定前与厘定后两种

:。

4藏文文献的标记框架

适用于对电子形式的全文的编码和描述元数据标准同时也规定了可供数据交换的标准

TEI。TEI

编码格式使用规定的作为其编码语言格式具有很大限度的灵活

,GB/T14814—1993SGML。TEI

性综合性可扩展性能支持对各种类型或特征的文档进行编码元数据标记可以对语料库的文

、、,。TEI

本属性信息与文本结构信息进行规范的标记

文档也是一个文档一般有四个部分题名文本前的信息

TEI,SGML,:teiHeader(),front(),body

正文文本后的信息对电子文本对象的描述对正文前的信息描述包含

(),back()。TeiHeader:

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论