标准解读

《GB/T 36472-2018 信息处理用藏语短语分类与标记规范》是一项国家标准,旨在为藏语文本的信息处理提供一套统一的短语分类和标记方法。该标准适用于藏文自然语言处理、机器翻译、信息检索等多个领域,通过定义一系列术语和规则来增强不同系统之间的互操作性。

根据标准内容,它首先界定了“短语”的概念,并将其按照功能划分为名词性短语、动词性短语等不同类型。每种类型的短语都有其特定的结构特征及组成部分说明。此外,《GB/T 36472-2018》还详细规定了如何对这些短语进行标注,包括但不限于使用何种符号作为分隔符、如何表示层次关系等技术细节。对于特殊情况下可能出现的问题,如歧义性表达或非典型结构,则提供了相应的解决方案或建议处理方式。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 2018-06-07 颁布
  • 2019-01-01 实施
©正版授权
GB/T 36472-2018信息处理用藏语短语分类与标记规范_第1页
GB/T 36472-2018信息处理用藏语短语分类与标记规范_第2页
GB/T 36472-2018信息处理用藏语短语分类与标记规范_第3页
GB/T 36472-2018信息处理用藏语短语分类与标记规范_第4页
GB/T 36472-2018信息处理用藏语短语分类与标记规范_第5页
免费预览已结束,剩余11页可下载查看

下载本文档

免费下载试读页

文档简介

ICS3524001

L70..

中华人民共和国国家标准

GB/T36472—2018

信息处理用藏语短语分类与标记规范

SpecificationonTibetanphraseclassificationandtagging

forinformationprocessing

2018-06-07发布2019-01-01实施

国家市场监督管理总局发布

中国国家标准化管理委员会

GB/T36472—2018

目次

前言

…………………………Ⅰ

引言

…………………………Ⅱ

范围

1………………………1

术语和定义

2………………1

总则

3………………………1

短语类别的划分及标记代码

4……………1

附录规范性附录信息处理用藏语短语分类及标记代码表

A()………7

参考文献

……………………11

GB/T36472—2018

前言

本标准按照给出的规则起草

GB/T1.1—2009。

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别这些专利的责任

。。

本标准由全国信息技术标准化技术委员会提出并归口

(SAC/TC28)。

本标准起草单位中国电子技术标准化研究院青海师范大学西藏自治区藏语文工作委员会办公

:、、

室中国藏学研究中心青海民族大学西藏大学中国科学院软件研究所西北民族大学

、、、、、。

本标准主要起草人才让加吉太加熊涛华却才让扎洛才藏太才智杰头旦才让周毛先

:、、、、、、、、。

GB/T36472—2018

引言

本标准依据藏语传统语法分类体系根据藏语信息处理的特点和要求按照语法功能和便于计算机

,,

自动分析和处理的原则划分藏语短语词类并规定了藏语短语标记代码

,。

GB/T36472—2018

信息处理用藏语短语分类与标记规范

1范围

本标准规定了信息处理中藏语短语的类别划分和标记代码

本标准适用于藏文信息处理各领域其他行业和有关学科可参照使用

,。

2术语和定义

下列术语和定义适用于本文件

21

.

藏文信息处理TibetanInformationProcessingTIP

;

用计算机对藏文的音形义等信息进行处理

、、。

22

.

短语类别phrasecategories

短语的语法分类主要是根据语法功能划分出来的类

,。

23

.

标记tag

对文本中短语类别进行标注的代码

3总则

31短语的基本范围

.

本标准的类别特指信息处理用藏语短语类别如名词性短语动词性短语形容词性短

,(NP)、(VP)、

语等

(AP)。

32短语类别划分的原则

.

本标准针对藏语信息处理的特点和要求依据藏语传统语法分类体系并参考汉语短语分类研究成

,,

果见参考文献确定了藏文短语类别划分原则短语大类之间不应出现交叉包括标注形式层和语义

(),。,

层小类间允许出现标注形式层交叉但不应出现语义层的交叉

;,。

33标记代码的制定原则

.

依据国际通常做法标记代码主要采用英文术语的字母例如名词短语采用数词采

,。,“”,NP;“”,

用作为标记代码藏语独有的或使用英文术语字母标记不便的依据国内通常做法标记代码采

MP。,,,

用汉语拼音字母如判断性短语采用汉语拼音的首字母作为标记代码

。,“”,PP。

4短语类别的划分及标记代码

41短语类别的划分

.

本标准将藏语短语划分为名词性

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论