语言资源管理 语义标注框架 第6部分:语义标注原则-编制说明_第1页
语言资源管理 语义标注框架 第6部分:语义标注原则-编制说明_第2页
语言资源管理 语义标注框架 第6部分:语义标注原则-编制说明_第3页
语言资源管理 语义标注框架 第6部分:语义标注原则-编制说明_第4页
语言资源管理 语义标注框架 第6部分:语义标注原则-编制说明_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、工作简况

(一)任务来源及背景

根据《国家标准化管理委员会关于下达2022年第四批推荐性国家标准计划及相关标准

外文版计划的通知》(国标委发〔2022〕51号)国家标准制修订计划要求,国家标准项目编

号:20221824-T-469,项目名称为《语言资源管理语义标注框架第6部分:语义标注原则》,

由中国标准化研究院等单位负责起草。

语义标注是计算机对自然语言深层次处理的一个重要技术之一,是对文本中的词语或句

子添加可供理解的语义标签的过程。本标准给出语义标注框架的基本原则和要求,为建立一

致且连续的语义标注方案提供支持。本标准的制定具有以下重要意义:

一、有助于提升数据资源的共享和服务能力,通过给出制定语义标注框架的基本要求,

为语义标注框架提供了方法上的一致性,并有助于确保已有对时间、事件、语义角色等已有

语义标注的兼容性,使得依据此标准进行语义标注的数据可以更好地实现数据的交换和共享,

进一步提高数据服务能力;

二、提高数据资源的管理能力,根据本标准实现的语义标注具有通用性、完整性、可变

粒度等,不局限于特定语言、领域中概念、术语的标注,可适应不同粒度级别的概念、术语

的标注,可以涵盖更广范围的语义现象,有助于计算机对数据的处理能力;

三、促进标准数字化发展。语义标注将有助于将推进标准文本内容的数字化、结构化,

对语义标注方法、流程的规范化有助于提高标准解析的准确性,有效推动标准文本与信息化

的融合,促进标准数字化发展。

(二)起草过程

标准编制过程如下:

(1)2022年5月完成标准草案稿,提交国标委申请立项;

(2)2022年12月正式下达标准立项计划;

(3)2023年3月标准起草组召开专家讨论会,对标准主要技术内容等进行讨论,完善

标准草案稿;

(4)2023年7月,标准起草组根据专家意见,完善草案稿形成标准征求意见稿,编写

征求意见稿编制说明。

二、国家标准编制原则、主要内容及其确定依据,修订国家标准时,还

包括修订前后技术内容的对比

(一)编制原则

标准的编制工作严格执行GB/T1.1—2000《标准化工作导则第1部分:标准的结构和

编写规则》及GB/T20000.2—2001《标准化工作指南第2部分:采用国际标准的规则》的

要求。

(二)主要内容及确定依据

本标准修改采用ISO24617-6:2016。

本标准主要技术内容包括:

(1)目的和动机;

(2)简述;

(3)标注原则和要求;

(4)SemAF的方法论基础;

(5)标注方案之间的重叠;

(6)跨越多个标注框架的语义现象;

三、试验验证的分析、综述报告,技术经济论证,预期的经济效益、社

会效益和生态效益

本标准规定了用ISO语义标注框架进行语义标注的方法,给出了语义标注的抽象和具

体语法的概念,反映ISO语言标注框架(ISOLinguisticAnnotationFramework)中标注和表

示之间的区别。标准的实施为建立一致且连续的语义标注方案提供支持,有助于进一步提升

数据资源的共享和服务能力,提高数据资源的管理能力,推进标准文本内容的数字化、结构

化,有效推动标准文本与信息化的融合,促进标准数字化发展。

四、以国际标准为基础的起草情况,以及是否合规引用或者采用国际国

外标准,并说明未采用国际标准的原因;

本标准修改采用国际标准ISO24617-6:2016Languageresourcemanagement—Semantic

annotationframework—Part6:Principleofsemanticannotation(SemAFprinciples)

五、与有关法律、行政法规及相关标准的关系;

六、重大分歧意见的处理经过和依据;

无重大分歧。

七、涉及专利的有关说明;

八、实施国家标准的要求,以及组织措施、技术措施、过渡期和实施日

期的建议等措施建议;

建议发布即实施。

九、其他应当说明的事项

一、工作简况

(一)任务来源及背景

根据《国家标准化管理委员会关于下达2022年第四批推荐性国家标准计划及相关标准

外文版计划的通知》(国标委发〔2022〕51号)国家标准制修订计划要求,国家标准项目编

号:20221824-T-469,项目名称为《语言资源管理语义标注框架第6部分:语义标注原则》,

由中国标准化研究院等单位负责起草。

语义标注是计算机对自然语言深层次处理的一个重要技术之一,是对文本中的词语或句

子添加可供理解的语义标签的过程。本标准给出语义标注框架的基本原则和要求,为建立一

致且连续的语义标注方案提供支持。本标准的制定具有以下重要意义:

一、有助于提升数据资源的共享和服务能力,通过给出制定语义标注框架的基本要求,

为语义标注框架提供了方法上的一致性,并有助于确保已有对时间、事件、语义角色等已有

语义标注的兼容性,使得依据此标准进行语义标注的数据可以更好地实现数据的交换和共享,

进一步提高数据服务能力;

二、提高数据资源的管理能力,根据本标准实现的语义标注具有通用性、完整性、可变

粒度等,不局限于特定语言、领域中概念、术语的标注,可适应不同粒度级别的概念、术语

的标注,可以涵盖更广范围的语义现象,有助于计算机对数据的处理能力;

三、促进标准数字化发展。语义标注将有助于将推进标准文本内容的数字化、结构化,

对语义标注方法、流程的规范化有助于提高标准解析的准确性,有效推动标准文本与信息化

的融合,促进标准数字化发展。

(二)起草过程

标准编制过程如下:

(1)2022年5月完成标准草案稿,提交国标委申请立项;

(2)2022年12月正式下达标准立项计划;

(3)2023年3月标准起草组召开专家讨论会,对标准主要技术内容等进行讨论,完善

标准草案稿;

(4)2023年7月,标准起草组根据专家意见,完善草案稿形成标准征求意见稿,编写

征求意见稿编制说明。

二、国家标准编制原则、主要内容及其确定依据,修订国家标准时,还

包括修订前后技术内容的对比

(一)编制原则

标准的编制工作严格执行GB/T1.1—2000《标准化工作导则第1部分:标准的结构和

编写规则》及GB/T20000.2—2001《标准化工作指南第2部分:采用国际标准的规则》的

要求。

(二)主要内容及确定依据

本标准修改采用ISO24617-6:2016。

本标准主要技术内容包括:

(1)目的和动机;

(2)简述;

(3)标注原则和要求;

(4)SemAF的方法论基础;

(5)标注方案之间的重叠;

(6)跨越多个标注框架的语义现象;

三、试验验证的分析、综述报告,技术经济论证,预期的经济效益、社

会效益和生态效益

本标准规定了用ISO语义标注框架进行语义标注的方法,给出了语义标注的抽象

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论