标准解读

《GB/T 13715-1992 信息处理用现代汉语分词规范》作为一项关于现代汉语分词的标准,为信息处理领域提供了一套统一的规则和方法。然而,您提供的对比对象不完整,无法直接进行详细的变更对比分析。通常,对比两个标准的变更点会涉及它们在分词原则、规则调整、术语定义更新、技术要求变化等方面的具体内容。如果想要了解《GB/T 13715-1992》与另一个特定版本或相关标准之间的具体变更,需要明确指出该对比标准的名称或版本号,例如将其与后续更新的《GB/T XXXX-YYYY 信息处理用现代汉语分词规范》或其他相关语言处理标准进行比较。

一旦提供了完整的对比对象信息,可以深入探讨在语言处理技术进步、语料库扩大、社会语言习惯演变等因素影响下,新旧标准之间可能存在的差异,包括但不限于:

  • 分词算法和技术的更新:新标准是否采用了更先进的自然语言处理技术,如机器学习、深度学习等方法来优化分词准确性。
  • 词汇收录与更新:随着时代发展,新词汇、网络用语等是否被纳入新标准的词汇表中。
  • 规则细化与优化:分词规则是否更加细致,对于多音字、成语、专有名词等特殊用例的处理是否有新的规定。
  • 兼容性和互操作性:新标准是否增强了与其他语言处理标准或系统的兼容性,便于信息交换和共享。
  • 术语和定义的修订:相关专业术语的定义是否更加准确清晰,以适应学术研究和实际应用的需求。

但请注意,上述仅为一般性的对比框架,具体变更内容需依据实际对比的两个标准版本来确定。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 1992-10-04 颁布
  • 1993-06-01 实施
©正版授权
GB/T 13715-1992信息处理用现代汉语分词规范_第1页
GB/T 13715-1992信息处理用现代汉语分词规范_第2页
GB/T 13715-1992信息处理用现代汉语分词规范_第3页
免费预览已结束,剩余9页可下载查看

下载本文档

文档简介

UDC681.3:809.51170中华人民共和国国家标准GB/T13715-92信息处理用现代汉语分词规范ContemporaryChineseianguagewordsegmentationspecificationforinformationprocessing1992-10-04发布1993-06-01实施国家技术监督局发布

(京)新登字023号中华人民共和国国家标准信息处理用现代汉语分词规范GB/T13715-92中国标准出版社出版发行北京西城区复兴门外三里河北街16号邮邮政编码:1X45电话:63787337、637874471993年3月第一版20%5年12月电子版制作书号:155066·1-9287版权专有侵权必究举报电话:(010)68533533

中华人民共和国国家标准信息处理用现代汉语分词规范GB/T13715-92ContemporaryChineselanguagewordsegmentationspecificationforinrormationprocessing主题内容与适用范围1.1主题内容本规范规定了现代汉语的分词原则,以满足信息处理的需要。。它对汉语信息处理的规范化,对各种汉语信息处理系统之间的兼容性有重要的作用。1.2适用范围本规范适用于汉语信息处理各领域,其他行业和有关学科可以参考使用。汉语信息处理各领域可以根据其专门需求,进一步补充和细化本规范的规定。引用标准GB12200汉语信息处理词汇3术语以下术语引自GB12200。3.1汉语信息处理用计算机对汉语的音、形、义等信息进行的处理。3.2词最小的能独立运用的语言单位。3.3词组由两个或两个以上的词,按一定的语法规则组成,表达一定意义的语言单位。3.44分词单位汉语信息处理使用的、具有确定的语义或语法功能的基本单位。它包括本规范的规则限定的词和词组3.55汉语分词从信息处理需要出发,按照特定的规范,对汉语按分词单位进行划分的过程,4概述本规范以信息处理应用为目的,根据现代汉语的特点及规律.规定现代汉语的分词原则。本规范用下划线”。“作为分词单位标记。4.1空格或标点符号是计算机中分词单位的分隔标记。作为分隔标记的标点符号有:句号、返号、顿号分号、冒号、间号、叹号、引号、括号、破折号、省略号、书名号、间隔号、连接号及符号"/"等。“.2二字或三字词,以及结合紧密、使用

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论