标准解读

GB/T 17961-2000 是一项由中国发布的国家标准,全称为《印刷体汉字识别系统要求与测试方法》。这项标准主要针对印刷体汉字的自动识别技术,规定了此类系统应满足的基本要求及性能评估的测试方法,旨在促进汉字识别技术的标准化和规范化,提升系统的可靠性和准确性。以下是该标准的主要内容概览:

1. 范围

该标准明确了适用范围,即规定了印刷体汉字识别系统在设计、开发、评估时应遵循的要求和测试方法。这些系统主要用于从各种印刷材料中自动识别并提取汉字信息。

2. 规范性引用文件

列出了实施该标准时所直接引用或参考的其他标准文献,确保了各项要求和技术细节的一致性和兼容性。

3. 术语和定义

对涉及的关键术语进行了明确界定,如“识别率”、“拒识率”、“误识率”等,为后续要求和测试提供了统一的语言基础。

4. 系统要求

  • 识别能力:要求系统能有效识别规定范围内的汉字字符集,包括常用字、罕用字以及特定领域的专业字符。
  • 准确率:设定了识别准确率的最低标准,包括总体识别准确率和特定条件下的识别准确率(如不同字体、字号、印刷质量)。
  • 处理速度:规定了系统处理文本的速度要求,确保在实际应用中的效率。
  • 鲁棒性:要求系统对文档条件变化(如倾斜、噪声、背景复杂度)有较好的适应性和稳定性。
  • 用户界面:对于面向用户的系统,要求具备友好、直观的操作界面,便于用户操作和结果查看。

5. 测试方法

详细描述了如何对上述要求进行测试,包括:

  • 测试样本集:建立包含各种条件下的样本文本,以全面评估系统的识别能力。
  • 测试环境:规定了测试时的软硬件环境和条件,确保测试结果的可比性和重复性。
  • 评价指标:具体说明了如何计算识别率、拒识率、误识率等关键性能指标。
  • 测试流程:阐述了从样本选取到数据处理、结果分析的整个测试过程。

6. 性能报告

指导如何编制性能测试报告,包括测试条件、测试结果、性能分析等内容,以便于系统性能的客观评价和比较。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 被代替
  • 已被新标准代替,建议下载现行标准GB/T 17961-2010
  • 2000-01-03 颁布
  • 2000-08-01 实施
©正版授权
GB/T 17961-2000印刷体汉字识别系统要求与测试方法_第1页
GB/T 17961-2000印刷体汉字识别系统要求与测试方法_第2页
GB/T 17961-2000印刷体汉字识别系统要求与测试方法_第3页
免费预览已结束,剩余5页可下载查看

下载本文档

免费下载试读页

文档简介

TC535.240.20L67中华人民共和国国家标准GB/T17961—2000印刷体汉字识别系统要求与测试方法RequirementsandtestmethodsforidentifysystemofprintedChinesecharacter2000-01-03发布2000-08-01实施国家质量技术监督局发布

GB/T17961-2000本标准是非键盘输入标准,它规定印刷体汉字识别系统的功能、技术要求、测试方法,该标准的制定和实施将正确引导印刷体汉字识别系统的研制与开发。本标准的附录A是提示的附录。本标准由中华人民共和国信息产业部提出本标准由中国电子技术标准化研究所归口本标准起草单位:八六三”计算机智能主题专家组。本标准主要起草人:顾小凤、丁晓青、刘迎建、钱跃良

中华人民共和国国家标准印刷体汉字识别系统要求与测试方法GB/T17961-2000RequirementsandtestmethodsforidentifysystemofprintedChinesecharacter1范围本标准规定了印刷体汉字识别系统的功能、技术要求和测试方法本标准适用于印刷体汉字识别系统,也适用于其他有关系统。2引用标准下列标准所包含的条文·通过在本标准中引用而构成为本标准的条文。本标准出版时.所示版本均为有效。所有标准都会被修订·使用本标准的各方应探讨使用下列标准最新版本的可能性。GB2312—1980信息交换用汉字编码字符集基本集GB/T7589—1987信息交换用汉字编码字符集第二辅助集GB/T7590—1987信息交换用汉字编码字符集第四辅助集GB/T12345—1990信息交换用汉字编码字符集辅助集GB13000.1—1993信息技术通用多八位编码字符集(UCS))第1部分:体系结构(idtISO/IEC10646.4:1993)GB13131-1991信息交换用汉字编码字符集第三辅助集信息交换用汉字编码字符集GB13132-1991第五辅助集系统功能3.1本功能3.1.1预处理将普通纸媒体文本在自动或人工干预下通过光学输人设备将印刷信息转换成适合识别的灰度(含二值)图像。3.1.2识别将上述图像所包括的印刷符号转换为GB2312、GB/T7589、GB/T7590、GB/T12345、GB13000.1、GB13131和GB13132所规定的编码信息。3.2扩展功能3.2.1版面分析应将版面自动分成块.并正确标明每个块的属性,对文字块还需标明各块之间连接关系的逻辑序3.2.2表格识别应能

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论