标准解读
《GB/T 21023-2007 中文语音识别系统通用技术规范》是中华人民共和国国家质量监督检验检疫总局和中国国家标准化管理委员会联合发布的一项国家标准,旨在为中文语音识别系统的开发、评估及应用提供一套统一的技术要求和测试方法。此标准详细规定了中文语音识别系统在性能、功能、数据格式、测试评估等方面应遵循的基本原则和技术指标,以促进该领域技术的规范化和产品质量的提升。以下是对该标准主要内容的概述:
-
范围:明确了本标准适用于基于自动识别和处理汉语语音信号的中文语音识别系统,包括但不限于连续语音、关键词识别、语音命令识别等应用场景。
-
术语和定义:定义了一系列与中文语音识别相关的专业术语,如识别率、拒识率、误识率等,为标准的后续内容奠定了语言基础。
-
技术要求:
- 识别性能:规定了识别系统的准确度、响应时间、稳定性等关键性能指标,要求系统能在不同环境条件下保持较高识别率。
- 功能要求:包括语音输入处理、声学模型、语言模型、语音数据库管理、用户界面及交互设计等方面的功能需求,确保系统具备良好的用户体验和实用性。
- 兼容性与可扩展性:要求系统能适应不同的软硬件平台,支持多种音频格式和编码方式,且易于升级和扩展以应对未来技术发展。
-
数据与格式:对语音数据库的构建、标注、存储及交换格式提出了具体要求,强调数据的代表性和多样性,以支持系统的训练和测试。
-
测试与评估方法:确立了一套详细的测试流程和评价体系,包括测试环境设置、测试集选择、性能指标计算方法等,用以客观评价系统的实际表现。
-
安全与隐私保护:虽然该标准主要聚焦于技术层面,但也提及了在系统设计和实施过程中应考虑的数据安全和用户隐私保护原则。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
- 现行
- 正在执行有效
- 2007-06-29 颁布
- 2007-11-01 实施
文档简介
ICS35.040L71中华人民共和国国家标准GB/T21023—2007中文语音识别系统通用技术规范GeneralspecificationforChinesespeechrecognitionsystem2007-06-29发布2007-11-01实施中华人民共和国国家质量监督检验检疫总局爱布中国国家标准化管理委员会
GB/T21023一2007三前言范围2规范性引用文件3术语和定义4语音识别系统分类及表述4.1基于用途的分类4.2基于词汇量的分类4.3基于所能识别的说话人群的分类4.4基于系统工作模式的分类4.5曙音识别系统的应用环境4.6语音识别系统使用背景环境4.7语音识别系统表述规范5语音识别系统性能指标5.2识别性能分类指标5.3应时间指标5.4系统分类指标要求6语音输入和识别输出6.1语音识别输入准则6.2语音识别输出准则7语音识别系统性能测试方法7.17.2测试语料设计7.3测试语音录制7.4基于语音识别标准库的测试方法7.5基于现场口呼的测试方法7.6测试报告内容8语音识别标准库及规范8.1述8.2语音识别标准库语音特性的描述8.3语语音识别标准库的标注8.48.5语音识别标准库的数据转换附录A(资料性附录)听写系统有关符号读法附录B(资料性附录)语音识别用无调汉语拼音表参考文献
GB/T21023-2007前请注意本标准的某些内容有可能涉及专利。本标准的发布机构不承担识别这些专利的责任本标准的附录A、附录B是资料性附录。本标准由中华人民共和国信息产业部提出本标准由全国信息技术标准化技术委员会归口本标准由中国电子技术标准化研究所、中国科学院白动化研究所、清华大学、中国社会科学院语言研究所起草。本标准主要起草人:徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚
GB/T21023-2007中文语音识别系统通用技术规范范围本标准规定了中文语音识别系统的基本术语、分类、技术指标、测试方法、输入/输出以及中文语音识别标准库等。本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统。本标准的制定和实施主要用于指导中文语音识别系统的研制、应用和测试。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勒误的内容)或修订版均不适用于本标准,然而.鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB18030—2005信息技术中文编码字符集3术语和定义下列术语和定义适用于本标准语音识别speechrecognition将人类的声音信号转化为文字或者指令的过程3.2语音识别系统speechrecognitionsystem具有语音识别功能的开发工具、软件、装置或应用3.3词汇表vocabularylist语音识别系统所包含和处理的所有词汇。3.4激活词汇activeword语音识别系统在某个时间点能同时识别的所有词汇。3.5发音lutterance用户输入的一个语音单位,可以是词、短语或句子。。发音单元之间需有有意、明显停顿。3.6孤立字语音isolatedwordspeech以字为发音单元,字与字之间需有有意、明显停顿的语音连接词语音connectedwordspeech以词为发音单元.
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 抵押车借款合同
- 承包搅拌车运输合同
- 房屋装修补偿合同
- 广告发布业务合同
- 业主共同管理合同
- 劳动合同中的培训协议问题
- 合同延续补充协议2024年
- 企业展会筹划委托合同(2024年版)
- 2024年新版显示器销售代理合同协议新范本
- 工厂招聘合同范例
- 实验 苯甲酸乙酯的制备
- 北师大版七年级上册英语(全册知识点语法考点梳理、重点题型分类巩固练习)(家教、补习、复习用)
- 经济周期与产业周期演进的关系(成长篇)
- 松花江水污染事件工程伦理案例分析
- 特别的人歌词
- 耳尖放血课件完整版
- 混凝土井施工方案
- 云南省地图含市县地图矢量分层地图行政区划市县概况ppt模板
- GB/T 12763.4-2007海洋调查规范第4部分:海水化学要素调查
- 金融风险防控指标考核办法
- 优化设计思路(管道)课件
评论
0/150
提交评论