标准解读
《GB/T 21023-2007 中文语音识别系统通用技术规范》是中华人民共和国国家质量监督检验检疫总局和中国国家标准化管理委员会联合发布的一项国家标准,旨在为中文语音识别系统的开发、评估及应用提供一套统一的技术要求和测试方法。此标准详细规定了中文语音识别系统在性能、功能、数据格式、测试评估等方面应遵循的基本原则和技术指标,以促进该领域技术的规范化和产品质量的提升。以下是对该标准主要内容的概述:
-
范围:明确了本标准适用于基于自动识别和处理汉语语音信号的中文语音识别系统,包括但不限于连续语音、关键词识别、语音命令识别等应用场景。
-
术语和定义:定义了一系列与中文语音识别相关的专业术语,如识别率、拒识率、误识率等,为标准的后续内容奠定了语言基础。
-
技术要求:
- 识别性能:规定了识别系统的准确度、响应时间、稳定性等关键性能指标,要求系统能在不同环境条件下保持较高识别率。
- 功能要求:包括语音输入处理、声学模型、语言模型、语音数据库管理、用户界面及交互设计等方面的功能需求,确保系统具备良好的用户体验和实用性。
- 兼容性与可扩展性:要求系统能适应不同的软硬件平台,支持多种音频格式和编码方式,且易于升级和扩展以应对未来技术发展。
-
数据与格式:对语音数据库的构建、标注、存储及交换格式提出了具体要求,强调数据的代表性和多样性,以支持系统的训练和测试。
-
测试与评估方法:确立了一套详细的测试流程和评价体系,包括测试环境设置、测试集选择、性能指标计算方法等,用以客观评价系统的实际表现。
-
安全与隐私保护:虽然该标准主要聚焦于技术层面,但也提及了在系统设计和实施过程中应考虑的数据安全和用户隐私保护原则。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
- 现行
- 正在执行有效
- 2007-06-29 颁布
- 2007-11-01 实施
文档简介
ICS35.040L71中华人民共和国国家标准GB/T21023—2007中文语音识别系统通用技术规范GeneralspecificationforChinesespeechrecognitionsystem2007-06-29发布2007-11-01实施中华人民共和国国家质量监督检验检疫总局爱布中国国家标准化管理委员会
GB/T21023一2007三前言范围2规范性引用文件3术语和定义4语音识别系统分类及表述4.1基于用途的分类4.2基于词汇量的分类4.3基于所能识别的说话人群的分类4.4基于系统工作模式的分类4.5曙音识别系统的应用环境4.6语音识别系统使用背景环境4.7语音识别系统表述规范5语音识别系统性能指标5.2识别性能分类指标5.3应时间指标5.4系统分类指标要求6语音输入和识别输出6.1语音识别输入准则6.2语音识别输出准则7语音识别系统性能测试方法7.17.2测试语料设计7.3测试语音录制7.4基于语音识别标准库的测试方法7.5基于现场口呼的测试方法7.6测试报告内容8语音识别标准库及规范8.1述8.2语音识别标准库语音特性的描述8.3语语音识别标准库的标注8.48.5语音识别标准库的数据转换附录A(资料性附录)听写系统有关符号读法附录B(资料性附录)语音识别用无调汉语拼音表参考文献
GB/T21023-2007前请注意本标准的某些内容有可能涉及专利。本标准的发布机构不承担识别这些专利的责任本标准的附录A、附录B是资料性附录。本标准由中华人民共和国信息产业部提出本标准由全国信息技术标准化技术委员会归口本标准由中国电子技术标准化研究所、中国科学院白动化研究所、清华大学、中国社会科学院语言研究所起草。本标准主要起草人:徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚
GB/T21023-2007中文语音识别系统通用技术规范范围本标准规定了中文语音识别系统的基本术语、分类、技术指标、测试方法、输入/输出以及中文语音识别标准库等。本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统。本标准的制定和实施主要用于指导中文语音识别系统的研制、应用和测试。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勒误的内容)或修订版均不适用于本标准,然而.鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB18030—2005信息技术中文编码字符集3术语和定义下列术语和定义适用于本标准语音识别speechrecognition将人类的声音信号转化为文字或者指令的过程3.2语音识别系统speechrecognitionsystem具有语音识别功能的开发工具、软件、装置或应用3.3词汇表vocabularylist语音识别系统所包含和处理的所有词汇。3.4激活词汇activeword语音识别系统在某个时间点能同时识别的所有词汇。3.5发音lutterance用户输入的一个语音单位,可以是词、短语或句子。。发音单元之间需有有意、明显停顿。3.6孤立字语音isolatedwordspeech以字为发音单元,字与字之间需有有意、明显停顿的语音连接词语音connectedwordspeech以词为发音单元.
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 2025年潍坊货车从业资格证考试试题
- 洛阳商业职业学院《口述史实践》2023-2024学年第一学期期末试卷
- 2024年新能源发电项目投资合作协议
- 港口安全防护设施施工合同
- 橡胶制品招投标内控要点分析
- 高层公寓建设合同范文
- 施工合同执行追踪系统
- 2025正规货物运输合同
- 人事专用章使用规范
- 营业执照办理中的地址问题
- 《工厂垃圾分类》课件
- 2025年1月“八省联考”考前猜想卷历史试题01 含解析
- 《小学科学实验教学探究的国内外文献综述》2300字
- 山东省淄博市2023-2024学年高二上学期期末教学质量检测试题 数学 含解析
- 教育部《中小学校园食品安全和膳食经费管理工作指引》专题培训
- 2医疗器械企业税务筹划(2024年)
- 专题23 殖民地人民的反抗与资本主义制度的扩展(练习)
- 2024至2030年中国无甲醛多层板数据监测研究报告
- 医疗行业工会主席选举的实施细则
- 校园心理健康教育文化建设方案
- 李斯列传课件教学课件
评论
0/150
提交评论