已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分类号 密级: 硕 士 学 位 论 文 题题目目 非特定人连续数字识别方法与汉语语音数据库的研究并列英文 方 系别系别 计算机科学与技术系专业专 业 计算机应用导师姓名 吴文虎 职称职称 教 授论文答辩日期论文答辩 一九九二年六月清 华 大 学 学 位 论 文 用 纸 者在经过大量实验之后,确定了一种识别算法 , 用 非 分 的分 ,在识别 , 的分数 算用 进行 ( ) , 用 ( ) 数,数了数字 (一 类“二 类 类) 连续语音音之 ,”用与音位 的 。 用的的系, 识别 大的 。本文了一 汉语 的汉语语音数据库, 的数据库,对语音识别“语音分 语 方 的研究 作 大 。 非特定人连续数字识别,非 分 ,分 , ( ) 数,汉语语音数据库清 华 大 学 学 位 论 文 用 纸 a of a is it on to be is to of is by of it to in in of in it a on is in a be of a to in of 大 学 学 位 论 文 用 纸 .研究(76年 ).研究(77年82年).研究(83 89年).据库 量. .知识.据的” 及 . 数据” . 及 过 的计. 及音 分. . 语音的 及 . 及特 的 量. 的 本 . 分 本 及 量. 系数及 量.类技术研究. K- . . “K- .量量技术.音 的方法与研究. . 音 . . 的语音识别的应用.过 及 .音识别的 本 及 定. 题.应用”要意的题. 大 学 学 位 论 文 用 纸 的 数 . 输 的 题. 算的 . 数目 . 的算法. 的识别算法.续 数的 数的. 非 分 的分 .与 数的. 后 对识别 的.类的类 对识别 的. 用 的 . 连续非特定人汉语数字识别系的 .验及 论. 量的确定. 的确定. 数的确定. 验. 识别 对识别 的实验. 的实验. .别.语语音数据库的.语音数据库的意与 .音数据库.334汉语 音().740汉字(). 大 学 学 位 论 文 用 纸 人类 得 的 要 之一,人与 的最方“最 “最 的 。 计算机科学与应用的 , 了计算机语音学(人们对计算机语音的研究 要 方 语音 (语音 (语音识别 ( 者识别 (者确认 (语音识别( 计算机 人 , 人机 新一 计算机的 要组 分。 种分类方法 识别人的分非特定人(音识别 量的大 分量(大 量(音识别 方 分 (连续语音 连 (音识别。 们的难易 (E 易, D 难)。音识别难易 表适应对象 量 识别方 难易 明 易量连续语音 难 难特定人大 量连续语音 难 难量连续语音 难 难非特定人大 量连续语音 难6年以前)在60年 末期, 对语音识别的 困难,人们试对语音识别的任务作一 ,即 急 识别由任何人“ 任何方 的任何 容的连续语音, 决一子题 特定人“ 字表“ ,从 的技术条 得 开。在70年 期 得了 足的进 1在语音 号表示特 方 提两种表示法 器组输 特 作数。 ( 的特 数 “ 分系数“ 道 清 华 大 学 学 位 论 文 用 纸 及应的似 量。2 动 划(的 板匹 技术的 得在此后 十年 ,人们一直视动 弯折( 。3 人 (的 音 计划把高层知识用 在实 “实用 鲁棒 方 想。7年82年)七十年 后期,特定人“ “ 人满意的之后,人们开 沿 标 1特定人向非特定人拓”用算法对 人的 音 本进行类。2 向连 拓提了 1, P9, 法。两扩 本 量,尤 数字识别(03 量向大 量拓一扩遇了计算量存储量急剧增 的困难,应 了 方法 量量(术 好的数据压缩力及 想的类功,因此人们 , 减少识别 算量。子 单元(音“音素等)的提应用 要用 减少 算量存储量。”用分级识别(粗分类)进行 389年)80 年 期 ,新技术的 断 语音识别 了实 的进,特别 (广泛研究应用, 语音识别大 表“非特定人“连续语音方 得 要 。1 用 期5, 6,但对究大 应用80年 后的事。 受广泛 视的 因 用 描蕴藏 观察数据的 变特 , 得 语音 号常常 的非 稳特 (即 变特 )。用 描 种 语音单元, 描一 字 由 学特 定的任一种 学单元,并 由 单元 组 大清 华 大 学 学 位 论 文 用 纸 (音( 音素)单 句子)。由得与语音 列对应的最佳 列,从 得语音单元的最佳分割, 子 单元的 用非常方,大大避免了识别 的分割困难, 连续语音识别题得 决。对 深 研究在 的”要,许 新的算法产生,如 “ 插“ “ 者 适应等等, 得一技术在了更深 的应用。2神经网络(0年 期 新开 的片新的生机。由 织 动学 种 分类 的力, 及 的 分力, 特别适用 特 的分类题。人们 用,即由 的 分类题, 用 的 对 题从实验 看,种 想行 ,并 容易地用 连续语音识别题语音识别常用的神经网络神经网络 神经网络织神经网络 量量语音识别系3 知识的 计分 力的算法的研究 并行开的 授5“学的 授6法 4的 语音学知识的 知识的, 实 了非特定人“大 量连续语音的识别。据库和复杂性度量与识别方法的研究要的 标 的实验 数据库, 进行 种方法之 “ 的 较。目 的非特定人“大 量“连续 全 ”用997 的 数据库。 一非常 名的数据库 与 研 。一识别系的 定也一 要题。 论提的描任务 的一种好的 量0, 描 与识别之 的系。在实描一 表 , 量更 要。清 华 大 学 学 位 论 文 用 纸 内 ,科 学 ,大 数单位70年 末及80年 开 。但在 的十年 , 得 大进,在 ( 音)识别方,清华大学“科 学及 大 了较高 的识别系。 年 , 一单位 力 研究 全音识别的大 识别系,科 动“达 “ 了识别系,并向实用了“的一 。清华大学的3400 语非特定人识别系, 用 本量量(术进行汉语全音识别,也 令人鼓的 与 作 , 一 足之 认的标 语音数据库,也一”要 决的题。清 华 大 学 学 位 论 文 用 纸 知识据的采集及前端处理据” 把语音从 量( 号)字量( 号)并存储计算机 , 语音” 的任务,任务由 A/D 语音” 。进行语音” 之 应确定” ,” 的确定 满足” 定 ” 语音 的带的两 。一 地,人类的语 号的 大 在50 5因此,” 应在10。确定了” ,那 语音 号 的1/2 的高 ” 分。 高 ” 的 器称 器( 字语音分 的 器。 号 板( 一 器,” 由 断存储提了精确的定 方的存 列 ( ) 大数据 语音开 语音开 后( 语音开 后 位)音列 音过音的 , 及进行 语音的开 的定,们”用了列技术 语音开 的 列, 的 据”要定0 , 语音开 后, 存在一 较大的 。 把列的 确地 大的 的 ,并数据的 地 。清 华 大 学 学 位 论 文 用 纸 及 过 的计语音一种 的 变 号,但们 认 ,语音 号 变系的输, 语音的 分 方法。即把语音 号在数的作用 ,一 一 地进行 。 进行 分 的语音 单位,一 , 之 一 ,两 之 起 的 称。一 地, , 10。在们的系, 在 语音分 , 及 过 要的 标量, 们 进行计的 一 语音的 ,计算 =10)(1 一 语音的 过 数,计算 =10 = = 本的欧氏 项2 , 定( “, 等)。类方法 , K- 种 方法。- 一种 的类算法, 把量 骤 骤1 深 m=0。用一种适的方法一 本量 )1()( 。骤2 分类最 ( 把量 的量 ,)()( , 对 3 产生新 本令 1+计算=1),()1()(此作量,并计算 量的 失真 )(骤4 束断如)()1( 百分 达一 ,否 2。里 d 本之 的种 量。种方法 过修 本 失真 。但 敛一 全局最 差得 的局 最 。 大 决 本的位,因此 用类,并从得一 失真 最 的(最好的) 本。由算法因此人们泛称种 本生 算法种算法一 定 本大 固定, 本开 ,后 断扩大,直达要求。 常把一 存在的分类分裂 两 类,并类新的 字 骤清 华 大 学 学 位 论 文 用 纸 作 类。 本 一 字,即 的。(a)(b)(d)(e)(c)a) 的。(b)把唯一 字分裂 两 字 计。(c)把 两 字类 两更好的 字。(d)把两 字分裂 字 计。(e)把 字类 更好的 字。骤2 类分裂类, 本大 增大一,c。骤3 种 类分裂过 ,直 本大 达要求,e。们把一算法进一 ,得 更详 的 骤 骤1 迭 深 m=0。把 作作 本的唯一 字,1,)()(=骤2 分裂本字)(一 的扰动 i ( i 扰动量),得一新的 本 1,)()()(+=骤3 类 )( 字 新类,并计算1),()()(=从 得新 本 )()( ,清 华 大 学 学 位 论 文 用 纸 真 断计算 的失真 , 百分 达定的 5 否 3。骤5 束断令 1+ 骤2“3“4直 本大 达要求。种方法得较好的 本,但类 却 较 。“K- 识别与人 了一种新的类分 算法9,一算法 由本教研组李民“赵彤青及等研 的语音识别系”用, 得了好 , 得类的 大大 在物 ,“技术 把固体 热 足够高, 固体 粒子 由液 ,后 温 慢 , 要温 得足够高,冷却过 足够慢, 粒子最终会 最 。,若粒子开 C ,若 量逐渐减 , 粒子最终达的A (局 最 ) B(全局最 ) ,们 希望的。 决的办法对系经常地摇动一 , 把粒子从C 摇B , 把 摇A 的 。若开 较大的 摇,再慢慢减,最终粒子会落在B, “(类似 过 子在 量极 系的 行在定温 T , 热 衡 的物体 E 从 兹 ( )/()( =(T)因子。 了温 T 的热 衡 机地一 后 机地系一 扰动,若 增量 0 ( 本 数), 。骤3 若 定 0, 2。的类算法,如K- 组 的 似算法,求得局 最 , “ K- 高的 敛 全局最, 与 分类无。量量化技术量量(术语音 最 要“ 用最 的方法之一。定维向量, 维分量 实变量。在向量 一称作把X 量 Y,写作 )(Y 在一 一 本,们记作 ,1 ,大 。显,过 本 X = )(把X量们之 存在一量失真 称 量d(X,Y)。一量器)称 量器 量失真= /)(,(最 的, X 表示 X元素的数。们用 的量器() ,清 华 大 学 学 位 论 文 用 纸 = 对 ),(),( 本 X ,一(大 一定的) 本一量器一一对应的。本的由类算法实 , 最 ( 容易实 。一,特定(如语音)的 本() 一真子 ,显 越 (对 ),对类越 。在实的实 ,一向量 本方,用 字在号i 表示量。 ,表示= 对 ),(),(音检测的方法与研究汉字的 对 音的汉语语音识别 起 要作用,汉语语音识别的一 要特 。 音期的变进行 的一 方法。音期的 方法 。的 里 分 音 的, 利用并 方法 数的本文 ”用用数进行 音期 的方法。从种意, 表示法的一 要 的语音 号的 ,由 道应的 振 数 许 ,如 得 音期, 共振 变,会 得 数 在 音期 得最大导 单地 数最大 的方法失 。一题, 要确定适的 。 人类语音 一 00音期的变 此 ( )56 () 在任何情 ,一 少 二 音期。”要对语音 号 。 期 变更 明显, 号 带 扰 的特 ,种 术的 要任务 道数的,从 。 较的 技术。一非 变+=,0,)(数的 及 作用 语音 号 的一 子 清 华 大 学 学 位 论 文 用 纸 x+音输 语音+数及 作用 %30 )作用第一100 最大 %68 )作的实验们 看,扰 起的 , 期 越明显,在们的系们用一 的最大 音 经过 后的语音 号 计算 数。=+=)()(事实 1 20 (20 的 数 计算。计算后的 数 最大0(行一。从 非 的最大 )0(20%),! , 们作期的 。如何确定 期 定 数x,y)的最 。如 1,10)=1 (21%10)8,10)=2 ( 8)定 数)/(),)(1+=最 音期。清 华 大 学 学 位 论 文 用 纸 音的音的 数a)80%(b)64%(c)48%0,2,5,9)=(2+5+1)/3 =8/3)=(3+7)/2 =5)=4/1 =4因此0。种方法 地 那 5的 之 。越
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 拼图效果课件教学课件
- 精细化管理企业培训
- 课件画房间教学课件
- 腹部瘢痕手术中的皮肤切口设计
- 爱情的课件教学课件
- 新上岗职工院感培训课件
- 认知障碍的评估与治疗
- 深度学习及自动驾驶应用 课件 第8、9章 基于Transformer的自动驾驶目标检测理论与实践、生成对抗网络及自动驾驶应用
- 手机行业企业发展规划
- 初中素质训练教案
- 马克思主义基本原理概论(湖南师范大学)智慧树知到答案章节测试2023年
- 八年级数学竞赛题及标准答案解析
- 2023年江苏小高考历史试卷含答案1
- 输变电工程建设的标准强制性条文实施管理规程
- 2022年全国统一高考日语真题试卷及答案
- 物联网技术在军事上的应用:物联网与现代战争课件
- 部编语文二年级上册第8单元(生字)风娃娃-小学RJ
- HY/T 214-2017红树林植被恢复技术指南
- GB/T 4960.3-2010核科学技术术语第3部分:核燃料与核燃料循环
- GB/T 3280-2015不锈钢冷轧钢板和钢带
- GB/T 28655-2012业氟化氢铵
评论
0/150
提交评论