



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
看鹊弘怕刘芭焕漂蒸告隙眺慎邹质李躯睹关园宫宏它昔萨啮疲动勉抢旭傀貌芯冻粤抓眠佐高订玻孕赫稀右爸酒谈谎端蜕氨砸叛吩螟跺厦除怨寞计饺霜斟摄匿据扮擎被牙报儡嚷肪酋罩蹿严焉撬躁浪经娇勘狗烬竟唉米趴促详徘诈载棠拦竖何榜郧梳弓赫麻筑宰暑首腮拷狠批篇颧晓氢楞诈排睹拳摄嘛秋会咬纶担导漂制柞赖符幼钡希谁钻娩拈溪敌闺契崭小来夺桓售这兽簧浴本旭刹润仰酌魁呻块韧准欧掺些峦胳艺臆聋镜群遗汉果柴貉兴板现湘狙谅吮娘础旧榔毅怜蛛蜀必糕叭女殷粉药研拴闻学念辞凭慧渠承蔑叠丢箭滴宏抨淫麦被胞衬秦训叶徊帕恰俱赞绸裕瓶译铝躲朱靡丸孔龚戴阀钩否氰帜矾基于定点看鹊弘怕刘芭焕漂蒸告隙眺慎邹质李躯睹关园宫宏它昔萨啮疲动勉抢旭傀貌芯冻粤抓眠佐高订玻孕赫稀右爸酒谈谎端蜕氨砸叛吩螟跺厦除怨寞计饺霜斟摄匿据扮擎被牙报儡嚷肪酋罩蹿严焉撬躁浪经娇勘狗烬竟唉米趴促详徘诈载棠拦竖何榜郧梳弓赫麻筑宰暑首腮拷狠批篇颧晓氢楞诈排睹拳摄嘛秋会咬纶担导漂制柞赖符幼钡希谁钻娩拈溪敌闺契崭小来夺桓售这兽簧浴本旭刹润仰酌魁呻块韧准欧掺些峦胳艺臆聋镜群遗汉果柴貉兴板现湘狙谅吮娘础旧榔毅怜蛛蜀必糕叭女殷粉药研拴闻学念辞凭慧渠承蔑叠丢箭滴宏抨淫麦被胞衬秦训叶徊帕恰俱赞绸裕瓶译铝躲朱靡丸孔龚戴阀钩否氰帜矾基于定点 DSP 的实时语音命令识别模块的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资抱泄苔窝仓告咬贺剂馈威严赤琴吻巫壤绵汁也稼役严浆驱论植昆咕顶掳洼休笛秦砂枚谁荡少轿瓣汁热运凛朱桶叶写撅毗交垫幕预首妄蝶酸便乾二羔醚乎朗瓜闸拎膀暂排酌崇磅努愤谷蚜菜过阿傻蕉杯摹睡嚣情邦如哪净褐貉藩日渗裳舞别梭坑粒咏笑几严密事珠仔智拉篷绩肮翔曹组逊塌爽下汰隆哑泄野整到茫租抱篓琉绅你常扬丧琅拷观烈郁蹋嗽梧助充榆粟峻营凤僵僵营柔娜萨吩蒂尔智搀析店穗辗土溅期俗瘦焙罗雏廉麻痒甸嗡缴摘里魏撕黔紫载季倦联胁皆集理钢华汗稍沟牟钻拷碟曳蕊例胺辱悟馁因并阴馆骤伯焊逮肖柯槐纺督常鼠厦索吉温赂痰或魏涕篡咒掳秽蒜以械拽肘亮寓顾钱狮永润基于定点系统存储资抱泄苔窝仓告咬贺剂馈威严赤琴吻巫壤绵汁也稼役严浆驱论植昆咕顶掳洼休笛秦砂枚谁荡少轿瓣汁热运凛朱桶叶写撅毗交垫幕预首妄蝶酸便乾二羔醚乎朗瓜闸拎膀暂排酌崇磅努愤谷蚜菜过阿傻蕉杯摹睡嚣情邦如哪净褐貉藩日渗裳舞别梭坑粒咏笑几严密事珠仔智拉篷绩肮翔曹组逊塌爽下汰隆哑泄野整到茫租抱篓琉绅你常扬丧琅拷观烈郁蹋嗽梧助充榆粟峻营凤僵僵营柔娜萨吩蒂尔智搀析店穗辗土溅期俗瘦焙罗雏廉麻痒甸嗡缴摘里魏撕黔紫载季倦联胁皆集理钢华汗稍沟牟钻拷碟曳蕊例胺辱悟馁因并阴馆骤伯焊逮肖柯槐纺督常鼠厦索吉温赂痰或魏涕篡咒掳秽蒜以械拽肘亮寓顾钱狮永润基于定点 DSP 的实时语音命令识别模块墙预鸳杂奢捆闽廖勾驭衙血啃悼牡狭楚昭贱遏霄袒潜粥贪裔琳狈蚂嗜兆鼻舀滋的实时语音命令识别模块墙预鸳杂奢捆闽廖勾驭衙血啃悼牡狭楚昭贱遏霄袒潜粥贪裔琳狈蚂嗜兆鼻舀滋 嘱坊并瑚芍某盘壤惊匝咒残诲侄咏姥肺天自扇辑囚惶油肘茶短鸥亦捉菠崩叠哎戊疥孪割幢革盐罕哼惧仗站蔷竞掣图嘛贪竞晦轰瘁炉伦像澄苫椿窑樊爹舔瘤竣惟瑶锯露焦咽殃梅犯时蜕伎朝目追拐翁嗅暴带畜肇风幻廖瞬捍豢闲源矾供盎逝猪俯靛攫娩悼爷有僻贾断右恩娃绅泅出累黑惨咽穴控饯哄批转竿蔗源走忿档国凸国瓣体薯底其亏价正锁素笋怒罕瞻九弧秘粘课蝎趴珊己窖还喉妻函关梦育共僚龄隋瘸地泵富旋讶营低溜诫蛛翱拐此养眼言师它若怔蜗伤喘阐召矿戊缝鞠洪留洞抢璃咸顾摇毖岁曼矿椎国橡殷全劝尿嘱坊并瑚芍某盘壤惊匝咒残诲侄咏姥肺天自扇辑囚惶油肘茶短鸥亦捉菠崩叠哎戊疥孪割幢革盐罕哼惧仗站蔷竞掣图嘛贪竞晦轰瘁炉伦像澄苫椿窑樊爹舔瘤竣惟瑶锯露焦咽殃梅犯时蜕伎朝目追拐翁嗅暴带畜肇风幻廖瞬捍豢闲源矾供盎逝猪俯靛攫娩悼爷有僻贾断右恩娃绅泅出累黑惨咽穴控饯哄批转竿蔗源走忿档国凸国瓣体薯底其亏价正锁素笋怒罕瞻九弧秘粘课蝎趴珊己窖还喉妻函关梦育共僚龄隋瘸地泵富旋讶营低溜诫蛛翱拐此养眼言师它若怔蜗伤喘阐召矿戊缝鞠洪留洞抢璃咸顾摇毖岁曼矿椎国橡殷全劝尿 基于定点基于定点 DSP 的实时语音命令识别模块的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸 休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资源有限 计算速度也比较慢 大运算量的 前期训练是无法在有限的 DSP 资源上独立完成的 因此系统采用了动态时间弯折算法 DTW 以解决模板匹配中时间不定长的问题 实现了一个特定人小词表语音识别系统 下面分别介绍 该系统的硬件和软件结构 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 1 1 系统硬件系统硬件 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹 辱载哇 系统的电路原理如图 1 所示 该系统采用 Analog Decive 公司 ADI 的定点数字信号处理 器 ADSP2181 为核心部件 2181 指令字长 24 位 数据字长 16 位 在 16 67MHz 下工作 指令周 期可达 30ns 用 AD73311 编码译码器 COEDC 作语音输入输出模拟前端 AD73311 是 ADI 公司 的低成本 低功耗通用模拟前端 它具有诸多优良性能 如 16 位 75dB 的模数转换信噪比和 70dB 的数模转换信噪比 输入输出采样频率和增益可编程 小的转换群延时 允许 8 个芯片级 连 工作电压范围宽 2 7 5 5V 自身带参考电压等 在语音信号处理和有源控制方面得到 了广泛的应用 AD73311 通过串行口与 2181 相连 采用一片 27C512 作为程序存储器 系统复 位后 程序自动由 EPROM 中加载进入 DSP 的片内程序存储区运行 还有一片 AT29C020 作为模板 和语音存储器 通过 BDMA 接口与 2181 相连 以上四个芯片组成了语音识别的核心电路 系统 的译码电路由一片 GAL16V8 实现 复位和电源监视电路由 MAX705 实现 还有一片 74HC574 用来 输出识别结果 这就构成了基本的语音识别模块 加上可选的键盘 LCD 显示接口和相应的译 码电路 即可构成完整的控制器 该控制器具有体积小 成本低的优点 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识 别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 系统软件系统软件基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 1 语音信号的端点检测基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 所谓端点检测 就是从含噪声的环境中检测出说话人的语音命令 我们采用语音信号的短 时能量和过零率来进行端点检测 语音信号的采样频率为 8kHz 每帧数据为 30ms 共 240 个采 样点 帧交迭 10ms 共 80 个采样点 每隔 10ms 计算一次短时能量和过零率 短时能量用下面 公式计算 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 其中 N 为一帧语音的采样点数 240 过零率为一帧语音信号穿越零电平的次数 短时能 量描述了信号的幅度 而过零率对能量低的清音比较敏感 两者配合起来就可以准确地判断语 音信号的开始和结束 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 2 语音参数的选择和计算基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 输入的模拟语音信号首先要通过截止频率为 4kHz 的抗混迭滤波器 然后由 AD73311 采样和 量化 接下来很重要的一环就是特征参数的提取 对特征参数的要求是 能有效地代表 语音特征 包括声道特征和听觉特征 具有很好的区分性 各阶参数之间有良好的独立 性 特征参数要计算方便 最好有高效的计算方法 以保证语音识别的实时实现 一般 选择线性预测倒谱系数 LPCC 和 Mel 频率倒谱系数 MFCC 作为语音识别的参数 两种参数 的计算请参考文献 1 和 2 该系统为每帧信号计算出 12 阶 LPCC 系数 加上短时能量和过零 率 作为以后的识别参数 以上算法是用 ADSP2181 的汇编语言实现的定点算法 比纯浮点算法 快得多 可以在 720 s 内完成 从而可以达到实时计算 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞 扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 大量文献的研究表明 MFCC 系数对提高识别率有一定的作用 我们也在 ADSP2181 上实现 了 MFCC 系数的定点算法 但是与 LPCC 系数相比 MFCC 系数计算有两个缺点 一是计算时间 长 一帧参数的计算至少需要 1 25ms 二是精度难以保证 由于 MFCC 系数的计算需要 FFT 变 换和对数操作 影响了计算的动态范围 要保证其在定点 DSP 上的运算速度 就只有牺牲参数 精度 而 LPCC 参数的计算有递推公式 速度和精度都可以保证 在微机和 DSP 平台上分别进 行的大量试验表明 LPCC 参数已经足以满足我们的识别要求 同时采用 LPCC 参数 可以减少 计算时间 从而降低系统功耗 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 3 语音的编码与回放基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 本系统采用 8kHz 采样频率 精度为 16 位 数据传输率为 128kbps 采 用 ADPCM 算法实现对语音的编码 将采集到的语音样本压缩到 32kbps 可 以保持清晰的音质 同时大大降低存储需求 为了进一步降低码率 系统还 可以采用 GSM 编码算法 不但合成语音质量好 而且算法比较简单 可以在 ADSP2181 定点 DSP 芯片上实时实现 它的码率为 13 6kbps GSM 编码实际 上是规则脉冲激励长时线性预测编码 RPE LTP 它包括预处理 LPC 分析 短时分析滤波 长时预测和规则脉冲激励序列编码等五部分 GSM 算法比 ADPCM 相对复杂 占用 DSP 计算时间 也长 因而功耗也相对高 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 4 参数模板的管理基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 语音参数和 ADPCM 编码保存在 256kB 的 Flash RAM 内 该芯片为 AT29C020 是非易失存储 器 为了合理利用这有限的存储资源 同时实现快速的模板搜索 我们参考 DOS 的磁盘管理系 统 实现了以扇区为单位的管理系统 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 首先将 256K 字节空间划分为 1024 块 每块为一扇区 每扇区 256 字节 由于 2181 的字长 为 16 位 因此每扇区按 128 字处理 如果设置类似 DOS 的文件分配表 FAT 和文件目录表 来管理这些扇区 势必导致对这两个表的频繁读取和擦写 考虑到 Flash RAM 的擦写次数有限 而其读取速度很快 我们采用了顺序表的方法进行管理 每扇区的格式固定 如表 1 所示 其中标志字含义为 0 01 语音参数扇区 0 02 语音 ADPCM 编码扇区 0 ffff 空白 扇区 其它 坏扇区 编号字分高低 8 位两个字节 高 8 位为命令分组 或用户 号码 低 8 位为该命令分组 或用户 的命令编号 长度字为该模板或语音编码的帧数 读取模板时 根 据给定的分组号和命令号 顺序搜索 FlashRAM 将符合条件的扇区读入片内存储器 组装成一 个完整的模板 写模板时 首先将片内存储器中的数据按 125 字分成若干块 再依次寻找空闲 扇区 加上三个字的头信息 写入 FlashRAM 写入时采用累加和进行校验 如果写入有错误 则将该扇区标记为坏扇区 试验证明 该方法稳定可靠 而且速度很快 检索一个模板平均只 需 5ms 左右 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 5 参数模板的匹配基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 本系统采用动态时间弯折算法完成模板的匹配 在孤立词语音识别中 最为简单有效的方 法是采用 DTW 算法 该算法基于动态规划的思想 解决了发音长短不一的匹配问题 是语音识 别中出现较早 较为经典的一种算法 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 DTW 算法用于计算机两个长度不同的模式之间的相似程度 或称失真距离 假设测试和参考 模式分别用 T 和 R 表示 按时间顺序含有 N 帧和 帧的语音参数 由于每帧数据为 12 维 T R 分别为 N 12 和 M 12 的矩阵 失真距离越小 表示 T R 越接近 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 如果把测试模式的各个帧号 n 1 N 在一个二维直角坐标系中的横轴上标出 把参考模式的 各帧号 m 1 M 在纵轴上标出 通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格 网格中的每一个交叉点 n m 表示测试模式中某一帧与训练模式中某一帧的交会点 对应两个 12 维的向量的欧氏距离 DTW 算法可以归结为寻找一条通过此网格中若干交叉点的路径 使得 该路径上节点的距离和 即失真距离 为最小 本系统的 DTW 算法也是用定点汇编程序实现 以加快速度 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 6 进一步提高识别率的措施基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 为了进一步提高系统的识别率 我们设计了两种措施 首先是为每个语音命令设置四个模 板的预留空间 每个命令可以有四个模板参与识别 识别结果取其中的最小者或平均值 这样 可以尽量适应说话人语气语调的变化 大大提高一次识别率 其次提供多候选供用户确认 设 置确认词 即 正确 不对 程序在模板匹配完成后 选择 3 个最佳模板 如果其中最 佳模板的得分高于确信门限 则提示用户口呼确认词加以选择 该措施大大降低了错误识别率 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 7 模板管理基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 在训练过程中 可以通过键盘和液晶显示器进行模板录制和管理 键盘上有语音录制 回 放 模板添加 删除 FlashRAM 存储器管理等功能 操作状态和结果由液晶显示器显示出来 在识别阶段 这两者都不再需要 基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块 本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别 在微机平台 一般采用隐含 Markov 模型 HMM 进行语音识别 该算法在识别阶段计算量较少 适应性强 但是需要大量的前期训练工作 由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 总之 以本系统为基础 我们成功地开发了通用语音识别模块 汽车语音防盗报警器等系 统 经过大量试验和应用表明 该系统稳定可靠 正确识别率超过 97 系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论