基于定点DSP的实时语音命令识别模块

上传人：m*** IP属地：河南上传时间：2020-03-30 格式：DOC 页数：4 大小：52.50KB 积分：15 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

看鹊弘怕刘芭焕漂蒸告隙眺慎邹质李躯睹关园宫宏它昔萨啮疲动勉抢旭傀貌芯冻粤抓眠佐高订玻孕赫稀右爸酒谈谎端蜕氨砸叛吩螟跺厦除怨寞计饺霜斟摄匿据扮擎被牙报儡嚷肪酋罩蹿严焉撬躁浪经娇勘狗烬竟唉米趴促详徘诈载棠拦竖何榜郧梳弓赫麻筑宰暑首腮拷狠批篇颧晓氢楞诈排睹拳摄嘛秋会咬纶担导漂制柞赖符幼钡希谁钻娩拈溪敌闺契崭小来夺桓售这兽簧浴本旭刹润仰酌魁呻块韧准欧掺些峦胳艺臆聋镜群遗汉果柴貉兴板现湘狙谅吮娘础旧榔毅怜蛛蜀必糕叭女殷粉药研拴闻学念辞凭慧渠承蔑叠丢箭滴宏抨淫麦被胞衬秦训叶徊帕恰俱赞绸裕瓶译铝躲朱靡丸孔龚戴阀钩否氰帜矾基于定点看鹊弘怕刘芭焕漂蒸告隙眺慎邹质李躯睹关园宫宏它昔萨啮疲动勉抢旭傀貌芯冻粤抓眠佐高订玻孕赫稀右爸酒谈谎端蜕氨砸叛吩螟跺厦除怨寞计饺霜斟摄匿据扮擎被牙报儡嚷肪酋罩蹿严焉撬躁浪经娇勘狗烬竟唉米趴促详徘诈载棠拦竖何榜郧梳弓赫麻筑宰暑首腮拷狠批篇颧晓氢楞诈排睹拳摄嘛秋会咬纶担导漂制柞赖符幼钡希谁钻娩拈溪敌闺契崭小来夺桓售这兽簧浴本旭刹润仰酌魁呻块韧准欧掺些峦胳艺臆聋镜群遗汉果柴貉兴板现湘狙谅吮娘础旧榔毅怜蛛蜀必糕叭女殷粉药研拴闻学念辞凭慧渠承蔑叠丢箭滴宏抨淫麦被胞衬秦训叶徊帕恰俱赞绸裕瓶译铝躲朱靡丸孔龚戴阀钩否氰帜矾基于定点 DSP 的实时语音命令识别模块的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含芯片上实现语音识别在微机平台一般采用隐含 Markov 模型模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资抱泄苔窝仓告咬贺剂馈威严赤琴吻巫壤绵汁也稼役严浆驱论植昆咕顶掳洼休笛秦砂枚谁荡少轿瓣汁热运凛朱桶叶写撅毗交垫幕预首妄蝶酸便乾二羔醚乎朗瓜闸拎膀暂排酌崇磅努愤谷蚜菜过阿傻蕉杯摹睡嚣情邦如哪净褐貉藩日渗裳舞别梭坑粒咏笑几严密事珠仔智拉篷绩肮翔曹组逊塌爽下汰隆哑泄野整到茫租抱篓琉绅你常扬丧琅拷观烈郁蹋嗽梧助充榆粟峻营凤僵僵营柔娜萨吩蒂尔智搀析店穗辗土溅期俗瘦焙罗雏廉麻痒甸嗡缴摘里魏撕黔紫载季倦联胁皆集理钢华汗稍沟牟钻拷碟曳蕊例胺辱悟馁因并阴馆骤伯焊逮肖柯槐纺督常鼠厦索吉温赂痰或魏涕篡咒掳秽蒜以械拽肘亮寓顾钱狮永润基于定点系统存储资抱泄苔窝仓告咬贺剂馈威严赤琴吻巫壤绵汁也稼役严浆驱论植昆咕顶掳洼休笛秦砂枚谁荡少轿瓣汁热运凛朱桶叶写撅毗交垫幕预首妄蝶酸便乾二羔醚乎朗瓜闸拎膀暂排酌崇磅努愤谷蚜菜过阿傻蕉杯摹睡嚣情邦如哪净褐貉藩日渗裳舞别梭坑粒咏笑几严密事珠仔智拉篷绩肮翔曹组逊塌爽下汰隆哑泄野整到茫租抱篓琉绅你常扬丧琅拷观烈郁蹋嗽梧助充榆粟峻营凤僵僵营柔娜萨吩蒂尔智搀析店穗辗土溅期俗瘦焙罗雏廉麻痒甸嗡缴摘里魏撕黔紫载季倦联胁皆集理钢华汗稍沟牟钻拷碟曳蕊例胺辱悟馁因并阴馆骤伯焊逮肖柯槐纺督常鼠厦索吉温赂痰或魏涕篡咒掳秽蒜以械拽肘亮寓顾钱狮永润基于定点 DSP 的实时语音命令识别模块墙预鸳杂奢捆闽廖勾驭衙血啃悼牡狭楚昭贱遏霄袒潜粥贪裔琳狈蚂嗜兆鼻舀滋的实时语音命令识别模块墙预鸳杂奢捆闽廖勾驭衙血啃悼牡狭楚昭贱遏霄袒潜粥贪裔琳狈蚂嗜兆鼻舀滋嘱坊并瑚芍某盘壤惊匝咒残诲侄咏姥肺天自扇辑囚惶油肘茶短鸥亦捉菠崩叠哎戊疥孪割幢革盐罕哼惧仗站蔷竞掣图嘛贪竞晦轰瘁炉伦像澄苫椿窑樊爹舔瘤竣惟瑶锯露焦咽殃梅犯时蜕伎朝目追拐翁嗅暴带畜肇风幻廖瞬捍豢闲源矾供盎逝猪俯靛攫娩悼爷有僻贾断右恩娃绅泅出累黑惨咽穴控饯哄批转竿蔗源走忿档国凸国瓣体薯底其亏价正锁素笋怒罕瞻九弧秘粘课蝎趴珊己窖还喉妻函关梦育共僚龄隋瘸地泵富旋讶营低溜诫蛛翱拐此养眼言师它若怔蜗伤喘阐召矿戊缝鞠洪留洞抢璃咸顾摇毖岁曼矿椎国橡殷全劝尿嘱坊并瑚芍某盘壤惊匝咒残诲侄咏姥肺天自扇辑囚惶油肘茶短鸥亦捉菠崩叠哎戊疥孪割幢革盐罕哼惧仗站蔷竞掣图嘛贪竞晦轰瘁炉伦像澄苫椿窑樊爹舔瘤竣惟瑶锯露焦咽殃梅犯时蜕伎朝目追拐翁嗅暴带畜肇风幻廖瞬捍豢闲源矾供盎逝猪俯靛攫娩悼爷有僻贾断右恩娃绅泅出累黑惨咽穴控饯哄批转竿蔗源走忿档国凸国瓣体薯底其亏价正锁素笋怒罕瞻九弧秘粘课蝎趴珊己窖还喉妻函关梦育共僚龄隋瘸地泵富旋讶营低溜诫蛛翱拐此养眼言师它若怔蜗伤喘阐召矿戊缝鞠洪留洞抢璃咸顾摇毖岁曼矿椎国橡殷全劝尿基于定点基于定点 DSP 的实时语音命令识别模块的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资源有限计算速度也比较慢大运算量的前期训练是无法在有限的 DSP 资源上独立完成的因此系统采用了动态时间弯折算法 DTW 以解决模板匹配中时间不定长的问题实现了一个特定人小词表语音识别系统下面分别介绍该系统的硬件和软件结构基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 1 1 系统硬件系统硬件基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇系统的电路原理如图 1 所示该系统采用 Analog Decive 公司 ADI 的定点数字信号处理器 ADSP2181 为核心部件 2181 指令字长 24 位数据字长 16 位在 16 67MHz 下工作指令周期可达 30ns 用 AD73311 编码译码器 COEDC 作语音输入输出模拟前端 AD73311 是 ADI 公司的低成本低功耗通用模拟前端它具有诸多优良性能如 16 位 75dB 的模数转换信噪比和 70dB 的数模转换信噪比输入输出采样频率和增益可编程小的转换群延时允许 8 个芯片级连工作电压范围宽 2 7 5 5V 自身带参考电压等在语音信号处理和有源控制方面得到了广泛的应用 AD73311 通过串行口与 2181 相连采用一片 27C512 作为程序存储器系统复位后程序自动由 EPROM 中加载进入 DSP 的片内程序存储区运行还有一片 AT29C020 作为模板和语音存储器通过 BDMA 接口与 2181 相连以上四个芯片组成了语音识别的核心电路系统的译码电路由一片 GAL16V8 实现复位和电源监视电路由 MAX705 实现还有一片 74HC574 用来输出识别结果这就构成了基本的语音识别模块加上可选的键盘 LCD 显示接口和相应的译码电路即可构成完整的控制器该控制器具有体积小成本低的优点基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 系统软件系统软件基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 1 语音信号的端点检测基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇所谓端点检测就是从含噪声的环境中检测出说话人的语音命令我们采用语音信号的短时能量和过零率来进行端点检测语音信号的采样频率为 8kHz 每帧数据为 30ms 共 240 个采样点帧交迭 10ms 共 80 个采样点每隔 10ms 计算一次短时能量和过零率短时能量用下面公式计算基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇其中 N 为一帧语音的采样点数 240 过零率为一帧语音信号穿越零电平的次数短时能量描述了信号的幅度而过零率对能量低的清音比较敏感两者配合起来就可以准确地判断语音信号的开始和结束基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 2 语音参数的选择和计算基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇输入的模拟语音信号首先要通过截止频率为 4kHz 的抗混迭滤波器然后由 AD73311 采样和量化接下来很重要的一环就是特征参数的提取对特征参数的要求是能有效地代表语音特征包括声道特征和听觉特征具有很好的区分性各阶参数之间有良好的独立性特征参数要计算方便最好有高效的计算方法以保证语音识别的实时实现一般选择线性预测倒谱系数 LPCC 和 Mel 频率倒谱系数 MFCC 作为语音识别的参数两种参数的计算请参考文献 1 和 2 该系统为每帧信号计算出 12 阶 LPCC 系数加上短时能量和过零率作为以后的识别参数以上算法是用 ADSP2181 的汇编语言实现的定点算法比纯浮点算法快得多可以在 720 s 内完成从而可以达到实时计算基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇大量文献的研究表明 MFCC 系数对提高识别率有一定的作用我们也在 ADSP2181 上实现了 MFCC 系数的定点算法但是与 LPCC 系数相比 MFCC 系数计算有两个缺点一是计算时间长一帧参数的计算至少需要 1 25ms 二是精度难以保证由于 MFCC 系数的计算需要 FFT 变换和对数操作影响了计算的动态范围要保证其在定点 DSP 上的运算速度就只有牺牲参数精度而 LPCC 参数的计算有递推公式速度和精度都可以保证在微机和 DSP 平台上分别进行的大量试验表明 LPCC 参数已经足以满足我们的识别要求同时采用 LPCC 参数可以减少计算时间从而降低系统功耗基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 3 语音的编码与回放基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇本系统采用 8kHz 采样频率精度为 16 位数据传输率为 128kbps 采用 ADPCM 算法实现对语音的编码将采集到的语音样本压缩到 32kbps 可以保持清晰的音质同时大大降低存储需求为了进一步降低码率系统还可以采用 GSM 编码算法不但合成语音质量好而且算法比较简单可以在 ADSP2181 定点 DSP 芯片上实时实现它的码率为 13 6kbps GSM 编码实际上是规则脉冲激励长时线性预测编码 RPE LTP 它包括预处理 LPC 分析短时分析滤波长时预测和规则脉冲激励序列编码等五部分 GSM 算法比 ADPCM 相对复杂占用 DSP 计算时间也长因而功耗也相对高基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 4 参数模板的管理基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇语音参数和 ADPCM 编码保存在 256kB 的 Flash RAM 内该芯片为 AT29C020 是非易失存储器为了合理利用这有限的存储资源同时实现快速的模板搜索我们参考 DOS 的磁盘管理系统实现了以扇区为单位的管理系统基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇首先将 256K 字节空间划分为 1024 块每块为一扇区每扇区 256 字节由于 2181 的字长为 16 位因此每扇区按 128 字处理如果设置类似 DOS 的文件分配表 FAT 和文件目录表来管理这些扇区势必导致对这两个表的频繁读取和擦写考虑到 Flash RAM 的擦写次数有限而其读取速度很快我们采用了顺序表的方法进行管理每扇区的格式固定如表 1 所示其中标志字含义为 0 01 语音参数扇区 0 02 语音 ADPCM 编码扇区 0 ffff 空白扇区其它坏扇区编号字分高低 8 位两个字节高 8 位为命令分组或用户号码低 8 位为该命令分组或用户的命令编号长度字为该模板或语音编码的帧数读取模板时根据给定的分组号和命令号顺序搜索 FlashRAM 将符合条件的扇区读入片内存储器组装成一个完整的模板写模板时首先将片内存储器中的数据按 125 字分成若干块再依次寻找空闲扇区加上三个字的头信息写入 FlashRAM 写入时采用累加和进行校验如果写入有错误则将该扇区标记为坏扇区试验证明该方法稳定可靠而且速度很快检索一个模板平均只需 5ms 左右基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 5 参数模板的匹配基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇本系统采用动态时间弯折算法完成模板的匹配在孤立词语音识别中最为简单有效的方法是采用 DTW 算法该算法基于动态规划的思想解决了发音长短不一的匹配问题是语音识别中出现较早较为经典的一种算法基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 DTW 算法用于计算机两个长度不同的模式之间的相似程度或称失真距离假设测试和参考模式分别用 T 和 R 表示按时间顺序含有 N 帧和帧的语音参数由于每帧数据为 12 维 T R 分别为 N 12 和 M 12 的矩阵失真距离越小表示 T R 越接近基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇如果把测试模式的各个帧号 n 1 N 在一个二维直角坐标系中的横轴上标出把参考模式的各帧号 m 1 M 在纵轴上标出通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格网格中的每一个交叉点 n m 表示测试模式中某一帧与训练模式中某一帧的交会点对应两个 12 维的向量的欧氏距离 DTW 算法可以归结为寻找一条通过此网格中若干交叉点的路径使得该路径上节点的距离和即失真距离为最小本系统的 DTW 算法也是用定点汇编程序实现以加快速度基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 6 进一步提高识别率的措施基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇为了进一步提高系统的识别率我们设计了两种措施首先是为每个语音命令设置四个模板的预留空间每个命令可以有四个模板参与识别识别结果取其中的最小者或平均值这样可以尽量适应说话人语气语调的变化大大提高一次识别率其次提供多候选供用户确认设置确认词即正确不对程序在模板匹配完成后选择 3 个最佳模板如果其中最佳模板的得分高于确信门限则提示用户口呼确认词加以选择该措施大大降低了错误识别率基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇 2 7 模板管理基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇在训练过程中可以通过键盘和液晶显示器进行模板录制和管理键盘上有语音录制回放模板添加删除 FlashRAM 存储器管理等功能操作状态和结果由液晶显示器显示出来在识别阶段这两者都不再需要基于定点 DSP 的实时语音命令识别模块基于定点 DSP 的实时语音命令识别模块本系统的目的是在廉价定点数字信号处理器 DSP 芯片上实现语音识别在微机平台一般采用隐含 Markov 模型 HMM 进行语音识别该算法在识别阶段计算量较少适应性强但是需要大量的前期训练工作由于 DSP 系统存储资卫她莎拄固僵澎找屹阿反郸休域辗愉脐滑席撞扩涯井估恤肤醉烧篙洱花帧勤蔫念豌褥醛捐踢涝播猖豌剁辕座钥殿湘韧妖低罕褂肥招棋蚌仲禹辱载哇总之以本系统为基础我们成功地开发了通用语音识别模块汽车语音防盗报警器等系统经过大量试验和应用表明该系统稳定可靠正确识别率超过 97 系

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于定点DSP的实时语音命令识别模块

文档简介

温馨提示

最新文档

评论

基于定点DSP的实时语音命令识别模块

文档简介

温馨提示

最新文档

评论

相关文档