




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于ARM2103的语音识别系统设计,自动化与电气工程学院,主要内容,设计课题,学习语音识别的基础原理和方法,设计语音识别系统。基于ARM2103,设计硬件系统(能够采集声音,存储声音片段),编程语音识别算法的程序,能够识别简单的语音信号,如“前进”、“后退”、“停”等。并且进行实验,验证语音识别算法的有效性。,设计方案,(一)、语音识别系统的硬件设计 (二)、语音识别系统的软件设计,语音识别系统的硬件设计,按照设计要求,本设计课题的硬件系统包括声音采集系统、中央处理系统(ARM2103)与输出显示系统。设计中我们利用ARM2103上自带的4个LED灯来分别表示“前进”、“后退”“左转”“右转”四个指令。,硬件系统原理框图,声音采集系统,语音信号由麦克接收后,经过前置的两级放大电路将语音信号放大约100-200倍,才能变成ARM单片机可以检测到的电压信号,然后信号经过功率放大电路后连接到ARM的A/D转换端口进行语音信号采集。,语音信号放大电路,前置放大电路我们采用两级的LM324放大,通过改变C1、C2的值我们可以用来采集不同频率的语音信号。由于此放大电路是由单电源供电,我们使用R4-R7是为LM324提供了参考电压,使之可以工作在正常的范围内。R1、R2是输入电阻,最后的电阻为输出电阻。,功率放大电路,功率放大电路是用LM386组成的OTL功率放大电路,Rp1为音量调节电位器,C1为旁路电容,电位器Rp2和C2构成增益调节电路,Rp2越小,增益越大,最大增益为46Db,C3为滤波电容,滤掉电源的高频成分,R和C4串联组成校正网路,防止电路自激。C5为耦合电容,电源从6脚输入,2、4脚接地。,输出显示系统,语音信号与模版信号匹配后对输入的语音指令进行识别,我们我们利用ARM2103自带的LED灯显示指令是否被识别。显示电路采用了灌电流的方式来驱动发光二极管,由于微控制器LPC2103I/O口提供的灌电流大于其拉电流,采用此驱动方式可以保证LED发光。,语音识别系统的软件设计,软件系统设计主要包括语音信号预处理、特征提取与模板匹配三个方面。,软件系统流程图,语音识别流程,我们首先采集模板语音信号,采集后的语音信号经过预处理(预加重、分帧处理、窗化处理)后求取LPC系数,进而求取倒谱系数。 我们将模板信号保存到ARM2103处理器中,采用麦克风输入语音信号,输入的语音信号经过过零率判断其是否有效,有效后进行预处理求出倒谱系数,采用DTW算法进行模板匹配,进而控制LED灯的亮灭。,LPC系数求取公式:求出后对其求取对数功率谱。LPCC系数求取方法是对LPC系数的对数进行傅里叶反变换,或者使用声道系统的传递函数H(z)求取。,LPCC系数求取主要步骤,DTW算法是将时间规整与距离测度的计算结合在一起的一种非线性的规整技术,是把测试的矢量时间轴采用非线性算法与参考模板进行匹配,函数满足下列公式: DTW算法是采用局部最佳化处理自动寻找最近的路径,并且利用此路径将两个互相参考的特征矢量间的累积失真最小化。,DTW算法,主要程序,端点检测程序: 其中的zer为预设的过零率。首先循环的采集第一帧的100个采样点,当100个采样点中,有计算得到的过零率zerozer的时候即认为语音信号为有效值,开始采集并保存数据。其中的datai为存储数据的数组。,while(zero 6) ,主要程序,倒谱系数算法: 求取得到的倒普系数我们保存在a数组中,并且在程序的开始我们定义了全局变量vc_cepstral120=0;mf_cepstral120=0;mb_cepstral120=0;用来存储模板和识别信号的倒普系数。这样方便了我们后期程序对数组的调用。,for(i=0;i=cwnum;i+) for(j=0;j100;j+) finaldataj=uiali*100+j*Hanmingj;finaldataj=finaldataj/1000; for(l=0;l=Lp;l+) /计算 RpRl=0;for(j=0;j=99-l;j+) Rl=Rl+finaldataj*finaldataj+l; E0=R0;,for(j=1;j=Lp;j+) result=0; for(l=1;l=j-1;l+); result=result+(alfalj-1*R(j-l); if(Ej-1=0) Ej-1=1; kj=(Rj-result)/Ej-1/1000;alfajj=kj;for(l=1;l=j-1;l+)alfalj=alfalj-1-kj*alfaj-lj-1;Ej=(1-kj*kj)*Ej-1; for(j=1;j=Lp;j+) ai*Lp+j=alfajLp;,毕业设计结论,经过3个月的努力,我基本掌握了利用单片机ARM2103进行语音识别系统开发的主要步骤,基本掌握了语音信号的预处理、倒谱系数求取、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药物市场调研及分析能力试题及答案
- 激光技术的专利申请与保护策略试题及答案
- 战略分析笔试题目及答案
- 卫生管理证书及能力评估题及答案
- 患者发生脑疝试题及答案
- 目标明确2025年初级会计师试题及答案
- 药品使用与经济性的关系探讨试题及答案
- 药学研究方法论试题及答案
- 药物质量标准的检查试题及答案
- 电梯营销考试题及答案
- 《初中生物实验教学的创新与实践》
- 控制计划课件教材-2024年
- 期中检测卷(试题)-2023-2024学年人教PEP版英语六年级下册
- 共同办展会合作协议书范文范本
- 《如何有效组织幼儿开展体能大循环活动》课件
- 市政夜景亮化施工方案
- 浙教版高中信息技术必修2 1.1“信息技术与信息系统”教学设计(PDF版)
- 第19课+资本主义国家的新变化+教学设计 高一下学期统编版(2019)必修中外历史纲要下
- 医学课件慢性胰腺炎2
- CMOS光电图像传感器课件
- 基于BOPPPS模型的微观经济学网课教学设计探析-以市场结构理论的教学为例
评论
0/150
提交评论