毕业设计(论文)答辩-基于ARM2103的语音识别系统设计_第1页
毕业设计(论文)答辩-基于ARM2103的语音识别系统设计_第2页
毕业设计(论文)答辩-基于ARM2103的语音识别系统设计_第3页
毕业设计(论文)答辩-基于ARM2103的语音识别系统设计_第4页
毕业设计(论文)答辩-基于ARM2103的语音识别系统设计_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于ARM2103的语音识别系统设计自动化与电气工程学院 主要内容 毕业设计课题1毕业设计方案2毕业设计结果3设计课题 学习语音识别的根底原理和方法,设计语音识别系统。基于ARM2103,设计硬件系统能够采集声音,存储声音片段,编程语音识别算法的程序,能够识别简单的语音信号,如“前进、“后退、“停等。并且进行实验,验证语音识别算法的有效性。 设计方案 一、语音识别系统的硬件设计 二、语音识别系统的软件设计 语音识别系统的硬件设计 按照设计要求,本设计课题的硬件系统包括声音采集系统、中央处理系统ARM2103与输出显示系统。设计中我们利用ARM2103上自带的4个LED灯来分别表示“前进、“后退

2、“左转“右转四个指令。 硬件系统原理框图 语音信号麦克风采集ARM2103处理5V电源放大电路LED灯亮灭声音采集系统 语音信号由麦克接收后,经过前置的两级放大电路将语音信号放大约100-200倍,才能变成ARM单片机可以检测到的电压信号,然后信号经过功率放大电路后连接到ARM的A/D转换端口进行语音信号采集。 语音信号放大电路 前置放大电路我们采用两级的LM324放大,通过改变C1、C2的值我们可以用来采集不同频率的语音信号。由于此放大电路是由单电源供电,我们使用R4-R7是为LM324提供了参考电压,使之可以工作在正常的范围内。R1、R2是输入电阻,最后的电阻为输出电阻。 功率放大电路 功

3、率放大电路是用LM386组成的OTL功率放大电路,Rp1为音量调节电位器,C1为旁路电容,电位器Rp2和C2构成增益调节电路,Rp2越小,增益越大,最大增益为46Db,C3为滤波电容,滤掉电源的高频成分,R和C4串联组成校正网路,防止电路自激。C5为耦合电容,电源从6脚输入,2、4脚接地。 输出显示系统 语音信号与模版信号匹配后对输入的语音指令进行识别,我们我们利用ARM2103自带的LED灯显示指令是否被识别。显示电路采用了灌电流的方式来驱动发光二极管,由于微控制器LPC2103I/O口提供的灌电流大于其拉电流,采用此驱动方式可以保证LED发光。 语音识别系统的软件设计 软件系统设计主要包括

4、语音信号预处理、特征提取与模板匹配三个方面。 软件系统流程图 语音采集是否有效预加重分帧处理窗化处理LPC系数DTW算法倒谱系数模板匹配动作输出语音识别流程 我们首先采集模板语音信号,采集后的语音信号经过预处理预加重、分帧处理、窗化处理后求取LPC系数,进而求取倒谱系数。 我们将模板信号保存到ARM2103处理器中,采用麦克风输入语音信号,输入的语音信号经过过零率判断其是否有效,有效后进行预处理求出倒谱系数,采用DTW算法进行模板匹配,进而控制LED灯的亮灭。 LPC系数求取公式:求出后对其求取对数功率谱。LPCC系数求取方法是对LPC系数的对数进行傅里叶反变换,或者使用声道系统的传递函数H(

5、z)求取。 LPCC系数求取主要步骤 DTW算法是将时间规整与距离测度的计算结合在一起的一种非线性的规整技术,是把测试的矢量时间轴采用非线性算法与参考模板进行匹配,函数满足以下公式: DTW算法是采用局部最正确化处理自动寻找最近的路径,并且利用此路径将两个互相参考的特征矢量间的累积失真最小化。 DTW算法主要程序端点检测程序: 其中的zer为预设的过零率。首先循环的采集第一帧的100个采样点,当100个采样点中,有计算得到的过零率zerozer的时候即认为语音信号为有效值,开始采集并保存数据。其中的datai为存储数据的数组。 while(zerozre) zero=0; for(i=0;i1

6、00;i+) AD0CR |= (1 24); while (AD0STAT & 0 x01) = 0); /* 读取AD0STAT的通道0的Done */ AD0CR |= (1 6) & 0 x3FF; datai=temp; if(i0)n=(Abs(Sgn(datai)-Sgn(datai-1)/2; /*过零率计算 */ zero=zero+n; 主要程序倒谱系数算法: 求取得到的倒普系数我们保存在a数组中,并且在程序的开始我们定义了全局变量vc_cepstral120=0;mf_cepstral120=0;mb_cepstral120=0;用来存储模板和识别信号的倒普系数。这样方便

7、了我们后期程序对数组的调用。 for(i=0;i=cwnum;i+) for(j=0;j100;j+) finaldataj=uiali*100+j*Hanmingj;finaldataj=finaldataj/1000; for(l=0;l=Lp;l+) /计算 RpRl=0;for(j=0;j=99-l;j+) Rl=Rl+finaldataj*finaldataj+l; E0=R0; for(j=1;j=Lp;j+) result=0; for(l=1;l=j-1;l+); result=result+(alfalj-1*R(j-l); if(Ej-1=0) Ej-1=1; kj=(Rj-result)/Ej-1/1000;alfajj=kj;for(l=1;l=j-1;l+)alfalj=alfalj-1-kj*alfaj-lj-1;Ej=(1-kj*kj)*Ej-1; for(j=1;j=Lp;j+) ai*Lp+j=alfajLp;毕业设计结论 经过3个月的努力,我根本掌握了利用单片机ARM2103进行语音识别系统开发的主要步骤,根本掌握了语

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论