2、外文参考资料及译文-杨敏_第1页
2、外文参考资料及译文-杨敏_第2页
2、外文参考资料及译文-杨敏_第3页
2、外文参考资料及译文-杨敏_第4页
2、外文参考资料及译文-杨敏_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、毕 业 设 计(论 文)外 文 参 考 资 料 及 译 文译文题目: 基于语音识别的智能门控系统设计 学生姓名: 杨 敏 学号: 0805110732 专业: 通信工程 所在学院: 信息技术学院 指导教师: 陈 美 君 职称: 高级工程师/副教授 2011年 12月 7 日说明:要求学生结合毕业设计(论文)课题参阅一篇以上的外文资料,并翻译至少一万印刷符(或译出3千汉字)以上的译文。译文原则上要求打印(如手写,一律用400字方格稿纸书写),连同学校提供的统一封面及英文原文装订,于毕业设计(论文)工作开始后2周内完成,作为成绩考核的一部分。13基于语音识别的智能门控系统设计崔波中国,唐山河北理工

2、大学信息学院邮箱:mikecui薛同泽中国,石家庄河北科技大学信息科学与工程学院邮箱:dianzixinxi摘要:该智能门控系统采用语音识别技术,在陵阳单片机SPCE061A上实现。硬件部分主要由SPCE061A单片机、电源与门控电路、外扩存储器SPR4096、音频输入与输出电路等组成。主要技术是该单片机在语音识别中的应用和对门控电路的设计。该系统软件部分由语音训练模块、语音识别模块、语音数据处理模块、语音播报模块和密码输入与确认模块组成,通过对系统的初始化和识别训练实现了语音数据的采集、特征提取、特定语音识别和语音播放等功能。根据语音识别算法原理,对语音信号的预处理、特征提取、模式匹配做了分

3、析。该系统实验结果表明,系统性能稳定,识别效果好,可用于家庭或小型办公场所的门锁控制。关键词: 访问控制、线性预测、语音识别、模式匹配、特征提取一、引言当前智能型门卫系统中利用的识别技术有很多种,其中基于特定人的身份识别的技术也有很多,但相对于其他技术,语音识别技术是目前公认的比较方便与安全的识别技术之一,该技术是利用人体生物特征进行身份认证的一种技术。由于每个人的生物特征与其他人相比具有不同的唯一性和在一定时期内不变的稳定性,因此不易伪造和假冒,所以利用语音识别技术进行身份认证,安全、准确、可靠。二、语音识别的分类由于语音识别的目的和作用不同,识别又分为说话人识别和语音识别。其中说话人识别,

4、可分为与文本有关和与文本无关两类。与文本有关的语音识别系统要求用户按照规定的内容发音,每个人的语音模型逐个被精确地建立,而识别时也必须按规定的内容发音,因此可以达到较好的识别效果;而与文本无关的识别系统则不规定说话人的发音内容,模型建立相对困难,但用户使用方便,应用范围较宽。从用途上看,可分为说话人识别和说话人确认。前者判定某一待识别的声音是多个话者中的一个,是多选一的问题,属于闭集识别范围。后者判定一个待识别的声音“是或不是”某一特定说话者的语音,其输出只有两种结果,为肯定或否定的问题。该系统的核心处理器是陵阳16位单片机SPCE061A,并在其上实现与文本有关的说话人的确认,然后执行相应的

5、命令与操作。该系统主要由说话人识别模块、门锁控制电机以及门锁等部分组成。在训练时,说话人的声音通过麦克风进入说话人语音信号采集前端电路,由语音信号处理电路对采集的语音信号进行特征化和语音处理,提取说话人的个性特征参数并进行存储,形成说话人特征参数数据库。在识别时,将待识别语音与说话人特征参数数据库进行匹配,通过输出电路控制门控电机,最终实现对门锁的控制。本系统的硬件部分由单片机SPCE061A、音频输出电路、音频输入电路、语音识别电路、门锁控制电路、FLASH电路和按键电路等部分组成。系统框图如图1所示。硬件系统主要完成的任务是将语音信号数字化,实现语音数据的采集、上传、保存、识别及播放。三、

6、硬件系统的设计(一)、CPU核心电路SPCE061A 高性能 16 位单片机的工作电压范围为 2.65.5V , 系统工作频率为 0.37549.152MHz。在片内集成有 32 位可编程的多功能 I/O 端口、两个 16 位定时器/计数器、7 通道10位电压模-数转换器(ADC)、自动增益控制功能的麦克风输入方式、双通道10位DAC方式的音频输出功能及看门狗定时器。中断控制器可处理3种 FIQ中断和 11种IRQ 中断,以及一个由指令BREAK控制的软中断。提供丰富的C函数库和语音处理函数库,因此非常适合数字声音和语音识别产品的开发。(二)、语音识别电路语音识别电路的工作原理是智能系统在提取

7、语音后,对语音信号进行分析,首先是噪音的滤除和预加重,然后语音信号经过滤波器组进行信号的选择,提取有用信号,通过PARCOR系数、线性预测系数、过零次数和能量性关函数等的计算匹配对信号进行处理选择。语音信号在进行分析处理后与语音库(即字典)里的语音量进行模式匹配,最后根据匹配的结果输出语音识别结果。语音识别电路的基本结构如图2所示。(三)、电源电路为了减少功率的消耗,单片机SPCE061A芯片采用低供电电压来实现。它有两个电源,一个是内部集成的电源VDD,另一个是通过I / O口供电的电源VDDH。I / O口供电电源的电压是5V,内部电源的电压则是3.3V。内部电源电压较低主要是为了减少功率

8、消耗和降低单片机的工作温度。虽然SPCE061A单片机的电压范围很广,芯片仍然能稳定运行,且能满足I / O端口电压,其外部供电电路如图3所示。220V的交流电压由稳压模块7805转化为直流电压5 V,再为语音识别模块和每一个内部I / O口提供电源。5 V的直流电压由TR1972-33转换成3.3 V的直流电压。四、语音信号的处理语音信号处理过程的总体结构框架图,如图4所示。从总体结构图可以看出:首先对输入的语音信号要进行预处理,对信号进行适当的放大,并进行反混叠滤波来消除工频干扰;然后为方便数字化设备对信号进行计算处理则对信号进行数字化,将模拟信号转化为数字信号;接着进行特征提取,用反映语

9、音信号特点的若干参数来代表语音,最后根据任务的不同,采用不同的处理方法。语音识别分为两个阶段:训练阶段和识别阶段。在训练阶段对用特征参数形式表示的语音信号进行相应的处理,获得表示识别基本单元共性特点的标准数据,以此形成参考模板,将所有能识别的基本单元的参考模板结合在一起,形成参考模板库。在识别阶段将待识别的语音经过特征提取后逐一与参考模板比较,找出最相似的参考模板所对应的发音,即为识别结果。(一)语音信号预处理噪声的存在对语音信号的处理和识别存在着严重的干扰,因此我们在处理前先要进行噪声的处理。对麦克风输入的模拟语音信号要进行采样和量化,获得数字化的语音信号。在语音信号数字化之前,要进行防混叠

10、滤波及防工频干扰。其中防混叠滤波是滤除高于1/2采样频率的信号成分或噪声,使信号带宽限制在某个范围内。得到干净的语音信号后并通过预加重技术滤除低频干扰,尤其是50Hz或60Hz的工频干扰,提升语音信号的高频部分,而且它还可以起到消除直流漂移、抑制随机噪声和提升清音部分能量的作用。(二)特征提取本系统采用了不同说话人的分散程度与各说话人自身的分散程度之间的对比值作为特征参数的评价方法。其基本思想是:对同一说话人的一段语音提取一组特征参数,相当于把该段语音映射到多维空间上的一个点。同一说话人的不同语音会在特征空间产生不同的点,其分布可用多变量概率密度函数来描述。对同一个说话人的不相同单次的发音,这

11、些点比较集中;而不同说话人的发音分布相距较远,则所选择的这组特征参数就能够有效的描述说话人的个性特征。根据这一原则,对单个参数而言,可以取两种分布参数的方差比(称为F比)作为有效的度量准则。F比反映了不同说话人的分散程度与各说话人自身的分散程度之间的对比关系。某一特征参数的F比越大,说明对于本特征,平均而言前者要大于后者。因此,说话人识别系统中采用F比较大的,这样系统会得到较好的性能。(三)模块匹配目前针对各种特征参数提出的模式匹配方法的研究越来越深入。典型的方法有:矢量量化方法、高斯混合模型方法、隐马尔可夫模型方法、动态时间规整(DTW)方法和人工神经网络方法。这些方法都有各自的优点和缺点。

12、其中DTW算法对于较长语音的识别,模版匹配运算量太大,但对短语音(有效语音长度低于3s)的识别既简单又有效,而且并不比其他方法识别率低,特别适用于短语音、与文本有关的说话人识别系统。本系统采用端点松弛两点的(DTW)算法,端点松弛引起的计算量增加并不大,还可以放松对端点检测的精度要求五、实验结果对于使用者要确认该系统的实用性和稳定性,则表征系统性能的两个重要的参量是错误识别率和拒绝识别率。前者是系统接受非使用者的语音信号而造成的错误,后者是系统拒绝使用者的语音信号而造成的错误,二者与匹配阈值的设定相关。匹配阈值的设定与语音锁系统的功能侧重有关、应用场合,对于特意为家用使用者设计的该智能系统而言

13、,要求错误识别率和拒绝识别率尽可能低,甚至为零。表1是先用录音机对特定人的发音进行录音(发音的语调、语素和话音内容相同),然后用录音与特定人真实发音在不同的距离范围内做40次比较。在实验结果中,使用录音机进行40次实验,非特定人通过认证的次数为零。对于使用该系统的家庭而言,这个结果十分理想的。而当说话人与麦克风距离较远时,识别率有明显下降,主要是因为随着距离的增加,有用的语音信号的能量与噪声能量的比值逐渐下降,使得在特征提取时发生失真,最终导致在模式匹配时很难达到匹配要求。解决这一问题可以通过调整阈值来实现。六、结论本文介绍的智能门控系统采用的是语音识别技术,即利用语音控制智能系统来执行对门禁

14、系统的操作,并随语音的不同给予相应的语音回答与提示。语音识别与其他生物识别技术相比,不仅具有不会遗失和忘记、不需记忆、使用方便等优点,而且还具有用户接受程度高,声音输入设备造价低廉等优点。由于涉及不到用户的隐私问题,所以可以方便的推广应用。实验测试表明,该系统性能稳定、识别效果好。本文作者创新点:将陵阳单片机的语音处理技术用于门控系统,拓展了单片机使用范围,丰富了语音识别应用领域,为智能门控系统提供了一种新方法。参考文献:1 韩吉庆张磊郑铁燃语音信号处理M 北京:清华大学出版社, 20042 俞铁城.语音识别的发展现状J通信世界,20052:563 赵世强荆炳礼赵满凌阳16位单片机SPCE061A的最小系统及开发J国外电子元器件,20035:37394 姜志玲用凌阳单片机实现多路数据采集与传输系统J西华大学学报:自然科学版,200524(2): 69725 罗俊光汤荣江基于DSP的非特定人语音识别系统J微计算机信息,2007 4-2:1951966 Mohamed AbouiianaOn line weight and shrinkage control of cotton kn-itsEB/OLhttp : /www.ntcre

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论