智能门卫系统_第1页
智能门卫系统_第2页
智能门卫系统_第3页
智能门卫系统_第4页
智能门卫系统_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、摘要:该智能门卫系统采用语音识别技术,在陵阳单片机SPCE061A上实现。硬件部分主要由SPCE061A 单片机、电源与门控电路、外扩存储器SPR4096、音频输入与输出电路等组成。主要技术是该单片机在语 音识别中的应用和对门控电路的设计。该系统软件部分由语音训练模块、语音识别模块、语音数据处理模 块、语音播报模块和密码输入与确认模块组成,通过对系统的初始化和识别训练实现了语音数据的采集、 特征提取、特定语音识别和语音播放等功能。根据语音识别算法原理,对语音信号的预处理、特征提取、 模式匹配做了分析。该系统实验结果表明,系统性能稳定,识别效果好,可用于家庭或小型办公场所的门 锁控制。关键词:语

2、音识别、门控系统、线性预测、特征提取、模式匹配引言当前智能型门卫系统中利用的识别技术有很多种,其中基于特定人的身份识别的技术也有很多,但相对于 其他技术,语音识别技术是目前公认的比较方便与安全的识别技术之一,该技术是利用人体生物特征进行 身份认证的一种技术。由于每个人的生物特征与其他人相比具有不同的唯一性和在一定时期内不变的稳定 性,因此不易伪造和假冒,所以利用语音识别技术进行身份认证,安全、准确、可靠。1语音识别的分类由于语音识别的目的和作用不同,识别又分为说话人识别和语音识别。其中说话人识别,可分为与文本有关和与文本无关两类。与文本有关的语音识别系统要求用户按照规定的 内容发音,每个人的语

3、音模型逐个被精确地建立,而识别时也必须按规定的内容发音,因此可以达到较好 的识别效果;而与文本无关的识别系统则不规定说话人的发音内容,模型建立相对困难,但用户使用方便, 应用范围较宽。从用途上看,可分为说话人识别和说话人确认。前者判定某一待识别的声音是多个话者中 的一个,是多选一的问题,属于闭集识别范围。后者判定一个待识别的声音“是或不是”某一特定说话者的 语音,其输出只有两种结果,为肯定或否定的问题1。该系统的核心处理器是陵阳16位单片机SPCE061A,并在其上实现与文本有关的说话人的确认,然后执行 相应的命令与操作。该系统主要由说话人识别模块、门锁控制电机以及门锁等部分组成。在训练时,说

4、话 人的声音通过麦克风进入说话人语音信号采集前端电路,由语音信号处理电路对采集的语音信号进行特征 化和语音处理,提取说话人的个性特征参数并进行存储,形成说话人特征参数数据库。在识别时,将待识 别语音与说话人特征参数数据库进行匹配,通过输出电路控制门控电机,最终实现对门锁的控制。本系统的硬件部分由单片机SPCE061A、音频输出电路、音频输入电路、语音识别电路、门锁控制电路、 FLASH电路和按键电路等部分组成。系统框图如图1所示。硬件系统主要完成的任务是将语音信号数字化, 实现语音数据的采集、上传、保存、识别及播放。SPR409677麦克风:陵阳十六位. 单片机 SPCE061A无忧电子开发网

5、W V.1 W -U J-JVJ_ 口 l_- UJIL开美电路控制电机门锁喇叭键盘图1系统硬件框图2硬件系统设计2.1 CPU核心电路SPCE061A高性能16位单片机的工作电压范围为2.65.5V,系统工作频率为0.37549.152MHz。在片 内集成有32位可编程的多功能I/O端口、两个16位定时器/计数器、7通道10位电压模-数转换器 (ADC)、自动增益控制功能的麦克风输入方式、双通道10位DAC方式的音频输出功能及看门狗定时器。 中断控制器可处理3种FIQ中断和11种IRQ中断,以及一个由指令BREAK控制的软中断。提供丰富的 C函数库和语音处理函数库,因此非常适合数字声音和语音

6、识别产品的开发。使得设计电路简单化,大大 降低了硬件成本。2.2语音识别电路语音识别电路的工作原理是智能系统在提取语音后,对语音信号进行分析,首先是噪音的滤除和预加重, 然后语音信号经过滤波器组进行信号的选择,提取有用信号,通过PARCOR系数、线性预测系数、过零次 数和能量性关函数等的计算匹配对信号进行处理选择。语音信号在进行分析处理后与语音库(即字典)里 的语音量进行模式匹配,最后根据匹配的结果输出语音识别结果。语音识别电路的基本结构如图2所示。图2语音识别电路框图3语音信号处理语音信号处理过程的总体结构框架图,如图3所示。存储语菖输入识别结果语音输出参考模版库com 训练模式匹配*存储语

7、菖输入识别结果语音输出参考模版库com 训练模式匹配*压缩处理解压缩处理图3语音信号处理过程结构图从总体结构图可以看出:首先对输入的语音信号要进行预处理,对信号进行适当的放大,并进行反混叠滤 波来消除工频干扰;然后为方便数字化设备对信号进行计算处理则对信号进行数字化,将模拟信号转化为 数字信号;接着进行特征提取,用反映语音信号特点的若干参数来代表语音,最后根据任务的不同,采用 不同的处理方法。语音识别分为两个阶段:训练阶段和识别阶段。在训练阶段对用特征参数形式表示的语 音信号进行相应的处理,获得表示识别基本单元共性特点的标准数据,以此形成参考模板,将所有能识别 的基本单元的参考模板结合在一起,

8、形成参考模板库;在识别阶段将待识别的语音经过特征提取后逐一与 参考模板比较,找出最相似的参考模板所对应的发音,即为识别结果43.1语音信号预处理噪声的存在对语音信号的处理和识别存在着严重的干扰,因此我们在处理前先要进行噪声的处理。对麦克 风输入的模拟语音信号要进行采样和量化,获得数字化的语音信号。在语音信号数字化之前,要进行防混 叠滤波及防工频干扰。其中防混叠滤波是滤除高于1/2采样频率的信号成分或噪声,使信号带宽限制在某 个范围内。得到干净的语音信号后并通过预加重技术滤除低频干扰,尤其是50Hz或60Hz的工频干扰,提 升语音信号的高频部分,而且它还可以起到消除直流漂移、抑制随机噪声和提升清

9、音部分能量的作用。3.2 特征提取本系统采用了不同说话人的分散程度与各说话人自身的分散程度之间的对比值作为特征参数的评价方法。 其基本思想是:对同一说话人的一段语音提取一组特征参数,相当于把该段语音映射到多维空间上的一个 点。同一说话人的不同语音会在特征空间产生不同的点,其分布可用多变量概率密度函数来描述。对同一 个说话人的不相同单次的发音,这些点比较集中;而不同说话人的发音分布相距较远,则所选择的这组特 征参数就能够有效的描述说话人的个性特征。根据这一原则,对单个参数而言,可以取两种分布参数的方 差比(称为F比)作为有效的度量准则。F比反映了不同说话人的分散程度与各说话人自身的分散程度之 间

10、的对比关系。某一特征参数的F比越大,说明对于本特征,平均而言前者要大于后者。因此,说话人识 别系统中采用F比较大的,这样系统会得到较好的性能。3.3模式匹配目前针对各种特征参数提出的模式匹配方法的研究越来越深入。典型的方法有:矢量量化方法、高斯混合 模型方法、隐马尔可夫模型方法、动态时间规整(DTW)方法和人工神经网络方法。这些方法都有各自的 优点和缺点。其中DTW算法对于较长语音的识别,模版匹配运算量太大,但对短语音(有效语音长度低 于3s)的识别既简单又有效,而且并不比其他方法识别率低,特别适用于短语音、与文本有关的说话人识 别系统。本系统采用端点松弛两点的(DTW)算法,端点松弛引起的计

11、算量增加并不大,还可以放松对端 点检测的精度要求6。4实验结果对于使用者要确认该系统的实用性和稳定性,则表征系统性能的两个重要的参量是错误识别率和拒绝识别 率。前者是系统接受非使用者的语音信号而造成的错误,后者是系统拒绝使用者的语音信号而造成的错误, 二者与匹配阈值的设定相关。匹配阈值的设定与语音锁系统的功能侧重有关、应用场合,对于特意为家用 使用者设计的该智能系统而言,要求错误识别率和拒绝识别率尽可能低,甚至为零。表1是先用录音机对特定人的发音进行录音(发音的语调、语素和话音内容相同),然后用录音与特定人 真实发音在不同的距离范围内做40次比较。表1录音与特定人发音实时匹配结果发音分类次数人

12、与话筒距离特定人相同发音特定人录音发音特定人相似发音非特定人相同发音非特定人相似发音拒绝次数1m内3740364039接受次数1m内30401拒绝次数2m夕卜2537394040接受次数2m夕卜153100在实验结果中,使用录音机进行40次实验,非特定人通过认证的次数为零。对于使用该系统的家庭而言, 这个结果十分理想的。而当说话人与麦克风距离较远时,识别率有明显下降,主要是因为随着距离的增加, 有用的语音信号的能量与噪声能量的比值逐渐下降,使得在特征提取时发生失真,最终导致在模式匹配时 很难达到匹配要求。解决这一问题可以通过调整阈值来实现。5结论本文介绍的智能门控系统采用的是语音识别技术,即利

13、用语音控制智能系统来执行对门禁系统的操作,并 随语音的不同给予相应的语音回答与提示。语音识别与其他生物识别技术相比,不仅具有不会遗失和忘记、 不需记忆、使用方便等优点,而且还具有用户接受程度高,声音输入设备造价低廉等优点。由于涉及不到 用户的隐私问题,所以可以方便的推广应用。实验测试表明,该系统性能稳定、识别效果好。本文作者创新点:将陵阳单片机的语音处理技术用于门控系统,拓展了单片机使用范围,丰富了语音识别 应用领域,为智能门控系统提供了一种新方法。参考文献韩吉庆,张磊,郑铁燃.语音信号处理M.北京:清华大学出版社,2004俞铁城.语音识别的发展现状J.通信世界.2005,2:56赵世强,荆炳礼,赵满.凌阳16位单片机SPC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论