版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、科技广场2007.5基于凌阳单片机的嵌入式声控门锁的设计Design of Embedded Speech Recognition Lock Based on Sunplus Microcontroller徐春辉 Xu Chunhui(华东交通大学电气与电子工程学院, 南昌)(School of Electric and Electronic Eng., East China Jiaotong Uni., Nanchang)摘 要: 通过分析语音特征参数的特点和说话人识别的基本方法,以线性预测倒谱系数为特征参数提取算法以及隐马尔可 夫模型为建模算法, 利用凌阳单片机作硬件平台,实现了声控锁的语
2、音控制功能。实验结果表明, 系统性能稳定, 识别效果良 好。关键词: 凌阳单片机 ; 声控锁;声纹识别; 线性预测倒谱系数; 隐马尔可夫模型中图分类号:TN602文献标识码:B文章编号:1671-4792-(2007)5-0147-03Abstract: The features of voice- character parameters and fundamental speaker recognition methods are analyzed by using linear prediction cepstrum coefficient and hidden Markov model
3、 as modeling algorithms. The speech recognition control function is implemented by the hardware platform Sunplus MCU .The experimental results show that the designed system has high identity precision can achieve the request of safety- secrecy.Key words: Sunplus Microcontroller; Speech Recognition L
4、ock ;Voiceprint Recognition; Linear Prediction Cepstrum Coefficient(LPCC); Hidden Markov Model0 引言 随着人们生活水平的提高和安全意识的加强,锁具系统的可靠性变得越来越重要。传统的用钥匙开启的锁具已经不能满足人们的安全需求,各种新型锁具如磁性锁、密码锁、 指纹锁、IC 卡锁、激光锁、声控锁等相继出现,其中采用生 物识别技术的声控锁,由于其安全可靠使用方便受到了特别 的关注。生物识别技术是利用人体生物特征进行身份认证的一种 技术, 是目前公认的最为方便与安全的识别技术。由于每个 人的生物特征具有与其他
5、人不同的惟一性和在一定时期内不 变的稳定性,不易伪造和假冒,所以利用生物识别技术进行身 份认定,安全、准确、可靠。在生物识别领域中,声纹识别,也称为说话人识别,以其 独特的方便性、经济性和准确性等优势受到世人瞩目, 并日 益成为人们日常生活和工作中重要且普遍的安全认证方式。 声纹识别是一种根据说话人语音波形中反映说话人生理和行 为特征的语音参数, 自动识别说话人身份的技术。本文介绍的声控门锁是一种在凌阳 1 6 位单片机 SPCE061A 上实现的与文本有关的说话人确认系统。该系统 主要由: 说话人识别模块、门锁控制电磁执行机构以及门锁 等部分组成。在训练时, 说话人的声音通过麦克风进入说话人
6、语音信号采集前端电路, 由语音信号处理电路对采集的语 音信号进行特征化和语音处理, 提取说话人的个性特征参数 并进行存储, 形成说话人特征参数数据库。在识别时, 将待 识别语音与说话人特征参数数据库进行匹配, 通过输出电路 控制门锁电机, 最终实现对门锁的控制。1 算法设计 声控锁设计的难点是对算法的研究和算法的选择。说话人识别力求挖掘出包含在语音信号中的说话人的个性因素,强调不同人之间的个性差异。说话人识别的特征提取就是要舍去语义内容而保留个人特征信息。声音中所包含的个人特 征信息有两种: 一种是由声道长度、声带等先天性发音器官 的个人差别所产生的; 另一种是由方言、语调等后天性讲话 习惯产
7、生的。前者是以共振峰频率的高低、带宽的大小、平 均基频、频谱基本形状的频率等所表现的; 后者是以基频、 共振峰频率的时间波形、单词的时间长短所表现的。两种特 征分离并提取是困难的, 多采用同时兼有两者特征的特征参 数。1.1 算法选择的前提 应用声控锁的条件是: 声控锁针对小型公司或家庭,在人数较少的系统中使用; 外部环境较好; 针对的是 文本有关的说话人识别; 说话人声音时延性较差。其中条208件 对声控锁的设计是有利的,可提高系统设计的效 率。而条件将是系统识别和测试遇到的较大困难, 可通过 调整算法以及系统更新的方式解决。说话人识别包括两个阶段, 即训练和识别阶段,如图一 所示。在训练阶
8、段建立说话人的特征参数模型同时保存相应 的参数, 声控锁采用隐马尔可夫模型(Hidden Markov Model, HMM) 建立模型。在系统识别阶段是判断测试音是否与系统 内某个说话人的模型相匹配。系统的特征提取阶段所采用的 算法为线性预测倒谱系数( Linear Prediction Cepstrum Coefficient,LPCC) 。图一 说话人识别系统框图 1.2 特征参数提取声控锁中特征参数提取采用的是LPCC,LPCC 去掉了语音 产生过程中激励信息,主要反映声道响应,而且只需少量的 倒谱系数就能够较好地描述语音的共振峰特性。线性预测系 数( Linear Predictio
9、nCoefficient, LPC) 是识别特征 的重要来源, 但是在语音识别系统中, 很少直接使用 LPC, 而是由它推导出另一种参数即 LPCC,倒谱实际上是一种同态 信号处理方法。(1)线性预测系数对于一个 LPC 系统, 采样点的输出 s(n)可以用前面 p 个 样本的线性组合来表示,即:s(n)a1s(n-1)+a2s(n-2)+ +aps(n-p) (1) 其中 a1, a2, , ap 为常数, 即 LPC。若一个随机过程用一个 p 阶的全极点系统受白噪声 u(n)激励产生的输出来模 拟,则该系统的传递函数为(2)声道模型和辐射模型的级联就是 H(z),实际上是一个短 时稳定的时
10、变滤波器,但也是随着时间缓慢变化的,因此预 测的误差为:(3)使式(3)中En达到最小值,ak必定满足En/ai=0(i=1, 2, ,p),由此得到以ak为变量的线性方程组(4)其中 i=1, 2, ,P。 由此可解出其中的变量ak。(2)线性预测倒谱系数 将一帧中的语音信号s(n)=h(n)*i(n)处理为其倒谱c(n)的过程如图二所示。可以先用 DFT,采用 FFT 计算 s(n)的短 时傅里叶变换, 变换的结构使得在 B 点得到了声道冲激响应 和音源激励的傅里叶变换的乘积。再取这一乘积的幅度对 数,在 C 点就得到声道冲激响应和音源激励的傅里叶变换的 对数之和。最后对其进行逆傅里叶变换
11、,将在 D 点得到的信 号称为是 s(n)的倒谱 c(n),也称之为倒谱系数, 它是声道分 量的倒谱 h(n)和音源激励分量的倒谱 i(n)之和。图二倒谱系数实现框图联合 LPC 和 LPCC 的算法,可以得到 LPCC 的直接递推关系(5)这里 c0 实际上是直流分量, 反映频谱的能量, 其值大 小不影响频谱, 在系统中不使用, 不用计算其结果。cm 为LPCC 的待定系数, am 为所求得的 LPC。该系统的线性预测模 型选择的阶数 p 为 10, LPCC 的阶数 m 为 16, 根据式(5)可计 算每帧声音信号的 LPCC 参数。1.3 模型匹配方法HMM 是一种基于转移概率和输出概率
12、的随机模型, 它把 语音看成由可观察到的符号序列组成的随机过程, 符号序列 则是发声系统状态序列的输出。在使用 HMM 识别时, 为每个 说话人建立发声模型, 通过训练得到状态转移概率矩阵和符 号输出概率矩阵。识别时, 计算未知语音在状态转移过程中 的最大概率, 根据最大概率对应的模型进行判决。对于与文 本有关的说话人识别采用从左到右型 HMM, HMM 不需要时间 归整, 可节省判决时的计算时间和存储量。在语音识别时,若记模型ij 表示第 i 个人的第 j 个模型 ( i=1,2, ,n; j=1,2, ,m),观测序列是O,在训练阶段, 不 断地修正 ij 的 3 个参数矢量,使 P(O|
13、 ij)最大;在测试时, 对测试样本序列 O,计算所有使 P(O| ij)(i=1,2, ,n;j=1, 2, ,m)。那么,i=argMAX P(O| ij)就是测试结果。2 软硬件设计及系统实现 语音电子门锁系统的核心是说话人识别模块,包括按键输入、语音信号采集、语音信号处理、FLASH 存储扩展、扬 声器输出、驱动电路以及 LCD 模块等。说话人识别模块的原 理框图如图三所示,其核心为语音信号处理。本系统选用特 别适用于数字语音识别领域且具很高性价比的凌阳16位单片209基 于 凌 阳 单 片 机 的 嵌 入 式 声 控 门 锁 的 设 计科技广场2007.5机 SPCE061A 作为数
14、字信号处理器,并通过 SPCE061A 实现对误, 后者是接受假冒者而造成的错误, 二者与匹配阈值的设其他各组成部分的控制。定相关。匹配阈值的设定与语音锁系统的应用场合、功能侧重有关, 对于家庭、宾馆等门锁用户, 要求误识率尽可能低,甚至为零; 若用于公司员工考勤等同类功能, 就不能有太高的拒识率。表一是对以下每种情况各进行 100 次实时匹配的结果, 其中设定的阈值适合门锁用户。表一100 次实时匹配结果图三 系统硬件结构框图 软件设计是设计过程的关键, 系统软件由驱动程序和算法程序两部分组成。其中驱动程序较为简单,主要是利用识 别的结果驱动机电装置开启锁具。而算法程序也包括两个部 分: 建
15、模程序和识别程序,程序流程如图四、图五所示。图四建模程序流程图图五识别程序流程图3 实验结果分析 对于说话人确认系统, 表征其性能的最重要的两个参量是拒识率和误识率。前者是拒绝真实的说话人而造成的错由以上实验结果可知, 对于同一个人相同发音的拒识率 为 8%; 对于同一个人相似发音情况, 因为系统是对说话的 人进行判别, 对于这种情况, 无论拒绝或接受都是合理的; 对于同一个人不同发音和不同人发音的情况, 误识率为零。 使用录音机录音进行多次实验, 通过认证的次数为零。对于 门锁用户, 这个结果是十分理想的。4结束语基于 SPCE061A 构建的语音电子门锁系统具有成本低、 使用方便、保密性好等优点。经大量实验测试表明, 该系统 性能稳定,识别效果好。但是, 在环境噪声或干扰信号高于 语音信号时, 该系统将无法进行正确的语音识别, 在背景噪 声处理及其工程实现上还需进一步改进。参考文献1曾海涛说话人识别的研究与 DSP 实现D 西南 交通大学, 2006.2刘永红说话人识别系统的研究D 西安交通大 学,2003.3周星,王成友 基于矢量量化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广告公司设计师工作预案
- 工程机械保养与维护管理手册
- 体育综合实践活动方案
- 任何可能的紧急情况的处理措施和预案
- 储能锂电池租赁合同模板(2篇)
- 学校传染病疫情应急预案演练方案
- 基于物联网技术的智能家居自动化管理方案
- 羊肚菌采购协议书范文模板下载
- 老人去世兄弟房屋转让协议书范文
- 勘察阶段监理工作方案
- 五年级上册小数乘除口算练习400题及答案
- 二年级上册口算练习1000道
- 2024年广东新华发行集团股份有限公司招聘笔试参考题库含答案解析
- 中阮谱大全(24首)
- 师徒结对活动记录表
- 企业号运营方案
- 公安情报分析报告
- 探究初中政治教学中的跨学科融合
- 三废环保管理培训
- 冷库建设项目总结汇报
- 马工程《艺术学概论》课件-第一章
评论
0/150
提交评论