基于DSP的语音识别技术在宾馆客房中的应用_第1页
基于DSP的语音识别技术在宾馆客房中的应用_第2页
基于DSP的语音识别技术在宾馆客房中的应用_第3页
基于DSP的语音识别技术在宾馆客房中的应用_第4页
基于DSP的语音识别技术在宾馆客房中的应用_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、东北电力学院学报第25卷第2期Journal Of Northeast China Vol.25,No.2 2005年4月Institute Of Electric Pow er Engineering Apr.,2005文章编号:1005-2992(200502-0054-04基于DSP的语音识别技术在宾馆客房中的应用高芙楠,白雪,张文婷(东北电力学院信息工程系,吉林吉林132012摘要:结合人们对宾馆客房中电气设备应用的需求,提出一种用DSP实现的说话人识别系统,对客房中基本电气功能进行语音控制,从而将语音识别技术应用到宾馆客房控制中。关键词:语音识别;特征参数提取;宾馆;DSP(Digi

2、tal Signal Processing中图分类号:TN910文献标识码:A传统的宾馆客房门多采用钥匙或磁性门卡,这使得人们在外出时不得不多携带一把钥匙或是一张门卡,这对在外旅行的人造成了不大不小的麻烦;另外从市场的角度来看,存在这样的需求,当我们到一个陌生的客房时,完全不了解不熟悉它的电器控制开关的位置、对应关系及特点,给我们的旅途带来诸多的不便。宾馆客房的电气控制系统还有待于作进一步的人性化设计。语音识别是近二十几年发展起来的信息学科,特别是近十年来国内外竞相研究的热点。语音识别具有最自然、最快速、最方便等优点。始于二十世纪六十年代的语音识别研究,识别率有了很大的提高,基本可达实用水平。

3、但是因为语音识别的计算量非常大,难以实时实现,因此一直制约着它的应用。随着DSP和专用集成电路技术的发展,始语音识别尤其是计算量较小的说话人实时实现成为可能。宾馆客房采用语音电子门禁(语音识别技术,合法用户(经过注册可通过语音密码进入房间,然后可进行口述命令,控制室内电器的启动、调节和关闭等,而非法用户则被语音密码阻挡,无法进入客房。1客房语音服务方案可对客房进行的语音服务方案大致如下:a.运用语音识别技术对客房内的电器进行开关的控制;如控制电视、空调、床灯及其他的电器时,只需要呼叫相应的电器名字即可以改变它的开关状况;b.运用语音识别的语音确认的功能,对客房的临时主人进行身份登记确认,防止其

4、他外人进入客房和使用控制系统;c.语音的实时报时及趣味语音闹钟功能;您只需要开口问时间几点,系统将准确地把实时的时间通过语音方式告知;d.宾馆把最重要的服务信息,通过语音的方式储存在系统中,供客户进行语音的查询;储存的信息内容可以随时录入更改,信息播放采用语音唤醒功能。收稿日期:2005203206作者简介:高芙楠(1979-,女,东北电力学院信息工程系研究生,研究方向基于DSP技术语音信号处理.2语音识别系统目前,常用的语音识别方法有模版匹配法、随机模型法、人工神经网络法等。考虑到数据量、实时性及识别率的问题,本文采用基于矢量量化的隐马尔可夫模型(HMM 相结合的方法1。说话人识别系统主要由

5、预处理、语音特征参数的提取、训练、识别和后处理组成,系统图如下:图1说话人识别系统2.1预处理预处理主要是对输入的模拟语音数据作初步处理,使其适于后面的特征提取及识别。预处理主要有以下几步:A/D 转换、量化编码、反混叠处理、预加重、短时过零率等。2.2语音特征参数提取语音识别系统中的特征检测即提取语音信号中表征人的基本特征,此特征应能有效区分不同的说话人,且对同一说话人的变化保持相对稳定。考虑到特征的可量化性、训练样本的数量和系统性能的评价问题,目前的语音识别系统主要依靠较低层次的声学特征进行识别。说话人特征大体可归为下述几类:谱包络参数语音信息通过滤波器组输出,以合适的速率对滤波器输出抽样

6、,并将它们作为识别特征。基音轮廓、共振峰频率带宽及其轨迹这类特征是基于发声器官如声门、声道和鼻腔的生理结构而提取的参数。线性预测系数使用线性预测系数是语音信号处理中的一次飞跃,以线性预测导出的各种参数,如线性预测系数、自相关系数、反射系数、对数面积比、线性预测残差及其组合等参数,作为识别特征,可以得到较好的效果。主要原因是线性预测与声道参数模型是相符合的。反映听觉特性的参数模拟人耳对声音频率感知的特性而提出了多种参数,如倒谱系数、感知线性预测等。本系统在说话人识别中采用倒谱系数和基音周期参数,而在控制命令的语音识别中仅采用倒谱系数,倒谱系数采用线性预测倒谱系数(L PCC 2。对L PCC 参

7、数的提取,可采用协方差算法来求L PC 系数,然后求L PCC 参数。可定义R n (j =N -1n =0s (n s (n -j R n (j -i =N -1n =0s (n -j s (n -i 可用c (j ,i 来表示R n (j -i ,c (j ,i 即为s (n 的协方差。c (j ,i =R n (j -i =N -1n =0s (n -j s (n -i c (j ,0=P i =1i c (j ,i =0(1j P 矩阵表示形式如下:c (1,1c (1,2c (1,3c (1,P c (2,1c (2,2c (2,3c (2,P c (3,1c (3,2 c (3,3

8、c (3,P c (P ,1c (P ,2c (P ,3c (P ,P 123P =c (1,0c (2,0c (3,0c (P ,0求解矩阵方程可以用矩阵分解的Cholesky 法3进行,它可将协方差矩阵C 进行L U 分解,其中L 为55第2期高芙楠等:基于DSP 的语音识别技术在宾馆客房中的应用三角矩阵,U 为上三角阵。下图给出了协方差算法图解 :图2协方差算法图解基音周期估计的方法主要有基自相关函数的算法、基于求短时平均幅度差函数(AMDF 的算法、基于同态信号处理和线性预测编码的算法。本系统可采用自相关函数算法。设S W (n 是一段加窗语音信号,它的非零区间为n =0,1,N -1

9、。S W (n 的自相关函数称为语音信号的短时自相关函数,用R W (l 表示:R W (l =+n =-S W (n S W (n +l =N -l -1n =0S W (n S W (n +l R W (0=N -1n =0S 2W (n 短时自相关函数在R W (0处最大,且在基音周期的各个整数倍点上有很大的峰值,选择合适的窗函数与滤波器后,只要找到自相关函数的第一最大峰值点的位置并计算它与零点的距离,便能估计出基音周期。2.3训练训练单元的功能是把事先收集到的语音利用一定的算法为每一个待识别的说话人训练出与之相匹配的参数。考虑到宾馆客房服务的实际需要,此训练应主要针对语音电子门禁,因为

10、同一个房间可能同时住多个人,所以应为每个合法用户建立一个HMM 模型,同时采用基于矢量量化(VQ 的方法,为每个合法用户建立VQ 码本。考虑到房间内设施复杂,为尽可能减少训练事项(我们都不希望在宾馆住宿时还要进行繁琐的语音识别训练,所以应该把室内的语音控制系统设计为非特定人识别系统。2.4识别识别单元的功能是利用经训练已经获得的HMM 模型4参数和测得的说话人的基音周期在一定的判决条件下辨认出带识别的说话人并估计出待识别的控制命令词串。HMM 模型参数通常采用的判决条件是最大后验概率,用Viterbi 算法实现。3系统实现由于宾馆客房中的电气控制命令是有限的词条和数字串的组合,对这些语音命令的

11、识别属于特定人小词汇量的识别,不论是从目前的DSP 运算还是存储空间来说,实时实现这些语音命令的识别都是完全可能的。系统中采用TMS320VC54025。它是TI 公司生产的从属于TMS320C54x 系列的一个工作灵活、高速、具有较高性价比、低功耗的16b 定点通用DSP 芯片。其主要特点为:采用改进的哈佛结构,一条程序总线(PB ,三条数据总线(CB ,DB ,EB 和四条地址总线(PAB ,CAB ,DAB ,EAB ,带有专用硬件逻辑CPU (40b 算术逻辑单元AL U ,包括一个40b 桶形移位器和两个40b 累加器;一个17×17乘法器和一个40b 专用加法器,允许16

12、b 带或不带符号的乘法,片内存储器(八个辅助寄存器及一个软件栈,片内外专用的指令集,允许使用最先进的定点DSP C 语言编译器。A/D 芯片采用TLC320AD50C ,其中含有A/D 、D/A 、低通滤波器和采样保持电路。模拟语音信号主要通过传声器输入,A/D 转换后的数字语音数据以同步串行通信方式传送给DSP 。65东北电力学院学报第25卷用DSP 来完成对语音命令的识别,见图3。图3识别系统框图4小结语音识别技术的精度本身很难衡量,这主要因为很多因素的影响,包括:环境噪声、使用者的语音(受年龄、性别、口音、重音程度、健康、语音强度甚至一天中说话的时间、使用产品的用户的水平和垂直位置、声学

13、环境、麦克风类型、麦克风安装以及所使用的提示类型,所有这些都能影响识别性能,当在用户产品中设计语音识别时必须考虑这些因素。出于以上语音识别技术的特点考虑,应用在宾馆客房相对封闭安静的空间、使用者(成年人的声音稳定变化较小、电器类型基本不重复的环境中,完全可以实现高精度的语音识别效果.考文献1张军英.说话人识别的现代方法与技术M .西安:西北大学出版社,1994.2易克初等.语音信号处理M .北京:国防工业出版社,2000.5孙宗瀛,谢鸿琳.TMS320C54X DSP 原理设计与应用M .北京:清华大学出版社,2002.Application of Speech R ecognition T

14、echnology to G uest Room of H otelG AO Fu 2nan ,BAI Xue ,ZHANG Wen 2ting(Department of Computer Engineering ,Northeast China Institute of Electric Power Engineering ,Jilin City ,132012Abstract :To satisfy with the needs of electronic equipments application ,this paper puts forward a sort of speech recognition system based on DSP technology to control electric equipment in gu

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论