语音采集与回放_第1页
语音采集与回放_第2页
语音采集与回放_第3页
语音采集与回放_第4页
语音采集与回放_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 实验报告之 语音采集与回放作者:吴瑶 魏翠 袁文涛 赛前及文稿整理辅导老师:黄根春 摘要 本系统基本实现了语音信号的采集与回放。其主要结构由语音处理前向通道,A/D转换模块,单片机控制兼数据处理模块,D/A转换模块,键盘显示模块及后向处理通道组成,实现了语音的采集与回放功能。设计制作时使用了32K存储器和较高速A/D(AD574),并分别尝试了4K,8K的采样频率,效果不错,在PCM,DPCM,IV三种编码模式下,基本上都能较好的进行语音回放。整个制作过程,单片机控制处理程序简练,前后向处理通道效果良好,系统已具备较高的性能指标。 一:方案设计与论证顾名思义,语音采集与回放系统具有两个最基本

2、的功能:完整的采集原音数据和回放语音。采集数据主要由前向通道和A/D实现,前向通道将语音放大,滤波,然后送给AD采样,继而CPU读入数据并压缩存储;而语音回放主要是将前向采集的数据解压缩,然后送至DA及后向通道还原出语音信号。下面就对这些重要环节的设计方案做论证和比较。1:语音采集(1):语音信号放大:因为话筒采集的声音信号极为弱小,一般小于5mv,所以在AD采集之前要对小信号进行隔离放大。测量放大器具有高输入阻抗,高放大倍数,抗噪性能好,可以对小信号进行很好的隔离与放大,所以选择该种放大器来做语音信号前置放大的核心放大电路。(2):前向滤波:滤波要求通频带内平外陡。一般情况,巴特沃斯滤波器通

3、频带较为平坦,而采用多阶滤波可提高陡度。所以采用5阶巴特沃斯低通和5阶巴特沃斯高通级联,效果挺好。(3):数据采入:选择较高速AD采样芯片AD574作信号采样和转换处理,据奈奎斯特采样定理,系统分别采用了4K,8K的采样速率对语音信号进行采样。下面则对读取和压缩数据的设计方案作比较。 方案(一):使用CPLD或FPGA高速读入数据,继而在其内部进行压缩编码,不经过CPU直接送至存储器,而CPU只作一些控制功能。(用FPGA实现DMA功能) 方案(二):使用单片机作控制兼数据处理功能。也即CPU控制读入采样数据,继而自行进行数据压缩,放至存储器。 两种方案都可以较好的进行语音压缩编码。方案1速度

4、快,处理方便,可以作更多的算法处理,但价格昂贵,成本太高;方案2速度虽慢,但若使程序简练,算法精辟,速度可以达到要求,而且成本相对较低,故采用第二种方案。(4):数据压缩编码方式:采用常用的三种语音编码方式:即采即放PCM,插值IV,差分脉冲编码DPCM。2 语音回放 (1):输出已压缩语音:选择DAC0832作D/A转换处理,比0800控制方便。而CPU的数据解压缩,也有两种方案,同上,设计时选择单片机自行进行数据解码处理。(2):后向滤波:与前向滤波方案一致。(3):音频功放:人耳听到的语音功率不大,故选择常用的集成功放芯片LM386来驱动0.5W的扬声器,达到了不错的效果。二:系统各模块

5、的具体设计与实现系统组成及原理框图如图111所示。以下就各模块进行具体分析。 麦克风隔离放大器测量放大器AGC自动增益控制300Hz3.4kHz带通滤波器AD采样51单片机显示键盘RAM音频功放300Hz3.4kHz带通滤波器DA转换扬声器 (系统框图1-1-1)1:前向通道(1):小信号隔离放大的电路设计和实现:拾音器采集的信号极为弱小,且拾音器输出阻抗不可忽略,故放大前必须进行隔离,并尽量减小信号输出阻抗。本电路采用运放隔离电路,放大部分则分前置同向放大,测量放大及自增益控制放大电路。前置同向放大电路具有很高的输入阻抗,可以先将小信号进行适当放大,再用高抗噪的测量放大器进行大幅度放大,自增

6、益控制放大电路则是考虑到放大信号过大,以防A/D采样失真,并可以使声音变得圆润。又考虑到放大电路会引入直流分量,还会有偏零现象,故在整个放大电路的设计中必须加入耦合和调零电路。具体电路图分别如下: (前置隔离放大电路图1-1-2)这是隔离电路,4.7uf的电容和3M的电阻组成阻容耦合电路,并增大隔离器输入阻抗。同向放大器的运放在1,5调零端接入调零电路。我们取该放大器Av2;继而进入测量放大,见图(113) (测量放大电路1-1-3)该测量放大器同样采用了阻容耦合电路,前级的两个运放则是将输入信号进行双极性转换。进入测量放大器的信号线采用屏蔽导线。而两个1M的电阻则是使测放电路上下充分对称,降

7、低零点漂移,并提高共模抑制比。其中Av=1+2R/Rf,(该电路中,R27K取标称值,Rf为2K滑变),故Av=28。此时已将一般语音信号放大至1V左右。然后进入AGC控制放大电路,将信号峰峰值范围稳住,见图(1-1-4)。 (AGC控制放大电路1-1-4) 图中场效应管选用3DJ6F,N沟道,Vgs必须是负值。当Vgs由0向负向增大时,管子沟道变窄,导通电阻增大,放大倍数减小,否则反之;故在运放输出进行负向检波,得到负直流控制电压,两个3M的电阻则是使管子栅极电流小,并有高频扼流功能,47uf的电容也是去纹波。(2):前向滤波电路:选择巴特沃斯滤波器,5阶低通级联5阶高通,具体电路见图1-1

8、-5。 (图1-1-5) 滤波器参数选择:由5阶巴特沃斯函数极点可以算出其归一化滤波器的各元件参数:低通:R=47k;C1=1.75nf;C2=1.35 nf;C3=0.42 nf;C1=3.2 nf;C2=0.31 nf; 高通:C=0.01UF;R1=30.3K;R2=39.2K;R3=126;R1=16.4K;R2=171.8K; 2:中央处理模块 中央处理模块由AD,DA及单片机控制兼处理模块组成。(1):A/D芯片选择较高速12位AD芯片AD574,但由于单片机内部处理限制,只启动8位转换。其与单片机的接口采用标准接法,见图(1-1-6)。 (AD574采样电路1-1-6) (2):

9、D/A选用0832,方便控制,速度适中,性能良好。 接口图见(1-1-7):(DAC0832数模转换电路1-1-7) (3):单片机控制兼处理模块:采用89S52处理器构成单片机最小系统,扩展一片容量为32Kbyte的62256芯片作为语音存储介质,通过键盘选择如下几种编码解码方式。下面分别对各种方式进行阐述:1:压缩编码:有三种编码方式:即存即放PCM,差分脉冲DPCM,插值IV;PCM: 录音时,单片机采入AD转换的数据,随即存入RAM;放音时,单片机又将这些数据依次送入DA转换,可以很好的还原语音。DPCM: 差分脉冲编码调制。采用预测编码技术,从输入中减去预测值,然后对预测误差进行量化

10、,最终的编码就是预测值与实际值的差值 。解码器用以前的数据对当前样值进行预测,然后用误差编码重构原始样值。性能决定于预测编码的方法。DPCM系统是一个负反馈系统,采用这种结构可以避免量化误差的积累。在实际应用中,我们用四个Bit对差值进行量化编码,最高位作为符号位,0表示当前样本值大于预测值,1表示当前样本值小于预测值,剩下三位保存插值的量化绝对值。这种编码方式可以很好的还原原始语音信号,并且将录音时间延长到了8s,但是引入了少量噪音。DM:增量调制,也称调制。DM是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成0和1这两种可能的取值之一。这样每个byte可以用一个bit来表示

11、,压缩率达到8:1,录音时间延长到了32s。在增量调制编码中,量化阶的选择至关重要。过大,会引入严重的粒状失真;过小,会产生斜率过载,造成超越失真。根据AD采集的语音信号幅度的大小和实际的调试经验,取10可以得到最佳的语音还原。由于超越失真和粒状失真的存在,恢复的语音信号幅度明显没有其他几种编码方式大,并且当输入信号较平坦时,重构信号被一个周期性的方波信号污染,经分析认为是由粒状失真造成。在软件中采取适当措施,很好的抑制了污染。 IV:线性插值法。即使用4k/s对语音信号进行半采样,并且直接编码存储,重构时在两个实际值之间插入它们的平均值,用8k/s的速率播放。在实际调试中我们发现,取3个实际

12、值的平均值作为插入值效果更加理想。由于是半采样,所以对语音信号中的高频分量损失很大,在放音时有明显表现。 2:解压缩:由于压缩算法都是线性算法,故只需对压缩算法进行逆运算就可以对压缩编码进行解压缩。3:后向通道(1): 后向滤波:复制前向滤波器。(2):音频功放:选择一般集成功放芯片LM386。设计时在其传统接法上作了些改进,使男低音得到适当提升,并稍微抑制女高音,感觉效果较好。具体电路图如下:(功放电路1-1-8)三:系统调试根据方案设计的要求,调试过程分为三大部分:硬件调试、软件调试和软硬件联调。电路按模块调试,各个模块调试通过后再联调。1:硬件调试前级测量放大电路和AGC电路的调试是本系

13、统硬件调试的重点和难点,测量放大器具有很高的共模抑制比,调整其参数,使背景噪声得到有效的抑制;AGC电路根据输入信号的幅度自动调整增益的大小,使语音信号幅度平坦,限制在AD的最佳采集范围之内(-2V2V),使微弱信号和大信号都能得到有效的采集。使用AGC电路之后,系统的动态范围得到了很大的扩展,使得系统的语音采集范围达到了4米!2:软件调试程序全部由C语言编写,可实现编码模式选择、录放起止、暂停、停止、音量加减、快进、快退、反复播放等功能。人机交互采用161液晶显示器和44键盘,界面友好。本系统使用单片机内部定时器中断产生采样频率。即使定时器T0工作在可以自动赋初值的模式2状态,定时125us

14、,产生8K的采样频率。本软件设计的瓶颈在于,两次中断的时间间隔太短(125us),在这125us内,单片机要完成启动AD转换、等待转换结束、读取转换结果并对数据进行压缩存储。单片机的执行速度限制了压缩与解压算法的复杂程度,使我们只能选择最简单的算法,这直接影响到了恢复的语音信号的质量。本软件设计的另一个难点在于显示部分。由于LCD是慢速器件,执行一条指令需要多达100多个机器周期,在系统不断产生中断的情况下,实时显示录放信息(录放时间)成为很大困难。为了解决这个问题,我们尝试了在中断服务程序中添加显示指令,即当录放时间达一秒时,执行一次显示指令,在指定的显示位上显示当前秒数。为了节省时间,我们

15、抛弃了传统的刷屏显示套路,而是对光标进行精确定位,只对要显示的位进行操作,这样就大大的节省了CPU的等待时间。当然,在每一秒钟到来的时刻,执行显示指令会对采样频率造成影响,但是实际证明,这种影响几乎可以忽略不记。程序开始时设计了RAM检测程序,以保证RAM工作的可靠性。软件主体流程图如下:(图1-1-9)T0中断服务程序流程图如下:(图1-1-10)3:软硬联调本系统的软件和硬件联系非常紧密。在软件调试成功之后加入AD,DA电路,用信号源和示波器模拟前向通道和后向通道,直至DA输出波形与AD采集波形一致。最后加入前向放大系统、滤波系统、功放系统实现整机联调。四:系统性能测试1、 测试仪器:PC机(P4 1.8G,256M内存)、WAVE6000仿真机、SG1733SB3A直流稳压稳流电源、TDS1002数字示波器、33120A信号源及FLUKE17B数字万用表各一台。2、 测试过程:一名组员在离麦克风不同的距离上以同样的声音大小说话,分别换用不同的编码方式,对各种编码方式的最终放音效果进行了记录,如表111所示:编码方式采样速率(k/s)放音速率(k/s)录音时间(s)放音效果PCM884好DPCM888好ADM8832能听清楚插值法488能听清楚(表111)由表可见,在有限的存储空间下,PCM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论