




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、dsp课程设计实验报告 语音压缩、存储和回放指导教师:实验课程:dsp课程设计 实验名称:语音压缩、存储和回放 小组成员:自动化0605班 自动化0605班 目录一、 概述.3二、 算法原理及硬件要求 .4三、 程序及说明.11四、 程序的调试及结果.18五、 总结.20六、 参考文献.21一 概述语音压缩、存储和回放语音信号是信息的重要形式, 语音信号处理有着广泛的应用领域,而语音压缩在语音信号的传输、存储等方面有非常广泛的作用,而且在通信领域中已经有较成熟的发展和广泛应用。本设计要求采用dsp及其a/d、d/a转换器进行语音信号的压缩、存储和回放。1.设计要求及目标基本部分:(1)使用ds
2、p实现语音压缩和解压缩的基本算法,算法类型自定,例如可以采用g.711、g.729等语音压缩算法。(2)采用a/d转换器从mic输入口实时采集语音信号,进行压缩后存储到dsp的片内和片外ram存储器中,存储时间不小于10秒。(3)存储器存满之后,使用dsp进行实时解压缩,并从speaker输出口进行回放输出。(4)使用指示灯对语音存储和回放过程进行指示。发挥部分:使用多种算法进行语音的压缩、存储和解压缩,比较它们之间的优缺点。2.设计思路 语音信号的幅度(发音强度)并非均匀分布,由于小信号占的比例比大信号大很多,因此可以进行非均匀量化。达到这一目标的基本做法是,对大信号使用大的量化间隔,而小信
3、号则使用小的台阶。itu-t g.711建议的pcm a律和律语音压缩标准可以分别将13比特和14比特压缩为8比特,达到语音压缩的目的。3.设计内容1使用dsp实现语音压缩和解压缩的基本算法,算法类型采用g.711的a律压扩算法。2采用a/d转换器从mic输入口实时采集语音信号,进行压缩后存储到dsp的片内ram存储器中,存储时间约为10秒。3但采样数据达到规定次数后,使用dsp进行实时解压缩,并从speaker输出口进行回放输出。4使用dsk板的指示灯对语音存储和回放过程进行指示:循环闪烁:板子自检,程序开始led0亮:录音(10秒钟左右)led0灭:放音二 算法原理1实验原理分析如下:语音
4、信号的幅度并非均匀分布,由于小信号占的比例比大信号大得多,因此可以进行非均匀量化。达到这一目标的基本做法是,对大信号是用大的量化间隔,而小信号则是用小的量化间隔。itu-t g.711建议的pcma律a律语音压缩标准可以分别将13位和14位的线性语音压缩编码压缩为8位,达到语音压缩的目的。在主程序中通过a/d抽样量化,可以得到16位的线性编码,再由编码表通过16位线性编码,再由编码表通过软件计算得到8位a律编码。将8位的压缩结果存储到系统ram中进行缓存,根据抽样率、语音存储时间以及系统ram的容量设置语音存储缓冲区的大小,待采样达到一定次数后,将缓存区内的数据进行解压缩,然后输出到speak
5、er接口输出端。2相关理论知识准备:(1)dsk系统基本结构:5402 dsk主要包括100mhz vc5402 dsp,1个软件等待周期的64k字的外部sram存储器,256k字的flash存储器,内嵌的并口仿真器,模拟输入/输出音频接口,以及扩展板接口。其结构如下图:dsk的主要硬件资源包括:dsp主芯片1枚:100 mhz tms320vc5402 dspram 1枚:1个软件等待的64k16bit的sram(cy7c1021v33)flash 1枚:256k16bit 的 flash存储器(am39vf400a)接口2个:用于仿真的jtag测试总线控制器 和一个连接到pc机并口的主机端
6、接口hpi信号采集和输出端口:麦克风/耳机音频接口 下面分别介绍:adsp芯片dsk 支持tms320vc5402 dsp,工作频率可以高达100mhz,工作的内核电压为1.8v,i/o 电压为3.3vb外部数据存储器dsk提供了64字sram。可以使用的外部数据存储器的大小取决于drom 的设置。如果drom0,那么0x40000xffff(48k words)的空间是外部存储器(flash 或sram)。如果drom1,外部存储器只能使用0x40000xefff。是否可以访问板上或扩展板存储器取决于dmsel 控制寄存器位。如果dmsel0(缺省),那么可以使用板上的数据存储器。如果dms
7、el1,那么可以使用扩展板存储器,并且地址开始于0x8000。数据存储器空间资源也取决于mp/mc 状态。c外部程序存储器dsk提供了256k字的flash。外部程序存储器的可用大小取决于ovly 位的设置和mp/mc# 跳线的设置。如果 ovly位0 、mp/mc#0,那么程序存储器的空间0x00000xefff(60k words)映射到外部存储器,是flash 还是sram 决定于控制寄存器的flashenb 状态位。在上电状态,flashenb位置位是为了允许从flash 引导。然后软件清除此位,使具有1个等待状态的sram 使用这个相同的存储器空间。如果mp/mc = 1 并且 ov
8、ly = 0,那么0x00000xffff 空间是分配给外部存储器( flash 或sram )。使用 flash 存储器的情况下(flashenb=1),总线的速率为100mhz,访问flash需要7个等待状态。在sram 情况下(flashenb=0),总线速率为100mhz 时,访问sram需要1 个等待状态。如果mp/mc = 1并且ovly = 1,则只有x40000xffff 是映射到外部存储器的。di/o空间存储器i/o空间由2部分组成,一部分是系统基于cpld的控制空间,另一部分是扩展板存储器空间。dm_sel位是外部存储器存取控制寄存器位,能够控制i/o空间的访问。如果dsp
9、向此位写1,那么扩展板存储器的i/o空间是不能被访问的。如果向此位写0,那么扩展板存储器的i/o空间可以被访问。 e模拟输入/输出音频接口音频接口使用了2 个标准的3.5mm 的连接器:一个连接麦克风(j5)的音频输入一个连接耳机(j6)的音频输出麦克风的输入信号最大允许标准是500mvp。在dsk上有10db前置放大器增益。当接入信号源的输入时,需要使用隔直电容(0.1u)。音频输入可以编程控制,在软件的控制下,可以提供0db、+6db、+12db的增益。音频输出也是可以编程控制的,在软件的控制下,可以提供0db、-6db、-12db的增益。dsk板上使用了ad50 codec作为a/d和d
10、/a的转换设备。它是内部集成了16位的a/d和d/a转换器以及抗混叠滤波器,采样速率最高可达22.05khz。 此外,adc之后有一个抽取滤波器以提高输入信号的信噪比,在dac之前有一个插值滤波器以保证输出信号平滑输出。 ad50与dsp芯片通过同步串行通信接口(mcbsp1)相连。(2)tlc320ad50c的内部结构及初始化程序tlc320ad50c是ti公司生产的一个sigma-delta型16位串行a/d、d/a转换电路。采样速率可通过dsp编程来设置,最高可达22.05 khz。内含抗混叠滤波器和重构滤波器。在dac之前有一个插值滤波器:保证输出信号平滑,在adc之后有一个抽取滤波器
11、:提高输入信号的信噪比a/d、d/a转换器的初始化编程:/* 获取设置a/d和d/a的句柄 */hhandset = codec_open(handset_codec);/* 设置codec的工作参数 */* dac和adc工作在15+1bit模式 */codec_dac_mode(hhandset, codec_dac_15bit); codec_adc_mode(hhandset, codec_adc_15bit);/* adc模拟增益设置为6db */ codec_ain_gain(hhandset, codec_ain_6db); /* 设置dac模拟输出增益为-6db */codec
12、_aout_gain(hhandset, codec_aout_minus_6db);/* 设置抽样频率为8khz */codec_sample_rate(hhandset,sr_8000);(3)mcbsp的结构及寄存器部分配置mcbsp:多通道缓冲串行口(multi-channel buffered serial port),是串行口的一种。它既可以利用dsp提供的dma功能实现自动缓存功能,又可以实现时分多路通信功能。tms320c5402有两个mcbsp串口,分别为mcbsp0、mcbsp1。mcbsp由引脚、接收发送部分、时钟及祯同步信号产生、多通道选择以及cpu中断信号和dma同步
13、信号组成。引脚中我们用到的只有两个: dr和dx,通过这两个引脚实现dsp与外部设备的通信和数据交换。dr用来接收数据,dx完成数据的发送。这两个引脚分别对应两个寄存器drr和dxr,如果准备就绪,从这两个寄存器中就可以读取数据了。(注:两个mcbsp串口,所以两个寄存器分别用drr1、dxr1、 drr2、dxr2表示)那么如何判断接收器和发送器是否准备就绪呢?这就采用了spcr1、spcr2控制位来判断。当rrdy=0时,接收器未就绪;当rrdy=1时,接受器就绪,可以从ddr1或2种读取数据。当xrdy=0时,发送器尚未就绪;当xrdy=1时,发送器就绪,可以从xdr1或2种发送数据。所
14、以在实际实验中我们采用以下语句命令:a接收数据时while (!mcbsp_rrdy(handset_codec) ; /查询、等待接收handset处的采样data = *(volatile u16*)drr1_addr(handset_codec); /从handset处读取采样b发送数据时while (!mcbsp_xrdy(handset_codec) ; *(volatile u16*)dxr1_addr(handset_codec) = data1;/a律解压完成后,dsp将数据通过串行口mcbsp1发送(4)均匀量化、非均匀量化如果采用相等的量化间隔对采样得到的信号作量化,那么这
15、种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如图2所示。均匀量化pcm就是直接对声音信号作a/d转换,在处理过程中没有利用声音信号的任何特性,也没有进行压缩。该方法将输入的声音信号的振幅范围分成个等份(b为量化位数),所以落入同一等份数的采样值都编码成相同的b位二进制码。只要采样频率足够大,量化位数也适当,便能获得较高的声音信号数字化效果。为了满足听觉上的效果,均匀量化pcm必须使用较多的量化位数。这样所记录和产生的音乐,可以达到最接近原声的效果。当然提高采样率及分辨率后,将引起储存数据空间的增大。 pcm的编码规律pcm: pulse code
16、modulation 脉冲编码调制,一般速率为64kbps,是指对语音信号直接采样量化的一种编码办法,采样速率为8000hz,每样点用8bit表示。cd 用16bit 44.1khz采样的pcm。 数字电话用的也是pcm,pcm是非线性编码,根据g.711建议,编码结束后需要做偶数位翻转。即如果编码后结果是 0110 1001 则在发送的时候需要经过偶数位翻转得到: 0011 1100 。pcm码的压缩分a律u律,在中国使用a律。pcm码有很多种,网络上主要有4种:manchester码,差分manchester码,ami码,hdb3码,2b1q码。分别用于以太网,isdn,ddn,电话。a律
17、压扩其特性可表示为: 很明显,小信号时为线性特性,大信号时近似为对数特性。这种压扩特性常把压缩、量化和编码合为一体。a律可用13段折线逼近(相当于a=87.6),便于用数字电路实现。13段折线的压缩特性如下图。过程为:第一步:把x(x0 部分)划分为不均匀的8段。第一分点取在v/2处,然后每段都是剩下部分的1/2。;依次取第八段为vv/2 第七段为v/2v/4;第一段为v/1280。第二步:把每段均匀划分为16等份,每一份表示一个量化级,显然8段共16x8=128= 个量化级,需要二进制7位编码表示。可以看出每个量化级是不均匀的。在小信号的量化台阶很小,使小信号时量化噪声减小。如果按均匀量化计
18、算,以最小台阶 为单位,最大信号需用l=128x16=2048= 个量化级表示,既需要11位编码。这样非均匀编码使小信号量化台阶缩小了16倍,相当于小信号信噪比改善了20db。第三步:把y轴均匀划分为8段,每段均匀分为16分。这样y也分为128个量化级,与x轴的128个量化级对应。因此,压扩特性各段的斜率 是不同的。第一段斜率 其他段为: 。以上分段为x取正值时的情况。而x取负值时,压扩特性与x取正值成奇对称。在正8段和负8段中,正1,2段和负1,2段斜率相同,合为一段。所以原来的16段折线变为13段折线。 表1(5)编译流程首先要掌握实验的编译流程,从而在其指导下进行实验。ac编译器(c c
19、ompiler)将c语言源程序自动地编译为c54x的汇编语言源程序。b汇编器(assembler)将汇编语言源文件汇编成机器语言coff目标文件。源文件中包括指令、汇编命令以及宏命令。c链接器(linker)把汇编生成的、可重新定位的coff目标模块组合成一个可执行的coff目标模块。当链接器生成可执行模块时,它要调整对符号的引用,并解决外部引用的问题。它也可以接受来自文档管理其中的目标文件,以及链接以前运行时所生成的输出模块。d文档管理器(archiver)将一组文件(源文件或目标文件)集中为一个文档文件库。汇编时,可以搜索宏文件库,并通过源文件中的宏命令来调用。也可以利用文档管理器,将一组
20、目标文件集中到一个目标文件库。通过文档管理器来替换、添加、删除和提取库文件。e助记符指令,将包含的助记符指令的汇编语言源文件转换成包含代数指令的汇编语言源文件。f建库实用程序。用来建立用户自己用的、c语言编写的支持运行的库函数。链接时,用rts.src中的源文件代码和rts.lib中的目标代码提供标准的支持运行的库函数。g十六进制转换程序,将coff目标文件转换成ti、intel等目标文件格式,可以下载到eprom编程器,以便对用户的eprom进行编程。h绝对列表程序将链接后的目标文件作为输入,生成.abs输出文件。对.abs文件汇编产生包含绝对地址的清单。如果没有绝对制表程序,所生成清单可能
21、是冗长的,并要求进行许多人工操作。i交叉引用制表程序利用目标文件生成一个交叉引用清单,列出所链 接的源文件中的符号以及它们的定义和引用情况。 图4三 程序及说明下面就是本程序设计的流程图:/*/* 头文件 */*/#include #include #include #include /*/* 变量宏定义 */*/#definesign_bit(0x80)/* sign bit for a a-law byte. */#definequant_mask(0xf)/* quantization field mask. */#definensegs(8) /* number of a-law se
22、gments. */#defineseg_shift(4) /* left shift for segment number. */#defineseg_mask(0x70)/* segment field mask. */*/* 函数声明 */*/void delay(s16 period);void led(s16 cnt);void initcodec(void);void flashenable(void);unsigned char data2alaw(s16 pcm_val);int alaw2data(unsigned chara_val);static int search(i
23、nt val,short*table,int size);/*/* 全局变量 */*/handle hhandset; /*codec句柄设置*/s16 data; /*定义有符号的整形变量,名字是data*/s16 data1; /*定义有符号的整形变量,名字是data1*/u16 i=0; /*定义无符号的整形变量并附值为0,名字是i*/u16 temp1; /*定义无符号的整形变量,名字是temp1*/u16 j=0; /*定义无符号的整形变量并附值为0,名字是j*/u16 k,l=0; /*定义两个无符号的整形变量并附值为0,名字是k和l*/u8 temp2; /*定义无符号的字符型变
24、量,名字是temp2*/u16 buffer15000;/*定义无符号的一维数组,名字是buffer,容量是15000*/static short seg_end8=0x1f,0x3f,0x7f,0xff,0x1ff,0x3ff,0x7ff,0xfff;/*/* 主函数 */*/void main() if (brd_init(100) /*dsk板初始化函数,将dsp主频设置为100mhz*/ return; led(2); /闪灯两次 initcodec(); /初始化codec flashenable(); /选择片外flash为片外存储器 /* delay(100); brd_led_
25、toggle(brd_led0); for(i=0x9000;i0xefff;i+) reg_write(i,*(volatile u16*)drr1_addr(handset_codec); delay(20); brd_led_toggle(brd_led1); delay(200); for(i=0x9000;i0xefff;i+) *(volatile u16*)dxr1_addr(handset_codec)=reg_read(i); delay(20); brd_led_toggle(brd_led2); */ while (1) while (!mcbsp_rrdy(handse
26、t_codec) ; /等待接收handset处的采样 data = *(volatile u16*)drr1_addr(handset_codec); /从handset处读取采样 temp1=data2alaw(data); /对采样进行a律压缩 /*/ /* 把低地址数据放在高八位 高地址数据放在低八位 */ /*/ i=i+1; if(i%2=1) bufferj=(temp1=30000) i=0; if(j=15000) j=0; brd_led_toggle(brd_led0); /熄灭数码管0 表示录音结束 delay(100); /延时100 brd_led_toggle(b
27、rd_led1); /点亮二极管1 表示放音开始 /*/ /* 放音部分 */ /*/ for(k=0;k8)&0x0ff; else temp2=bufferl&0x0ff; l+; if(l=15000) l=0; data1=alaw2data(temp2); while (!mcbsp_xrdy(handset_codec) ; *(volatile u16*)dxr1_addr(handset_codec) = data1; /*/ /* 放音结束 */ /*/ if(k=29999) brd_led_toggle(brd_led1); /熄灭二极管1 表示放音结束 delay(10
28、0); /延时100 brd_led_toggle(brd_led2); /点亮二极管2 表示程序结束 /主程序结束/*/ /* 子函数 */ /*/*延时*/void delay(s16 period) int i, j; for(i=0; iperiod; i+) for(j=0; j1; j+); /*闪灯*/void led(s16 cnt)while ( cnt- )brd_led_toggle(brd_led0);delay(1000);brd_led_toggle(brd_led1);delay(1000);brd_led_toggle(brd_led2);delay(1000)
29、;/*初始化codec*/void initcodec(void) /* open handset codec */ hhandset = codec_open(handset_codec); / 获得对编码器的处理 /* set codec parameters */ codec_dac_mode(hhandset, codec_dac_15bit); / dac 放在15-bit模式 codec_adc_mode(hhandset, codec_adc_15bit); / adc放在15-bit模式 codec_ain_gain(hhandset, codec_ain_6db); / 模拟
30、输入获得6db增益 codec_aout_gain(hhandset,codec_aout_minus_6db); /模拟输出获得-6db增益 codec_sample_rate(hhandset,sr_16000); / 设置16khz 取样率 /*设置flash*/void flashenable(void)cpld_ctrl2_reg|=0x0010;cpld_dmctrl_reg|=0x0040;/*a律压缩*/unsigned char data2alaw(s16 pcm_val) intmask;intseg;unsigned charaval;if (pcm_val = 0) m
31、ask = 0xd5; / 标记 (7th) bit = 1 else mask = 0x55; / 标记 bit = 0 pcm_val = -pcm_val;/ 将以测量的数量转换成分割数据. seg = search(pcm_val, seg_end, 8); / 链接信号,段和量子化数据 if (seg = 8) / 超出范围, 返回最大数. return (0x7f mask);else aval = seg seg_shift;if (seg 1) & quant_mask;elseaval |= (pcm_val seg) & quant_mask;return (aval ma
32、sk);/*总程序需要调用的子程序*/static int search(int val,short*table,int size)inti;for (i = 0; i size; i+) if (val = *table+)return (i);return (size);/*a律解压*/int alaw2data(unsigned chara_val)intt;intseg;a_val = 0x55; t = (a_val & quant_mask) seg_shift;if(seg=0) t += 8; t=(t3);if(seg0) t +=0x108; t=(t(4-seg);if(
33、seg3)t+=0x108;t=(t=(seg-4);return (a_val & sign_bit) ? t : -t);/*/* 结束 */*/四程序调试及结果1ccs程序调试运行:(1).编译程序之前的准备工作a头文件的添加,本实验中的具体路径为:c:tic5400dsk5402include,在build options选项中的preprocessor(预编译)选项中的include seach path中的路径应该与此路径一致,否则程序编译将报错,报错的原因是某些头文件无法找到。b还有就是library的库文件就需要自己从ti文件夹中寻找添加。(a)drv5402.lib是软件仿真
34、所用的仿真器所必需的库文件;(b)dsk5402.lib是驱动dsk板所必需的库文件;(c)rts.lib,这个库提供目标dsp运行时间支持。c添加.cmd文件(cmd文件描述见下面)。(2)选择project/rebuild all或单击(rebuild all)菜单条按钮,ccs重新进行编辑、汇编、连接工程里的所有文件。这个处理的有关信息在窗口底部一个小框里显示。(3)默认时,.out文件编译到位于当前工程文件夹中的调试(debug)目录中; 也可以通过ccs工具条选择一个存储目录。(4)选择file/load program.选中sound.out,并按open。(c:timyproje
35、ctssound1debug 文件夹中。)ccs将程序装载到目标dsp上,打开显示程序反汇编指令的disassembly窗口。(5)选择view/mixed source/asm,这样可以同时查看c源程序和产生的汇编代码。(6)在混合窗口单击汇编指令(单击有效指令,而不是指令的地址或指令所传递的区域),单击f1,ccs可以寻找此指令的帮助。这是学习指令的很好的方法。(7)选择debug/go main。从主程序开始执行。(8)选择debug/run或单击(run)按钮。(9)选择debug/ halt,退出程序运行。2结果分析编译运行结果如下图:图5编译运行无错误输入波形输出波形结论:编译调试过程到此就完毕了,实验的结果比较理想,基本满足实验的基本要求。我们采用a律压扩法,抽样频率为4000hz,符合奈奎斯特抽样定理(因为一般人的声音在303000hz,而正常的语音为1001100hz)。用人说话声和mp3分别进行实验,效果都比较理想,失真很小,录音时间也大概在10秒左右,符合所有的实验要求。五、总结从设计方案的提交开始,我们便着手准备这个实验。虽然后来由于考试的原因我们暂时地放下一阵,但我们所查找的资料以及所准备的内容在后来都是非常有用的。这个实验的基本思路是:利用codec对输入的语音数据进行采集,进行非均匀量化和a律压缩后存储到片内数据存储器(dar
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国空调用离心通风机市场调查研究报告
- 企业试用期个人总结
- 居住房产抵押典当合同范本
- 商店摊位出租合同范本
- 项目合作及利润分配协议书范本
- 初学者看图写话技巧及经典范文
- 急救医疗服务宣传策略范文
- 建筑工地交叉作业安全措施指南
- 小学一年级上册情绪管理教育计划
- 法律行业律师岗位职责与伦理
- 人教版(2025版)七年级下册英语UNIT 1 Animal Friends 单元整体教学设计(6个课时)
- 项目管理知识手册指南
- 全屋定制家居建议书可行性研究报告备案
- 2025年常熟市招聘进村人员历年高频重点提升(共500题)附带答案详解
- (主城一诊)重庆市2025年高2025届高三学业质量调研抽测 (第一次)物理试卷(含答案)
- 2025年中国电信集团有限公司招聘笔试参考题库含答案解析
- DB50T 393-2011 城市三维建模技术规范
- 《肺癌围手术期护理》课件
- 《糖尿病足护理查房》课件
- 山东省临沂市地图矢量课件模板()
- 2024复工复产安全培训
评论
0/150
提交评论