工学语音信号数字化及压缩编码_第1页
工学语音信号数字化及压缩编码_第2页
工学语音信号数字化及压缩编码_第3页
工学语音信号数字化及压缩编码_第4页
工学语音信号数字化及压缩编码_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/9/31第三讲语音信号数字化及压缩编码(2)

2023/9/32DPCM降低语音编码速率的必要性模拟单边带多路载波电话的带宽4K,而PCM的带宽的理论值为32K在频带受限的应用场合经济性太低,如卫星通信、移动通信等PCM占用高带宽的原因分析为满足语音信号的高动态范围而采用了多位的量化对每个采样点都进行量化,没有考虑语音信号的前后相关性2023/9/33预测编码的概念相邻样点之间可能只有一个量化间隔或少数个量化间隔的差别,PCM传送的信息存在冗余在编码前就去掉相关性很强的冗余,然后再进行编码传送预测编码,就是根据过去的信号样值预测下一个样值,并且把预测值与现实的采样值之差进行量化加以编码和传送在接收端,经过相同的预测和滤波,即可得到原始信号波形2023/9/34DPCM基本原理2023/9/35DPCM性能一般总是大于1,称为DPCM处理增益,其值主要取决于预测的效果由于量化的是样值与预测值的差值信号,因此动态范围可以减小,同时也可有效减小量化误差,从而使DPCM在较低的编码率下获得较高的信噪比质量需要研究的问题是:如何设计预测器获得更好的SNR零点预测器极点预测器最佳预测器2023/9/36极点预测器N阶预测器的输出是前N个本地重建值的线性组合由于H(Z)只有极点,称这种预测器为全极点预测器2023/9/37零点预测器M阶预测器的输出是前M个量化值的线性组合2023/9/38零极点预测器把零点预测器和极点预测器组合在一起,即构成零极点预测器2023/9/39最佳预测器确定一组最佳预测系数,使得最小在全极点模型下,并忽略量化误差最终输出的信噪比与预测阶数有关2023/9/310增量调制(,Delta-M)(1) 简单增量调制 可以认为是一位编码时的特例,但编码的是差值信号。编码过程2023/9/311Q[]数码形成Z-1C(n)S(n)e(n)-+Sl(n)解码增量调制编码器增量调制解码器2023/9/312差值信号2023/9/313译码过程实际编码译码器常用简单RC积分器和比较器来实现和2023/9/314(2) 斜率过载和量化信噪比当信号变化速率超出波形变化速率时,会出现斜率过载现象,以单频信号为例2023/9/3152023/9/316

量化噪声量化信噪比2023/9/317通常认为在内均匀分布,则低通滤波后2023/9/318临界过载时信噪比与信号幅度有关,信号幅度小,信噪比降低2023/9/319例:结论:①与三次方成正比,提高一倍,增大9②与成反比,信号频率提高一倍,下降62023/9/320简单增量调制的性能改进简单增量调制有两个问题:①斜率过载②动态范围2023/9/321(1). 数字压扩自适应增量调制可同时解决动态范围和斜率过载问题。基本概念:如同非均匀中那样,改变量化间隔△。如果连续出现多个“1”或者“0,即可认为信号有出现过载的可能,从而增大△,使其本地译码信号跟上变化。 如果量阶随信号瞬时压扩,则称为瞬时压扩,如果量 阶随语音音节时间间隔中信号的平均斜率变化而进行压 扩,则称为CVSD-连续可变斜率 {一音节=基音周期=(5~20)ms}2023/9/322(2). 增量总和调制可解决斜率过载问题其要点是:将信号先进行积分,改变其频率响应。使高频分量幅度下降(与预加重相反),然后再进行编码。为此,在接收端为了不失真恢复原信号,需要将解码后信号进行微分。2023/9/323信道误码对的影响对简单有2023/9/324例如:

抗误码性能优于概念上来看:个别误码不会引起信号严重恶化2023/9/325简单增量调制与PCM的性能比较抽样频率PCM系统的抽样频率8K

系统的抽样频率不能根据抽样定理来确定,而需要根据斜率过载条件以及信噪比来确定,一般情况下,为保证不发生斜率过载以及保证与PCM系统有相同的信噪比,的抽样频率将远高于PCM系统带宽PCM码速率64Kbit/s,带宽需求32K如要求与PCM有相同的传输质量,则要求抽样频率100K以上,带宽要求50K

一般速率为32Kbit/s或16Kbit/s,但质量不如PCM2023/9/326量化信噪比(比较单频正弦情况)抗信道误码性能优于PCM设备复杂度单路简单,多路PCM简单2023/9/327ADPCM采用自适应的必要性由于不同的讲话人的语音信号的特性各不相同语音信号只能认为是短时平稳采用固定的预测系数不可能对所有的语音信号获得最好的结果,因此有必要采取自适应的算法ADPCM的设计思路尽可能消除语音信号中的冗余对消除冗余后的信号进行有效的比特分配,从自适应角度进行最佳编码自适应的方法自适应量化自适应预测2023/9/328自适应量化针对被量化信号的变化状态,随时调节量化台阶大小以匹配输入信号的时变方差前向估值的自适应量化对输入信号尚未量化的样本计算出其前向估值大小需要缓存训练的样本,并传送相关的边信息,因此引入了编码延时和占用了一定的信道容量后向估值的自适应量化利用量化器的输出样本计算输出信号的方差估值并确定量化台阶没有延时,但影响估值的追踪速度2023/9/329自适应预测前向估值的自适应预测思路与前向估值量化一致,同样有编码延时及边信息传输等问题后向估值的自适应预测利用已量化的样本或发送数据更新预测系数2023/9/330信源编码信源编码的目的减少信源输出符号序列的冗余度,提高符号的平均信息量信源编码的主要方法针对信源输出的符号序列的统计特性,寻找一定的方法把信源输出序列符号变换为最短的码字序列,使每个码元所携带的平均信息量为最大,同时又尽可能保证无失真的恢复出原来的符号序列信源编码的核心就是研究压缩编码算法,用尽可能低的传输码率获得尽可能好的质量2023/9/331匹配编码根据编码对象出现的概率分配不同长度的代码,以保证总的代码长度最短需要知道信号的概率分布,可采用数学模型建模的方式或根据大量样本信号进行统计得到典型编码算法:Huffman编码预测编码利用信号之间的相关性,预测未来的信号,对预测的残差信号进行编码变换编码利用信号在不同的函数空间分布的不同,选择合适的函数将信号从一种信号空间变换到另一种有利于压缩编码的信号空间,再进行编码常用的函数变换:DFT、Walsh、DCT、Haar识别编码分解文字、语音、图象的基本特征,与汇集这些基本特征的样本集进行对照识别,选择失真最小的样本编码传送可用于印刷、打印等标准形状的文字、符号和数据的编码2023/9/332信源编码算法信源编码定理一个熵为H的信源,当信源速率为R时,只要R>H,则能够以任意小的错误概率进行编码;反之,如果R<H,则无论采用多么复杂的编码器和译码器,错误概率都不可能达到任意小Shannon在1948年证明了该定理,但并没有指出具体的编解码算法信源编码与失真度量编码失真原始信号x经过编码以及解码后恢复成x’,失真量即为x与x’之间的保真度或近似度的度量常用的失真度量:汉明失真、均方误差等以一定的、可以接受的失真换取较高的信源压缩效率2023/9/333语音与图像压缩编码类型带宽KHZ采样率KHZ比特/样点比特率kb/s电话语音0.3~3.481296宽带语音0.05~71614224调频广播0.02~

153216512CD光盘0.01~

2044.116705.6DAB/DAT0.01~

2048167682023/9/334类型格式分辨率帧频HZ比特/像素比特率Mb/s电视电话QCIF176×14429.97129.1会议电视CIF352×28829.971236.4常规电视ITU-R601720×5762516165.9HDTVITU-R7091920×11522516884.72023/9/335图像压缩编码图像压缩编码的必要性图像的数据量巨大,一般必须进行压缩编码图像压缩编码的依据图像信号在结构和统计上存在大量的冗余度结构冗余度:空间和时间上的强相关性统计冗余度:被编码信号概率分布的不均匀基于人眼的视觉特性人眼对某些失真较不敏感,察觉不到图像的某些细微变化图像压缩编码的评价压缩效率:压缩前后编码速率的比值压缩质量:恢复图像的质量编码算法的复杂度编解码延时图像编码采取的主要技术措施利用离散余弦变换,去除各象素点在空间域的相关性通过帧间预测差分编码,去除活动图像的时间相关性采用熵编码技术,使编码域信源的概率模型相匹配利用人眼的视觉特性,进行自适应量化编码通过缓冲存储器实现变长码输入与定长码输出之间的匹配,,,2023/9/336图像压缩编码方法2023/9/337图像压缩编码举例Huffman编码基本思想对出现概率较大的信源符号编以较短的代码,对出现概率较小的信源符号编以较长的代码JPEG、H.261、MPEG-1、MPEG-2中对量化后的DCT系数进行Huffman编码编码算法

1.初始化,根据符号概率的大小按由大到小顺序对符号进行排序;

2. 把概率最小的两个符号组成一个节点;

3. 重复步骤2,形成一棵“树”;

4. 从根节点开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。

5. 从根节点开始顺着树枝到每个叶子分别写出每个符号的代码2023/9/338编码特点霍夫曼码的码长虽然是可变的,但却不需要另外附加同步代码。如果事先编写出一本解释各种代码意义的“词典”,即码簿,那么就可以根据码簿一个码一个码地依次进行译码。霍夫曼码没有错误保护功能,如果码串中有错误,哪怕是1位出现错误,会出现错误传播(errorpropagation)。霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑2023/9/339预测变换编码利用图像信号的空间和时间冗余特性,用已知的相邻象素或图像块预测当前象素值,再对预测误差进行量化、编码和传输帧内预测编码,在一帧图像内进行预测,消除图像在空间的相关性帧间预测编码,在多幅图像之间进行预测,消除图像在时间域上的相关性关键在于预测算法的选取游程长度编码编码对象为信源符号在信息流中连续出现的长度,根据其出现概率的不同编成不同长度的码字常用于文件传真系统中2023/9/340StandardOrganizationVideoCodingStandardTypicalRangeofBitRatesTypicalApplicationsITU-TH.261P*64kbits/sISDNVideoConferencingITU-TH.263,H.263+,H.263++WiderangePSTNVideoPhoneITU-TH.26L<64kbits/sWiderangeISO11172-2MPEG-1Video1.5Mbits/sCD-ROMISO13818-2MPEG-2Video4-80Mbits/sSDTV,HDTVISO14496-2MPEG-4VideoWiderangeWiderangeJVT(ITU-T,ISO)H.264WiderangeWiderange中国标准AVSWiderangeWiderange2023/9/341语音压缩编码语音编码的基本问题给定编码速率的条件下,如何获得更高质量的重建语音给定重建语音质量的条件下,如何降低编码速率基本依据利用语音信号本身的冗余度以及人耳的听觉特性主要指标语音编码质量编码速率编码算法的复杂度编解码的延时2023/9/342语音压缩编码算法语音编码器波形编码器参量编码器频域时域非差分子带编码自适应变换域编码差分PCMDPCM

M连续可变斜率MADPCMAPC线性预测编码信道声码器共振峰声码器倒频谱声码器语音激励声码器多脉冲激励LPC码本激励LPC矢量和激励LPC混合编码器2023/9/343波形编码力图使重建语音信号保持原始语音波形语音信号作为一般信号进行处理适应能力强,重建语音质量好编码速率较高,一般应用于64-16K速率参量编码(声码器)通过对语音信号特征参数的提取及编码,力图使语音信号有尽可能高的可懂度,保持语音的语意重建语音信号的波形与原始语音信号的波形可能有相当大的差别往往利用某种语音生成的模型,在幅度谱上逼近原始语音合成语音的自然度不好,抗背景噪声的能力比较差混合编码结合声码器的特点,同时又利用波形编码器的特点提取语音参数,优化激励信号使其达到与原始语音的波形匹配中速率语音编码4.8-16K,应用于蜂窝移动通信、卫星通信、军用通信低速率语音编码100bit/s-4.8Kbit/s2023/9/344语音编码的标准G.711PCM(64kbps)G.721ADPCM(32kbps)G.7227kHz带宽64kbps速率内的音频编码G.723.16.3k/5.6k双速率多媒体语音编码G.72816kbps语音编码LD-CELPG.7298kbps多媒体语音编码2023/9/345线形预测编码LPC的原理原理:模型化人类语音信号产生的机制,提取模型参数,并且只传输模型的参数。语音信号的产生模型:语音的产生,声带和声道不同语音产生的原因:声音激励源和声道不同声音分类:浊音和清音发声过程口腔和鼻腔形成时变滤波器2023/9/346LPC语音编码语音信号相邻样点之间又很强的相关性,可以用过去的样点的线性组合来预测未来的样点预测的误差因此上式可看成信号e(n)激励一个全极点滤波器得到语音信号与人的发声过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论