




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三讲 语音信号数字化及压缩编码(2)8/4/20221第1页,共51页。DPCM降低语音编码速率的必要性模拟单边带多路载波电话的带宽4K,而PCM的带宽的理论值为32K在频带受限的应用场合经济性太低,如卫星通信、移动通信等PCM占用高带宽的原因分析为满足语音信号的高动态范围而采用了多位的量化对每个采样点都进行量化,没有考虑语音信号的前后相关性8/4/20222第2页,共51页。预测编码的概念相邻样点之间可能只有一个量化间隔或少数个量化间隔的差别,PCM传送的信息存在冗余在编码前就去掉相关性很强的冗余,然后再进行编码传送预测编码,就是根据过去的信号样值预测下一个样值,并且把预测值与现实的采样值
2、之差进行量化加以编码和传送在接收端,经过相同的预测和滤波,即可得到原始信号波形8/4/20223第3页,共51页。DPCM基本原理8/4/20224第4页,共51页。DPCM性能 一般总是大于1,称为DPCM处理增益,其值主要取决于预测的效果由于量化的是样值与预测值的差值信号,因此动态范围可以减小,同时也可有效减小量化误差,从而使DPCM在较低的编码率下获得较高的信噪比质量需要研究的问题是:如何设计预测器获得更好的SNR零点预测器极点预测器最佳预测器8/4/20225第5页,共51页。极点预测器N阶预测器的输出是前N个本地重建值的线性组合由于H(Z)只有极点,称这种预测器为全极点预测器8/4/
3、20226第6页,共51页。零点预测器M阶预测器的输出是前M个量化值的线性组合8/4/20227第7页,共51页。零极点预测器把零点预测器和极点预测器组合在一起,即构成零极点预测器8/4/20228第8页,共51页。最佳预测器确定一组最佳预测系数,使得 最小在全极点模型下,并忽略量化误差最终输出的信噪比与预测阶数有关8/4/20229第9页,共51页。增量调制(,DeltaM)(1)简单增量调制可以认为是 一位编码时的特例,但编码的是差值信号。编码过程8/4/202210第10页,共51页。Q数码形成Z-1C(n)S(n)e(n)-+Sl(n)解码增量调制编码器增量调制解码器8/4/20221
4、1第11页,共51页。差值信号8/4/202212第12页,共51页。译码过程实际编码译码器常用简单RC积分器和比较器来实现 和8/4/202213第13页,共51页。(2)斜率过载和量化信噪比当信号变化速率超出 波形变化速率时,会出现斜率过载现象,以单频信号为例8/4/202214第14页,共51页。8/4/202215第15页,共51页。量化噪声量化信噪比8/4/202216第16页,共51页。通常认为 在 内均匀分布,则低通滤波 后8/4/202217第17页,共51页。临界过载时信噪比与信号幅度有关,信号幅度小,信噪比降低8/4/202218第18页,共51页。例:结论: 与 三次方成
5、正比, 提 高一倍, 增大9 与 成反比,信号频率提高一倍, 下降68/4/202219第19页,共51页。简单增量调制的性能改进简单增量调制有两个问题: 斜率过载 动态范围8/4/202220第20页,共51页。(1).数字压扩自适应增量调制可同时解决动态范围和斜率过载问题。基本概念:如同非均匀 中那样,改变量化间隔。 如果连续出现多个“1”或者“0,即可认为信号有出现过载的可能,从而增大,使其本地译码信号跟上变化。 如果量阶随信号瞬时压扩,则称为瞬时压扩,如果量阶随语音音节时间间隔中信号的平均斜率变化而进行压扩,则称为CVSD连续可变斜率一音节基音周期(520)ms8/4/202221第2
6、1页,共51页。(2).增量总和调制可解决斜率过载问题其要点是:将信号先进行积分,改变其频率响应。使高频分量幅度下降(与预加重相反),然后再进行 编码。为此,在接收端为了不失真恢复原信号,需要将解码后信号进行微分。8/4/202222第22页,共51页。信道误码对 的影响对简单 有8/4/202223第23页,共51页。例如: 抗误码性能优于概念上来看:个别误码不会引起信号严重恶化8/4/202224第24页,共51页。简单增量调制与PCM的性能比较抽样频率PCM系统的抽样频率8K 系统的抽样频率不能根据抽样定理来确定,而需要根据斜率过载条件以及信噪比来确定,一般情况下,为保证不发生斜率过载以
7、及保证与PCM系统有相同的信噪比, 的抽样频率将远高于PCM系统带宽PCM码速率64Kbit/s,带宽需求32K如要求与PCM有相同的传输质量,则要求抽样频率100K以上,带宽要求50K 一般速率为32Kbit/s或16Kbit/s,但质量不如PCM 8/4/202225第25页,共51页。量化信噪比(比较单频正弦情况)抗信道误码性能 优于PCM设备复杂度单路 简单,多路PCM简单8/4/202226第26页,共51页。ADPCM采用自适应的必要性由于不同的讲话人的语音信号的特性各不相同语音信号只能认为是短时平稳采用固定的预测系数不可能对所有的语音信号获得最好的结果,因此有必要采取自适应的算法
8、ADPCM的设计思路尽可能消除语音信号中的冗余对消除冗余后的信号进行有效的比特分配,从自适应角度进行最佳编码自适应的方法自适应量化自适应预测8/4/202227第27页,共51页。自适应量化针对被量化信号的变化状态,随时调节量化台阶大小以匹配输入信号的时变方差前向估值的自适应量化对输入信号尚未量化的样本计算出其前向估值大小需要缓存训练的样本,并传送相关的边信息,因此引入了编码延时和占用了一定的信道容量后向估值的自适应量化利用量化器的输出样本计算输出信号的方差估值并确定量化台阶没有延时,但影响估值的追踪速度8/4/202228第28页,共51页。自适应预测前向估值的自适应预测思路与前向估值量化一
9、致,同样有编码延时及边信息传输等问题后向估值的自适应预测利用已量化的样本或发送数据更新预测系数8/4/202229第29页,共51页。信源编码信源编码的目的减少信源输出符号序列的冗余度,提高符号的平均信息量信源编码的主要方法针对信源输出的符号序列的统计特性,寻找一定的方法把信源输出序列符号变换为最短的码字序列,使每个码元所携带的平均信息量为最大,同时又尽可能保证无失真的恢复出原来的符号序列信源编码的核心就是研究压缩编码算法,用尽可能低的传输码率获得尽可能好的质量8/4/202230第30页,共51页。匹配编码根据编码对象出现的概率分配不同长度的代码,以保证总的代码长度最短需要知道信号的概率分布
10、,可采用数学模型建模的方式或根据大量样本信号进行统计得到典型编码算法:Huffman编码预测编码利用信号之间的相关性,预测未来的信号,对预测的残差信号进行编码变换编码利用信号在不同的函数空间分布的不同,选择合适的函数将信号从一种信号空间变换到另一种有利于压缩编码的信号空间,再进行编码常用的函数变换:DFT、Walsh、DCT、Haar识别编码分解文字、语音、图象的基本特征,与汇集这些基本特征的样本集进行对照识别,选择失真最小的样本编码传送可用于印刷、打印等标准形状的文字、符号和数据的编码8/4/202231第31页,共51页。信源编码算法信源编码定理一个熵为H的信源,当信源速率为R时,只要RH
11、,则能够以任意小的错误概率进行编码;反之,如果RH,则无论采用多么复杂的编码器和译码器,错误概率都不可能达到任意小Shannon在1948年证明了该定理,但并没有指出具体的编解码算法信源编码与失真度量编码失真原始信号x经过编码以及解码后恢复成x,失真量即为x与x之间的保真度或近似度的度量常用的失真度量:汉明失真、均方误差等以一定的、可以接受的失真换取较高的信源压缩效率8/4/202232第32页,共51页。语音与图像压缩编码类型带宽KHZ采样率KHZ比特/样点比特率kb/s电话语音0.33.481296宽带语音0.0571614224调频广播0.02 153216512CD光盘0.01 204
12、4.116705.6DAB/DAT0.01 2048167688/4/202233第33页,共51页。类型格式分辨率帧频HZ比特/像素比特率Mb/s电视电话QCIF17614429.97129.1会议电视CIF35228829.971236.4常规电视ITU-R6017205762516165.9HDTVITU-R709192011522516884.78/4/202234第34页,共51页。图像压缩编码图像压缩编码的必要性图像的数据量巨大,一般必须进行压缩编码图像压缩编码的依据图像信号在结构和统计上存在大量的冗余度结构冗余度:空间和时间上的强相关性统计冗余度:被编码信号概率分布的不均匀基于人
13、眼的视觉特性人眼对某些失真较不敏感,察觉不到图像的某些细微变化图像压缩编码的评价压缩效率:压缩前后编码速率的比值压缩质量:恢复图像的质量编码算法的复杂度编解码延时图像编码采取的主要技术措施利用离散余弦变换,去除各象素点在空间域的相关性通过帧间预测差分编码,去除活动图像的时间相关性采用熵编码技术,使编码域信源的概率模型相匹配利用人眼的视觉特性,进行自适应量化编码通过缓冲存储器实现变长码输入与定长码输出之间的匹配,8/4/202235第35页,共51页。图像压缩编码方法8/4/202236第36页,共51页。图像压缩编码举例Huffman编码基本思想对出现概率较大的信源符号编以较短的代码,对出现概
14、率较小的信源符号编以较长的代码JPEG、H.261、MPEG-1、 MPEG-2中对量化后的DCT系数进行Huffman编码编码算法 1. 初始化,根据符号概率的大小按由大到小顺序对符号进行排序; 2. 把概率最小的两个符号组成一个节点; 3.重复步骤2,形成一棵“树” ; 4.从根节点开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。 5.从根节点开始顺着树枝到每个叶子分别写出每个符号的代码8/4/202237第37页,共51页。编码特点霍夫曼码的码长虽然是可变的,但
15、却不需要另外附加同步代码。如果事先编写出一本解释各种代码意义的“词典”,即码簿,那么就可以根据码簿一个码一个码地依次进行译码。霍夫曼码没有错误保护功能,如果码串中有错误,哪怕是1位出现错误,会出现错误传播(error propagation)。霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑8/4/202238第38页,共51页。预测变换编码利用图像信号的空间和时间冗余特性,用已知的相邻象素或图像块预测当前象素值,再对预测误差进行量化、编码和传输帧内预测编码,在一帧图像内进行预测,消除图像在空间的相关性帧间预测编码,在多幅图像之间进行预
16、测,消除图像在时间域上的相关性关键在于预测算法的选取游程长度编码编码对象为信源符号在信息流中连续出现的长度,根据其出现概率的不同编成不同长度的码字常用于文件传真系统中8/4/202239第39页,共51页。Standard OrganizationVideo Coding StandardTypical Range of Bit RatesTypical ApplicationsITU-TH.261P*64 k bits/sISDN Video ConferencingITU-TH.263, H.263+, H.263+Wide rangePSTN Video PhoneITU-TH.26L6
17、4kbits/sWide rangeISO11172-2MPEG-1 Video1.5 M bits/sCD-ROMISO13818-2MPEG-2 Video4-80 M bits/sSDTV, HDTVISO14496-2MPEG-4 VideoWide rangeWide rangeJVT (ITU-T, ISO)H.264Wide rangeWide range中国标准AVSWide rangeWide range8/4/202240第40页,共51页。语音压缩编码语音编码的基本问题给定编码速率的条件下,如何获得更高质量的重建语音给定重建语音质量的条件下,如何降低编码速率基本依据利用语
18、音信号本身的冗余度以及人耳的听觉特性主要指标语音编码质量编码速率编码算法的复杂度编解码的延时8/4/202241第41页,共51页。语音压缩编码算法语音编码器波形编码器参量编码器频域时域非差分子带编码自适应变换域编码差分PCMDPCMM连续可变斜率MADPCMAPC线性预测编码信道声码器共振峰声码器倒频谱声码器语音激励声码器多脉冲激励LPC码本激励LPC矢量和激励LPC混合编码器8/4/202242第42页,共51页。波形编码力图使重建语音信号保持原始语音波形语音信号作为一般信号进行处理适应能力强,重建语音质量好编码速率较高,一般应用于6416K速率参量编码(声码器)通过对语音信号特征参数的提
19、取及编码,力图使语音信号有尽可能高的可懂度,保持语音的语意重建语音信号的波形与原始语音信号的波形可能有相当大的差别往往利用某种语音生成的模型,在幅度谱上逼近原始语音合成语音的自然度不好,抗背景噪声的能力比较差混合编码结合声码器的特点,同时又利用波形编码器的特点提取语音参数,优化激励信号使其达到与原始语音的波形匹配中速率语音编码4.816K,应用于蜂窝移动通信、卫星通信、军用通信低速率语音编码100bit/s-4.8Kbit/s8/4/202243第43页,共51页。语音编码的标准G.711 PCM (64k bps)G.721 ADPCM (32k bps)G.722 7kHz带宽64k bp
20、s速率内的音频编码G.723.1 6.3k/5.6k 双速率多媒体语音编码G.728 16k bps 语音编码 LD-CELPG.729 8k bps多媒体语音编码8/4/202244第44页,共51页。线形预测编码LPC的原理原理:模型化人类语音信号产生的机制,提取模型参数,并且只传输模型的参数。语音信号的产生模型:语音的产生,声带和声道不同语音产生的原因:声音激励源和声道不同声音分类:浊音和清音发声过程口腔和鼻腔形成时变滤波器8/4/202245第45页,共51页。LPC语音编码语音信号相邻样点之间又很强的相关性,可以用过去的样点的线性组合来预测未来的样点预测的误差因此上式可看成信号e(n)激励一个全极点滤波器 得到语音信号与人的发声过程吻合,采用清音及浊音二元激励模型即可合成语音使误差均方最小,可求得一组预测系数ak,传送:预测系数,基音周期和增益,清浊音判决8/4/202246第46页
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生领导力发展的计划
- 二年级上册数学 第四单元森林里的故事 《 除法的初步认识》 教案青岛版(五四学制)
- 一年级下册数学教案-8.1.认识厘米 青岛版
- 三年级数学上册单元教案-第1单元 混合运算-北师大版
- 管家工作表现好的评语
- 第四单元信息窗一《三角形的认识》(教案)-四年级上册数学青岛版(五四学制)
- 2025年拉萨货运从业考试试题答案大全
- 2025年甘孜驾校考试客货运从业资格证考试题库
- 2025年呼和浩特货车资格证答案
- 2025年陕西运输从业资格证考试试题库
- 带货主播签约合同范本
- 《DNA的转录和翻译》课件
- 医院安保服务投标方案医院保安服务投标方案(技术方案)
- 中医理疗免责协议书
- 中医基础学题库(附答案)
- 精神科病人安全与治疗管理制度
- 厨房食材收货流程
- 吨袋培训课件
- GB/T 45077-2024国家公园项目建设指南
- 品牌服饰行业快速消费品库存管理优化方案
- 贝雷桥吊装专项方案(危大工程吊装方案)
评论
0/150
提交评论