节自适应差分脉码调制_第1页
节自适应差分脉码调制_第2页
节自适应差分脉码调制_第3页
节自适应差分脉码调制_第4页
节自适应差分脉码调制_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1节自适应差分脉码调制节自适应差分脉码调制 ( )( )( )( )( )( )( )( )( )( )( )ereqrqd kS kS kS kS kd ke kS kS kd kd k22( )( )qSNRE dkE e k1( )()NeiriS ka S ki1( )1NiiiD za z 11( ) 1( )1NiiiH zD zaz A/D 信号 变换 压缩编码 输出 语音编码器波形编码器参量编码器频域时域非差分子带编码自适应变换域编码差分PCMDPCMM连续可变斜率MADPCMAPC线性预测编码声码器信道声码器共振峰声码器倒频谱声码器语音激励声码器多脉冲激励LPC码本激励

2、LPC矢量和激励LPC周期基音周期浊音声带振动语音波形三角形周期脉冲波,含丰富谐波清音声带不振动类似白噪声周期脉冲发生器随机噪声发生器G时变数字滤波器)(nu清/浊音开关声道参数)(ns基音周期111()()()1( )()( )( )()( )( )( )NkkkNkkNkkS ZGH ZU Za ZS na S nkG u nS na S nke nS nS n时变滤波器:预测器:误差:.261DFTDCTHJPEGWTHTSlant静止二维预测变换利用象素间的相关特性活动三维离散傅立叶变换变换离散余弦变换最广,函数变换利用变换域沃尔什变换参数分布特征哈达码变换倾斜变换帧内编码局部更新编码

3、帧间编码 帧间预测运动补偿统计冗余度低频分量多视觉冗余度人眼的感觉冗余度空间冗余度 图像结构时间冗余度 图像活动性12,4MPEGISO MPEGDVD DVBMPEGInternet.261.263.264HITUHHn为什么要变换和量化为什么要变换和量化变换变换量化量化熵编码熵编码具有优良频率特性的滤波器作变换工具,有利于得到平稳的能量分布,有利于进一步的量化处理原始信号的信息损失主要发生在量化阶段,好的量化能以尽可能少的量化误差换取最小的码率+=高质量编码器120( ) ( )( ),01NjnkNnX kDFT x nx n ekN1201( )( )( ),01NjnkNkx nID

4、FT X kX k enNNn DFT变换变换 结果有虚部和实部结果有虚部和实部n 对对DFT变换系数量化后,吉布斯效应明显变换系数量化后,吉布斯效应明显n 把把x(n)对称延拓,可以消除其中的虚部,对称延拓,可以消除其中的虚部,得得 到到DCT变换变换假设图象的大小只有一个假设图象的大小只有一个44的块,即一共的块,即一共16个个点,其中每个象素点都有一定的值,我们把这个值点,其中每个象素点都有一定的值,我们把这个值叫灰度值。对图象而言,这些值为叫灰度值。对图象而言,这些值为0255之间的整之间的整数。假设一幅数。假设一幅44的图象,它的灰度值如下:的图象,它的灰度值如下: 12816581

5、82345214200168486424362204下面我们对这个下面我们对这个44的图象做变换,变换矩阵我的图象做变换,变换矩阵我们选:们选:111111111111121111T一般我们希望它是正交矩阵,即变换矩阵和它的一般我们希望它是正交矩阵,即变换矩阵和它的逆矩阵的乘积,为单位矩阵,即:逆矩阵的乘积,为单位矩阵,即:1TTII1000010000100001I对上述图像作变换,可以验证:对上述图像作变换,可以验证: T1111111111111211111281658182345214200168486424362204370243318290781652181541661391322

6、662286125212146我们希望这个过程是可逆的,即可以验证:我们希望这个过程是可逆的,即可以验证: = 1111111111111211113702433182907816521815416613913226622861252121461281658182345214200168486424362204aaaaabacbccbacabaaaaacabcbbcabacTY= AXAX1113,cos ,cos22828abcTY= CXCEX22222222aac aac11111 d11d11d111dac cac c1111111 daac aac1dd11d11ac cac c若若

7、 表示矩阵对应元素相乘,表示矩阵对应元素相乘,d=b/c,那么上式,那么上式可以表示为可以表示为 时,为最优变换矩阵时,为最优变换矩阵1/( 2 1 ) 2.4142.d 在这里,在这里,d取取52,非常接近最优值,非常接近最优值 此时,此时, ,得到整数变换矩阵的正变换得到整数变换矩阵的正变换为:为: 1/( 2 1 ) 2.4142.d 1522,22 2929abcTfffY= C XCEX2222222211111511aac/2aac/251151115ac/2 c /4 ac/2 c /411111115aac/2aac/215511511ac/2 c /4 ac/2 c /4对于

8、对于9比特的预测误差数据做变换,变换矩阵每一行比特的预测误差数据做变换,变换矩阵每一行绝对值之和的最大值为绝对值之和的最大值为14,因此对于变换后的矩阵,因此对于变换后的矩阵元素需要元素需要 位来表示。现在大多数处理装置位来表示。现在大多数处理装置(如(如CPU,DSP)为)为32位宽,用上述变换进行处理位宽,用上述变换进行处理就没有数据溢出的危险。就没有数据溢出的危险。 29+log14 14=17一旦得到变换后的系数,我们就可以对变换系数进一旦得到变换后的系数,我们就可以对变换系数进行量化操作。对于某个量化步长行量化操作。对于某个量化步长QStep,对应一个,对应一个量化参数量化参数Q,量

9、化参数,量化参数Q的取值范围为的取值范围为0到到44整数,整数,量化就是把变换得到的结果都除以量化就是把变换得到的结果都除以QStep: TfffY/Qstep= C XCEX/Qstep1/41/2321/41/23211111511511511151/2321/581/2321/58/Qstep111111151/41/2321/41/232155115111/2321/581/2321/58Tfff= C XCMqbitsQ/(2)Y2fqbitsfEMQStep可以得到:可以得到:其中,其中, ,floor表示向负无穷取整。量表示向负无穷取整。量化参数化参数Q与量化步长与量化步长QSt

10、ep的对应关系如表的对应关系如表1。从。从表表1中可以看出,量化参数中可以看出,量化参数Q每增加每增加5时,量化步时,量化步长长QStep就随之翻倍增加。就随之翻倍增加。15( /5)qbitsfloor Q可以得到可以得到Q01234567891011QStep 0.625 0.6875 0.8125 0.875 11.251.375 1.625 1.75 2 2.5 2.75 Q1419 24 29 34 39 QStep 48 163264128 表表1 量化参数量化参数Q与量化步长与量化步长QStep的对应关的对应关系系 11( )( ) ( )X ZH Z X Z1/21/21111

11、( )()()2Y zX ZXZ)()(211ZYZU1111111( )( )( )( ) ( )() ()( )2T ZK Z U ZH Z X ZHz XZ K Z2222221( )( )( )( ) ( )() ()( )2T ZK Z U ZH Z X ZHz XZ K Z假设:11( )( )K ZH Z221( )( )()K ZH ZHZ22121( )( )( )( )2S ZHZHZX Z得到:同理:211( )()UZY Z( )(2)nkthtn1( )( 1)(2)nnkthtnn 对于具有紧支的标准正交函数系,任何连续可积函数的取样值为: 0( ), ()ncx

12、ttnn 那么,x(t)可以写成: 0( )()nnx tctnn 由于 (t-n)对不同的n正交,对x(t)的小波分解算法可以写成: 11( ), (2)ncx tt n 0(),(2)kmkmctkhtnm 02n mmmch 1021( 1)mnn mmmdchn 可以证明, (t-n)对不同的n正交,等价于: 22( )()1HH Mallat提出了多分辨率分析提出了多分辨率分析(Multiresolution analysis, MRA)理论,希望得到图象理论,希望得到图象3 3个方向的个方向的纹理特征,以便机器识别纹理特征,以便机器识别22222 (0)(0)(1)(2) .( )

13、2 (1)(0) (1) .(1) ( )2 (2)(0) (2) .(2) ( ).2 ( )(0) ( )ghhhh Nghhh Nh Nghhh Nh Ng Lhh N 根据根据MRA的思想,的思想,Daubechies设计了正交性能设计了正交性能良好的高低通滤波器组,良好的高低通滤波器组,但是它们不对称即不满足但是它们不对称即不满足线性相位,因此不能完全重构图象的边界线性相位,因此不能完全重构图象的边界 1 2(0)(0) (0) 2 (1) (1)9162 (1)2 (0) (1) 2 (1) (0) 2 (1) (2)02 (2)2 (0) (2) 2 (1) (1)1162 (3

14、)2 (1) (2)ghhhhghhhhhhghhhhghh -1/8 -1/8 分解取偶数点,重构时补分解取偶数点,重构时补0在奇数点,分解时在奇数点,补在奇数点,分解时在奇数点,补0在偶数点。然后在偶数点。然后以边界点为中心对称延拓,分解和重构时延拓方式是一样的。以边界点为中心对称延拓,分解和重构时延拓方式是一样的。6.7.6 矢量小波矢量小波(Multiwavelets)SOM多重小波具有很好的低通、带通和多重小波具有很好的低通、带通和高通特性,具有提高编码质量的潜力高通特性,具有提高编码质量的潜力6.7.7 零树量化零树量化(EZW SPIHT)6.7.8 Wavelet与与DCT的比

15、较的比较(Y)Wavelet与DCT的比较(U V)DCT变换编码变换编码, 17.95 dBWavelet变换编码变换编码, 20.98 dB小波变换可以有效的克服块效应小波变换可以有效的克服块效应(a) Lenna原图原图 (b) 0.005bpp, PSNR=20.76dB (c) 0.01bpp, PSNR=22.72dB (d) 0.02bpp, PSNR=24.21dB (e) 0.05bpp, PSNR=27.30dB (f) 0.1bpp, PSNR=28.81dB 小波编码在高码率和低码率情况下都取得很很好的实验结果小波编码在高码率和低码率情况下都取得很很好的实验结果编码的尺

16、寸编码的尺寸可伸缩性可伸缩性编码的质量编码的质量可伸缩性可伸缩性6.7.9 小波变换编码具有可伸缩性小波变换编码具有可伸缩性小波编码的数据结构的量化手段十分有小波编码的数据结构的量化手段十分有利于可伸缩性编码和解码利于可伸缩性编码和解码 6.8 视频编码与视频编码与H.264随着数字技术的发展,欣赏数字影视成为大众娱随着数字技术的发展,欣赏数字影视成为大众娱乐生活的重要内容。数字影视以数字信号形式,乐生活的重要内容。数字影视以数字信号形式,或者说以或者说以bit的形式在各种介质(或者叫存储器的形式在各种介质(或者叫存储器)存储和传输。我们希望在容量有限的存储器内)存储和传输。我们希望在容量有限

17、的存储器内存放更多的电影数量,或者希望在网络点播中看存放更多的电影数量,或者希望在网络点播中看到更流畅的电影作品。然而存储器的容量或者网到更流畅的电影作品。然而存储器的容量或者网络能提供的带宽总是不能满足人们不断增长的需络能提供的带宽总是不能满足人们不断增长的需要,这就推动了视频压缩编码技术的发展。要,这就推动了视频压缩编码技术的发展。对于对于CIF格式的视频流,它的画面大小是格式的视频流,它的画面大小是352288个象个象素,每个象素点用素,每个象素点用8个个bit来表示,对于黑白的画面来说来表示,对于黑白的画面来说,一幅画面需要,一幅画面需要3522888=811,008bit,如果是彩色

18、,如果是彩色画面,则需要画面,则需要1,216,512。为了欣赏到连续的画面,根。为了欣赏到连续的画面,根据人类的视觉特性,每秒差不多要播放据人类的视觉特性,每秒差不多要播放25个这样的画面个这样的画面(或者叫帧),才不会有快镜头的感觉(比如象卓别林(或者叫帧),才不会有快镜头的感觉(比如象卓别林的老电影)。那么,对于一部的老电影)。那么,对于一部60分钟长的电影,它需要分钟长的电影,它需要的存储量为的存储量为1,216,512256060=109,486,080,000,约为,约为13,685,760,000个字节,即个字节,即13个个G的存储空间。的存储空间。市场上的硬盘目前流行的一般为市

19、场上的硬盘目前流行的一般为150个个G,也就是说,也就是说,这么一个硬盘里面只能放这么一个硬盘里面只能放10部电影,这远远不能满足我部电影,这远远不能满足我们实际的需要。而实际上,们实际的需要。而实际上,150G的硬盘至少可以存放的硬盘至少可以存放100部高质量的电影,这正是通过视频压缩手段才能做部高质量的电影,这正是通过视频压缩手段才能做到这一点的。到这一点的。6.8.1 视频编码框架视频编码框架6.8.2 运动预测运动预测块搜索窗口帧k(当前帧)帧k-1(参考帧)1, 2( , (,)| , - -, -|1,1B BSAD s c REF ms x y c x my mxyxyn 多参考

20、帧技术多参考帧技术如果在整个宇宙中找到的最如果在整个宇宙中找到的最亮的恒星,一定不会比在整个银河系中找到的暗亮的恒星,一定不会比在整个银河系中找到的暗当前帧 =4 =2 =1前面4 个参考帧同一帧中的不同块的预测值可以在不同的参考帧中参。而且考帧越多,越能同一帧中的不同块的预测值可以在不同的参考帧中参。而且考帧越多,越能找到符合要求的预测值。找到符合要求的预测值。以硬件的计算、存储能力为代价以硬件的计算、存储能力为代价1/2精度精度(33.25dB) 整数精度整数精度(33.00dB) n多尺寸预测块多尺寸预测块能根据物体的运动剧烈情况选能根据物体的运动剧烈情况选择预测块的尺寸择预测块的尺寸码

21、率开销码率开销(161616预测误差预测误差+ +一个运动矢量的一个运动矢量的) ) 码率开销码率开销(4个个88 8预测误差预测误差+4+4个运动矢量的个运动矢量的) )?5个参考帧个参考帧(33.19dB) 1个参考帧个参考帧(31.65dB) n 分精度插值预测技术分精度插值预测技术运动物体半个象素点的运动物体半个象素点的位移,但只能通过整数点象素来表达,影响了预测位移,但只能通过整数点象素来表达,影响了预测的精度的精度AB预测误差预测误差ERROR:|B-A| |B-A|A通过预测滤波器,得到通过预测滤波器,得到A,滤波器的系数为,滤波器的系数为M/2N,有利于硬件的实现,有利于硬件的实现6.8.3 率失真率失真-RDJDR SADR 2( )lnR DaD( )1R DaDD278Q 语音编码器波形编码器参量编码器频域时域非差分子带编码自适应变换域编码差分P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论