数据压缩预测编码_第1页
数据压缩预测编码_第2页
数据压缩预测编码_第3页
数据压缩预测编码_第4页
数据压缩预测编码_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章预测编码

具有M种取值的符号序列,第L符号的熵满足:预测

1第5章预测编码

5.1DPCM基本原理工作过程:1)先发送

2)在基础上进行预测,得到预测值;3)差分,量化和编码4)重复一样的过程,预测器必须相同

25.2最佳线性预测非时变线性预测:预测误差:一、MMSE线性预测预测误差的均方值MSE最小的必要条件35.2最佳线性预测定义自相关函数得到由于自相关函数满足当广义平稳时有45.2最佳线性预测得到实对称的Toeplitz矩阵,正定,可逆。如果各态历经的且N足够大由上述方法求出的最佳预测系数得到的最小均方误差55.2最佳线性预测二、预测阶数的选择当N

足够大使预测误差不相关再增大N不会使均方误差在减小。若为N

阶马尔克夫过程,则用N阶预测。例5-2设为一阶马尔克夫序列,其相关系数求解的公式若N=1,则65.2最佳线性预测误差:有若加大N=2,与N=1时的预测表达式完全相等。75.3音频信号与听觉感知人耳可听到的声音频率范围:20Hz~20KHz一、语音信号的时域冗余度1、幅度非均匀分布2、样本间的相关性3、基音之间的相关性语音浊音(嗓音)清音(非嗓音)4、话音间隔5、长时自相关函数85.3音频信号与听觉感知二、语音信号的频域冗余度1、非均匀的长时功率谱密度2、语音特有的短时功率谱密度95.3音频信号与听觉感知三、单音的听觉感知人类听觉系统(HAS,HumanAuditorySystem)带通滤波器组,一系列带宽递增的带通滤波器组成

可闻阈(听觉阈):人耳刚能听见的声压级疼痛阈:使人耳有痛感的声压级听觉范围:疼痛阈和可闻阈之差HAS表现特性(纯音)1)响度:与频率有关1kHz/10dB200Hz/30dB

2)频率:可闻阈与频率有关2~4kHZ低<40Hz或>16kHz高

3)相位:对相位感知不敏感105.3音频信号与听觉感知三、多音的掩蔽效应

掩蔽效应:一个声音的存在会影响人耳对另一个声音的听觉能力。掩蔽阈:单音都有一个掩蔽阈其声压级越高,对其周围频率声音的掩蔽效应越强。

115.4语音信号的预测编码一、基于预测的语音压缩技术

波形编码:被编码的语音信号与重建信号波形基本相同。

语声编码:重建信号听起来与原始声音基本一样

混合编码:综合两种方法。几个阶段:1)增量调制DM,Deltamodulation

125.4语音信号的预测编码2)DPCM3)ADPCM预测器或量化器中引入自适应调节1986-1990ITU-T制定的语音编码标准技术基础4)LPC声码器:不传送预测误差,传送参数波形编码参数编码135.4语音信号的预测编码5)混合编码RELP:残差激励线性预测CELP:码激励线性预测(1984提出)LD-CELP:低时延的码激励线性预测(G.728建议,1992)ACELP:代数码激励线性预测(G.723.1建议,1996)CS-ACELP:共轭结构代数码激励线性预测(G.729建议,1996)145.5静止图像的预测编码一、预测器设计

1、预测器一维预测:二维预测:三维预测:2、相关性的强弱3、阶数选择4、预测器实现5、系数确定155.5静止图像的预测编码二、JPEG无损压缩模式空间域无量化DPCM,Huffman或算术编码165.5静止图像的预测编码三、JPEG-LS压缩标准近无损、无损压缩标准,1998正式公布JPEG-LS编码系统1)基于上下文的建模计算其邻域点变化量判断进入预测还是游程175.5静止图像的预测编码2)预测自适应非线性预测

=3)常规模式的误差编码4)游程模式185.6视频信号与视觉感知一、电视信号概述PAL25帧/s625行视频带宽6M

195.6视频信号与视觉感知二、数字化格式CCIT601:对彩色电视信号的亮度和色差采样编码采样频率:13.5MHz(亮度)205.6视频信号与视觉感知采样频率:13.5MHz(亮度)采样定理行频的整数倍兼容三种国际标准制式取样结构:4:4:44:2:24:1:1数码率:r=(13.5+6.75+6.75)*8=216Mb/sr=3*13.5*8=324Mb/s215.6视频信号与视觉感知三、电视信号的冗余度空间冗余:时间冗余(帧间冗余):

帧间差值对相邻两帧图像进行测试黑白图像:帧间差值超过3的像素不到4%变化剧烈的彩色序列:亮度>6只有7.5%色度只有千分之7.5可视电话,电视会议225.6视频信号与视觉感知四、人的视觉感知特性彩色电视信号的数码率人类视觉系统(HVS,humanvisualsystem)1)亮度掩蔽特性:背景较明或较暗时,人眼对亮度分辨能力下降。2)空间掩蔽特性:随着空间变化频率的提高,人眼对亮度(灰度)分辨能力下降3)时间掩蔽特性:随着时间变化频率的提高,人眼对细节和亮度分辨能力下降235.7活动图像的预测编码一、帧间预测编码1、发展2、编码方法1)条件帧修补法2)运动补偿预测电视图像特点(可视电话、电视会议和电视等)背景区:运动物体区:暴露区:245.7活动图像的预测编码3、运动补偿预测组成1)图像分割:把图像分为静止和运动两部分.2)运动估值:估计物体的位移量,得到运动矢量.3)运动补偿:用运动矢量补偿物体的运动效果,再预测.4)编码:帧间运动误差和运动矢量.255.7活动图像的预测编码二、快匹配运动估值对当前帧的每一个子块,在上一帧某一搜索范围内寻找最优匹配,该子块和最优匹配块之间的位移就是运动矢量。265.7活动图像的预测编码1)判断准则归一化互相关函数(NCCF)均方误差(MSE)最小绝对差(MAD)275.7活动图像的预测编码2)搜索策略全局搜索法(FullSearchMethod,FS)二维对数搜索法(Two-DimensionalLogarithmic,TDL基本思想:从原点开始,以“十”字形分布的五个点构成每次搜索的点群,通过快速搜索跟踪最小块误差MAD点。Step1:从原点开始,选取一定的步长,以十字形分布的五个点处进行MAD值的计算并比较。Step2:若MBD点在边缘四个点处,则以该点为中心点,保持步长不变,重新搜索十字形分布的五个点;若MBD点位于中心点,则保持中心点位置不变,将十字点群的步长减半,并在五个点处计算。Step3:若步长为1,在中心及周围8个点处找出MBD点,该点所在位置即对应最佳匹配点,算法结束;否则重复Step2。285.7活动图像的预测编码[0,-4]、[+4,-4]、[+6,-4]是每个搜索阶段的最小块误差点若[+5,-4]是8个点中的最小MBD,则运动矢量为[+5,-4],295.7活动图像的预测编码2)搜索策略三步搜索法(ThreeStepSearch,TSS)四步搜索法(FourStepSearch,FSS)基于块的梯度下降搜索法(Block-BasedGradientDescentSearch,BBGDS)菱形搜索法(DiamondSearch)基本思想:两种搜索模板,5个检测点的小模板SDSM和9个检测点的大模板LDSM。搜索时先用大模板计算,当最小块误差MAD点出现在中心点处时,将大模板LDSM换为SDSM,再进行匹配计算,这时5个点中的MAD即为最优匹配点。305.7活动图像的预测编码菱形搜索法SDSMLDSM315.7活动图像的预测编码3)块的划分H261,MPEG1,216*16H26316*16高级预测模式4个8*8H2647种模式325.8高光谱遥感图像的预测编码对同一对象(区域或目标)在多个窄光谱波段范围上获得的图像。一、特点1)三维空间冗余谱间冗余2)丰富纹理信息,空间相关性较弱各波段的成像对象是同一地物,在结构上具有相似性3)预测、变换和矢量量化等方法去除两种冗余4)无损压缩、近无损压缩。二、DPCM预测335.8高光谱遥感图像的预测编码三、最小绝对权值(MAW)预测树方法1、原理把一幅图像看作一个加权图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论