第五章图像编码2课件_第1页
第五章图像编码2课件_第2页
第五章图像编码2课件_第3页
第五章图像编码2课件_第4页
第五章图像编码2课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/12/615.4预测编码1)基本思想图像相邻像素间存在很强的相关性,通过观察其相邻像素取值,可以预测一个像素的大概情况。预测值和实际值存在误差,称为预测误差。预测误差的方差必然比原图像像素的方差小,因此对预测误差进行编码必然压缩其平均码长。2023/12/625.4预测编码2)预测误差的熵编码对比一幅图像和其差分图像的标准差和熵。Lenna差分图象2023/12/63

预测编码的基本原理

由于量化和传送的仅是误差信号,根据一般扫描图像信号在空间及时间邻域内个象素的相关性,预测误差分布更加集中,即熵值比原来图象小,可用较少的单位象素比特率进行编码,使得图象数据得以压缩。2023/12/64DPCM工作原理2023/12/653)DPCM预测编码预测器的阶数对当前像素进行预测的像素集合中的像素个数,称为预测器的阶数。理论上预测器的阶数越大越好,当阶数大于3时其性能的改变非常有限。预测器的系数如一个3阶预测器中,各像素的权重称为预测器的系数。其既可以固定不变,也可以变化。2023/12/66其它预测方法有:前值预测,用同一行中邻近前面一象素预测,即2.一维预测,用同一行中前面若干象素预测;3.二维预测,用几行内象素预测;4.三维预测,利用相邻两帧图像信号的相关性预测。2023/12/675.5变换编码熵保持。

正交变换具有熵保持性质,即正交变换不丢失信息,从而通过传输变换系数来传送信息。(2)能量保持性质。(3)能量重新分配与集中。在质量允许的情况下,可舍弃一些能量较小的系数。(4)去相关特性。正交变换可以使高度相关的空间图像值变为相关性很弱的变换系数。

2023/12/68举例设x1和x2是相邻的两个像素点,灰度级为8变换方法压缩编码频域方法的基础:通过可逆的线性变换将图像映射为一组变换系数,达到能量集中的目的,从而舍弃能量很小的系数,达到压缩的目的。频域方法的优点:压缩比高,视觉效果好2023/12/610频域方法的处理流程:构造子图像正变换重新量化符号编码合并子图像符号解码反变换输入图像压缩图像压缩图像解压图像2023/12/611子图像尺寸的选择变换方法的选择比特分配方法变换编码中的主要问题:1.子图像尺寸的选择原则子图像尺寸的选择影响到编码误差和计算的复杂度,实际中应考虑1.相邻子图像之间的相关性(冗余)降低到可接受的水平2.子图像的长和宽均为2的整数次幂一般情况下,压缩量和计算复杂度随子图像尺寸增加而增加,常用的尺寸为8×8和16×16。分块的好处:计算速度快;误差扩散小2.变换方法的选择压缩并不是在变换步骤取得的,而是在量化变换的系数时取得的。因此变换的能量集中特性影响了压缩效果。单就信息集中能力而言,K-L变换最强,但计算复杂,与输入图像相关。DCT在信息集中与计算复杂度方面具有较好的综合性能,得到广泛应用。2023/12/614

对变换系数的重新量化,要通过保留较大系数,舍弃较小的系数而达到压缩目的,因此其截断误差与两个因素有关:①舍弃的变换系数的数量和相对重要性3.比特分配方法(变换系数截断、量化与符号编码方法的选择)②所保留系数的表示精度为确定那些系数需要保留,可以选择采用下面的准则:准则1:分区编码方法准则2:阈值编码方法2023/12/6152)阈值采样阈值采样不是选择固定的采样区域,而是根据变换系数得方差的大小来决定是否选择该变换系数,也就是说,若某个系数的方差(或幅值)超过给定的阈值,则对该系数进行量化与编码.否则,略去该变换系数。1)区域采样JPEG压缩编码方法介绍JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。JPEG既适用于灰度图像也适用于彩色图像。JPEG有几种模式,其中最常用的是基于DCT变换的顺序式模式,又称为基本系统。JPEG的压缩编码大致分成三个步骤:使用正向离散余弦变换(forwarddiscretecosinetransform,FDCT)把空间域表示的图变换成频率域表示的图。使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。使用霍夫曼可变字长编码器对量化系数进行编码。JPEG基本系统的算法框图:具体讲:JPEG压缩编码算法的主要计算步骤如下:正向离散余弦变换(FDCT)。量化(quantization)。Z字形编码(zig-zagscan)。使用差分脉冲编码调制(differentialpulsecodemodulation,DPCM)对直流系数(DC)进行编码。使用行程长度编码(run-lengthencoding,RLE)对交流系数(AC)进行编码。熵编码(entropycoding)。2023/12/619一、正向离散余弦变换(FDCT)的算法与特性:(1)对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。f(i,j)F(u,v)DCT(2)DCT变换公式:C(u),C(v)=1/

, 当u,v=0;

C(u),C(v)=1, 其他。

f(i,j)经DCT变换之后,F(0,0)是直流系数,其他为交流系数。2023/12/621(3)在计算中,可将两维的DCT变换变成一维的DCT变换:(4)DCT变换后,F(0,0)是直流系数,其它为交流系数F(u,v)F(0,0)

考虑到整幅图像中各个子图像的平均亮度接近,因此将各子图像的直流系数取出单独组合编码。而将交流系数按Z字形顺序排列,组成符号流。DC二、量化问题:

量化是对DCT变换后的频率系数重新进行量化,以减少非零系数的数目。量化是图像降质的主要原因。

对于有损压缩算法,JPEG算法使用均匀量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。由于人眼对低频分量的图像比对高频分量的图像更敏感,因此变换图像中左上角的量化步距要比右下角的量化步距小。2023/12/624

考虑人眼对亮度信号比对色差信号更敏感,以及亮度和色差的能量集中情况不同,分别使用了两种量化表:亮度量化表色差量化表1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399

两种量化表都考虑了人眼的视觉特性。17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999亮度量化表色差量化表三、Z字形编排:

量化后的系数要分成两组,各子块的直流系数重新组合,而子块内的交流系数重新编排,以增加连续的“0”系数的个数,即“0”系数的游程长度,方法是按照Z字形的式样编排。将8×8的矩阵变成1×64的矢量,频率较低的系数放在矢量的顶部。6362585749483635615956504737342160555146383322205452453932231910534440312418119434130251712834229261613742282715146510编排顺序例如:150-100000-2-1000000-1-1000000000000000000000000000000000000000000000012………四、直流系数的编码方法:8×8图像块经过DCT变换之后得到的直流系数有两个特点:根据这些特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码,

Delta=DC(0,0)k-DC(0,0)k-1系数的数值比较大相邻8×8图像块的DC系数值变化不大2023/12/628

重新量化的AC系数的特点是1×63矢量中包含有许多“0”系数,并且许多“0”是连续的,因此使用非常简单和直观的游程长度编码(RLE)对它们进行编码。五、交流系数的编码方法六、熵编码:JPEG使用熵编码对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。JPEG图例:原图压缩9.2倍JPEG图例:压缩18.4倍原图JPEG图例:压缩27.6倍原图JPEG图例:压缩55.2倍原图2023/12/6335.6混合编码混合编码实现的可能性及有效性:回顾一下讲过的几个内容的特点1.行程编码:擅长于重复数字的压缩。2.Huffman编码:擅长于像素个数的不同编码。3.DCT变换:擅长将高频部分分离出来。2023/12/6345.6混合编码例:

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157

行程编码:4a3b2c1d5e7f

(共6*(8+3)=66Bits

)176662023/12/6355.6混合编码

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157Huffman编码:

f=01e=11a=10b=001c=0001d=0000

1010101010001001001000100010000111111111101010101010101

(共7*2+5*2+4*2+3*3+2*4+1*4=53bits)

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157Hufman与行程编码混合:

41030012000110000511701(共:3+2+3+3+3+4+3+4+3+2+3+2=35bits)1766653352023/12/637例:有图像f(x,y),如右图所示,灰阶为3bit,即0~7,比较几种不同编码的效果5.6通过映射变换达到压缩编码0011111122333333444444445555555566667777777777777777777777777777①直接将图像传输:图像的熵:H=2.47bit总码长为3×64=192bit平均码长为R=3bit编码效率:h

=82.3%2023/12/6382采用Huffman

编码编码灰度概率重排1重排2重排3重排4重排5重排6728/6428282828283658/64881216202848/64888121636/64688816/6466864/644622/64302/6410010100000000101100111001111总码长为160bit平均码长:R=160/64=2.5bit编码效率:h

=98.8%2023/12/6393先用差分映射进行变换,再用Huffman

编码差分映射:差分映射可以按行或按列进行,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论