图像压缩(my)青岛大学_第1页
图像压缩(my)青岛大学_第2页
图像压缩(my)青岛大学_第3页
图像压缩(my)青岛大学_第4页
图像压缩(my)青岛大学_第5页
已阅读5页,还剩151页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像压缩编码图像压缩编码

数据压缩与信息论基础图像压缩与编码基本概念信息论基础图像压缩编码

无损压缩

有损压缩图像压缩编码主要国际标准静止图像压缩编码标准-JPEG运动图像压缩编码标准-MPEG

第一节图像压缩与编码基本概念

为什么要进行图像压缩图像数据压缩的可能性数据冗余图像压缩的目的图像数据压缩技术的重要指标图像数据压缩的应用领域图像编码中的保真度准则信息论基础图像压缩模型一.为什么要进行图像压缩?

数字图像通常要求很大的比特数,这给图像的传输和存储带来相当大的困难。要占用很多的资源,花很高的费用。如一幅512*512的灰度图象的比特数为

512*512*8=256k

再如一部90分钟的彩色电影,每秒放映24帧。把它数字化,每帧512*512象素,每象素的R、G、B三分量分别占8bit,总比特数为

90*60*24*3*512*512*8bit=97,200M。如一张CD光盘可存600兆字节数据,这部电影光图像(还有声音)就需要160张CD光盘用来存储。

对图像数据进行压缩显得非常必要。二.图像数据压缩的可能性

一般原始图像中存在很大的冗余度。用户通常允许图像失真。当信道的分辨率不及原始图像的分辨率时,降低输入的原始图像的分辨率对输出图像分辨率影响不大。用户对原始图像的信号不全都感兴趣,可用特征提取和图像识别的方法,丢掉大量无用的信息。提取有用的信息,使必须传输和存储的图像数据大大减少。

设:n1和n2是在两个表达相同信息的数据集中,所携带的单位信息量。压缩率:——描述压缩算法性能

CR=n1/n2

其中,n1是压缩前的数据量,n2是压缩后的数据量相对数据冗余:

RD=1–1/CR例:CR=20;RD=19/20描述信源的数据是信息量(信源熵)和信息冗余量之和。三.数据冗余1)数据冗余的基本概念A.编码冗余:

2)常见的数据冗余在数字图像压缩中,常有3种基本的数据冗余:编码冗余、像素间的冗余以及心理视觉冗余为表达图像数据需要用一系列符号,用这些符号根据一定的规则来表达图像就是对图像编码。对每个信息或事件所赋的符号序列称为码字,而每个码字里的符号个数称为码字的长度。设定义在[0,1]区间的离散随机变量sk代表图像的灰度值,每个sk以概率ps(sk)出现Ps(sk)=nk/nk=0,1,2,…,L-1其中L为灰度级数,nk是第k个灰度级出现的次数,n是图像中像素总个数。设用来表示sk的每个数值的比特数是,那么为表示每个像素所需的平均比特数就是编码所用的符号构成的集合称为码本。等长码:对于一个消息集合中的不同消息,用相同长度的不同码字表示,编解码简单,编码效率不高。变长码:与等长码相对应,对于一个消息集合中的不同消息,也可以用不同长度的码字表示,编码效率高,编码解码复杂。例:如果用8位表示该图像的像素,我们就说该图像存在着编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。B.像素冗余:

由于任何给定的像素值,原理上都可以通过它的邻居预测到,单个像素携带的信息相对是小的。对于一个图像,很多单个像素对视觉的贡献是冗余的。这是建立在对邻居值预测的基础上。原始图像越有规则,各像素之间的相关性越强,它可能压缩的数据就越多。例:原图像数据:234223231238235

压缩后数据:23411-8-73相同的目标相同的直方图象素间的相关性不同类似还有:图像彩色光谱空间的冗余;

视频图像信号在时间上的冗余;

一些信息在一般视觉处理中比其它信息的相对重要程度要小,这种信息就被称为视觉心理冗余。(3)视觉心理冗余:33K15K四.图像压缩的目的

图像数据压缩的目的是在满足一定图像质量条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量。在信息论中称为信源编码。

图像从结构上大体上可分为两大类,一类是具有一定图形特征的结构,另一类是具有一定概率统计特性的结构。基于不同的图像结构特性,应采用不同的压缩编码方法。五.图像数据压缩技术的重要指标(1)压缩比:图像压缩前后所需的信息存储量之比,压缩比越大越好。(2)压缩算法:利用不同的编码方式,实现对图像的数据压缩。(3)失真性:压缩前后图像存在的误差大小。

全面评价一种编码方法的优劣,除了看它的编码效率、实时性和失真度以外,还要看它的设备复杂程度,是否经济与实用。常采用混合编码的方案,以求在性能和经济上取得折衷。随着计算方法的发展,使许多高效而又比较复杂的编码方法在工程上有实现的可能。1)办公自动化;

2)医学图像处理;

3)卫星遥感遥测系统;

4)高清晰度电视HDTV;

5)可视电话、会议电视;

6)移动多媒体图像及视频传输:

彩信业务,手机视频;……

凡是涉及到图像数据的传输、交换与存储的领域均要求进行图像数据的压缩。六图像数据压缩的应用领域七.图像编码中的保真度准则

图像信号在编码和传输过程中会产生误差,尤其是在有损压缩编码中,产生的误差应在允许的范围之内。在这种情况下,保真度准则可以用来衡量编码方法或系统质量的优劣。通常,这种衡量的尺度可分为客观保真度准则和主观保真度准则。

通常使用的客观保真度准则有输入图像和输出图像的均方根误差;输入图像和输出图像的均方根信噪比两种。

均方根误差:

设输入图像是由N×N个像素组成,令其为f(x,y),其中x,y=0,1,2,…,N-1。这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像,这里令重建图像为g(x,y)。它同样包含N×N个像素,并且x,y=0,1,2,…,N-1。(1)客观保真度准则在0,1,2,…,N-1范围内x,y的任意值,输入像素和对应的输出图像之间的误差可用下式表示:而包含N×N像素的图像之均方误差为:由式可得到均方根误差为

如果把输入、输出图像间的误差看作是噪声,那么,重建图像g(x,y)可由下式表示:

在这种情况下,另一个客观保真度准则——重建图像的均方信噪比如下式表示:

图像处理的结果,大多是给人观看,由研究人员来解释的,因此,图像质量的好坏,既与图像本身的客观质量有关,也与视觉系统的特性有关。有时候,客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则,这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量。(2)主观保真度准则评分评价说明1优秀的优秀的具有极高质量的图像2好的

是可供观赏的高质量的图像,干扰并不令人讨厌

3可通过的

图像质量可以接受,干扰不讨厌4边缘的图像质量较低,希望能加以改善,干扰有些讨厌5劣等的图像质量很差,尚能观看,干扰显著地令人讨厌6不能用图像质量非常之差,无法观看另外一种方法是规定一种绝对尺度,如:表6.1电视图像质量评价尺度八.信息理论(一)、信源空间概述

1、信息:事物运动状态或存在方式的不确定性的描述;

2、信源:信源是产生各类信息的实体。信源给出的符号是不确定的,可用随机变量及其统计特性描述。信源空间:随机符号及其出现概率的空间;

3、信源的分类:

(1)连续信源—离散信源;

(2)无记忆信源—有记忆信源(相关信源)—有限长度记忆信源(Markov信源)(二)、信息的度量

1、信息公理

(1)信息由不确定性程度进行度量;

确定事件的信息量为零。

(2)不确定性程度越高信息量越大;

(3)相互独立性与信息量可加性;

独立事件的联合信息等于两个独立事件的信息总和。

满足上述公理的函数为:2、离散无记忆信源(DNMS)的信息量度量:

(1)信源符号的自信息量定义为:(a)非负性;(b)信息量的单位:底为2时——单位为:比特(bit)底为e时——单位为:奈特(Nat)底为10时——单位为:哈特(2)、信源平均自信息量(信息熵)

离散无记忆信源A的平均自信息量(信息熵)定义为:熵是编码所需比特数的下限,即编码所需要最少的比特例:设8个随机变量具有同等概率为1/8,计算信息熵H。解:根据公式4-10可得:

H=8*[-1/8*(log2(1/8))=8*[-1/8*(-3)]=3

图像熵指该图像的平均信息量,即表示图像中各个灰度级比特数的统计平均值,等概率事件的熵最大。3、平均码字长借助熵的概念可以定义量度任何特定码的性能的准则,即平均码字长度。其中βi为灰度级di所对应的码字长度。的单位也是比特/字符。4、编码效率编码符号是在字母集合A={a1,a2,a3,…am}中选取的。如果编码后形成一个新的等概率的无记忆信源,字母数为n,则它的最大熵应为logn比特/符号。因此这是一个极限值。如果H(d)/=logn,则可以认为编码效率已经达到100%,如果H(d)/<logn,则可认为编码效率较低。编码效率冗余度根据信息熵编码理论,可以证明在H条件下,总可以设计出某种无失真编码方法。若编码结果使远大于H,表明这种编码效率很低,占用的比特数太多。若编码结果使等于或接近于H,这种状态的编码方法称为最佳编码。若要求编码结果使<H,则必然丢失信息而引起图像失真。这就是在允许失真条件下的一些失真编码方法。5、压缩比压缩比是衡量数据压缩程度的指标之一。目前常用的压缩比定义为其中LB为源代码长度,Ld为压缩后代码长度,Pr为压缩比。压缩比的物理意义是被压缩掉的数据占据源数据的百分比。当压缩比Pr接近100%时压缩效果最理想。6、互信息

信源编码输出为bk给出的关于ai的信息量究竟为多少呢?为此将引入另外一个信息量度-互信息

对给定的两个离散信源X和Y,Y中事件bk的发生给出关于X中事件ai的互信息I(ai:bk)定义为:其中,p(ai|bk)表示信源编码输出为bk,估计信源输入为ai的条件概率。I(ai|bk)称为条件自信息量,表示在发现信源编码输出为bk,对信源输入为ai的不确定性的猜测或知道bk后ai还保留的信息量。I(ai)表示ai的不确定性。两者值差即为bk解除的ai不确定性的多少。设一幅灰度级为K的图像,图像中第k级灰度出现的概率为pk,图像大小为M×N,每个像素用d比特表示,每两帧图像间隔△t数字图像的熵H图像的平均码字长度R为:编码效率η定义为:信息冗余度为:每秒钟所需的传输比特数bps为:压缩比r为:图像信息源图像预处理图像信源

编码信道编码调制信道传输解调信道解码图像信源

解码显示图像九.图像的压缩模型源数据编码:完成原数据的压缩。通道编码:为了抗干扰,增加一些容错、校验位,实际上是增加冗余。通道:如Internet、广播、通讯、可移动介质源数据编码通道编码通道通道解码源数据解码源数据编码的模型源数据解码的模型映射器量化器符号编码器符号解码器反向映射器源数据编码与解码的模型映射器:减少像素冗余,如使用RLE编码。或进行图像变换量化器:减少视觉心理冗余,仅用于有损压缩符号编码器:减少编码冗余,如使用哈夫曼编码源数据编码与解码的模型预测编码图像编码无损压缩编码有损压缩编码哈夫曼编码行程编码算术编码

频率域方法

其他编码方法常用的图像压缩编码方法※无损压缩算法中删除的仅仅是图像数据中冗余的信息,因此在解压缩时能精确恢复原图像,无损压缩的压缩比很少有能超过3:1的,常用于要求高的场合。第二节无损压缩编码哈夫曼编码等长码:对于一个消息集合中的不同消息,用相同长度的不同码字表示,编解码简单,编码效率不高。变长码:与等长码相对应,对于一个消息集合中的不同消息,也可以用不同长度的码字表示,编码效率高,编码解码复杂。

哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。

方法:将信源符号按出现概率从大到小排成一列,然后把最末两个符号的概率相加,合成一个概率。把这个符号的概率与其余符号的概率按从大到小排列,然后再把最末两个符号的概率加起来,合成一个概率。重复上述做法,直到最后剩下两个概率为止。从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码,如对概率大的赋予码0,对概率小的赋予码1。Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.4Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=1Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S2=00Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=011Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=0100Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=01010Huffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=01011哈夫曼编码效率信源熵为:H=-∑Pilog2Pi=-(0.4log20.4+0.3log20.3+2*0.1log20.1+0.06log20.06+0.04log20.04)=2.14比特/符号平均码字长度:R=∑βiPi码字长度R=∑βiPi=0.4×1+0.3×2+0.1×3+0.1×4+0.06×5+0.04×5=2.2比特/符号编码效率:η=H/R(%)η=H/R=2.14/2.2=0.973=97.3%编码举例cbafe7/225/224/222/2201f=10e=00a=01b=110c=1110d=1111d1/223/226/2222/2213/229/223/2201010101作业:1.有如下信源x,u1u2u3u4u5u6u7u8P1P2P3P4P5P6P7P8其中:P1=0.21,P2=0.09,P3=0.11,P4=0.13,P5=0.07,P6=0.12,P7=0.08,P8=0.19。将该信源进行哈夫曼编码。2.设一幅灰度级为8(分别用S0、S1、S2、S3、S4、S5、S6、S7表示)的图像中,各灰度所对应的概率分别为0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。现对其进行哈夫曼编码X=3.设有一信源X={x1,x2,x3,x4},对应概率P={0.5,0.1975,0.1775,0.125}.

⑴进行霍夫曼编码(要求大概率的赋码字0,小概率的赋码字1),给出码字,平均码长,编码效率;

⑵对码串10101011010110110000011110011解码.

由于霍夫曼编码法需要多次排序,当很多时十分不便,为此费诺(Fano)和香农(Shannon)分别单独提出类似的方法,使编码更简单。具体编码方法如下:①把按概率由大到小、从上到下排成一列,然后把分成两组,,并使得②把两组分别按0,1赋值。然后分组、赋值,不断反复,直到每组只有一种输入为止。将每个所赋的值依次排列起来就是费诺—香农编码。

香农-费诺编码以前面哈夫曼编码的例子进行香农-费诺编码:输入概率

x10.400x20.31010x30.11001100x40.111101x50.06101110x60.0411111从理论上分析,采用哈夫曼编码可以获得最佳信源字符编码效果;实际应用中,由于信源字符出现的概率并非满足2的负幂次方,因此往往无法达到理论上的编码效率和信息压缩比;算术编码以信源字符序列{x,y}为例设字符序列{x,y}对应的概率为{1/3,2/3},Nx和Ny分别表示字符x和y的最佳码长,则根据信息论有:字符x、y的最佳码长分别为1.58bit和0.588bi;这表明,要获得最佳编码效果,需要采用小数码字长度,这是不可能实现的;即采用哈夫曼方法对{x,y}的码字分别为0和1,也就是两个符号信息的编码长度都为1。对于出现概率大的字符y并未能赋予较短的码字;实际编码效果往往不能达到理论效率;为提高编码效率,Elias等人提出了算术编码算法。算术编码的特点

算术编码是信息保持型编码,它不像哈夫曼编码,无需为一个符号设定一个码字;算术编码分为固定方式和自适应方式两种编码;选择不同的编码方式,将直接影响到编码效率;自适应算术编码的方式,无需先定义概率模型,适合于无法知道信源字符概率分布的情况;当信源字符出现的概率比较接近时,算术编码效率高于哈夫曼编码的效率,在图像通信中常用它来取代哈夫曼编码;实现算术编码算法的硬件比哈夫曼编码复杂。编码原理

算术编码方法是将被编码的信源消息表示成0-1之间的一个间隔,即小数区间,消息越长,编码表示它的间隔就越小;以小数表示间隔,表示的间隔越小所需的二进制位数就越多,码字就越长。反之,间隔越大,编码所需的二进制位数就少,码字就短。算术编码将被编码的图像数据看作是由多个符号组成的字符序列,对该序列递归地进行算术运算后,成为一个二进制分数;接收端解码过程也是算术运算,由二进制分数重建图像符号序列。编码举例

设图像信源编码可用a、b、c、d这4个符号来表示,若图像信源字符集为{dacba},信源字符出现的概率分别如下表所示,采用算术编码对图像字符集编码。信源字符abcd出现概率0.40.20.20.2算术编码的基本步骤

(1)根据已知条件和数据可知,信源各字符在区间[0,1]内的子区间间隔分别如下:

a=[0.0,0.4)b=[0.4,0.6)c=[0.6,0.8)d=[0.8,1.0)(2)计算中按如下公式产生新的子区间:(3)第1个被压缩的字符为“d”,其初始子区间为[0.8,1.0)(4)第2个被压缩的字符为“a”,由于其前面的字符取值区间为[0.8,1.0)范围,因此,字符“a”应在前一字符区间间隔[0.8,1.0)的[0.0,0.4)子区间内,根据公式(8-15)可得:

=0.8+0.0×(1.0-0.8)=0.8=0.8+0.4×(1.0-0.8)=0.88(5)第3个被压缩的字符为“c”,由于其前面的字符取值区间为[0.8,0.88)范围内,因此,字符“c”应在前一字符区间间隔[0.8,0.88)的[0.6,0.8)子区间内,根据(8-15)可得:

=0.8+0.6×(0.88-0.8)=0.848=0.8+0.8×(0.88-0.8)=0.864(6)第4个被压缩的字符为“b”,由于其前面的字符取值区间为[0.848,0.864)范围内,因此,字符“b”应在前一字符区间间隔[0.848,0.864)的[0.4,0.6)子区间内,根据(8-15)可得:

=0.848+0.4×(0.864-0.848)=0.8544=0.848+0.6×(0.864-0.848)=0.8576(7)第5个被压缩的字符为“a”,由于其前面的字符取值区间为[0.8544,0.8)范围内,因此,字符“a”应在前一字符区间间隔[0.8544,0.8576)的[0.0,0.4)子区间内,根据(8-15)可得:

=0.8544+0.0×(0.8576-0.8544)=0.8544=0.8544+0.4×(0.8576-0.86544)=0.85568经过上述计算,字符集{dacba}被描述在实数[0.8544,0.85568)子区间内,即该区间内的任一实数值都惟一对应该符号序列{dacba};因此,可以用[0.8544,0.85568)内的一个实数表示字符集{dacba}。[0.8544,0.85568)子区间的二进制表示形式为:[0.1101101010000110,0.1101101100001101);在该区间内的最短二进制代码为0.11011011,去掉小数点及其前的字符,从而得到该字符序列的算术编码为11011011。算术编码可以通过硬件电路实现,在上述乘法运算,可以通过右移来实现,因此在算术编码算法中只有加法和移位运算。算术编码效能

根据上述运算结果,编码11011011惟一代表字符序列{dacba},因此,平均码字长度为:

bit/字符

[题]己知信源X=

试对1011进行算术编码。011/43/4[解](1)对二进制信源只有两个符号“0”

和“1”,设置小概率Qe=1/4,大概率

Pe=1–Qe=3/4.(2)设C为子区间的左端起始位置,A为子区间的宽度,符号“0”的子区间为[0,1/4),符号“1”的子区间为[1/4,1)(3)初始子区间为[0,1),C=0,A=1,子区间按以下各步依次缩小:步序符号CA110+1*1/4=1/41*3/4=3/4201/43/4*1/4=3/16311/4+3/16*1/4=19/643/16*3/4=9/644119/64+9/64*1/4=85/2569/64*3/4=27/25601/4119/6485/25610117/16112/256最后的子区间左端(起始位置)C=(85/256)d=(0.01010101)b最后的子区间右端(终止位置)C+A=(112/256)d=(0.01110000)b

编码结果为子区间头、尾之间取值,其值为0.011,可编码为011,原来4个符号1011现被压缩为三个符号011。行程编码RLE编码(游程长度编码)——RunLengthEncoding概念:行程:具有相同灰度值的像素序列。编码思想:去除像素冗余。用行程的灰度和行程的长度代替行程本身。由于一幅图像中有许多颜色相同的图块,用一整数对存储一个像素的颜色值及相同颜色像素的数目(长度)。例如:(G,L)

长度颜色值编码时采用从左到右,从上到下的排列,每当遇到一串相同数据时就用该数据及重复次数代替原来的数据串。000000003333333333222222222226666666111111111111111111111111555555555555888888888888888888555555555555553333222222222222222222(0,8)(3,10)(2,11)(6,7)(1,18)(1,6)(5,12)(8,18)(5,14)(3,4)(2,18)18*7的像素颜色仅用11对数据游程长度编码RLE(RunLengthEncoding):分析:对于有大面积色块的图像,压缩效果很好直观,经济,是一种无损压缩对于纷杂的图像,压缩效果不好,最坏情况下,会加倍图像RLE编码——RunLengthEncoding适合行程编码的图适合行程编码的图※有损压缩是通过牺牲图像的准确率以实现较大的压缩率,如果容许解压图像有一定的误差,则压缩率可显著提高。有损压缩在压缩比大于30:1时仍然可重构图像,而如果压缩比为10:1到20:1,则重构的图像与原图几乎没有差别第三节有损压缩编码变换编码图像数据一般有较强的相关性,若所选用的正交矢量空间的基矢量与图像本身的主要特征相近,在该正交矢量空间中描述图像数据则会变得更简单。经过正交变换,会把原来分散在原空间的图像数据在新的坐标空间中得到集中。对于大多数图像,大量变换系数很小,只要删除接近于零的系数,并且对较小的系数进行粗量化,而保留包含图像主要信息的系数,以此进行压缩编码。在重建图像进行解码时,所损失的将是一些不重要的信息,几乎不会引起图像的失真。基本概念:将空间域里描述的图像,经过某种变换(常用的是二维正交变换,如付里叶变换、离散余弦变换、沃尔什变换等),在变换域中进行描述,达到改变能量分布的目的。优点:将能量在空间域的分散分布变为在变换域的相对集中分布有利于进一步采用其它的处理方式,如“之”(zig-zag)字形扫描、自适应量化、变长编码等,从而对图像信息量进行有效压缩。变换编码的概念物理解释:

图像正交变换实现数据压缩的物理本质:经过坐标旋转或变换,能够把接近均匀散布在各个坐标轴上的原始图像数据,变换在新的坐标系中,集中在少数坐标上。可用较少的编码比特表示一幅子图像。图9.13正交变换物理概念012345677654321(a)变换前x1x2012345677654321(b)变换后x1x2y1y2从左图可以看出,相邻像素之间的相关性非常强。从右图可以看出,直流系数位于左上角。变换域要传送的数据量比空间域的大大减少。591106–1828–3414183350000000-1000000030000000-1000000000000000-1000000000000000(b)DCT系数矩阵图9.14一个子图象的二维余弦变换实例98929580758268509791947974816749958992777279654793879075707763459185887368756143898386716673594187888469647157398579826762695537(a)子图像矩阵DCTxyuv00实例分析:

关于正交变换码压缩的说明:将被处理的数据按照某种变换规则映射到另一个域中处理。①如果将一幅图像作为一个二维矩阵,则其正交变换计算量太大,通常将图像分成8×8或16×16的小块进行处理。②正交变换没有压缩数据量,不改变信源的熵,③正交变换前后能量不变,只是重新分配。④变换前后信息量没有丢失。典型的变换编码系统中编码器有四步:子图像分割、变换、量化和编码。先将整幅图像分成n×n(n一般为8或16)的子图像后分别处理:因为(1)小块图像的变换计算容易

(2)距离较远的像素之间的相关性比距离较近的像素之间的相关性小。压缩并不是在变换步骤中取得,而是在量化变换系数和编码时取得的。变换编码的步骤一幅n×n图像可表示成它的二维变换T(u,v)的函数。

(1)变换选择许多图像变换都可用于变换编码,变换选择取决于可允许的重建误差和计算复杂性.由f(x,y)组成的n×n矩阵若定义一个截断模板

F的截断近似

M(u,v)消除求和贡献最小的基础图像

整幅图像的均方差为所有截除的变换系数的方差之和。因此,能把最多的信息集中到最少的系数上的变换所能产生的重建误差最小。不同的变换,其信息集中能力不同。傅立叶变换、余弦变换、哈达玛变换一维离散余弦变换:一维DCT变换实际上就是将信号f(x)分解成直流分量(u=0)、基波分量(u=1)和各次谐波分量(u>1)由于二维离散余弦变换的可分离性,二维DCT可以用一维DCT来实现

二维离散余弦变换:利用FFT的快速算法的FDCT算法余弦变换核实际上就是傅里叶变换核的实部。而变换计算中的乘法运算就是f(x)与变换核的乘法运算。一种自然的想法就是先对f(x)执行FFT,然后对其取实部就可以了。利用代数分解的FDCT算法一维离散哈达玛变换

一维离散哈达玛反变换

离散哈达玛变换二维离散哈达玛变换

二维离散哈达玛反变换

基于FFT变换的图像压缩技术基于DCT变换的图像压缩技术基于哈达玛变换的图像压缩技术

FFT变换编码效果

原始图像压缩比为2:1erms=0.0398

压缩比为8:1erms=0.0474例erms均方根误差DCT变换编码效果原始图像压缩比为2:1erms=0.0359

压缩比为8:1erms=0.0489

Hadamard变换编码效果原始图像压缩比为2:1

erms=0.0362

压缩比为8:1erms=0.0515

从erms值比较可知,DCT比FFT和HT有更强的信息集中能力.离散余弦变换在图像压缩中具有广泛的应用例如,在JPEG图像压缩算法中,首先将输入图像划分为88的方块,然后对每一个方块执行二维离散余弦变换,最后将变换得到的量化的DCT系数进行编码和传送,形成压缩后的图像格式。在接受端,将量化的DCT系数进行解码,并对每个88方块进行二维IDCT,最后将操作完成后的块组合成一幅完整的图像。

在变换编码中,首先要将图像数据分割成子图像,然后对子图像数据块实施某种变换,如DCT变换,那么子图像尺寸取多少好呢?根据实践证明子图像尺寸取4×4、8×8、16×16适合作图像的压缩,这是因为:

<1>如果子图像尺寸取得太小,虽然计算速度快,实现简单,但压缩能力有一定的限制。

<2>如果子图像尺寸取得太大,虽然去相关效果变好,因为象DFT、DCT等正弦型变换均具有渐近最佳性,但也渐趋饱和。若尺寸太大,由于图像本身的相关性很小,反而使其压缩效果不显示,而且增加了计算的复杂性。

(2)子图像尺寸选择变换编码的步骤这里考虑对子图像经过变换后,要截取的变换系数的数量和保留系数的精度。在大多数变换编码中,选择保留的系数办法有以下二种:

<1>根据最大方差进行选择的,称为区域编码。

<2>根据最大值的量级选择,称为阈值编码。而整个对变换后的子图像的截取、量化和编码过程称为比特分配

(3)比特分配变换编码的步骤典型的区域模板

区域编码具有最大方差的变换系数携带着图像大部分信息并在编码处理的过程中应该保留下来。最大方差的系数通常被定位在图像变换的原点周围。区域取样处理可看成每个T(u,v)与相应的区域模板中的元素相乘。对区域取样过程中保留的系数必须进行量化和编码。因此,区域模板有时表示成对每个系数编码的比特数。两种分配方案:给系数分配相同的比特数给系数不均匀地分配几个固定数目的比特数(a)(b)区域编码的几点说明:

因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。例:典型的阈值模板和系数排序序列阈值编码(门限编码)对任何子图像,最大量级的变换系数对重构子图像的品质具有最大的影响.因为不同子图像的最大系数的位置是变化的,所以通常将m(u,v)T(u,v)的元素重新排列成一个一维行程编码.有3种基本途径对一幅变换后的子图像进行门限处理(即生成子图像门限模板函数)<1>对所有的子图像使用单一的全局门限;

对不同图像的压缩等级不同.<2>对每幅图像使用不同的门限;

对每幅子图像丢弃相同数目的系数,编码率恒定.<3>门限随子图像中每个系数的位置函数的变化而变化.

编码率变化,但是可以将门限处理和量化过程结合起来.是取阈值和量化近似,Z是变换的归一化矩阵

使用下式代替m(u,v)T(u,v),

将取阈值和量化结合起来(a)一条门限编码量化曲线对Z(u,v)赋予某个常数c(b)JPEG编码标准中的DCT量化步长矩阵Z

使用8×8DCT系数的12.5%门限编码区域编码利用DCT标准化阵列的压缩34:167:18:1误差预测编码的基本概念预测编码(Prediction

Coding)是根据某一种模型,利用以前的(已收到)一个或几个样值,对当前的(正在接收的)样本值进行预测,将样本实际值和预测值之差进行编码。如果模型足够好,图像样本时间上相关性很强,一定可以获得较高的压缩比。具体来说,从相邻像素之间有很强的相关性特点考虑,比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。那么,当前像素的灰度或颜色信号的数值,可用前面已出现的像素的值,进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法称为预测编码方法。预测编码2023/2/6统计编码126就是根据过去的信号样值预测下一个样值,并仅把预测值与现实的样值之差(预测误差)加以量化、编码以后进行传输的方式,如下图所示,在接收端,经过和发信端的预测完全相同的操作,可以得到量化的原信号,然后再通过低通滤波便可恢复与原信号近似的波形。预测编码的原理预测编码的基本思想

建立一个数学模型

利用以往的样本数据对新样本值进行预测

将预测值与实际值相减

对其差值进行编码,这时差值很少,可以减少编码码位预测编码的分类预测编码:在均方误差最小的准则下,使其误差最小的方法。

线性预测:利用线性方程计算预测值的编码方法。线性预测编码方法,也称差值脉冲编码调制(Differention

Pulse

Code

Modulation,DPCM)非线性预测:利用非线性方程计算预测值的编码方法。。

帧内预测编码:根据同一帧样本进行预测的编码方法。帧间预测编码:根据不同帧样本进行预测的编码方法。

自适应预测编码(ADPCM):预测器和量化器参数按图像局部特性进行调整的编码方法。条件补充帧间预测编码:在帧间预测编码中,若帧间对应像素样本值超过某一阈值就保留,否则不传或不存,恢复时就用上一帧对应像素样本值来代替,称为条件补充帧间预测编码。

运动补偿预测编码:在活动图像预测编码中,根据画面运动情况,对图像加以补偿再进行帧间预测的方法称为运动补偿预测编码方法。DPCM的基本原理对于具有M种取值的符号序列{xk},其第L个符号的熵满足:知道了前面的符号xk(k<L),再猜后续符号xL,则知道得越多,熵越小。意味着该信源的不确定度减小,数码率自然降低。基础理论:发展历史1952年,Bell实验室的B.M.Oliver等人开始线性预测编码理论研究。同年,该实验室的C.C.Culter取得了DPCM(DifferentialPulseCodeModulation,差分脉冲编码调制)系统的专利,奠定了真正实用的预测编码系统的基础。预测编码技术:从过去的符号样本来预测下一个符号样本的值。直观理解:根据:认为在信源符号之间存在相关性。如果符号的预测值与符号的实际值比较接近,它们之间的差值幅度的变化就比原始信源符号幅度值的变化小,因此量化这种差值信号时就可以用比较少的位数来表示差值。DPCM的基础—对预测的样本值与原始的样本值之差进行编码。DPCM系统DPCM系统原理框图量化器预测器编码器xk-ekSk信道解码器预测器接收端发送端发送端

先发送一个起始值x0;接着就只发送预测误差值接收端接收到量化后的误差与本地算出的预测值相加,得到恢复信号;式中线性预测:式中表示的时序在之前,为因果性预测,否则为非因果性预测。如果没有传输误码,预测编码系统的误差为:这正是发送端量化器造成的量化误差。即整个预测编码系统的失真完全来自量化器。对于xk已经是数字信号,去掉量化器,qk

=0:可用于“信息保持型”(Lossless)编码;如果qk≠0:可用于“非信息保持型”(Lossy)编码。

①算法简单、速度快、易于硬件实现。②编码压缩比不太高,DPCM一般压缩到2~4bit/s。③误码易于扩散,抗干扰能力差。预测编码方法的特点分形编码

分形编码分形是20世纪70年代出现的一门非线性学科。分形一词最早由数学家Mandelbrot提出,用以描述这样的几何外形,它与欧几里德外形相反,处处无规则可言,但在各种尺度上都有同样程度的不规则性。

20世纪80年代中期,Barnsley提出了迭代函数系统(IFS)的分形图像压缩编码方法,为图像编码提供了一个全新的思路。在此之后,他的学生Jacquin又提出分块的迭代变换算法理论,为利用计算机自动进行分形压缩奠定了基础。从分形的角度,许多视觉上感觉非常复杂的图形其信息量并不大,可以用算法和程序集来表示,在借助计算机可以显示其结合形态,这就是可以用分形的方法进行图像压缩的原因。对于分形图像压缩,它是一个逆问题,即把欲编码的图像当作一组压缩仿射变换的迭代极限,假如能够找到这些压缩仿射变换的参数,就可以重建原始图像。为此寻找一个压缩仿射变换,使它对原图像进行压缩仿射变换后的结果能与原图像的一部分吻合。如果原图像各个部分均可被对原图的不同压缩仿射变换的结果所覆盖,则就找到了一个将图像映射成自身的变换。分形编码由于其计算量的繁复、庞大,在实际应用中受到了限制。图像标准的制定:

ISO和CCITT(国际电报电话咨询委员会)联合制定标准的类型:连续图像压缩标准:静止帧黑白、彩色压缩:(1)面向静止的单幅图像-JPEG连续帧黑白、彩色压缩:(2)面向连续的视频影像-MPEG

第四节图像压缩编码标准

JPEG标准简述

JPEG压缩流程

JPEG压缩算法的实现

JPEG压缩举例

静止图像压缩编码标准-JPEGJPEG标准简述

由ISO/IEC与CCITT联合发起的联合图像专家组,在过去十几年图像编码研究成果的基础上于20世纪90年代初制定了静止图像(包括8bit/像素的灰度图像与24bit/像素的彩色图像)的编码标准。

JPEG标准在较低的计算复杂度下,能提供较高的压缩比与保真度。在视觉效果不受到严重损失的前提下,算法可以达到15到20的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到40:1或更高的压缩比。JPEG定义了一个基本系统,一个符合JPEG标准的编解码器至少要满足基本系统的技术指标。JPEG基本系统其核

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论