图像编码技术比较_第1页
图像编码技术比较_第2页
图像编码技术比较_第3页
图像编码技术比较_第4页
图像编码技术比较_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 河南大学物理与电子学院本科毕业论文目 录摘 要:10 前言11图像编码综述21.1图像编码起源与发展21.2图像编码的基本原理21.3图像编码的目的32经典编码技术42.1熵编码42.11行程编码42.12霍夫曼编码52.13算术编码52.2预测编码62.21差分脉冲编码调制62.22自适应差分脉冲编码调制72.3变换编码72.31 K-L变换82.32 离散余弦变换82.4混合编码83第二代编码技术93.1分型编码93.2模型编码93.3小波变换编码104图像编码技术发展前景115结论12参考文献1313图像编码技术比较刘炎基(河南大学物理与电子学院,河南 开封,475004)摘 要: 本

2、文简要回顾了图像编码技术起源及其发展。介绍了经典图像编码技术和“第二代”图像编码技术的理论思想与实现方法,比较分析了各种编码技术之间的区别与优缺点,并讨论了图像编码技术的发展前景。关键词: 数字图像处理;图像编码技术;比较;分析Compare of Image Coding Technology Liu Yan-ji(School of Physics and Electronics, Henan University, Henan Kaifeng 475004, China)Abstract:In this paper, a brief review of the origin of the

3、 image coding technology and its development. Introduced the classic image coding techniques and "second generation" image coding technology to achieve the theoretical ideas and methods, comparative analysis of a variety of coding techniques and the advantages and disadvantages of the dist

4、inction between and the image coding techniques discussed prospects for development.Key words: digital picture processing ; image coding technology;compare; analyse0 前言图像编码技术是20世纪60年代发展起来的一门新兴学科。近40年来,由于大规模集成电路技术和计算机技术的迅猛发展,离散数学理论的创立和完善以及社会各方面应用需要的不断增长,图像编码技术的理论和方法得到进一步完善,取得了很多成果,使得数字图像得到了近似完美的应用,显示

5、出其广阔的前景! 1图像编码综述1.1图像编码起源与发展图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是设法改变信源的概率分布,使其尽可能地非均匀,再用最佳编码方法使平均码长逼近信源熵。使用此途径的压缩方法其效率一般以其熵为上界,压缩比饱和于10:1,如Huffman编码、算术编码、行程编码等。另一种是联合信源的冗余度也寓于信源间的相关性之中,去除它们之间的相关性,使之成为或基本成为不相关信源,如预测编码、变换域编码、混合编码等,但也大都受信息熵的约束。总体上可以概括为熵

6、编码,预测编码,变换编码。也称为三大经典编码方法。随着人们对传统压缩编码方法的深入研究和应用,逐渐发现了这些传统方法的许多缺点。如高压缩比时恢复图像会出现方块效应,人眼视觉系统(HVS)的特性不易被引入到算法中等。为了克服这些缺点,1985年MKunl等人提出了第2代图像压缩编码的概念。经过近20年的发展,在这一框架下,人们提出了几种新的编码方法:分形编码、小波变换编码和基于模型的编码方法等。于是,对数据压缩技术的研究就突破了传统Shannon理论的框架,使得压缩效率得以极大提高。1.2图像编码的基本原理 虽然表示图像需要大量的数据,但是图像数据是高度相关的,或者说存在冗余信息,去掉这些信息后

7、可以有效压缩图像,同时不会损害图像的有效信息。数字图像的冗余主要表现为一下几种形式:空间冗余,时间冗余,视觉冗余,信息熵冗余,结构冗余和知识冗余。图像数据的这些冗余信息为图像压缩编码提供了依据。图像编码的目的就是充分利用图像中存在的各种冗余信息,特别时空间冗余,时间冗余以及视觉冗余,以尽量少的比特数来表示图像。利用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之一。1.3图像编码的目的图像编码主要使利用图像信号的统计特性以及人类视觉的生理学及心理学特性,对图像信号进行高效编码,即研究数据压缩技术,目的是在保证图

8、像质量的前提下压缩数据,便于存储和传输,以解决数据量大的矛盾。一般来说,图像编码的目的有三个:1.减少数据存储量;2.降低数据率以减少传输带宽;3.压缩信息量,便于特征提取,为后续识别做准备。1.4图像编码的评价随着众多图像压缩算法的出现,如何评价图像压缩算法就成为重要的课题。一般来说,评价图像压缩算法的优劣有以下4个参数:1) 算法的编码效率算法的编码效率通常有几种表现形式:平均码字长度(R),图像的压缩比(rate,r),每秒钟所需的传输比特数(bps),图像熵与平均码长之比()。2) 编码图像的质量图像质量评价可分为客观质量评价和主观质量评价。最常用的客观质量评价指标使均方误差(MSE)

9、和峰值信噪比(PSNR)。主观质量评价是指由一批观察者对编码图像进行观察并打分,然后综合所有人的批评结果,给出图像的质量评价。客观质量评价能够快速有效地评价编码图像的质量,但符合客观质量评价指标的图像不一定具有较好的主观质量。主观质量能够与人的视觉效果相匹配,但其评判过程缓慢费时。3) 算法的适用范围特定的图像编码算法具有其相应的适用范围,并不是对所有图像都有效。一般来说,大多数基于图像信息统计特性的压缩算法具有较广的适用范围,而一些特定的编码算法的适用范围较窄,如分形编码主要用于自相似性高的图像。4) 算法的复杂度算法的复杂度即指完成图像压缩和解压缩所需的运算量和硬件实现该算法的难易程度。优

10、秀的压缩算法要求有较高的压缩比,压缩和解压缩快,算法简单,易于硬件实现,还要求解压缩后的图像质量较好。选用编码方法时一定要考虑图像信源本身的统计特性,多媒体系统的适应能力,应用环境以及技术标准。2经典编码技术经典图像编码技术根据编码原理可分为:熵编码、预测编码、变换编码和混合编码等。2.1熵编码 熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码。熵编码的基本原理是给出现概率较大的符号赋予一个短码子,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码方法有行程编码、霍夫曼编码和算术编码等。2.11行程编码行程编码又称行程长度编码,是一种熵编码,该编码属于无损压缩

11、编码。对于二值图有效。其基本原理是:将具有相同值的连续串用其串长和一个代表值来代替,使符号长度少于原始数据的长度。改连续串就称为行程,串长称为行程长度。例如:5555557777733322221111111行程编码为:(5,6)(7,5)(3,3)(2,4)(l,7)。可见,行程编码的位数远远少于原始字符串的位数。行程编码分为定长和不定长编码两种。定长编码是指编码的行程长度所用的二进制位数固定,而变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。使用变长行程编码需要增加标志位来表明所使用的二进制位数。行程编码比较适合与二值图像的编码,一般用于量化后出现大量零系数连续的场合

12、,用行程来表示连零码。行程编码对传输差错很敏感,一位符号出错就会改变行程编码的长度,使整个图像出现偏移,因此,一般要用行同步、列同步的方法,把差错控制在一行一列之内。它适用于那些包含很少灰度级的图像,对单一颜色背景下物体的图形图像可以达到很高的压缩比,但对其他类型的图像压缩比就很低。在最坏的情况下,RLC甚至可将文件的大小加倍。2.12霍夫曼编码霍夫曼(Huffman)编码是1952年为文本文件而建立,是一种熵编码,属于无损压缩编码。该方法完全依据字符出现的概率来构造码字,对频繁出现的字符使用较短的码字,而对出现次数较少的字符使用较长的码字。在具有相同信源概率分布的前提下,它的平均码字长度是最

13、短的。变长最佳编码定理是霍夫曼编码的理论基础。静态霍夫曼编码使用一棵在压缩之前就建好的编码树,它是根据可能的字符出现的概率来生成的。相反,动态霍夫曼编码是在编码过程中建立它的编码树。具体的方法是,在分配码字长度时,首先将其中概率最小的两个符号的概率求和,并把它看作是一个新组合符号的概率,再与其它符号按概率递降顺序排列,重复上述做法,直到最后只剩下两个符号的概率为止。然后开始以相反顺序逐步进行编码,每一步有两个概率分支,各赋予一个二进制的码。可以对概率小的赋编码为0,则概率大的就赋l,也可以反过来赋编码。这种统计方法能够达到更高的压缩比,而且此方法有效简单,编码效率高。但是,这是以增大编码和解码

14、的时间为代价的。霍夫曼编码具有一些明显的特点: 1) 编出来的码都是异字头码,保证了码的唯一可译性。 2) 由于编码长度可变。因此译码时间较长,使得霍夫曼编码的压缩与还原相当费时。 3) 编码长度不统一,硬件实现有难度。 4) 对不同信号源的编码效率不同,当信号源的符号概率为2的负幂次方时,达到100的编码效率;若信号源符号的概率相等,则编码效率最低。 5) 由于"0"与"1"的指定是任意的,故由上述过程编出的最佳码不是唯一的,但其平均码长是一样的,故不影响编码效率与数据压缩性能。2.13算术编码算术编码是80年代发展起来的一种熵编码方法,其基本原理是将

15、被编码的数据序列表示成0和1之间的一个间隔(也就是一个小数范围),该间隔的位置与输入数据的概率分布有关。信息越长,表示间隔就越小。因而表示这一间隔所需的二进制位数就越多。算数编码有两种模式:一种是基于信源概率统计特性的固定编码模式,另一种是针对未知信源概率模型的自适应模式。算术编码适合于由相同的重复序列组成的文件,算术编码接近压缩的理论极限。这种方法,是将不同的序列映像到0到1之间的区域内,该区域表示成可变精度(位数)的二进制小数,越不常见的数据要的精度越高(更多的位数),这种方法比较复杂,因而不太常用。2.2预测编码预测编码是基于图像数据的空间或时间冗余特性,用已传输的像素对当前的像素进行预

16、测,然后对预测误差进行量化和编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。预测编码可以分为一维预测(行内预测)、二位预测(帧内预测)和三维预测(帧间预测)。常用的预测编码有差分脉冲编码调制(DPCM)和自适应差分脉冲编码调制(ADPCM)等。2.21差分脉冲编码调制在PCM系统中,原始的模拟信号经过采样后得到的每一个样值都被量化成为数字信号。为了压缩数据,可以不对每一样值都进行量化,而是预测下一样值,并量化实际值与预测值之间的差值,这就是DPCM(差分脉冲编码调制)。1952年贝尔(Bell)实验室的C.C.Cutler取得了差

17、分脉冲编码调制系统的专利,奠定了真正实用的预测编码系统的基础。在图像信号中应用DPCM时,用作预测的像素和被预测的像素可以在同一行,也可以在不同行(同一帧),甚至在不同帧,分别称为一维预测、二维预测和三维预测。DPCM的优点是算法简单,容易硬件实现,缺点是对信道噪声很敏感,会产生误差扩散。即某一位码出错,对图像一维预测来说,将使该像素以后的同一行各个像素都产生误差;而对二维预测,该码引起的误差还将扩散到以下的各行。这样,将使图像质量大大下降。同时,DPCM的压缩率也比较低。随着变换编码的广泛应用,DPCM的作用已很有限。2.22自适应差分脉冲编码调制进一步改善量化性能或压缩数据率的方法是采用自

18、适应量化或自适应预测,即自适应脉冲编码调制(ADPCM)。它的核心想法是:利用自适应的思想改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值,使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。1) 自适应量化 在一定量化级数下减少量化误差或在同样的误差条件下压缩数据,根据信号分布不均匀的特点,希望系统具有随输入信号的变化区间足以保持输入量化器的信号基本均匀的能力,这种能力叫自适应量化。 自适应量化必须有对输入信号的幅值进行估值的能力,有了估值才能确定相应的改变量。若估值在信号的输入端进行,称前馈自适应;若在量化输出端进行,称反馈自适

19、应。信号的估值必须简单,占用时间短,才能达到实时处理的目的。 2) 自适应预测 预测参数的最佳化依赖信源的特征,要得到最佳预测参数显然是一件繁琐的工作。而采用固定的预测参数往往又得不到较好的性能。为了能使性能较佳,又不致于有太大的工作量,可以采用自适应预测。 为了减少计算工作量,预测参数仍采用固定的,但此时有多组预测参数可供选择,这些预测参数根据常见的信源特征求得。编码时具体采用哪组预测参数需根据特征来自适应地确定。为了自适应地选择最佳参数,通常将信源数据分区间编码,编码时自动地选择一组预测参数,使该实际值与预测值的均方误差最小。随着编码区间的不同,预测参数自适应地变化,以达到准最佳预测。2.

20、3变换编码变换编码是将空间域里描述的图像,通过某种变换(常用的是二位正交变换,如离散余弦变换、KL变换等),映射到另一变换域中,是变换后的系数之间的相关性降低。图像变换本身并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码才可以有效的压缩图像。2.31 K-L变换K-L变换是一种最佳正交变换。它是用数据本身的相关矩阵对角化后完成的,这种变换将产生完全不相关的变换系数。如果图像数据之间是高度相关的,经过K-L变换后的系数将出现多个零值,同时某些系数的值会很小。K-L变换的变换矩阵是由图像数据本身求得的,不同的图像数据有不同的变换矩阵,由此造成反变换矩阵的不

21、惟一性;另外K-L变换矩阵的构造计算量很大,因而它不是一种实用的变换方法,通常作为评价其他线性变换的比较基准。2.32 离散余弦变换K-L变换算法复杂度较高,所以在实际编码工作中,人们常用离散余弦变换。对大多数图像信源来说,DCT变换是现行编码方法中最接近K-L变换的方法。DCT先根据变换系数的能量分布,将整个图像分成N*N像素块,然后对这N*N像素块逐一进行DCT变换。其中变换后幅值较大的图像系数大多集中在图像块的左上角。与其它系数相比,这些低频系数包括了图像的大部分内容,具有的能量最大,在变换图像中的地位最重要,应使它们的量化误差最小。另一方面,大多数图像的高频分量较小,对图像质量影响甚微

22、,加上人眼对高频成分的失真不太敏感,可以使用更粗的量化,一般采用设定闲值的方法,置小于闽值的变换系数为零,由此传送变换系数所用的码率要大大小于传送图像像素所用的码率,从而大大提高了编码效率。经区域编码和阐值编码后,变换图像的系数大部分为零,必须采用有效的方法将非零系数和零系数组织起来,在带有最少冗余的同时保证最大的连零系数出现概率,在DCT图像编码中,可以对变换系数采用Z字形扫描。2.4混合编码混合编码是指综合了熵编码、变换编码或预测编码的编码方法,如JPEG标准和MPEG标准等。3第二代编码技术3.1分型编码分形编码是在数学家Manddbmt建立的分型几何理论的基础上发展起来的一种编码方法。

23、分型编码最大限度的利用了图像在空间域上的自相似性,通过消除图像的几何冗余来压缩数据。M.Barnsley将迭代函数系统(IFS)用于描述图像的自相似性,并将其用于图像编码。对分形定义的一般描述:1)分形应有精细的结构,有任意小比例的细节。2)它是如此的不规则,以至其局部和整体都不能用传统的几何语言来描述。3)分形通常有某种自相似的形式,可能是近似的或是统计的。4)其“分形维数”一般大于其拓扑维数,并且通常能以非常简单的方法定义,由迭代方法产生。分形编码的方法是利用图形处理技术,如颜色分割、边缘检测、频谱分析等将原始图像分割成若干子图像,然后为每个子图像寻找迭代函数,子图像以迭代函数的形式存储。

24、由于这样的迭代函数一般只需要几个数据表示即可,所以分形压缩可以达到较高的压缩比。分形编码是一种新颖、独特的压缩方法。它充分考虑自然景物的特点。其优点是:压缩比取决于图像分割后所产生的子块的大小,子块取得越大,压缩比越高;由于分形变换可把图像划分成大得多、形状复杂得多的分区,故压缩比不受分辨率的影响。缺点有:分形编码是非对称的,压缩时计算量较大,所需时间较长,但解压缩速度很快;随被压缩图像增大,运算量增长过快。3.2模型编码基于模型的图像编码技术是近几年发展起来的一种很有前途的低比特率编码方法。它利用了计算机视觉和计算机图形学中的方法和理论,其基本出发点是在编、解码两端分别建立起相同的模型,针对

25、输入的图像提取模型参数,或根据模型参数重建图像。模型编码方法的核心是建模和提取模型参数,其中模型的选取、描述和建立是决定模型编码质量的关键因素。为了对图像数据建模,一般要求对输入图像要有某些先验知识。根据使用的模型的不同,模型编码可以分为语义基编码和物体基编码。基于模型的图像编码方法是利用先验模型来抽取图像中的主要信息,并以模型参数的形式表示它们,因此可以获得很高的压缩比。然而在模型编码方法的研究中还存在很多问题,例如:模型法需要先验知识,不适合一般的应用;对不同的应用所建模型是不一样的;在线框模型中控制点的个数不易确定,还未找到有效的方法能根据图像内容来选取;由于利用模型法压缩后复原图像的大

26、部分是用图形学的方法产生的,因此看起来不够自然;传统的误差评估准则不适合用于对模型编码的评价。3.3小波变换编码小波变换编码是随着小波变换理论的研究而提出的一种编码方式。小波变换的本质是多分辨率或多尺度地分析信号,非常适合视觉系统对频率感知的对数特性,因此,它很适合与图像信号的处理。小波变换编码一方面具有传统编码方法的一些优点,能够很好的消除统计冗余,另一方面它的多分辨率特性提供了利用人眼视觉特性的很好机制,而且变换后的图像数据能够保持原图像在各种分辨率下的精细结构,为进一步去除其他形式的冗余提供了便利。 小波变换编码的核心问题是要对子带图像进行小波分解系数的量化和编码。低频子带图像包含原图像

27、的大部分能量,即包含图像的基本特性。它在图像重构算法中起主导作用,对重建图像的质量有很大影响,因此这部分信号应精确保留。高频子图像的系数分布符合广义高斯分布,对其系数进行粗量化编码较为有效。这也完全符合人的视觉特性,根据对人眼视觉系统的研究可知,人眼视觉灵敏度具有明显的低通特性,而且对不同方向上的敏感度也不一样,尤其是对倾斜方向的刺激不太敏感,如人眼对对角线方向子图像系数误差敏感度较低,因此可对对角线方向子图像进行粗量化高压缩。小波变换后的能量主要集中在低频系数分量,而其他高频系数分量大多为零值,这为高倍率压缩提供了可能。通过选择合适的具有平滑特性小波基,就可消除重建图像中出现的方块效应,减小

28、量化噪声,获得较好的重建图像质量。用小波分析方法对图像进行编码时,主要涉及三个方面的问题:图像边界的扩展、小波基的选取和小波系数的组织。小波变换编码压缩方法可分为如下两大类:基于传统的图像编码方法和基于分形理论的小波变换图像编码方法。基于传统的图像编码方法包括:零树小波编码、基于塔式网络矢量量化的小波变换编码、基于LBG算法的小波变换编码、基于标量量化的小波变换编码等。由于不同分辨率级子图像之间存在着相似性,因此,利用此相似性,可提高压缩比。J.M.Shapiro采用零树自嵌套编码方法,对小波分解系数进行压缩,在PSNR=27.54dB的情况下,获得压缩比为1281。这是最著名的一种小波变换图

29、像编码压缩方法。该方法的优点是:与传统的DCT编码相比,它既可以克服方块效应,又可以在低比特率下获得较好的图像主观质量。缺点是:由于它对各子带采用相同的门限量化,因此不能充分利用人眼的视觉特性,限制了图像压缩比的进一步提高。对此,A.Said等人提出了改进算法。针对分形图像编码尚存在的缺点,如编码算法的耗时、自然图像不一定具有严格的分形结构而无法达到预期的高压缩比、高压缩倍率时的方块效应等,有人提出了基于小波变换的分形编码。它具有以下特点:采用平滑小波可去除传统分形变换中存在的方块效应;小波表示使图像的四叉树分割十分自然;可将零树算法看成是该算法的一个特例。图像经过金字塔形离散小波变换后的系数

30、在小波域内可组成分层树状数据结构小波树。这些跨越不同分辨率的小波树之间存在一定的相似性,可通过分形变换来描述。基于小波变换的分形压缩过程就是一个由分层树状结构的顶部开始一层层地向下预测其余系统的过程,而这个由上至下、由粗至细的预测过程是通过分形编码来实现的。 从现在的研究结果可看到,小波变换编码已获得了较好的编码效果,是现代图像压缩技术研究的热点之一,也是十分有前途的一种方法。4图像编码技术发展前景自20世纪80年代以来,图像编码技术已经逐步进入了较大范围的应用阶段。但由于没有统一的压缩算法和码流格式,在图像信息交流中遇到了很多困难,鉴于这一状况,国际电信联盟ITU和国际标准化组织ISO近年来已经制定并在继续制定一系列静止和活动图像编码的国际标准,这些标准和建议是在相应领域工作的各国专家合作研究的成果和经验的总结。由于这些国际标准的出现,图像编码尤其是视频图像编码压缩技术得到了飞速发展。目前,按照这些标准做的硬件、软件产品和专用集成电路已经在市场上大量涌现,对现代图像通信的迅速发展及开拓图像编码新的应用领域(如多媒体通信、数字高清晰度电视传输等)发挥了重要作用。目前已批准了JPEG、H.261和MPEG等标准。对于图像编码技术未来的发展,应注意经典和新技术、新方法的结合。1)目前应立足于经典的编码技术的研究我们认为图像压缩技术的近期研究工作似乎应该放在预测编码、变换编码和矢量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论