数字图像编码概述_第1页
数字图像编码概述_第2页
数字图像编码概述_第3页
数字图像编码概述_第4页
数字图像编码概述_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字图像编码概述现代通信原理数字图像编码概述 1.1 图像编码基本原理 虽然表示图像需要大量的数据,但图像数据是高度相关的,一幅图像内部以及视频序列中相邻图像之间存在冗余信息。主要表现为以下几种形式:空间冗余:图像内部相邻像素之间存在较强的相关性所造成的冗余 时间冗余:视频序列中的图像是高度相关信息熵冗余:也称为编码冗余。由信息论的有关原理可知,为表示图像数据的一个像素点,只要按信息熵的大小分配相应比特数即可。 知识冗余 :有些图像中包含的信息与某些先验的基础知识有关。视觉冗余 :人眼不能感知或不敏感的那部分图像信息。 结构冗余 :在有些图像的部分区域内存在着非常强的纹理结构,或者在图像的各个

2、部分之间有某种关系 。 图像数据的这些冗余信息为图像压缩编码提供了依据。用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之一。 不同的应用场合和不同的图像内容有不同的压缩方法。根据对压缩编码后的图像进行重建的准确程度可将常用的图像编码方法分为三类:(1) 信息保持编码。这一类编码技术主要应用在图像的数字存储方面。图像的数字存储可以实现高速“写”和“读”。 (2) 保真度编码。此类编码技术多应用在数字电视技术和静止图像通信、工业、贸易和娱乐等方面。 (3) 特征提取。在图像识别、分析和分类等技术中,往往并不需要全

3、部图像信息,而只要对感兴趣的部分特征信息进行编码即可压缩数据。 图像压缩编码系统的原理图,如图6.6所示。 图6.6 图像压缩编码系统的原理图框图 1.2 图像编码的常用方法 1、熵编码 熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码,解码后能无失真地恢复原图像。熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很 小。常见的熵编码方法有游程编码、Huffman编码和算术编码三种。 (1) 游程编码 游程编码又叫行程编码,其原理很简单,即将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。

4、 例如,有一字符串“aaaabbbccdfffff”,假设每个像素用8bit编码,共需158bit120bit。则经行程长度编码后,该字符串可以只用“4a3b2c1d5f”来表示,只需108bit=80bit。(2)哈夫曼(Huffman)编码 Huffman编码是一种常用的数据压缩编码方法,是Huffman于1952年建立的一种不等 长最佳编码方法。根据信息论中信源编码理论,当平均码长R大于等于图像熵H时,总可设计出一种无失真编码。 哈夫曼编码的一般算法如下:l首先统计信源中各符号出现的概率,按符号出现的概率从大到小排序。l把最小的两个概率相加合并成新的概率,与剩余的概率组成新的概率集合。

5、对新的概率集合重新排序,再次把其中最小的两个概率相加,组成新的概率集合,如此重复进行,直到最后两个概率的和为1。 分配码字。码字分配从最后一步开始反向进行,对于每次相加的两个概率,给大的赋“0”,小的赋“1”(也可以全部相反, 如果两个概率相等, 则从中任选一个赋“0”,另一个赋“1”即可),读出时由该符号开始一直走到最后的概率和“1”, 将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的哈夫曼编码。 例6.1 设一幅灰度级为8(分别用S0、S1、S2、S3、S4、S5、 S6、S7表示)的图像中,各灰度所对应的概率分别为0.40、0.18、0.10、0.10、0.07、0

6、.06、0.05、0.04。现对其进行哈夫曼编码,编码过程如图6.1所示,具体步骤如下: 首先对信源概率从大到小排序,选出最小的两个概率(0.04和0.05),相加得0.09,与其他概率组成新的概率集合0.40,0.18,0.10,0.10,0.07,0.06,0.09。l对新的概率集合重新排序,选出最小的两个概率(0.06和0.07),相加得0.13,组成新的概率集合0.40,0.18,0.10,0.10,0.09,0.13。l对新的概率集合重新排序,选出最小的两个概率(0.10和0.09),相加得0.19,组成新的概率集合0.40,0.18,0.13,0.10,0.19。 对新的概率集合重

7、新排序,选出最小的两个概率(0.13和0.10),相加得0.23,组成新的概率集合0.40,0.19,0.18,0.23。 对新的概率集合重新排序, 选出最小的两个概 率(0.19和0.18),相加得0.37,组成新的概率集合0.40, 0.23, 0.37。 对新的概率集合重新排序, 选出最小的两个概率(0.23和0.37),相加得0.60,组成新的概率集合0.40, 0.60。 直到最后两个概率(0.60和0.40)相加和为1。 分配码字。从最后一步反向进行,首先给最后相加的两个概率(0.60和0.40)分配码字,由于0.60大于0.40,于是给0.60赋“0”,给0.40赋“1”。如此依

8、次给每次相加的两个概率分配码字。 最后写出每个符号的哈夫曼编码。以符号S1(对应的概率为0.18)为例,在从0.18到1.0的路径上, 它所遇到的赋值(“0”或“1”)依次为1、0、0,将其反向排列成“001”,于是就形成了符号S1的哈夫曼码字“001”。 上述哈夫曼编码方法形成的码字是可识别的,即能够保证一个符号的码字不会与另一个符号的码字的前几位相同。比如说,如果S0的码字为1,S1的码字为001,而S2的码字为011,则当编码序列中出现0011时,就不能判别它是S2的码字还是S1的码字后面跟了一个S0的码字1。 图6.7 哈夫曼编码过程 下面来看一下哈夫曼编码的编码效率。平均码长为: 数

9、字图像的熵H为: 则哈夫曼编码的编码效率为 由此可见,哈夫曼编码的编码效率是相当高的,其冗余度只有2.2%。如果采用等长编码,由于有8种灰度级,则每种灰度级别至少需要3比特来表示,对于例6.1中的图像而言,其编码的平均码长为3,编码效率为85%。 3)算术编码 算术编码有两种模式:一种是基于信源概率统计特性的固定编码模式,另一种是针对未知信源概率模型的自适应模式。自适应模式中各个符号的概率初始值都相同,它们依据出现的符号而相应地改变。只要编码器和解码器都使用相同的初始值和相同的改变值的方法,那么它们的概率模型将保持一致。上述两种形式的算术编码均可用硬件实现,其中自适应模式适用于不进行概率统计的

10、场合。有关实验数据表明,在未知信源概率分布的情况下,算术编码一般要优于Huffman编码。在JPEG扩展系统中,就用算术编码取代了哈夫曼编码。 下面结合一个实例来阐述固定模式的算术编码的具体方法。 例6.2 设一待编码的数据序列(即信源)为“dacab”,信源中各符号出现的概率依次为P(a)=0.4,P(b)=0.2,P(c)=0.2,P(d)=0.2。 首先,数据序列中的各数据符号在区间0, 1内的间隔(赋值范围)设定为a=0, 0.4), b=0.4, 0.6),c=0.6, 0.8),d=0.8, 1.0) 为便于讨论,再给出一组关系式: (6.19) 式中,StartN、EndN分别表

11、示新间隔(或称之为区间)的起始位置和结束位置,StartB表示前一间隔的起始位置,L为前一间隔的长度,LeftC、RightC分别表示当前编码符号的初始区间的左端和右端。 第一个被压缩的符号为“d”,其初始间隔为0.8, 1.0; 第二个被压缩的符号为“a”,由于前面的符号“d”的取值区间被限制在0.8, 1.0范围内,所以“a”的取值范围应在前一符号间隔0.8, 1.0的0, 0.4子区间内,根据上式 即“a”的实际编码区间在0.8, 0.88之间。 第三个被压缩的符号为“c”, 其编码取值范围应在0.8, 0.88区间的0.6, 0.8的子区间内,据上式可知 第四个被压缩的符号为“a” ,

12、同理,根据上式 可知 第五个被压缩的符号为“b”,同理,根据上式可知 至此,数据序列“dacab”已被描述为一个实数区间0.85056, 0.85184,或者说在此区间内的任一实数值都惟一对应该数据序列。这样,就可以用一个实数表示这一数据序列。我们把区间0.85056,0.85184用二进制形式表示为0.110110011011,0.110110100001。从这个区间可以看出,0.1101101位于这个区间内并且其编码最短,故把其作为数据序列“dacab”的编码输出。考虑到算术编码中任一数据序列的编码都含有“0”,所以在编码时,可以不考虑“0”,于是把1101101作为本例中的数据序列的算术

13、编码。由此可见,数据序列“dacab”用7比特的二进制代码就可以表示,平均码长为1.4比特字符。 2 预测编码预测编码是基于图像数据的空间或时间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,将已知像素与预测值相减得到误差值,然后再对误差值进行量化和编码。例如,用248,2,1,0,1,3表示6个相邻像素的灰度,实际上这6个像素的灰度是248,250,251,251,252,255;表示第二个像素250需要8bit,而表示差值2只需2bit,这样就实现了压缩。(1)预测编码方法 差分脉冲编码调制DPCM 增量调制M (2)预测编码的类型线形预测编码器非线形预测编码器帧内

14、预测编码帧间预测编码 3.变换编码 (1)变换编码的基本原理 与预测编码技术相比,消除图像数据空间相关性的一种更有效的方法是进行信号变换,使图像数据在变换域上最大限度地不相关。尽管图像变换本身并不带来数据压缩,但由于变换后系数之间相关性明显降低,图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码可以有效地压缩图像地数据量。 统计表明,在变换域中,图像信号的绝大部分能量集中在低频部分,编码中如果略去那些能量很小的高频分量,或者给这些高频分量分配合适的位数,就可明显减少图像传输或存储的数据量。根据上述原理变换编码的系统如图6.8所示。 图6.8 变换编码方框图 (2)变换编码的方法 KL(Karhunen-Loeve)变换是以上思路下构造出来的最佳线性方案。 压缩图像解压图像压缩图像输入图像图像分块变换量化符号编码符号解码逆变换合并图像 (3)变换编码的缺点 在变换编码中,编码是在图像方块的基础上进行的,这导致变换编码的一个固有缺点方块效应。方块效应指的是,当压缩比提高到一定程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论