版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数字图像处理第七章第七章图像编码与压缩图像编码与压缩李熙莹李熙莹 副教授副教授http:/数字图像处理一、序言一、序言1. 为什么要进行图像压缩?为什么要进行图像压缩? 图像的数据量巨大,对计算机的处理速度、存储容量要求高。 必须减少必须减少/压缩数据量压缩数据量 传输信道带宽、通信链路容量一定,需要减少传输数据量,提高通信速度采用编码压缩技术采用编码压缩技术 PAL Colour Video:7685762425 = 265.4Mbit/s 1.5 Hour Colour Video Image:265.4Mbit6090 = 1433Gbit 高清晰度电视HDTV:12807202460
2、=1327Mbit/s 电话通道:28.8Kbit/s ISDN通道: 10Mbit/s, 1.5Mbit/s, 64Kbit/s数字图像处理2. 实现图像压缩的依据实现图像压缩的依据数据冗余数据冗余 数据冗余的概念数据冗余的概念数据是信息的载体同量的数据可表达不同量的信息同量的信息可用不同量的数据表达 冗余冗余数据表达了无用的信息数据表达了已表达的信息数字图像处理相对数据冗余相对数据冗余(数据冗余可定量描述) 相对冗余:相对冗余:压缩率:压缩率: CR 在开区间 (0, ) 中取值 n1和n2代表2个数据集合中的信息载体单位的个数n1 相 对 于n2CRRD对 应 的 情 况n1 = n21
3、0第1种 表 达 相 对 第2种 表 达 不 含 冗 余 数 据n 1 n2 1第1个 数 据 集 合 含 相 当 多 的 冗 余 数 据n 1 n2 0 第2个 数 据 集 合 包 括 比 原 始 表 达 多 得 多 的 数 据RD11CR21RnnC 数字图像处理 数据冗余类别数据冗余类别 (1) 编码冗余编码冗余与灰度分布的概率特性有关 (2) 像素相关冗余像素相关冗余空间冗余,几何冗余 (3) 心理视觉冗余心理视觉冗余与主观感觉有关 减少/消除其中的一种/多种冗余,就能取得数据压缩的效果数字图像处理(1) 编码冗余编码冗余 图像中灰度出现的概率不同灰度出现的概率不同平均比特数平均比特数
4、用较少的比特数表示出现概率较大的灰度级用较多的比特数表示出现概率较小的灰度级 图像能量在变换域内分布的不均匀性大部分能量集中在低频部分小部分能量集中在高和较高的频率部分10avg)()(LkkskspslL1 , , 1 , 0)(Lknnspkks数字图像处理(2) 像素间冗余像素间冗余 图像像素间的相关性造成信息冗余。空间冗余空间冗余:邻近像素灰度分布的相关性很强时间冗余:时间冗余:序列图像帧间画面对应像素灰度的相关性很强频间冗余:多谱段图像中各谱段图像对应像素之间灰度相关性很强00.81051015202500.810510152025规则 冗余大不规
5、则冗余小数字图像处理(3) 心理视觉冗余及其他心理视觉冗余及其他 应用环境允许图像有一定程度失真应用环境允许图像有一定程度失真因人而异,因应用要求而异 心理视觉冗余心理视觉冗余眼睛对某些视觉信息更敏感人对某些视觉信息更关心 心理视觉冗余与实在的视觉信息有联系,发生损失不可逆转。 接收端图像设备分辨率较低,则可降低图像分辨率。 应用方关心图像区域有限,可对其余部分图像可采用空间和灰级上的粗化。数字图像处理3. 如何实现图像压缩?如何实现图像压缩? 编码编码是用符号数码元素表示信号、消息或事件的过程。 图像编码图像编码采用对图像的新的表达方法以减小所需的数据量数据和信息数据和信息:数据是信息的载体
6、 对给定量的信息可用不同的数据量来表示 对给定量的信息,设法减少表达这些信息的数据量称为数据压缩数据压缩 图像压缩过程图像压缩过程就是编码过程编码过程,解压缩过程解压缩过程就是解码过解码过程程。数字图像处理4. 图像压缩(编码)的分类图像压缩(编码)的分类 压缩技术分为无损压缩和有损压缩。 无损压缩无损压缩:在解码时可以精确地恢复原图像,没有任何损失。压缩比小。 有损压缩有损压缩:在解码时只能近似原图像,不能无失真地恢复原图像。压缩比大。 失真:失真:编码输入图像与解码输出图像之间的随机误差。 压缩比:压缩比:指原图像比特数与压缩后图像比特数之比。数字图像处理 举例: 张三先生现在北京出差,住
7、在友谊宾馆,计划明天坐飞机回广州,收到信息:“你的妻子王女士将于明天晚上7点05分在广州新白云机场接你。” 简化1:你的妻子明晚7点05分在新白云机场接你。(信息无损) 简化2:王女士明晚7点机场接你。 (信息有损)数字图像处理二、图像压缩的评价二、图像压缩的评价1. 图像压缩的质量评价标准图像压缩的质量评价标准 在图像压缩编码中,解码图像与原始图像可能会有差异,需要评价压缩后图像的质量。 保真度保真度(逼真度逼真度)准则:准则: 描述解码图像相对原始图像的偏离程度 对信息损失的测度 常用的准则可分为两大类:客观保真度准则客观保真度准则和主观保真度准则主观保真度准则。数字图像处理(1) 客观保
8、真度准则客观保真度准则 最常用的客观保真度准则是原图像 f (x,y)和解码图像 之间的均方根误差和均方根信噪比两种。 点误差 图误差 均方根误差: 均方信噪比:均方信噪比:1 2211001( , )( , )MNrmsxyef x yf x yMN2111120000( , )( , )( , )MNMNmsxyxySNRf x yf x yf x y),(yxf),(),(),(yxfyxfyxe 1010),(),( MxNyyxfyxf数字图像处理 实际常使用归一化信噪比归一化信噪比(单位:分贝,dB)其中, 峰值信噪比峰值信噪比 不能很好反映图像的实际视觉失真。 因为客观保真度是种
9、统计平均意义下的度量准则,对于图像中的细节无法反映出来。1010210102,10logMxNyMxNyyxfyxffyxfSNR1010,1MxNyyxfMNf 10102 2max),(),(lg10MxNyyxfyxffMNPSNR数字图像处理(2) 主观保真度准则主观保真度准则 常用的方法:对一组(不少于20人)观察者显示图像,并将他们对该图像的评分取平均,用来评价一幅图像的主观质量。 主观评价具有一定的不确定性。数字图像处理2. 图像压缩算法的编码效率图像压缩算法的编码效率 编码效率的测量,往往需要定义一些所谓“标准图像”。 压缩比压缩比: bpp: bits per pixel 传
10、输比传输比: bps: bits per secondbppbppD24tbppNNbpsYX数字图像处理3. 图像编码模型图像编码模型 信源编码器的作用是减少或消除图像中的编码冗余、像素间冗余及心理视觉冗余。 信道编码器通过把可控制的冗余加入信源编码后的码字以减少信道噪声的影响。 信道编码器的作用在信道有噪声或易产生误差时,对整个编解码过程非常重要。 图像编码主要是研究信源编码。图像编码主要是研究信源编码。信源编信源编码器码器信道编码器信道解码器信源解码器信道输入图输出图数字图像处理三、信息论简介三、信息论简介1. 信息量信息量 假设:信息的产生是一个概率过程 一个发生概率为P(E )的随机
11、事件E 包含的信息信息是 I (E)称为称为E 的自信息(随概率增加而减少)的自信息(随概率增加而减少) 特例:如果 P(E) =1(即事件总发生),则 I (E)=0。 信息的单位:比特比特(log以2为底) 1个比特:即2个相等可能性的事件之一发生LiEPEPEI1)()(1log)(数字图像处理2. 信息系统信息系统 信源:指能够产生信息的事物。 信源通过信道与信宿(即信息用户)连通以传递自信息 数学表达: 信源是一概率场,信源符号集 A=a1, a2, , aJ 信源产生事件aj的概率为P(aj)概率矢量:u = P(a1) P(a2) P(aJ )T 用用(A, u)可以完全描述信源
12、可以完全描述信源信源信源信宿信道JjjaP11)(数字图像处理平均信息平均信息 产生单个信源符号的自信息:I(aj) = logP(aj) (7-1) 产生k个信源符号,符号aj平均来说将产生kP(aj)次 信源的平均信息(熵或不确定性)信源的平均信息(熵或不确定性):(7-2) 定义了观察到单个信源符号输出时所获得的平均信息量 一幅8比特灰度图像的平均信息: 其中 p(ai) 表示像素u 取 ai 值的概率,ai的取值范围为028-1。LiiiapapuH1)(log)()(LiiiapapuH12)(log)()(数字图像处理信道信息信道信息 信源的输出是一个离散随机变量 信道的输出也是一
13、个离散随机变量 信道符号集:B = b1, b2, , bK 概率矢量: v = P(b1) P(b2) P(bK)T 用用(B, v)可以完全描述信道输出和用户接受到的可以完全描述信道输出和用户接受到的信息信息数字图像处理信道输出概率P(bk )和信源u的概率分布 信道传递矩阵 输出符号集的概率分布 JjjjkkaPabPbP1)()|()(Quv )|()|()|()|()|()|()|()|(2121212111JKKKJJabPabPabPabPabPabPabPabPQ数字图像处理条件熵平均条件熵互信息互信息信道容量3. 互信息互信息JjkjkjkbaPbaPbH1)|(log)|(
14、)|(u JjKkkjkjKkkkbaPbaPbPbHH111)|(log),( )()|()|(uvu)|()(),(vuuvuHHI),(maxvuuIC 数字图像处理四、基本编码定理四、基本编码定理定义编码效率 式中分子是信息熵,而分母则表示代码的平均熵。 冗余度为 编码目的: 编码后输出的平均码长尽量最小 编码效率尽量趋近1 冗余度Rd 趋于零。 nNxH2log1dR数字图像处理1. 无失真编码定理(香农第一定理)无失真编码定理(香农第一定理) 确定每信源符号(每像素值)可达到的最小平均码字长度。 如果信道和传输系统都没有误差,传输系统的主要功能就是尽可能紧凑地表达信源(数据压缩)
15、零记忆信源:具有有限集合,且信源符号统计独立的信源。可用(A, u) 描述。 其n阶扩展信源的的熵为 产生块随机变量的(零记忆)信源的熵是对应单符号信源的 n 倍 信道编码器解码器信源信宿nJiiinHPPH1)()(log)()(u u数字图像处理 n阶扩展信源的平均码字长度为 零记忆信源的香农第一定理: 熵是在不造成信息失真的条件下,编码的平均码长可能的最短值(编码的下限)。 编码效率nJiiilPL1 avg)( )(1) ()( )() (1 avgHlPLHnJiiiuu)( lim avguHnLn avg)(LHnu数字图像处理2. 噪声编码定理(信道编码定理噪声编码定理(信道编
16、码定理/ /香农第二定理香农第二定理) 如何编码以保证可靠的传输? 一种简单方法多次重复传输每个符号,利用多次投票原则减少解码错误概率。 零记忆信源的信息产生率(信息单位/符号)等于信源的熵H(u);其n阶扩展信息源的信息产生率等于H(u)/n。对K个信源符号,每符号传输r次,仅用其中s个码字作为有效码字。当这s个码字具有相同概率时,可达到最大信息率(最大速率): 香农第二定理:对任意的 R 0rsRlog数字图像处理3. 信源编码定理(率失真定理)信源编码定理(率失真定理)一个理想的图像压缩器应具备:重构图像失真率低、压缩比高以及设计编码器和解码器的计算复杂度低等。实际互相冲突香农的信源编码
17、理论是建立在平均比特率和平均失真率这一相互冲突的矛盾之上。在比特率和失真率两者之间取得平衡可以用几种等价的方式定义:给定比特率R的约束下,使失真D 最小;或给定失真值 D 的约束下,使所需传输的比特率 R 最小;或最小化拉格朗日函数 D+R,不同的拉格朗日算子 可以在比特率和失真率之间起着权衡作用。数字图像处理 如果从信源发出信息uk,经过编、译码的组合,接受端得到信息为vl(由信道的噪声造成),定义信源编码经过编、译码的平均互信息量为: 率失真函数率失真函数:在一定允许的失真D条件下最低的平均互信息量 R(D)是在平均失真小于允许失真D以内能够得到的编码的码率下界。lklklklklkvPu
18、PvuPvuPvuI,)()(),(log),();();(min)(lkvuIDR数字图像处理香农的信源编码定理香农的信源编码定理 一个具有率失真函数R(D)的信源,若有平均失真D,并有两个任意小的正数与,则必存在一种信源编码、译码方法使信息率和平均失真率满足 香农信源编码定理只说明了码率在一个界限以上编码的可能性,并没有给出具体的编码方案。 图像也是一种信息,香农的信源编码理论对图像编码起着重要的指导作用。DDDRR)(数字图像处理4. 举例举例 编码器是用符号集中的符号构成输出代码,并建立输入信号单元与输出代码的对应关系。如下图所示: ),(21mxxxXmwwwW,21naaaA,21
19、编码器 消息集合 输出代码 符号集 符号(码元) 数字图像处理 分别表示要传递的四种可能消息,如果我们选择一符号集合 A =1, 2, 3, 4, 每一个符号分别代表一种消息,n = 4(符号个数) 则可以求出平均码长 则 814813412211,xxxxX1811811411211N874log147log22nNxH818711dR数字图像处理 从上例可以看出,这两种代码长度相同的编码方法没有得到最高的编码效率,即没作到用最少的码字传递信源的消息。如何使平均码长短到极限? 若A=0,1,n =2,选择编码方式:0、10、110、111,则平均码长 则 这种方式得到最高的编码效率,是因为每
20、个消息码字长度不同。由此可见至少有两种编码方式,即等长码和变长码。 47813813412211N 114747log2nNxH0dR数字图像处理五、无损压缩编码方法五、无损压缩编码方法 无损压缩可以精确无误地从压缩数据中恢复出原始数据。 应用:医疗、商业、卫星图像等不可允许或不希望有数据损失的场合。 常见的无损压缩技术包括: 基于统计概率的方法基于统计概率的方法 依据信息论中的变长编码定理和信息熵有关知识,用较短代码代表出现概率大的符号,用较长代码代表出现概率小的符号,从而实现数据压缩。 霍夫曼(Huffman)编码、算术编码 基于字典技术的数据压缩技术基于字典技术的数据压缩技术 游程编码(
21、Running Length Coding,简称为RLC) LZW编码数字图像处理1. 哈夫曼哈夫曼(Huffman)编码编码消除编码冗余最常用的技术。原理原理: 利用信息符号概率分布特性的变字长的利用信息符号概率分布特性的变字长的编码方法。编码方法。 对于出现概率大的信息符号编以短字长的码 对于出现概率小的信息符号编以长字长的码。优点优点: 一旦哈夫曼码获得,编码或解码都可用简单的查找表实现。 根据无失真编码定理,哈夫曼编码对固定的n值最优。数字图像处理步骤步骤:符号概率排序,并将出现概率最小的两个符号的概率相加,合成一个概率;第二步把这个合成概率看成是一个新组合符号的概率;重复上述做法,直
22、到最后只剩下两个符号的概率为止。完成以上概率相加顺序排列后,再反过来逐步向前进行编码; 每一步有二个分支,各赋予一个二进制码,可以对概率大的编码赋为0,概率小的编码赋为1。数字图像处理符号 概率 x1 0.4x2 0.3x3 0.1x4 0.1x5 0.06x6 0.041 40.60.4 例例1:设有编码输入 。其频率分布分别为 , , 现求其最佳霍夫曼编码 。 解:Huffman编码过程下图所示:123456,Xx xx xx x12( )0.4, ()0.3P xP x3()0.1,P x456()0.1, ()
23、0.06, ()0.04P xP xP x123456,Ww w w w w w图7.1 哈夫曼编码中的信源化简数字图像处理表7.1 哈夫曼编码分配过程x1x2 x3x4 x5x6符号符号 概率概率 编码编码 对0.6赋0,对0.4赋1;0.4传递到x1,所以x1的编码是1。 0.6传递到前一级是两个0.3相加,大值是单独一个元素x2的概率,小值是两个元素概率之和,每个概率都小于0.3,所以x2赋予0,0.2和0.1求和的0.3赋予1。 所以x2的编码是00;剩余元素编码的前两个码应为01。 0.1赋予1,0.2赋予0。 以此类推,最后得到诸元素的编码如下:数字图像处理 经霍夫曼编码后,平均码
24、长为: = = 0.41 + 0.302 + 0.13 + 0.14 + 0.065 + 0.045 = 2.20(bit) 该信源的熵为H2.14 bit,编码后计算的平均码长为2.2 bit,非常接近于熵。可见Huffman编码是种较好的编码。B61()iiPn数字图像处理 优点优点:已被证明具有最优变长码性质,平均码长最短,接近熵值。 缺点缺点: 码长参差不齐,存在输入、输出速率匹配问题。 在存储或传输过程中,如果出现误码,可能会引起误码的连续传播。 对不同信源其编码效率不尽相同。 应用应用: 需要与其他编码结合起来使用,才能进一步提高数据压缩比。Huffman编码特点编码特点数字图像处
25、理2. 香农费诺编码香农费诺编码 霍夫曼编码法需要多次排序,当很多时十分不便。 费诺(Fano)和香农(Shannon)分别单独提出类似的方法,使编码更简单。具体编码方法如下:(1)把 按概率由大到小、从上到下排成一列,然后把 分成两组 和 ,并使得(2)把两组分别按0,1赋值。(3)然后分组、赋值,不断反复,直到每组只有一种输入为止。将每个所赋的值依次排列起来就是费诺香农编码。nxx ,.,1nxx ,.,1kxx ,.,1nkxx,.,111()()knijijkPxPx数字图像处理 以前面哈夫曼编码的例子进行香农费诺编码 :输入输入概率概率 x10.40 0 x20.310 10 x30
26、.1100 1100 x40.11 1101x50.0610 1110 x60.041 1111数字图像处理3. 算术编码算术编码 算术编码是从整个符号序列出发,采用递推形式连续编码的方法,信源符号和码字之间不存在一一对应关系。 算术编码没有对各输入符号的信息量为整数的限制。数字图像处理 算术编码的基本思想: 将要压缩的数据X映射到0,1)实数区间中的某一区段上的实数Y,该实数的二进制展开式即为原符号串的压缩编码结果。 算术编码通过对当前的概率区间作迭代分割来确定实数。 算术编码是具体构造出的用小数表示信息的方法,因为小数随位数的增加,它的精度也随之提高,从信息的角度来说,它所含有的信息量也随
27、之增加。 数字图像处理 例例2:设输入两种符号A和B,它们出现的概率分别是3/4和1/4,需要编码的信息为AABA。算术编码过程如下: 从0,1)开始,一个符号一个符号地迭代分解区间。 第一字符A,取0, 1)区间的前3/4,即区间0, 3/4); 第二字符A,取0, 3/4)区间的前3/4,即区间0, 9/16); 第三字符B,取0, 9/16)区间的后1/4,即区间27/64, 9/16);第四字符A,取27/64, 9/16)区间的前3/4,即区间27/64, 135/64),其二进制表示为0.011011, 0.10000111) 数字图像处理图7.2 算术编码过程图解表7.2 算术编
28、码示例 例例2:四符号信源信息a1a2a3a3a4的算术编码过程见图7.2和表7.2。数字图像处理 优点: 不同的输入符号一定落入不同的区间,编码结果唯一。 信息中所用符号出现的概率愈大,对应的区间愈大,愈有机会选择较短的码字表示。 编码的符号数目足够多时,编码效率趋于熵值。 相比哈夫曼编码,压缩率较高。 编码算法与符号概率统计是相互独立的,更易于实现自适应。 缺点:不是即时码,必须等到所有信息收到后才能解码。需要几乎无限精度的实数运算,实际的程序只能是用有限精度的整数运算实现。算术编码特点算术编码特点数字图像处理4. 1-D 游程编码游程编码 (run length coding, RLC)
29、利用空间冗余度压缩图像,属于统计编码类。原理原理:用一系列描述黑色或白色像素的连续行程的长度表示二值图像或位平面的每一行。对于图像编码,可以定义沿特定方向上具有相同灰度值的相邻像元为一轮,其延续长度称之为延续的行程,简称为“游程”。游程终点位置由前一游程终点的相对距离确定,这样就可以由(灰度游程)串来表示图像数据。X SC RL串字符串位置串长数字图像处理游程编码分为定长游程编码和变长游程编码两种。定长游程编码是指编码的游程所使用的二进制位数固定。变长游程变码是指对不同范围的游程使用不同位数的二进制位数进行编码。应用:游程编码一般不直接应用于多灰度图像比较适合于二值图像的编码传真编码的标准压缩
30、方法为了达到较好的压缩效果,有时和其它编码方法混合使用。 数字图像处理四、四、 预测编码预测编码 统计冗余数据压缩理论的三个重要分支之一。 基本思想:减少数据在时间和空间上的相关性减少数据在时间和空间上的相关性。 预测:预测:图像的相邻像素之间有着较强的相关性(统计特性) 某像素的值可根据以前已知的几个像素来估计。 编码原理:通过提取每个像素中的新增信息并编码原理:通过提取每个像素中的新增信息并进行编码,以消除像素间的冗余。进行编码,以消除像素间的冗余。 设图像预测估计为: 新增信息(即预测误差值): 图像预测估计准则:最小均方优化准则最小均方优化准则。nnnffenf数字图像处理(a)预测误
31、差图像 (b) 原图直方图 (c) (a)的直方图图7.3 图像的预测编码数字图像处理1. 无损预测编码无损预测编码 对差值信号不进行量化而直接编码就称之为无损预测编码。预测器源图像熵编码器编码表压缩源图像图7.4 无损预测编码编码器工作原理数字图像处理 由先前三点预测可以定义为: 其中a1、a2、a3称预测系数,都是待定参数。 如果预测器中预测系数是固定不变的常数,称之为线性预测线性预测。 预测误差: ), 1() 1, 1() 1,(),(321jifajifajifajif),(),(),(jifjifjie), 1() 1, 1() 1,(),(321jifajifajifajif),
32、(jif数字图像处理2. 有损预测编码有损预测编码 在预测编码中,对差值信号进行量化量化后再进行编码就称之为有损预测编码。 消除心理视觉冗余数据。 量化:量化: 量化器将预测误差映射进有限个输出 中。 确定了有损编码中的压缩量和失真量。 预测器输入: 有损预测方法: 差分脉冲编码调制 ( Differential Pulse Code Modulation,简称DPCM ) 最典型 DM (德尔塔调制)方法最简单ne ne nnnfef 数字图像处理(1) DM(德尔塔调制)(德尔塔调制) 一种简单的有损预测编码方法,预测器和量化器分别定义为:其它对ceceaffnnnn0,1预测误差图像解码
33、后图像,erms = 25.5558图7.5 DM编码的图例(失真较为严重)数字图像处理图7.6 DM编码中的失真示例其它对ceceaffnnnn0,1 DM有损预测编码:数字图像处理主要的图像损伤主要的图像损伤 斜率过载: 图像扫描行越过黑白边界,预测误差可能比最大的量化输出大得多 复原图像的水平/垂直方向分辨能力降低,黑白边缘变得模糊。 颗粒噪声: 如果最小量化输出(绝对值)不够小,在图像亮度值缓慢变化的区域(平坦区域),可能在正负两个最小量化输出之间来回振荡,出现颗粒细斑 视觉对此噪声敏感度高。 伪轮廓图像: 对于较小(绝对值)的预测误差的量化区间太大,即量化特性曲线太粗糙,则在图像亮度
34、值缓慢增大或下降的区域,将产生伪轮廓图像,类似等高线构成的图。数字图像处理(2) 差分脉冲编码调制差分脉冲编码调制 (DPCM)预测器预测器 预测器: 最优准则:最小化均方预测误差 最优滤波器设计:选择m个预测系数,使下式最小。 预测系数 为保证预测器的输出落入允许的灰度值范围,并减少传输噪声的影响(水平条纹)。2112mininnffEeE1m1iimiininnnnnnnffffefef1数字图像处理 DPCM系统由编码器和解码器组成,它们各有一个相同的预测器。量化器编码器预测器信道传输解码器输入输出预测器( , )f i j( , )e i j( , )e i j( , )fi j( ,
35、 )fi j( , )fi j( , )e i j( , )fi j图7.7 DPCM有损编码系统DPCM系统的工作原理图系统的工作原理图数字图像处理预测模型特点预测模型特点 预测模型的复杂程度取决于线性预测中使用以前样本的数目,样本点越多,预测器就越复杂。 预测器的好坏取决于预测系数。 4阶线性预测器: (7-1) 1, 1(), 1() 1, 1() 1,(),(4321yxfayxfayxfayxfayxf数字图像处理) 1,(97. 0),(1yxfyxf), 1(5 . 0) 1,(5 . 0),(2yxfyxfyxf) 1, 1(5 . 0), 1(75. 0) 1,(75. 0)
36、,(3yxfyxfyxfyxf其它如), 1(97. 0) 1, 1() 1,() 1, 1(), 1( ) 1,(97. 0),(4yxfyxfyxfyxfyxfyxfyxf (7-1)式中的系数赋值不同,可得到不同的预测器:一阶:一阶:二阶:二阶:三阶:三阶:一阶自适应:一阶自适应:数字图像处理图7.8 DPCM编码中不同预测器的效果比较上排:不同预测器(一阶、二阶、三阶、一阶自适应)编码后得到的解码图(均采用2级德尔塔量化器)下排:对应误差图(原图和编码解码图的差)数字图像处理采用自适应系数预测编码后的重构图像a1=0.340, a2=0.664, a3=-0.005 根据输入图像来确定
37、预测系数 另外一种采用的是固定的预测系数采用固定系数预测编码后的结果 a1=0.5, a2=0.5, a3=-0.5 直接采用均匀标量量化后的结果在实验中采用几种不同的预测系数 图7.9 DPCM编码中不同预测系数的效果比较数字图像处理预测编码的效果图预测误差图预测编码的误差图图7.10 DPCM编码中不同量化器量化的效果比较 (一阶线性预测器,Lloyd-Max量化器)第一列:2级量化,均方根误差erms=21.5608;第二列:4级量化,均方根误差erms=10.6673;第三列:8级量化,均方根误差erms=5.8239。数字图像处理 预测编码压缩数据的基础: 如果模型足够好且样本序列在
38、时间上相关性较强,那么误差信号的幅度将远远小于原始信号预测误差分布更加集中,即熵值比原来图像小。 由于量化和传送的仅是误差信号,可用较少的单位像素比特率进行编码,使得图像数据得以压缩。 应用: 对于视频信号,预测编码充分利用了连续帧之间的统计冗余性,是当今主流技术并且还会流行于未来。对于静止图像,预测编码将被图像变换编码所取代。数字图像处理五、变换编码五、变换编码1. 变换编码的基本原理变换编码的基本原理 图像变换会使图像信号能量在空间重新分布,总能量不变。 (例) 像素之间的相关性下降; 能量集中在变换域中少数的变换系数上 根据统计编码的原理,能量分布集中,熵值最小,可实现平均码长最短。 在
39、正交空间中用变换系数来表示原始图像,并对变换系数进行编码。 在接收端进行反变换就可以得到重构图像。数字图像处理例:例:给定Lena图像的一个平坦区域(88子块)如下:6971757984899169707376839095777476748589957173767986919374777782889193787680848892957678808593949574798185869494给出给出DCT变换系数量化过程。变换系数量化过程。数字图像处理解:解:如下是它的DCT变换系数,可以看到能量集中在少数低频系数: 660.1250 47.0496 25.9980 10.3993 7.8750
40、8.4866 5.6025 1.317617.3267 2.6749 5.2236 1.3234 0.5222 0.2914 0.2800 2.281 0.0280 0.6463 0.9545 0.9620 2.4730 1.9783 0.316 2.1741 2.3003 0.4542 2.2403 3.5559 1.2907 1.0024 0.1580 0.97472.3750 0.1038 3.2220 0.9653 1.3750 2.2258 0.3875 3.5236 0.9294 1.3282 2.4256 0.9828 1.9317 0.6972 0.1253 1.856 0.3
41、943 2.6640 0.5669 3.4168 0.8891 1.6182 2.545 1.732 2.1666 1.7238 0.3335 0.4808 2.6253 0.9699 1.4854 1.183数字图像处理用JPEG的亮度量化矩阵式对每个系数进行均匀量化,量化器输出为: 41 4 3 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0数字图像处理 反量化后,进行DCT反变换,得到的解码图像
42、为:80 75 71 72 78 85 89 9080 75 71 72 78 85 89 9080 76 72 73 79 86 90 9181 77 72 74 80 87 91 9282 77 73 74 81 87 91 9383 78 74 75 81 88 92 9383 79 75 76 82 89 93 9484 79 75 76 82 89 93 94数字图像处理2 . 变换编码系统变换编码系统图7.11 一个典型的变换编码系统(a) 编码器;(b) 解码器编码部分:子图像分解、变换、量化和编码自适应变换编码:任一步骤都可以根据图像局部内容调整非自适应变换编码:所有步骤对所有
43、子图像都固定数字图像处理3. 变换选择变换选择 各种二维离散(正交)变换都可用于变换编码。 不同变换的信息集中能力、重建误差和计算复杂度不同。 信息集中能力: KLT (卡胡南-列夫变换) DCT DFT WHT 所需计算量:KLT DCT DFT WHT DCT是较好的(综合)选择是较好的(综合)选择,块效应最小,应用多。 主要算法:基于主要算法:基于块块的的DCT变换变换+量化量化+熵编码熵编码 数据压缩不是在变换步骤取的,而是在量化变换的系数时取得的。数字图像处理图7.12 使用(a)DFT, (c)Hadamard变换, (e) DCT 对右上图的近似,以及对应的标定后的误差图像数字图
44、像处理4. 子图像尺寸选择子图像尺寸选择 图像分块: 在DCT为主要方法的变换编码中,将MN的一幅图像分成不重叠的M/KN/K个块( 每块大小KK ),分别进行变换。 主要好处: 第一,降低运算量,如对一幅512512图像,分块变换仅需约13的运算量; 其次,后续的量化和扫描处理可以得到明显的简化; 第三,容易将传输误差引起的错误控制在一个块内,而不是整个图像扩散。 子图像尺寸影响变换编码误差和计算复杂度。数字图像处理 多数情况将图像分割成尺寸满足以下两个条件的子图像: 相邻子图像之间的相关(冗余)减少到某个可接受的水平; 子图像的长和宽都是2的整数次幂(减少子图像变换的计算量),最常用尺寸是
45、88和1616。图7.13 重构误差与子图像尺寸的关系数字图像处理图7.14 使用25%的DCT系数对标准图的近似。 (a)和(b)为88大小的子图像结果, (c)放大的原图像 (d) 22大小的结果 (e) 44大小的结果 (f) 88大小的结果数字图像处理5. 比特分配比特分配 截断误差和2个因素有关: 截除的变换系数的数量和相对重要性; 用来表示所保留系数的精度。 多数变换编码系统中保留的系数根据下列2个准则之一选择确定: 最大方差准则区域编码 最大幅度准则阈值编码 整个对变换子图像的系数截断、量化和编码的全过程称为比特分配。 数据压缩的关键数字图像处理图7.15 使用88 DCT系数的
46、12.5%对标准图的近似。(a),(c)和(e)为阈值编码结果,(b),(d)和(f)是区域编码结果数字图像处理六、图像压缩标准六、图像压缩标准 图像编码标准制定主要由国际标准化组织ISO (international stadardization organization和国际电信联盟 (international telecommunication union)进行。 ITU的前身是国际电话电报咨询委员会CCITT (consultative committee of the international telephone and telegrah )。 有关图像编码的国际标准处理图像类型
47、包括: 二值图像 静止灰度(和彩色)图像 序列(连续帧)灰度(和彩色)图像(视频图像)数字图像处理1. 二值图像压缩标准二值图像压缩标准 G3和G4:最初是CCITT为传真应用设计的。 G3采用了非自适应、1-D游程编码技术,对标准试验图的压缩率约为15:1。 G4是G3的一种简化版本,比G3压缩率高1倍。 JBIG:由ISO、ITU的二值图联合组(joint belevel imaging group,JBIG)于1991年制定。采用自适应技术,压缩比相对G3、G4可提高1.11.5倍。数字图像处理2. 静止图像压缩标准静止图像压缩标准JPEG JPEG(Joint Photographic
48、 Expert Group,简称JPEG)是联合图像专家小组的英文缩写。其中“联合”的含意是指,国际电报电话咨询委员会(CCITT)和国际标淮化协会(ISO)联合组成的一个图像专家小组。 国际上彩色、灰度、静止图像的第一个国际标准。 电视图像序列的帧内图像的压缩编码也常采用JPEG压缩标准(M-JPEG)。 实际定义了三种编码系统: 基于DCT的有损编码基本系统,可用于绝大多数压缩应用场合; 用于高压缩比、高精确度或渐进重建应用的扩展编码系统; 用于无失真应用场合无损系统。数字图像处理JPEG的工作模式的工作模式 JPEG对每一个图像分量单独编码。 JPEG对每个不同的图像分量可以采用不同的量
49、化参数和熵编码的码表 对于一个图像分量,JPEG提供4种工作模式。 顺序编码顺序编码:每一个图像分量按从左到右,从上到下扫描,一次扫描完成编码。(JPEG2000) 累进编码累进编码:图像编码在多次扫描中完成。 (JPEG2000) 无失真编码无失真编码:解码后能精确地恢复源图像采样值,其压缩比低于有失真压缩编码方法。 分层编码分层编码:图像在多个空间分辨率进行编码。数字图像处理 JPEG 标准算法的基本步骤 图像分块(88) ,用DCT 变换去除图像相关信息冗余度; 对变换系数按一定准则(如人眼最佳效果)进行量化; 对数据进行熵编码(变长码)。 编码器的输入端: 把原始图像顺序地分割成一系列
50、88的子块, 设原始图像的采样精度为P位,是无符号整数,输入时把0,2P范围的无符号整数变成-2P-1,2P-1-1范围的有符号整数,以此作为离散余弦正变换的输入。数字图像处理 解码器的输出端: 经离散余弦逆变换(IDCT)后,得到一系列8 8的图像数据块,需将其数值范围由-2P-1 ,2P-1-1再变回到0,2P范围内的无符号整数,来获得重构图像。 为了达到压缩数据的目的,对DCT系数需作量化处理,即在一定的主观保真度图像质量前提下,丢掉那些对视觉效果影响不大的信息。 在JPEG中采用线性均匀量化器,量化定义为对64个DCT系数除以量化步长,四舍五入取整。 量化处理是一个多到一的映射,它是造
51、成量化处理是一个多到一的映射,它是造成DCT编解码信息损失的根源。编解码信息损失的根源。数字图像处理解码器逆变换(IDCT)反量化器熵解码器量化表熵编码器恢复的图像数据图7.17 JPEG解编过程框图 88块编码器DCT正变换量化器熵编码器量化表熵编码器源图像数据压 缩 的图 像 数据图7.16 JPEG基本系统编码器框图数字图像处理图7. 18 JPEG编码效果示例 (a) 标准测试图(256x256, 256灰度级)(b)(h) 选择压缩比为48、32、22、15、11、8和2.2进行编码又解码得到的结果图(i)(l) 分别对应压缩比为48、22、11和2.2的误差图数字图像处理JPEG2
52、000 提高了图像压缩质量,尤其是低码率时的压缩质量。 增加许多功能。 编码变换采用小波变换。 小波变换编解码系统中没有图像分块的模块。 小波变换的计算效率很高,且本质上具有局部性,不会产生使用DCT变换在高压缩比时的块效应。图7.19 小波编码解编过程框图 数字图像处理3. 序列图像(视频)压缩标准序列图像(视频)压缩标准 视频信号的压缩包括两个主要方面: 帧内(帧内(Intra frame)压缩:)压缩:仅考虑本帧的数据而不考虑相邻帧之间的冗余信息 。也称空间压缩(Spatial compression)。 帧间(帧间(Inter frame)压缩:)压缩:通过比较时间轴上不同帧之间的数据
53、进行压缩。也称为时间压缩(Temporal compression)。 视频图像在时域上呈现出的相关性比空域相关性要深得多。 物体的运动是构成帧差别的主要原因。物体的运动是构成帧差别的主要原因。 运动补偿和运动估计运动补偿和运动估计技术各种视频压缩编码中的关键技术。 视频灰度/彩色图像压缩的国际标准主要有: H.261、H.263、 H.264 MPEG-1、 MPEG-2、MPEG-4 、MPEG-7数字图像处理图7.20 序列灰度图像压缩国际标准编码器基本框图数字图像处理(1) H.261H.264 ITU-T视频编码标准系列主要应用于实时视频通信领域,如会议电视。 H.261:序列灰度图像压缩标准, 1990年制定。 为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的 速率为64kb/s的整数倍 只对CIF和QCIF两种图像格式进行处理,每帧图像分成图像层、宏块组(GOB)层、宏块(MB)层、块(Block)层来处理。 扩展了基于DCT的压缩方法,包含了减少帧间冗余的方法。 序列中的第1帧(或某参考帧,I-frame)图用类似JPEG的DCT压缩,以减少帧内冗余度; 估计目标运动,减少帧间冗余度(预
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年物业维修合同:围墙整治与修缮条款3篇
- 公共设施用地租赁合同协议书
- 铁路出发行合同
- 国际展览综合楼租赁合同
- 橄榄球场建设合同
- 银行信贷专员聘用合同格式
- 办公设备租赁合同示范文本
- 亲子餐厅厨师劳务聘用协议
- 体育赛事场地租赁协议样本
- 砂石销售合同范例解析
- 部编版初中语文七至九年级语文教材各册人文主题与语文要素汇总一览表合集单元目标能力点
- 社会保险业务申报表(填表说明)
- 02S701砖砌化粪池标准图集
- 陕西西安未央区2021-2022学年度第一学期期末质量检测五年级英语试卷(人教PEP版含答案)
- 大疆开 FCC BOOST 教程指南
- C++面向对象程序设计(第二版)课件整套电子教案
- YY/T 0506.3-2005病人、医护人员和器械用手术单、手术衣和洁净服 第3部分:试验方法
- 医院行风建设及行风示范窗口建设工作计划
- 内部控制制度审计实施细则
- 加油站隐患排查表、整改台账
- 浙江温州文成县周壤镇招考聘用大学生村务助理【共500题附答案解析】模拟检测试卷0
评论
0/150
提交评论