




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字图象处理第七章第1页,课件共92页,创作于2023年2月引言图像信息之所以可被减少或称被压缩,是由于图像信息中有大量的冗余信息。图像压缩就是利用了图像信号中的冗余度,如数据编码冗余度、心理冗余度(利用人眼视觉系统的一些特性忽略掉一些不被人眼所察觉的信号成分)等,进行压缩。第2页,课件共92页,创作于2023年2月1、数据冗余如果用n1和n2分别代表相同信息的2个数据集合中的信息载体单位的个数,那么第一个数据集合的相对数据冗余RD(相对于第二个数据集合)定义为:
RD=1-1/CR其中CR称为压缩率:CR=n1/n2例如,对同一幅512×512点的全白图像,以两种方式表达这幅图像:每点用8位信息表示n1=512×512×8每点用1位信息表示n2=512×512×1则RD=1-1/CR=1-1/8=88%
CR=n1/n2=8第3页,课件共92页,创作于2023年2月2、冗余的形式编码冗余:没有充分利用编码对像的概率特性而产生的冗余。设定义在[0,1]区间的离散随机变量sk代表图像的灰度值,每个sk以概率ps(sk)出现:
ps(sk)=nk/nk=0,1,…,L-1
其中L为灰度级数,nk是第k个灰度级出现的次数,n是图像中像素总个数。如果一个像素(事件、信息)用8位表示,该信息被赋予的码符号序列称为码字;码字里的符号个数称为码长。第4页,课件共92页,创作于2023年2月若用于表示信息sk的位数是l(sk),那么为表示每个像素所需的平均位数(码长)为:自然码和变长码的例子第5页,课件共92页,创作于2023年2月RD=1-1/CR=1-0.91=9%CR=n1/n2=3/2.7=1.11说明该图像有9%的冗余。自然码和变长码的例子第6页,课件共92页,创作于2023年2月像素间的冗余图像的重要特点之一就是像素间具有某种相关性。换言之,就是如果相邻像素值可由本像素值得出,那么像素值原来的表达是多余的。心理视觉冗余如果随着图像信息表达位数的增加,主观视觉效果不在增加,那么多于的信息表达位数就是心理视觉冗余。100→110→120第7页,课件共92页,创作于2023年2月3、图像保真度和质量1)客观保真度原则均方根误差均方信噪比峰值信噪比2)主观保真度原则优秀——很好良好——较好可用——稍好刚可看——相同差——较差不能用——很差第8页,课件共92页,创作于2023年2月Lena.bmp(原图)第9页,课件共92页,创作于2023年2月Lenna.jpg(压缩率9.2)第10页,课件共92页,创作于2023年2月Lenna.jpg(压缩率18.4)第11页,课件共92页,创作于2023年2月Lenna.jpg(压缩率51.6)第12页,课件共92页,创作于2023年2月二、编码模型输入图像输出图像信源编码器信道解码器信道编码器信源解码器信道第13页,课件共92页,创作于2023年2月汉明码——一种纠错码。汉明指出:如果将3位的冗余加到4位码字上,则所有单个位出现的错误都可以发现和校正。编码:例如:0101→1010010解码:对汉明码进行校验,错误位置由非零校验字c4c2c1指出;对该位求反即可纠正错误。如果校验字为零,则解码结果为h3h5h6h7。信道编码、解码器以汉明码为例第14页,课件共92页,创作于2023年2月一个典型的信源压缩(编码)系统如图所示。通过时间轴上采样和幅度量化将连续信号变成离散数字信号并对其进行量化。将信号中绝大部分能量集中在少数几个变换系数上,去除信号中的相关性信号压缩真正体现在量化阶段。一般先是游程编码,然后Huffman编码或算术编码进一步提高压缩比如果信号已经数字化最终的“无损”与“有损”编码的区别在于:在编码过程中是否是对全部的“数据”进行编码。第15页,课件共92页,创作于2023年2月1、设计一个好的图像编码器的步骤要为图像信号选择一个正确合适的模型;在这个给定模型框架中优化编码器。压缩算法的选择;数据压缩率、失真度和算法的复杂度。2、图像编码算法的分类:1)、一类是无损编码即在编码过程中信息没有丢失。2)、另一类是有损编码即在编码过程中没有对所有信息编码。
三、编码器的设计原则第16页,课件共92页,创作于2023年2月3、图像信息率及编码效率
一般静止灰度图像中每个像素用8比特来表示,那么一幅图像的平均信息率可以用下面的熵值来表示:其中pi=ni/ni=0,1,…,L-1表示像素取i级灰度的概率,i的取值范围为0~(28-1)。H表示该图像在不失真情况下,每像素编码所需的最小码长;如果对每像素编码的码长小于H,则解码后的图像会产生失真。第17页,课件共92页,创作于2023年2月4、最佳编码定理主要内容:若对一幅图像进行编码,将出现概率较高的信息(出现概率较高的像素值)赋予较短的码字;反之,将出现概率较低的信息(出现概率较低的像素值)赋予较长的码字;如果码字长度严格按照所对应信息出现的概率大小逆序排列,则这样编码结果的平均码字长度一定是小于任何其它排列方式。衡量编码优劣可用编码效率作为一个重要指标。第18页,课件共92页,创作于2023年2月对最佳编码定理的简单说明设图像灰度级为w1,w2,…wN;各级灰度出现的概率分别为p1,p2,…pN(由大到小);编码器赋予各级灰度对应的码字长度分别为t1,t2,…tN(由小到大)
;则编码后图像平均码字长度R应为:令:R1为严格按最优编码定理规定的原则编码的平均码字长度;R2为在编码过程中将任意两个灰度级不按最优编码定理规定的原则编码的平均码字长度。依最优编码定理的结论应有R2=R1+△R。只要证明△R>0即可第19页,课件共92页,创作于2023年2月令第m和n个灰度级出现的概率分别为pm,pn,且pm>pn;对应的码字长度分别为tm,tn,且tm>tn(不符合严格逆序的原则)。构造下列运算:注意:概率和字长均为正数。不按定理的码长按定理的码长说明不按定理编码的平均码长一定大于按定理编码的平均码长说明运算构造的合理性第20页,课件共92页,创作于2023年2月5、编码的唯一可译码(单义码)原则一个能唯一的被译出、不会产生歧义的编码序列称为唯一可译码编码(单义码)
。这样的编码序列应满足以下两个条件:编码中的任何一个码字都不是另一个码字的简单续长代码——由一个码字简单添加一些码元而构成一个新的码字。注意:非续长码一定是单义码;而单义码不一定是非续长码。编码序列应为单义代码序列,即满足Kraft不等式。其中:n为编码序列的编码个数;D为编码系统的进制;ti为第i个码字的长度。第21页,课件共92页,创作于2023年2月编码的唯一可译码原则的解释某编码序列C=[00,10,0(0)11,101]对应信息[a,b,c,d]编码序列C满足Kraft不等式,所以C是单义代码。例:某编码序列C=[101,10,00,10]dbab某编码序列C=[0,01,1,11]对应信息[a,b,c,d]编码序列C不满足Kraft不等式,所以C不是单义代码。例:某编码序列C=[0,1,11,0,11]acdad→bdbc?所有应用于信号的编码,都应满足编码的唯一可译码原则。第22页,课件共92页,创作于2023年2月四、简单编码方法哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。具体步骤:分配码字长度时,首先将出现概率最小的两个符号的概率相加,合成一个概率;第二步把这个合成概率看成是一个新组合符号的概率。重复上述做法,直到最后只剩下两个符号的概率为止。完成以上概率相加顺序排列后,再反过来逐步向前进行编码;每一步有二个分支,各赋予一个二进制码,可以对概率大的编码赋为0,概率小的编码赋为1。1、哈夫曼编码——最优变长编码第23页,课件共92页,创作于2023年2月哈夫曼编码示例某图像中的一个子集如图所示,其哈夫曼编码为(逐行a2a6a2a6a4a5a2a3a1):1
00
1
00
0100
01011
1
01010
001
共24位如果用每个符号3位自然码编码:共需27位;符号概率排序编码过程①⑩②⑨③⑧④⑦⑤⑥a10.1a20.410.410.410.410.60a20.4a60.3000.3000.3000.3000.41a30.06a10.10110.10110.20100.301a40.1a40.101000.101000.1011a50.04a30.06010100.10101a60.3a50.0401011a2a2a2a6a6a4a3a1a5第24页,课件共92页,创作于2023年2月设某一幅图象共有8个灰度级,各灰度级出现概率分别为:试对此图象进行Huffman编码。第25页,课件共92页,创作于2023年2月计算上例的编码效率图像的熵、平均码字长度、编码效率若按自然码编码:H=2.14Lavg=3编码效率=71.3%之所以没有达到H=2.14的水平,是因为字长是整数。第26页,课件共92页,创作于2023年2月哈夫曼编码在使用中出现的问题1、编码过程太复杂2、对每个文件的编码是不一样的3、解码器的构造不一致4、压缩文件中必须包含解码信息针对上述问题,常常采用一些亚最优编码只要对文件信息的统计参数已知,可直接用亚最优编码对其进行压缩。第27页,课件共92页,创作于2023年2月2、亚最优可变长编码哈夫曼编码为最优编码。但在使用过程中有不便之处:要对编码对像进行概率统计,不利于快速编码。如果对某一类编码对像的统计统计规律有一定的了解,即可利用一些亚最优变长编码技术得到近似最优的编码结果。第28页,课件共92页,创作于2023年2月亚最优可变长编码常见的亚最优变长编码有:截断哈夫曼码——对最有可能出现的M个符号进行哈夫曼编码;将其余的符号概率相加,查出对应的哈夫曼编码作为前缀,后跟由0开始的自然码对剩余的信息进行编码。哈夫曼平移码——①重新排列信源符号使它们的概率单减;②将符号总数分成相同大小的符号块;③对所有块中的各个元素采用同样方法编码;④对每个块加上专门的移上移下符号以区别它们。每当解码器认出1个移上移下符号,它就相对事先定义的参考块移上移下1个块。具体到平移哈夫曼码,则在用哈夫曼方法对参考块编码前先将概率赋给平移符号。第29页,课件共92页,创作于2023年2月编码应用举例1——图像的差分编码某卫星图像f为2340×3240像素,灰度量化为128级。如果采用自然码编码,共需使用2340×3240×7≈50Mbit。若每天接收30幅,则共需使用约50×30=1500Mbit。图像的直方图如图所示。构造差分变换矩阵A,对图像f进行变换。A为(2340×3240)×(2340×3240)方阵f为(2340×3240)×1列向量;g为(2340×3240)×1列向量图像以堆叠向量表示第30页,课件共92页,创作于2023年2月直方图的比较可以看出:由于图像数据的相关性,差分数据的方差(数据的离散程度小)远小于灰度数据的方差。根据最佳编码定理,对差分数据编码所需的平均码长会远小于对灰度数据编码所需的平均码长。skpk(sk)1690gipi(gi)-32032-88灰度直方图差分数据直方图0.250.4第31页,课件共92页,创作于2023年2月构造编码构造一种变形的A码(移位码),共16个码字c1c2c3…c16
。c1=0000,c2=0001,c3=0010,……c16=1111将其中的14个码字c2c3…c15分配给差分数据;c1
、c16
作为指示位。0…678…2021…35…c9…c15c16c2c16c3…c16c15c16c16c2…c16c16c16c2……-36-35…-23-22-21…-9-8-7……c1c1c1c15c1c1c2…c1c1c14c1c1c15c1c2c1c14c1c15c2…图像重构:编码图像→解码→逆变换f=A-1g压缩后的平均码长为4.3,压缩61%;如果用哈夫曼编码平均码长为3.5,压缩50%。第32页,课件共92页,创作于2023年2月对存在大面积等灰度块的图像(可能是直接得到,也可能是通过某种增强方法得到)可采用图像轮廓编码进行压缩。——任何一个灰度区域,都可以按照某种规则勾画成一个封闭的等值线。编码应用举例2——图像的轮廓编码①将所有像素标记为I②从左上角开始逐行寻找起始点并将该点标记成IP;能够成为起始点的条件为该点标记为I,并且不在已勾画过的轮廓当中。③按“向左看”,“顺时针转”的原则,寻找等灰度I点,按标记规则加注标记。④完成一个封闭轮廓后,寻找新的轮廓起点。直至标记完所有轮廓。标记像元出的方向↑→↓←像元进的方向↑←AR↓→RDIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII第33页,课件共92页,创作于2023年2月勾画轮廓及标记新IP点的确定:从左到右从上到下逐行搜索。①构造栈区,搜索新的一行时,将栈区清空。②遇A进栈,遇D出栈,遇R不管;如果空栈遇I则为一新的IP点;如果非空栈遇I且该像素的灰度值不同于先前进栈A点的灰度值,则该点为一新的IP点,反之不是。IP1RRRRRRDARRRRRIDARIP2RDRARDRARAIDDAIP3DAARADDRRDADAARRRDADRDAARRRDADRR对于同一像素点上出现两次标记得处理两次标记DADRARADRDRARRDDAA最后标记RDAA第34页,课件共92页,创作于2023年2月编码方案轮廓号:自然码轮廓灰度:自然码坐标起点:自然码轮廓码:Flame方向码轮廓号轮廓灰度起点坐标轮廓码编码0000000000010101010101011010101010100000000011111010……010101001001011010111100001010011111101010110001000000011011Flame方向码解码:每完成一个轮廓的描绘,将该轮廓内填充为对应的轮廓灰度。该图像如果用自然码编码共用7×8×8=448bit;采用轮廓编码共用3×16+2×16+92=172bit。同灰度面积越大,效果越明显。可以是8位第35页,课件共92页,创作于2023年2月编码应用举例3——图像的游程编码图像的每一行可以看成是由i个长度不等,灰度级为k个的像素组成。l1l2l3l4l5像素坐标灰度级对每一行像素用(li,gk)表达,选择恰当编码方式对其进行编码(甚至直接保存),即可对图像进行压缩。图像中等灰度的面积越大,压缩效果越好。对上图表示的某一行像素而言:(l1,g1),(l2,g3),(l3,g2),(l4,g5),(l5,g4)g1g2g3g4g5第36页,课件共92页,创作于2023年2月编码应用举例4——算术编码特点:递推式编码。编码条件:必须知道各符号信息的概率例:已知符号源{a1,a2,a3,a4},已知各符号出现的概率分别为p(a1)=0.2,p(a2)=0.2,p(a3)=0.4,p(a4)=0.2,现需对a1a2a3a3a4编码。01a1a2a3a400.2a1a2a3a40.06240.0688a1a2a3a40.0560.072a1a2a3a40.040.08a1a2a3a4a1a2a3a3a40.06752在最后一个符号的区间内[0.06752,0.0688]内的任意的一个实数就可以表示整个序列(码长尽可能的短)。如0.068。(0.04/10)×4+0.04=0.056(0.04/10)×8+0.04=0.072第37页,课件共92页,创作于2023年2月算术编码的解码:条件同上,给定编码0.0676059解码方法:排列概率、选择展开区间去逼近被解码字区间。01a1a2a3a400.2a1a2a3a40.06240.0688a1a2a3a40.0560.072a1a2a3a40.040.08a1a2a3a4a1a2a3a3a40.067520.067520.0688a1a2a3a40.067520.067776a1a2a3a40.0675993680.067607426a1a2a3a40.067591320.06761144a1a2a3a40.06757120.0676224a1a2a3a4a1a2a3a3a40.0676058064解码结果:a1a2a3a3a4a1a2a3a3a4被编码的信息长度应是已知的第38页,课件共92页,创作于2023年2月五、二值图像编码1、二值图像编码——跳过白块编码(WBS)二值图像是指只有两个灰度级的图像。例如文字组成的文件扫描图、气像图、工程图、指纹卡、军用态势图…。分辨率越高,图像细节越清晰,因而图像质量越高。但是其代价是表示一幅图像的数据量也越大,这使得传输时间、存储容量、处理计算时间都要付出更高的代价。CCITT(国际电话与电报顾问委员会)建议采用两种分辨率:1728像素/行(8取样/mm),3.5行/mm;1728像素/行(8取样/mm),7.7行/mm。第39页,课件共92页,创作于2023年2月在一般情况下,用主观测试方法确定结果表明,对中等质量要求,如我国常用的公文纸幅面190mm×270mm,如果分辨率取5点/mm,直接编码所需bit数:190×270×52=1282500bit≈1.3Mbit如果用常用的速率为2.4kbit/s的传真机传送,需要9分钟。如要达到CCITT规定的三类传真机的传输标准,即传输一帧公文约需1分钟,则需将数据压缩9倍。第40页,课件共92页,创作于2023年2月1)、一维跳过白块编码基本原理:大多数二值图像中的黑像素只占整个图像的一小部分,若能跳过白色像素,只对黑色像素编码,则表示图像的比特数就能减少,平均比特数就能大大降低。步骤:将图像的每条扫描线分成若干段,每一段的像素个数为n;对全部是白色的像素用0表示;对至少有一个黑像素的线段用n+1个比特表示,第一个比特为1,其余n比特采用直接编码。第41页,课件共92页,创作于2023年2月举例:黑白白黑——11001
白白白白——0设长度为n的像素段出现全白的概率为Pw,则一维WBS编码每一段的平均码长bn为:例:某二值图像行有40个黑白像素(40位)。n=4时0011110011111000共16位n=8时01111000001111100000共20位n=5时01000111100001011110000共23位可见,分段大小的不同,编码效率也不同。第42页,课件共92页,创作于2023年2月2)、二维跳过白块编码将一维WBS的像素段推广为像素块。设像素块大小为M×N,全白像素块用“0”表示,否则用M×N个比特来直接编码,并在编码前加一个1作为标识位。则每块像素的平均码长R为若按4×4分块:5位0+5×(16+1)位1=90位编码。其中:Pw为像素块出现全白的概率例:某二值图像4行有160个黑白像素。如果此像素为白第43页,课件共92页,创作于2023年2月3)、自适应跳过白块编码根据图像的局部结构或统计特性,改变像素块的大小,进一步提高压缩效果,这就是所谓的自适应WBS编码。改进型的一维WBS编码:对于一维的WBS编码,如果一条扫描线全为白像素时,则用1比特“0”表示,否则用正常的一维WBS编码。自适应的WBS编码可以使得表示图像的bit数下降很多,但是增加了自适应增加了译码的复杂性。第44页,课件共92页,创作于2023年2月2、二值图像编码——游程编码
主要思路是将一个连续相同值的串用一个代表值和串长来代替。对于图像编码,可以定义沿特定方向上具有相同灰度值的相邻像元为一组,其延续长度称之为延续的行程,简称为“游程”。游程终点位置由前一游程终点的相对距离确定,这样就可以由游程长度串来表示图像数据。游程编码一般不直接应用于多灰度图像,而比较适合于二值图像的编码,例如传真图像的编码等。为了达到较好的压缩效果,有时游程编码和其它一些编码方法混合使用。第45页,课件共92页,创作于2023年2月1)、一维游程长度编码(RLC)对二值图像的每一扫描行来看,总是由若干段连着的黑像素段和连着的白像素段组成,分别称为“黑长”和“白长”。黑长和白长总是交替发生。对于不同长度按其发生概率分配以不同长度的码字,这就是游程长度编码(RLC)。设二值图像中有长度为1,2,…,N等不同长度的黑长和白长,N为一个扫描行的像素数。步骤:对每一扫描行从左到右按游程长度编码,且每行都由白色游程开始(其长度可以是0)。用最优变长编码或亚最优变长编码对游程长度进行编码。第46页,课件共92页,创作于2023年2月一维游程长度(RLC)编码举例各行编码:1,7,4,4,4,122,7,3,12,4,43,7,2,4,1,2,1,4,1,74,7,1,4,4,4,4,4概率统计按大小排列:4,1,7,2,12,3用哈夫曼编码方案编码00,011,1,1,1,010100100,011,01011,01010,1,101011,011,0100,1,00,0100,00,1,00,0111,011,00,1,1,1,1,1
共计:13+19+27+11=70(直接编码为128位)符号码字411007011201001201010301011第47页,课件共92页,创作于2023年2月2)、二维游程长度编码(RAC)RAC编码举例各行编码:第一行:1,7,4,4,4,12——RLC编码第二行:1,1,3,4,4,4第三行:2,1,2,4,1,2,1,4,1,3第四行:3,1,1,4,3,4,3,4第48页,课件共92页,创作于2023年2月3)、预测差值量化编码(PDQ)游程长度编码只利用了沿扫描线方向的像素间的相关性。如果进一步利用行间像素相关性则可能达到更高的压缩效率,这就是预测差值量化编码。PDQ实际是RLC基础上改进得到的二维游程编码,它不是对游程长度本身进行编码,而是对扫描线之间的代表两个游程长度变化的差值进行编码,但相应的规则较多。第49页,课件共92页,创作于2023年2月六、预测编码预测编码是统计冗余数据压缩理论的三个重要分支之一(直接编码、预测编码、变换编码)。预测编码的理论基础是现代统计学和控制论,它主要减少了数据在时间和空间上的相关性。对于静止图像来说,预测编码将被图像变换编码所取代。而预测编码对于视频信号来说,它充分利用了连续帧之间的统计冗余性,是当今主流技术并且还会流行于未来。第50页,课件共92页,创作于2023年2月1、预测编码的基本原理预测编码是根据图像数学模型利用以往的样本值对于新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差值,对这一误差值进行编码。如果模型足够好且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于原始信号,从而可以用较少的码字对其差值量化得到较大的数据压缩效果。如果能精确地预测数据源输出,那就不存在关于数据源的不确定性。第51页,课件共92页,创作于2023年2月然而没有一个实际的系统能找到其完整的数学模型,我们能找到的最好预测器是以某种最小化的误差对下一个采样进行预测的预测器。通常预测器的设计不是利用数据源的实际数学模型,因为数据源的实际数学模型是非常复杂,而且是时变的。实验结果表明以最小均方预测误差设计的预测器不但能获得最小均方预测误差,同时在视觉效果上也是比较好的。第52页,课件共92页,创作于2023年2月预测编码原理——线性预测设时间序列像元如下XM,XM-1,XM-2,……,X1,Xn,Xn+1,……则对Xn的线性估值可表述为:为了得到最佳的预测系数,定义均方误差准则:求使en2最小的ai:被预测数据历史数据看成常数不可能=0第53页,课件共92页,创作于2023年2月有:当i=1,2,…,M时若定义Xi、Xj的协方差为Rij=E[Xi,Xj]则上式可写为:且可以证明|ai|<1。由于Rij是可以求出来的,因此ai也是可以求出来的。求取偏差的方差——观察其离散程度。Xnp
(Xn)e2np
(e2n)对称方阵第54页,课件共92页,创作于2023年2月若Rij=E[Xi,Xj],定义相关系数:ρij=E[Xi,Xj]
/E[Xi2]0≤ρij≤1则Rij等式可以写成如果预测的比较准确则近似等于Xn第55页,课件共92页,创作于2023年2月显然,M=1时,有:在前面公式推导时,前提条件是各点的均值为0。但在实际的图像中,图像点的均值不可能等于0,总有一个值m。因此,要保证上式成立应有:上式称为最佳一维一阶预测公式。其中:使用预测编码方式可以实现无损编码——在预测过程中不进行各种舍入的量化;以及有损编码——在预测过程中进行了适当的舍入和量化。实际上,前面推导的公式是不好用的。因为期望值与自相关系数是不容易得到的。第56页,课件共92页,创作于2023年2月2、无损编码实例——一阶DPCM编码设预测器为一阶预测器:偏差为:用其对给定图像进行编码。对选择恰当的编码方式进行编码(如前例中的变形移位码)。编码器解码器令a1=1第57页,课件共92页,创作于2023年2月3、有损编码实例——DM(差值调制)编码为了进一步提高压缩率,可使用DM编码方案。设预测器为一阶预测器:,其中a1=1;偏差为:用其对给定图像进行编码。令+c=1,-c=0对进行编码,每像素仅一位(每行的第一个像素用自然码编码)。编码器解码器第58页,课件共92页,创作于2023年2月DM(差值调制)编码存在地问题造成颗粒噪声形成亮暗噪声点,噪声的强弱取决于c的选择。当图像的灰度发生剧烈变化时,预测值跟不上变化,解码后会造成边缘的不清晰——斜率过载现像。4、最优量化——高阶预测(有损编码)如果使用高阶预测,M>1,由于|ai|<1,则偏差会出现小数,且为各种可能值,如:0.312、0.1237、4.7856。为了对其进行编码,必须要进行量化。最简单的方法是取整运算:当像素间的相关性较强时,误差很大。第59页,课件共92页,创作于2023年2月量化方案的选择如何对偏差信息进行量化,需几级量化才能使解码图像更接近原始图像,量化时怎样才能使量化误差最小等问题是我们关心的问题。所谓量化问题,简言之就是为输入按某种规律分配码字的过程。常见的量化方式为均匀量化,如A/D。即给定输入s,如果s落在[s0,s1)之间则赋予码字t0;如果s落在[s1,s2)之间则赋予码字t1;如果s落在[si-1,si)之间则赋予码字ti-1;…………重建层决策层t0t1t2t3tk+1tk-1tk输入s第60页,课件共92页,创作于2023年2月均匀量化的最小量化误差设想si、ti有同样的量纲,问如何量化si,量化误差最小。设s在其可量化范围内的概率密度p(s)为常数——各可能出现值得概率相等。构造均方误差函数:如果设si、ti都是变化的,问:si、ti如何取值时均方误差最小。重建层是均匀的,A/D转换恰是如此。第61页,课件共92页,创作于2023年2月概率密度p(s)不为常数时,有可见,重建层是不均匀的——每个titi+1的宽度取决于s在[si,si+1)区间内分布的概率密度。对预测偏差而言,其概率密度为Laplace分布:由此构造出的量化器称为Lloyd-Max量化器(P165)。第62页,课件共92页,创作于2023年2月Lloyd-Max量化器假设预测方程的预测结果足够准,用8级最优量化已能满足要求,也就是说偏差范围在-2.994~2.994之间,既便是采用自然码编码,也可以将256级灰度的图像压缩近50%。如果采用变长码压缩率会更高。0.707-0.70700.395-0.39501.810-1.8100.222-0.22200.785-0.7851.576-1.5762.994-2.994110010111010100100000001001000110100
00111000110000011110110010100001001102级量化4级量化表示决策区域自然码编码哈夫曼编码第63页,课件共92页,创作于2023年2月5、二维和三维预测对一幅图像而言,被预测点的值不仅与本行的点相关,而且也与前一行的邻近点相关,如果将其考虑进来,预测会更加准确。考虑到行间相关性的预测称为二维预测。一个常用的四阶预测公式为:X6X2X3X4X7X5X1X前一行当前行同理,有时图像帧之间也有相关性。如电视图像的每帧之间具有较高的相关性。考虑到帧间相关性的预测称为三维预测。应用领域:电视图像、可视电话。第64页,课件共92页,创作于2023年2月编码器解码器第1帧预测帧2第2帧偏差帧2预测帧3第3帧偏差帧3预测帧4第4帧偏差帧4预测帧4第4帧偏差帧4第1帧预测帧2第2帧偏差帧2预测帧3第3帧偏差帧3预测帧4第4帧偏差帧4预测帧4第4帧偏差帧4
第一帧中使用一维或二维预测编码第65页,课件共92页,创作于2023年2月七、变换编码
1、变换编码中的有损与无损编码“无损”编码:由于经过正交变换后“图像”,都具有能量集中的特点——绝大部分“像素”为0或很小,它们占用的码位相对较少,所以,直接对变换“图像”进行编码,会比对原图像进行编码需要的码位少。由于绝大多数图像变换都会产生带有经舍入的小数点的变换矩阵,一般而言,变换编码不可能做到绝对“无损”。有损编码:将经过正交变换后“图像”中能量较集中的“像素”依照某种准则保留,而将其它“像素”置为0,然后对其进行编码,这样会比对原图像进行编码需要的码位少的多。但解码后,图像不可能恢复原来状态。第66页,课件共92页,创作于2023年2月2、变换编码的基本步骤选择变换形式;变换编码的一个极其重要的作用是将信号中的能量尽可能集中在少数几个系数上,选择的准则应是集中度较高的变换。几乎所有的图像变换编码器都采用基于分块的DCT变换。对给定图像按某种方案(如分块)进行变换。对这变换系数进行按给定的规则进行量化,这样图像压缩率有明显的提高(如:DCT变换之后通常是均匀量化)。最后按指定编码方式编码(如:哈夫曼编码)。第67页,课件共92页,创作于2023年2月3、图像压缩为什么选中的余弦变换实变换,且在给定条件下的重建误差较小。测试方法:对同一幅具有代表性的图像,将其分成n×n的子图像,计算各子图像的变换系数(求其变换“图像”),将变换系数由小到大截除75%,求取截除系数后的变换“图像”的反变换,计算均方根误差后比较。3.02.52.01.51.00.50.02×24×48×816×1632×32傅立叶余弦哈达玛131664第68页,课件共92页,创作于2023年2月4、国际标准简介——JPEG标准JPEG的产生JPEG是“联合图片专家组”(JointPhotograhicCodingExpertsGroup)的简称。是由ISO(国际标准化组织)和CCITT(国际电话与电报顾问委员会)于1986年联合成立的一个标准起草小组,该小组于1991年提出ISOCD10918标准建议草案,1992年成为国际标准ISO/IEC。后来,通常将该标准称为JPEG。
JPEG标准主要涉及连续色调(灰度和彩色)静止图像的压缩编码。它提供了一种适合大多数应用场合的简单高效的图像编码方案。下面,以灰度图像为例介绍JPEG标准。第69页,课件共92页,创作于2023年2月5、JPEG基本系统图像分割系数编码量化FDCT量化表码表编码器系数解码图像接拼IDCT反量化量化表码表解码器6、编码、解码过程1)、将图像分成8×8的图像块,以其为基本单位进行编码。2)、对每个8×8的图像块进行FDCT变换,得到变换系数矩阵。第70页,课件共92页,创作于2023年2月3)、量化。将每个DCT系数除以各自的量化步长并取整得到量化系数。4)、将量化后的系数分成直流系数和交流系数,查对应表格对量化系数编码。5)、用Z型扫描的方法形成数据流,对数据流查Huffman表进行编码。9910310011298959272101120121103877864499211310481645535247710310968563722186280875129221714566957402416131455605826191412126151402416101116亮度量化表S(u,v)第71页,课件共92页,创作于2023年2月7、JPEG编码应用举例158158158163161161162162157157157162163161162162157157157160161161161161155155155162162161160159159159159160160162161159156156156158163160155150156156156159156153151144155155155155153149144139原始数字图像0-112-2-42-3-1120-100-1-111-1020211-1021-1-1000110-2-70-1-102-2-9-11-100-3-3-6-17-231-3-22-5-12-11260DCT系数图像0000000000000000000000000000000000000000000000-1-1000000-1-200000-1079系数量化后图像数据流:79,0,-2,-1,-1,-1,0,0,-1,0,0,0,0,…….,0直流分量第72页,课件共92页,创作于2023年2月编码示例对直流分量而言,由于两块之间的直流分量非常接近所以JPEG对量化后的直流系数采用如下方法对ΔF(0,0)编码:ΔF(0,0)=Fi(0,0)-Fi-1(0,0)就本例而言,设ΔF(0,0)=2,查直流系数表,形成编码:类型码的编码+量化值范围的编码(使用自然码,负数用反码)。有:22,201110对交流分量而言,采用游程编码。由若干个0(也可以没有)和一个非0值组成一个编码的基本单位。就本例而言,在0,-2,-1,-1,-1,0,0,-1,0,0,0,0,…….,0中,0,-2为一个编码单位;有3个-1的编码单位;最后为EOB编码单位。每个编码单位下式构成:(游程/类型码)的编码+量化值范围的编码(使用自然码,负数用反码)类型:由非0值查直流系数表得到。游程:基本编码单位中0的个数。第73页,课件共92页,创作于2023年2月直流系数、交流系数量化表亮度分量直流系数编码表-2047~-1024,1024~2047-1023~-512,512~1023-511~-256,256~511-255~-128,-128~255-127~-64,64~127-63~-32,32~63-31~-16,16~31-15~-8,8~15-7~-4,4~7-1,-2,2,3-1,10量化值范围(使用自然码)11109876543210类型码类型码的Huffman码字00111110010111001111110100101110111111110111111101111110第74页,课件共92页,创作于2023年2月亮度分量交流系数编码表(负数用反码表示)1111111110001110……111110011110011111111110001000……1101111001111111110000011……001010Huffman码字游程/类型码Huffman码字游程/类型码2/A……2/22/11/A……1/21/10/A……0/10/0(EOB)5/A……5/25/14/A……4/24/13/A……3/23/11111111110100101……11110101110011111111110011101……11111110001110111111111110010101……111110111111010类型码的形成同亮度分量直流系数编码表第75页,课件共92页,创作于2023年2月最终编码1010111000000000000110110101110编码EOB2/1,-10/1,-10/1,-10/1,-11/2,-22,2类型表示0…..00-1-1-1-10-279量化值对于本例而言,可求其编码的压缩比等参数为:(游程/类型码)的编码+量化值范围的编码(使用自然码,负数用反码)第76页,课件共92页,创作于2023年2月0000000000000000000000000000000000000000000000-13-14000000-12-2400000-1001264解码及反量化后的图像158159161162161161159158158159161162162162161160157158160162164164163163156158160162163164163163155157159161162161161160155156157158158157156155156156156156154152150148156156156154152149146144经IDCT后的图像158158158163161161162162157157157162163161162162157157157160161161161161155155155162162161160159159159159160160162161159156156156158163160155150156156156159156153151144155155155155153149144139原始数字图像6)、解码时,对接收到的数据流查Huffman表进行解码,得到和编码器输出相同的量化系数,对其进行反量化恢复出DCT系数。最后,经IDCT恢复图像。第77页,课件共92页,创作于2023年2月158158158163161161162162157157157162163161162162157157157160161161161161155155155162162161160159159159159160160162161159156156156158163160155150156156156159156153151144155155155155153149144139原始数字图像0-112-2-42-3-1120-100-1-111-1020211-1021-1-1000110-2-70-1-102-2-9-11-100-3-3-6-17-231-3-22-5-12-11260DCT系数图像9910310011298959272101120121103877864499211310481645535247710310968563722186280875129221714566957402416131455605826191412126151402416101116亮度量化表S(u,v)0000000000000000000000000000000000000000000000-1-1000000-1-200000-1079系数量化后图像JPEG编码过程回顾第78页,课件共92页,创作于2023年2月数据流:79,0,-2,-1,-1,-1,0,0,-1,0,0,0,0,…….,0最终编码1010111000000000000110110101110编码EOB2/1,-10/1,-10/1,-10/1,-11/2,-22,2类型表示0…..00-1-1-1-10-279量化值0000000000000000000000000000000000000000000000-1-1000000-1-200000-10799910310011298959272101120121103877864499211310481645535247710310968563722186280875129221714566957402416131455605826191412126151402416101116亮度量化表S(u,v)解码后的图像第79页,课件共92页,创作于2023年2月0000000000000000000000000000000000000000000000-13-14000000-12-2400000-1001264反量化后的图像158159161162161161159158158159161162162162161160157158160162164164163163156158160162163164163163155157159161162161161160155156157158158157156155156156156156154152150148156156156154152149146144经IDCT后的解压缩图像158158
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《可怕的白色污染》(教学设计)-2023-2024学年四年级下册综合实践活动粤教版
- 七年级历史下册 第二单元 辽宋夏金元时期 民族关系发展和社会变化 第11课 元朝的统治教学设计 新人教版
- 2024年五年级数学上册 四 走进动物园-简易方程信息窗4列方程解应用题练习教学设计 青岛版六三制
- 七年级语文下册 第一单元 2 说和做-记闻一多先生言行片段第2课时教学设计 新人教版
- 2024-2025学年高中物理 第四章 电磁感应 4 法拉第电磁感应定律(1)教学设计 新人教版选修3-2
- 27故事二则 扁鹊治病 教学设计-2024-2025学年语文四年级上册统编版
- 7妈妈睡了教学设计-2024-2025学年统编版语文二年级上册
- 一年级品德与社会下册 和小树一起长大2教学设计 浙教版
- 05人美版七年级下册第3课大家动手做条龙教学设计
- 2024秋八年级英语上册 Unit 7 Will people have robots Section B 2(3a-Self check)教学设计 (新版)人教新目标版
- 风景园林基础试题及答案
- 陕西省县以下医疗卫生机构定向招聘真题2024
- 2024年中国邮政储蓄银行广东省分行招聘笔试真题
- 危重患者护理操作流程
- 2025-2030年中国喷涂加工行业市场全景调研及未来趋势研判报告
- 人工智能素养测试题及答案(初中版)
- 人教版八年级下册语文第三单元测试题含答案
- 四年级下册《生活·生命.安全》全册教案
- 2025年河南工业和信息化职业学院单招职业技能测试题库带答案
- 2024年法律职业资格考试(试卷一)客观题试卷与参考答案
- 室上性心动过速护理课件
评论
0/150
提交评论