![第六章-图像编码及压缩_第1页](http://file4.renrendoc.com/view/43ad2ef1ca6132dd3b9cdd175c8faf1d/43ad2ef1ca6132dd3b9cdd175c8faf1d1.gif)
![第六章-图像编码及压缩_第2页](http://file4.renrendoc.com/view/43ad2ef1ca6132dd3b9cdd175c8faf1d/43ad2ef1ca6132dd3b9cdd175c8faf1d2.gif)
![第六章-图像编码及压缩_第3页](http://file4.renrendoc.com/view/43ad2ef1ca6132dd3b9cdd175c8faf1d/43ad2ef1ca6132dd3b9cdd175c8faf1d3.gif)
![第六章-图像编码及压缩_第4页](http://file4.renrendoc.com/view/43ad2ef1ca6132dd3b9cdd175c8faf1d/43ad2ef1ca6132dd3b9cdd175c8faf1d4.gif)
![第六章-图像编码及压缩_第5页](http://file4.renrendoc.com/view/43ad2ef1ca6132dd3b9cdd175c8faf1d/43ad2ef1ca6132dd3b9cdd175c8faf1d5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章图像编码与压缩
6.1
概述
6.2图像编码的评价
6.3统计编码方法
6.4预测编码6.5正交变换编码6.6图像编码的国际标准简介6.7图像编码新技术1第六章图像编码与压缩图像如何压缩?26.1概述——图像编码的基本原理一、图像编码的基本原理图像数据量巨大——压缩的必要性图像数据高度相关——压缩的可能性空间冗余信息熵冗余视觉冗余知识冗余时间冗余——对于视频(图像序列)36.1概述——图像编码的基本原理空间冗余图像内部相邻像素之间存在较强的相关性所造成的冗余。信息熵冗余也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵(平均码长的下限),则图像中存在冗余,这种冗余称为信息熵冗余。空间冗余46.1概述——图像编码的基本原理视觉冗余人眼不能感知或不敏感的那部分图像信息所造成的冗余。知识冗余有些图像中还包含与某些先验知识有关的信息所造成的冗余。56.1概述——图像编码的基本原理时间冗余——对于视频(图像序列)视频图像序列中的不同帧之间的相关性所造成的冗余。时间冗余66.1概述——图像编码的基本原理几种常见应用的码率
76.1概述——图像编码的方法二、图像编码的方法根据压缩编码过程中的信息保持程度分类无损编码无信息损失,解压缩时能够从压缩数据精确地恢复原始图像。有损编码不能精确重建原始图像,存在一定程度的失真。根据压缩编码原理分类熵编码、预测编码、变换编码、混合编码等86.1概述——图像编码的方法无损编码也称无损压缩、无失真编码、信息保持编码优点:无信息损失,可精确恢复图像缺点:压缩率比较低,一般不超过3:1主要应用:图像的数字存储方面,如医学图像、遥感图像编码中。96.1概述——图像编码的方法有损编码也称有损压缩利用人眼视觉特性,丢掉人眼不敏感的信息优点:压缩率高缺点:存在信息损失,无法精确恢复图像主要应用:数字电视技术、静止图像通信、娱乐等。106.1概述——图像编码的方法有损编码特征编码——特殊的有损编码仅对于实际需要的(提取)特征信息进行编码例子:遥感图像分类图116.1概述——图像编码的方法熵编码熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码。熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码方法有霍夫曼编码、行程编码(RunLengthEncoding)和算术编码。126.1概述——图像编码的方法预测编码预测编码是基于图像数据的空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。预测编码可分为帧内预测和帧间预测,常用的预测编码有差分脉冲编码调制(DifferentialPulseCodeModulation,DPCM)和运动补偿法。136.1概述——图像编码的方法变换编码变换编码通常是将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。图像变换本身并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码就可以有效地压缩图像。常用的图像正交变换有离散余弦变换(Discrete
CosineTransform,DCT)。
146.1概述——图像编码的方法混合编码混合编码是指综合了熵编码、变换编码或预测编码的编码方法,如JPEG标准和MPEG标准。156.2图像编码评价
(1)图像保真度
(2)编码效率
(3)适用范围
(4)复杂度166.2图像编码评价——(1)图像保真度客观保真度准则误差均方根误差176.2图像编码评价——(1)图像保真度客观保真度准则均方根信噪比归一化并用dB表示,令 ,则186.2图像编码评价——(1)图像保真度客观保真度准则峰值信噪比其中196.2图像编码评价——(1)图像保真度主观保真度准则综合评价法电视图像质量评价表206.2图像编码评价——(1)图像保真度主观保真度准则成对比较打分法可以按照某种相对的尺度对f(m,n)和g(m,n)进行比较打分,从而获得相对的质量分。比如,可以用{-3,-2,-1,0,1,2,3}来表示主观评价{很差,较差,稍差,相同、稍好、较好、很好}。216.2图像编码评价——(1)图像保真度客观保真度准则与主观保真度准则客观保真度准则优点:快速易操作缺点:符合客观质量评价指标的图像不一定具有较好的主观质量主观保真度准则优点:能够与人的视觉效果相匹配缺点:评判过程缓慢费时226.2图像编码评价——(2)编码效率编码效率平均码字长度(R)编码效率(η)冗余度(r)压缩比(CR)每秒钟所需的传输比特数(bitspersecond,bps)236.2图像编码评价——(2)编码效率图像的熵的定义设一幅灰度级为N的图像,图像中第k级灰度出现的概率为Pk,图像大小为Nx×Ny,每个像素用d比特表示,每两帧图像间隔Δt,则按信息论中信息熵的定义,数字图像的熵H由下式定义:图像熵H表示各灰度级比特数的统计平均值。图像熵是图像无失真编码平均码长的下限。246.2图像编码评价——(2)编码效率平均码字长度(平均码长)对于一种图像编码方法,设第k级灰度的码字长度为Bk,则该图像的平均码字长度R为式中Pk为图像中第k级灰度出现的概率。256.2图像编码评价——(2)编码效率编码效率η冗余度r压缩比CR每秒钟所需的传输比特数m为采用自然编码时的码长266.2图像编码评价——(3)适用范围适用范围特定的图像编码算法具有其相应的适用范围,并不对所有图像都有效。一般说来,大多数基于图像信息统计特性的压缩算法具有较广的适用范围,而一些特定的编码算法的适用范围较窄,如分形编码主要用于自相似性高的图像。276.2图像编码评价——(4)复杂度复杂度算法的复杂度即指完成图像压缩和解压缩所需的运算量和硬件实现该算法的难易程度。优秀的压缩算法要求有较高的压缩比,压缩和解压缩快,算法简单,易于硬件实现,还要求解压缩后的图像质量较好。选用编码方法时一定要考虑图像信源本身的统计特性、多媒体系统(硬件和软件产品)的适应能力、应用环境以及技术标准。286.3统计编码方法
6.3.1霍夫曼编码
6.3.2费诺-香农编码
6.3.3算术编码
6.3.4行程编码296.3.1霍夫曼编码
基本思想通过减少编码冗余来达到压缩的目的。1.统计各符号的出现概率2.建立概率统计表将常出现的(概率大的)符号用较短码字编码将较少出现的(概率小的)符号用较长码字编码306.3.1霍夫曼编码
编码方法1.首先统计信源中各符号出现的概率,按符号出现的概率从大到小排序。2.把最小的两个概率相加合并成新的概率,与剩余的概率组成新的概率集合。3.对新的概率集合重新排序,再次把其中最小的两个概率相加,组成新的概率集合。如此重复进行,直到最后两个概率的和为1。316.3.1霍夫曼编码
编码方法4.分配码字。码字分配从最后一步开始反向进行,对于每次相加的两个概率,给大的赋“0”,小的赋“1”(也可以全部相反,如果两个概率相等,则从中任选一个赋“0”,另一个赋“1”即可),读出时由该符号开始一直走到最后的概率和“1”,将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。326.3.1霍夫曼编码霍夫曼编码举例第一步建立概率统计表和编码树336.3.1霍夫曼编码霍夫曼编码实例第二步分配码字346.3.1霍夫曼编码霍夫曼编码在不同概率分布下的编码效果对比356.3.1霍夫曼编码霍夫曼编码的特点1.码值不唯一。2.对不同概率分布的信源,哈夫曼编码的编码效率有所差别,对于二进制编码,当信源概率为2的负幂次方时,哈夫曼编码的编码效率可达100%,其平均码字长度也很短,而当信源概率为均匀分布时,其编码效果明显降低。3.需先计算图像数据的概率特性形成编码表后才对图像编码,因此缺乏构造性。366.3.2费诺-香农编码二分法费诺-香农编码步骤(简单了解)首先统计出每个符号出现的概率;从左到右对上述概率从大到小排序;从这个概率集合中的某个位置将其分为两个子集合,并尽量使两个子集合的概率和近似相等,给前面一个子集合赋值为0,后面一个子集合赋值为1;重复步骤3,直到各个子集合中只有一个元素为止;将每个元素所属的子集合的值依次串起来,即可得到各个元素的香农-范诺编码。
376.3.2费诺-香农编码费诺-香农编码举例386.3.3算术编码算术编码基本原理用一个特定的代码代替一个输入符号,把要压缩处理的整段数据映射到一段实数半开区间[0,1)内的某一区段,构造出小于1且大于或等于0的数值。算术编码的两种模式基于信源概率统计特性的固定编码模式;针对未知信源概率模型的自适应模式。396.3.3算术编码算术编码方法——举例设一待编码的数据序列(即信源)为“dacab”,信源中各符号出现的概率依次为P(a)=0.4,P(b)=0.2,P(c)=0.2,P(d)=0.2。406.3.3算术编码算术编码方法——举例首先,数据序列中的各数据符号在区间[0,1)内的间隔(赋值范围)设定为a:[0,0.4),b:[0.4,0.6),c:[0.6,0.8)d:[0.8,1.0)
为便于讨论,再给出一组关系式:
StartN、EndN
——新间隔(或称区间)的起始位置和结束位置
StartB
——表示前一间隔的起始位置L——前一间隔的长度
LeftC、RightC——当前编码符号的初始区间的左端和右端StartN=StartB+LeftC×L
EndN=StartB+RightC×L
416.3.3算术编码算术编码方法——举例第一个被压缩的符号为“d”,其初始间隔为[0.8,1.0);第二个被压缩的符号为“a”,由于前面的符号“d”的取值区间被限制在[0.8,1.0)范围内,所以“a”的取值范围应在前一符号间隔[0.8,1.0)的[0,0.4)子区间内,根据上式可知StartN=0.8+0×(1.0-0.8)=0.8EndN=0.8+0.4×(1.0-0.8)=0.88
即“a”的实际编码区间在[0.8,0.88)之间。426.3.3算术编码算术编码方法——举例第三个被压缩的符号为“c”,其编码取值范围应在[0.8,0.88)区间的[0.6,0.8)的子区间内,据上式可知第四个被压缩的符号为“a”,同理,根据上式可知StartN=0.848+0×(0.864-0.848)=0.848EndN=0.848+0.4×(0.864-0.848)=0.8544436.3.3算术编码算术编码方法——举例第五个被压缩的符号为“b”,同理,根据上式可知至此,数据序列“dacab”已被描述为一个实数区间[0.85056,0.85184],或者说在此区间内的任一实数值都惟一对应该数据序列。这样,就可以用一个实数表示这一数据序列。我们把区间[0.85056,0.85184]用二进制形式表示为[0.110110011011,0.110110100001]。StartN=0.848+0.4×(0.8544-0.848)=0.84856EndN=0.848+0.6×(0.8544-0.848)=0.85144446.3.3算术编码算术编码方法——举例从这个区间可以看出,0.1101101位于这个区间内并且其编码最短,故把其作为数据序列“dacab”的编码输出。考虑到算术编码中任一数据序列的编码都含有“0.”,所以在编码时,可以不考虑“0.”,于是把1101101作为本例中的数据序列的算术编码。由此可见,数据序列“dacab”用7比特的二进制代码就可以表示,平均码长为1.4比特/字符。解码是编码的逆过程,根据编码时的概率分配表和压缩后数据代码所在的范围,确定代码所对应的每一个数据符号。由此可见,算术编码的实现方法要比霍夫曼编码复杂一些。456.3.3算术编码算术编码的步骤总结“当前区间”初始化为[0,1)。对于输入信息流中的每个信符,编码器执行如下两个步骤:
①将“当前区间”分成子区间,该子区间的长度正比于符号的概率;
②选择下一个信符对应的子区间,并使它成为新的“当前区间”将整个消息处理后,在“当前区间”中任取一个数,该数就是输入信息流的算术编码。466.3.4行程编码
行程编码基本方法行程编码(RunLengthEncoding,RLE)也称行程长度编码,游程编码,是一种熵编码。其编码原理相当简单,即将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。例如,有一字符串“aabbbcddddd”,则经行程编码后,该字符串可以只用“2a3b1c5d”来表示。476.3.4行程编码
行程编码分为定长和不定长编码两种定长编码是指编码的行程长度所用的二进制位数固定变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。486.3.4行程编码
行程编码的特点适合于二值图像的编码常用于量化后出现大量零系数连续的场合对于由很多块颜色或灰度相同的大面积区域组成的图像,压缩比高数据非常分散时,反而增加文件大小,不适用一般不单独采用,而是和其他编码方法结合使用。496.4预测编码
差分脉冲编码调制
(DifferentialPulseCodeModulation,DPCM)编码方法:编码不是对像素的实际值进行编码,而是对预测误差(该样值的预测值与其实际值的差值)进行量化、编码和发送。预测的一种简单方法:使用相邻若干像素的灰度值压缩原理:预测误差通常数值更小,分布更加集中,熵值比原来图像小,可用较少的单位像素比特率进行编码,使得图像数据得以压缩。506.4预测编码516.4预测编码预测编码原理框图输入信号tN时刻的取样值
的预测值差值信号量化的差值信号重构样值,也即接收端的输出信号编码失真即为量化误差526.4预测编码预测编码原理框图注意:编码失真即为量化误差,仅在量化环节引入失真预测器的输入是重构值,而不是实际值536.4预测编码预测编码原理框图发送端组成:编码器,量化器,预测器,加/减法器接收端组成:解码器,预测器546.4预测编码
DPCM的预测器线性预测非线性预测k为自适应系数556.4预测编码
DPCM的特点结构简单,易用硬件实现(接收端的预测器与发送端完全相同)编码压缩比不太高误码易于扩散,抗干扰能力差常用预测方法如前值预测(用同一行中前一个像素)一维预测(用到同一行中前面若干像素)二维预测(用到以前行的像素)三维预测(用到以前帧的像素)566.5变换编码
变换编码原理图像低频能量占绝大多数,高频能量小通过变换使图像能量重新分布,使能量大部分只集中于少数几个变换系数上57亮度样值及其DCT系数的三维表示(a)亮度样值的三维表示(b)DCT系数的三维表示6.5变换编码
变换编码原理586.5变换编码
变换编码一般过程变换后图像能量更加集中,在量化和编码时,结合人类视觉心理因素等,采用“区域取样”或“阈值取样”等方法,保留变换系数中幅值较大的元素,进行量化编码,而大多数幅值小或某些特定区域的变换系数将全部当作零处理。596.5变换编码
正交变换性质正交变换是熵保持的正交变换是能量保持的正交变换重新分配能量去相关性质图像编码常用正交变换DCT(离散余弦变换)DWHT(离散Walsh-Hadamard变换)606.5变换编码
变换后的编码方法变换为压缩数据创造了条件,压缩数据还要通过编码来实现。通常所用的编码方法有二种:区域编码法门限编码法616.5变换编码1.区域编码法ACcomponentsaredividedby2DC2222222222222222222222444444444444444444444ACcomponentsaredividedby4LowHighLowHigh自适应量化SensitiveforhumaneyesLesssensitiveforhumaneyes626.5变换编码1.区域编码法636.5变换编码1.区域编码法缺点:
一旦选定某个区域就固定不变了,有时图像中的能量也会在其他区域集中较大的数值,舍弃它们会造成图像质量较大的损失。646.5变换编码2.门限编码法这种采样方法不同于区域编码法,它不是选择固定的区域,而是事先设定一个门限值T。如果系数超过T值,就保留下来并且进行编码传送。如果系数值小于T值就舍弃不用。这种方法有一定的自适应能力。它可以得到较区域编码好的图像质量。缺点:
超过门限值的系数的位置是随机的。因此,在编码中除对系数值编码外,还要有位置码。这两种码同时传送才能在接收端正确恢复图像。所以,其压缩比有时会有所下降。656.5变换编码注意图像变换本身不会造成信息损失(不考虑计算误差),也不会压缩图像。造成信息损失的是图像变换后的量化,量化在损失信息的同时压缩了图像。666.6图像编码的国际标准简介静止图像压缩标准(JPEG、JPEG2000等)运动图像压缩标准(MPEG、H.26x等)二值图像压缩标准(JBIG等)676.6图像编码的国际标准简介制定图像标准的国际组织ISO(国际标准化组织)ITU(国际电信联盟)(其前身CCITT(国际电报电话咨询委员会))标准类型——信源编码标准686.6图像编码的国际标准简介——JPEG标准JPEG标准——ISO标准JPEG(JointPhotographicExpertsGroup)
联合静止图像专家组三种压缩系统:基线编码系统:面向大多数有损压缩的应用,采用DCT变换压缩。扩展编码系统:面向递进式应用,从低分辨率到高分辨率逐步递进传递的应用独立编码系统:面向无损压缩的应用,采用无损预测压缩,符号编码采用哈夫曼或算术编码一个产品或系统必须包括对基线系统的支持696.6图像编码的国际标准简介——JPEG标准JPEG标准压缩流程符号解码器DCT逆向变换量化器DCT正向变换构造8x8的子图输入图像NxN符号编码器压缩图像压缩的图像合成8x8的子图解压图像颜色空间转换零偏置转换颜色空间转换零偏置转换706.6图像编码的国际标准简介——JPEG标准JPEG标准关键技术DCT(无损)非均匀量化(有损)ZigZag扫描(无损)熵编码(无损)ZigZag扫描716.6图像编码的国际标准简介——JPEG标准JPEG标准压缩实例726.6图像编码的国际标准简介——JPEG标准Matlab中的DCT演示Matlab命令行下输入“dctdemo”736.6图像编码的国际标准简介运动图像压缩标准ISO/IEC——针对电视MPEG-1MPEG-2MPEG-4ITU-T——针对通信、视频会议H.261H.263H.264(即MPEG-4Part10)国内自主研发标准AVS746.6图像编码的国际标准简介运动图像压缩标准MPEG
(MovingPhotographicExpertsGroup)
运动图像专家组MPEG分系统、音频、视频等多个部分MP3—MPEG1AudioLayer3VCD—MPEG1DVD—MPEG2756.6图像编码的国际标准简介二值图像压缩标准基本思想采用行程编码与霍夫曼编码相结合由于是二值图像,不用为灰度值编码。只给行程长度编码,且黑和白的长度分别使用不同的编码。按行压缩766.7图像编码新技术图像编码新技术人工神经网络(ArtificialNeuralNetwork,ANN)压缩编码分形编码(FractalCoding)小波编码(WaveletCoding)基于对象的压缩编码(ObjectBasedCoding)基于模型的压缩编码(ModelBasedCoding)……776.7图像编码新技术人工神经网络典型的神经网络结构神经元处理单元神经元接收输入信号并生成输出信号。每个输入有一个加权系数,神经元的激活受到一个门限信号的影响。786.7图像编码新技术分形(Fractal)什么是分形?具有某种自相似性结构的集合称为分形以分数维形式充填空间的形态特征Koch雪花796.7图像编码新技术分形(Fractal)分形的诞生Mandelbrot(曼德布洛特)的大量工作1967年,Science,英国的海岸线有多长?尺子越小,长度越大1975年,《分形对象:形,机遇和维数》分形(fractal)这个词源于这本书。它是从意思是“不规则的或者断裂的”拉丁语“fractus”派生出来的。806.7图像编码新技术分形(Fractal)分数维数的概念将长度为1的线段分为n等分,每段长为r,则n•r=1将面积为1的正方形n等分,每一个小正方形的边长为r,则将体积为1的正方体n等分,每一个小正方体的边长为r,则n•r2=1n•r3=1相似子图形个数x相似子图形边长维数=1816.7图像编码新技术n•rd=1相似子图形个数x相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 厂房设备承包合同
- 生态养殖基地承包合同
- 项目进度追踪与协同策划方案
- 现代学徒制师徒协议
- 柑橘树承包合同
- 食品安全检测技术研究开发合作协议
- 汽车租赁合同租赁车辆交接确认书
- 投资借款合同书
- 共建联合实验室合作合同协议书范本模板5篇
- 活动一《自己种菜乐趣多》(教学设计)-2023-2024学年四年级上册综合实践活动沪科黔科版
- 大数据专业实习报告范文共5篇
- 出口退税培训课件外贸企业出口退税
- 蛋白表达及纯化课件
- 304不锈钢管材质证明书
- DBJ 46-027-2013 海南省建筑塔式起重机安装使用安全评定规程
- 港口集装箱物流系统建模与仿真技术研究-教学平台课件
- 杭州湾跨海大桥项目案例ppt课件
- (完整版)光荣榜25张模板
- 工业催化剂作用原理—金属氧化物催化剂
- 优秀教材推荐意见(真实的专家意见)
- QTD01钢质焊接气瓶检验工艺指导书
评论
0/150
提交评论