多媒体图像压缩_第1页
多媒体图像压缩_第2页
多媒体图像压缩_第3页
多媒体图像压缩_第4页
多媒体图像压缩_第5页
已阅读5页,还剩111页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第八章图像压缩基础知识图像压缩模型信息论基础无损压缩有损压缩图像压缩标准2Why?存储空间有限传输信道带宽有限图像压缩所要解决的问题就是尽量减少表示数字图像时所需的数据量。减少数据量的基本原理就是去除数据中的冗余。3图像格式:BMP;文件大小:768K图像格式:JPG;文件大小:65.8K未压缩压缩4一段90分钟的电影。假设每帧画面大小800*600,每秒24帧,彩色图像画面,则总数据量为:58.1基础知识在数字图像压缩中,通常利用三种基本的数据冗余进行压缩处理:编码冗余、像素间冗余和心理视觉冗余。当这三种冗余中的一种或多种得到减少或消除的话,就实现了图像数据的压缩。68.1.1编码冗余7设rk表示图像像素的灰度级,且每个rk出现的概率为p(rk)其中L是灰度级数,nk是第k个灰度级别出现的次数,n是总的像素数。如果用于表示每个rk值得比特数位L(rk),则表达每个像素所需的平均比特数为:8设有一幅具有8个灰度级的图像,如果用3比特来表示这8个可能的灰度级,则例子:910将最短的码字赋予图像中出现频率最高的灰度级。118.1.2像素间冗余缩小一倍放大一倍12一般来说,一幅自然图像中相邻像素点的值与其周围的像素点具有高度的相似性,因此它可以根据它周围的像素点进行适当的预测出来。这种冗余一般称作为“像素间冗余”。13行程编码:例子:148.1.3心理视觉冗余在正常的视觉处理过程中,各种信息的相对重要程度不同。那些不十分重要的信息称为心理视觉冗余。在不会削弱图像感知质量的情况下可以消除这些冗余。15例子:通过量化进行压缩256级灰度16级灰度IGS16级灰度168.1.4保真度准则如何定量地衡量在消除冗余后,原始图像数据与压缩后数据的之间的丢失信息。客观保真度主观保真度17客观保真度:令

表示输入图像,

表示经压缩后再通过解压缩得到的图像,则它们之间的误差图像为:18均方差:信噪比:峰值信噪比:注:其中MAXI是图像灰度取值的最大范围值。8位图像就是255.198.2图像压缩模型一个图像压缩系统包括两个不同的结构块:一个编码器和一个解码器。编码器由一个消除输入冗余度信源编码其和一个用于增强编码器输出的噪声抗干扰性的信道编码器组成。20第一步:用转换器将输入图像转换为可以减少输入图像中像素间冗余的格式。如采用离散余弦变换将原图像转换为频率域。第二步:采用量化器将输出精度调整到与预设的保真度准则相一致。第三步:采用符号编码器生成一个固定的或可变长编码,减少编码冗余。8.2.1信源编码器218.2.2信道编码器信道编码器通过向信源编码数据中插入预制的冗余数据来减少信道传输过程中噪声点影响。常用的一种技术是由R.W.Hamming提出的hamming编码228.3信息论要素有没有描述一幅图像且没有信息丢失的最小数据量?一个以概率P(E)发生的随机事件E,它所包含的信息量定义为:如果取2为底数,则信息量的单位为比特。23设有一个信源符号集合,集合中的元素表示为aj。信源产生符号aj的概率是P(aj),且有则生成一个单一信源符号产生的信息量是:24因此,每个信源输出的平均信息量为:这个量称为信源的熵(Entropy)。它定义了信源输出的平均信息量。随着熵的增加,信源具有更大的不确定性。如果信源的各个符号的出现概率是等概率的,则信源具有最大的熵值。25当底数取2的时候,熵就是编码所需的比特数的下限。编码时一定要用不比熵少的比特编码才能完全保持原图像的信息,它是图像数据压缩的下限。设某信源具有8个符号,并且它们具有等概率1/8,则可以计算出这个信源的熵为H=3.如果其中一个符号的概率为p1=1,p2,…,p8=0,则该信源的熵为H=0.268.4无损压缩编码无损数据压缩(LosslessCompression)指数据经过压缩后,信息不受损失,还能完全恢复到压缩前的原样。常用的压缩软件Winzip,WinRAR等都是采用的无损压缩编码方式。278.4.1变长编码无损图像压缩编码最简单的方法就是减少仅有的编码冗余。编码冗余通常存在于图像的灰度级的自然二进制编码过程中。可以通过采用变长编码,将最短的码字赋予出现概率最大的灰度级。28Huffman编码Huffman编码使用一张特殊的编码表将信源符号进行编码。这张表的特殊之处在于,它是根据每一个符号出现的概率而建立起来的(出现概率高的符号使用较短的编码,反之出现概率低的则使用较长的编码)。这种方法是由David.A.Huffman在1952年提出的。29Huffman编码的步骤:Steps:将信源符号按照它们出现的概率大小进行排序,并将具有最低概率的两个符号连结为一个单一的符号,它的概率为这两个符号概率之和。将这个符号重新纳入符号集合中,然后重新进行概率大小排序,直到只剩下两个符号为止。3031a5a30.10.040.06a40.20.1a10.30.1a60.60.3a210.41010101010Huffman二叉树32这个信源的编码长度为:这个信源的熵为:338.4.2无损预测编码一般来说,实际图像相邻像素之间往往具有较大的相关性。如像素Xn可以用其前面的M个像素来进行估计,叫做Xn的估计值。这个估计是一般都会较为准确,其估计误差

的绝对值一般较小,方差较小。如对差值e进行量化编码,则可以压缩其平均码长。34一个无损预测编码的基本组成:35预测器:由于输入图像的每个表示为的连续像素都被送入编码器,因此,预测器应能根据以往的一些输入生成当前输入像素点的预测值。36一般,预测方法采用根据前面M个像素的线性组合生成当前像素的预测值其中M是线性预测器的阶,round是四舍五入的取整运算函数,ai(i=1,2,…,M)是预测系数37预测器的输出可用于计算当前像素值与预测值之前的预测误差这个预测误差可以使用变长码进行编码,以生成压缩数据流的下一个元素。解码器根据接收到的变长码字en进行重构:38采用一阶线性预测器对右图进行编码:此预测器一般称为前像素预测器,相应的预测编码过程称为差分编码或前像素编码。39a=140可以看出,用无损预测编码实现的压缩与将输入图像映射到预测误差序列得到的熵的减少直接相关。因为通过预测处理,消除了大量的像素间冗余,所得预测误差的概率密度函数通常在零点处有一个很高的峰值,并表现出变化相对较小的特征。418.5有损压缩有损压缩(LossyCompression)是与无损压缩对应的压缩方法。它是一种经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法。有损数据压缩又称破坏型压缩,即将次要的信息数据舍弃,牺牲一些重构图像的质量来减少图像压缩的数据量,从而使压缩比得到提高。42注意:只要重构的解压缩图像产生的失真(有时是明显可见的,有时是不很明显的)在可容忍范围之内,则压缩能力上的增加就是有效的。事实上,有许多压缩算法都可以在一定失真度范围内调整数据的压缩比率。43768kB44244kB4555.5kB4632.9kB478.5.1变换编码变换编码(TransformCoding)利用某种变换,将空域中的图像变换到变换域中描述的图像F(u,v),把变换域中的F(u,v)进行编码压缩要比在空域f(x,y)中进行压缩要更加有效。48变换编码是目前较常采用的一种编码方式。常用的变换有:傅里叶变换、余弦变换、沃尔什变换、K-L变换、小波变换等。这是因为在这些变换域中,图像相关性明显下降,能量只集中于少数低频率系数上。49在变换编码中,由于采用可逆线性变换将图像映射到变换系数集,这些系数然后被量化和编码。对于大多数自然图像来说,大量系数的量级很小,可以进行不精确的量化或完全丢弃,这几乎不会产生多少图像失真。50一个典型的变换编码系统:51编码器执行四种相对简单的操作:子图分解、变换、量化和编码。Step1:首先将一幅NxN的输入图像分解为大小为nxn的子图像,生成(N/n)2个子图像。Step2:进而对这些子图进行变换。变换处理的目的是将每幅子图中的像素进行去相关操作,或用最少的变换系数包含尽可能多的信息。52Step3:在量化阶段,有选择地消除或更粗略地量化带有最少信息的系数。这些系数对重构子图像的质量影响最小。Step4:编码处理阶段,对量化后的系数进行编码处理(通常使用变长码)。53变换选择:一个NxN的图像f(x,y),它的正向离散变换T(u,v)可以用下面的通用公式表示为:其中54给定T(u,v),则f(x,y)也可以采用下面的离散反变换通用公式得到:其中 分别被称为正向和逆向变换核函数。55如果下列等式成立,则称正向核函数是可分离的。如果g1等于g2,则核函数是对称的对反向核函数有相同的结论。56正向和反向变换核函数决定了所计算的变换类型和总体计算的复杂性以及所应用的变换编码的重构误差。当这就是离散傅立叶变换(M=N)57离散余弦变换(DCT)其中5859对上图进行变换编码:首先将原图分割为8×8大小的子图像块,并使用某种变换方法对各个子图像块进行变换,保留最大的32个系数,并进行反变换。512×51260原始图像离散傅立叶变换RMS=1.28离散余弦变换RMS=0.6861子图像尺寸选择:子图像的尺寸影响到变换编码压缩误差和计算复杂性。通常子图像块的大小选择为一个正方形,并且为一个2的整数次幂的数。如8×8,16×16等。62对前面的图像分割为n×n的子图像(其中n=2,4,8,16,32),计算每一幅子图像的变换,并保留25%的最大值系数,并对其进行反变换得到它们的均方误差RMS.636465比特分配图像的重构误差是与被丢弃的变化系数的数量和相对重要性,以及用于表示保留系数的精度相关的。在大多数变换编码系统中,常采用根据最大值方差进行选择保留的系数,称为区域编码,或者根据最大值的量级进行选择,称为门限编码。66区域编码区域编码是以信息论中观察信息的不确定性为基础的,它认为具有最大方差的变换系数携带有图像的大部分信息,因此应该予以保留。用每个变换系数去乘以相应的区域模板中的元素,保留在最大值上的系数。67将每一个位置上的变换系数都看成是一个随机变量,这个随机变量的分布可以通过对所有变换子图像的总体进行统计计算得到。具有最大的方差的n个系数位置被定位,并用它们判定系数的坐标u,v,这些系数将为所有的子图像所保留。6869对区域取样的过程中保留的系数必须进行量化和编码。因此,区域模板优势被描述成用于对每个系数编码的比特数。可以对系数分配相同的比特数,或在系数中不均匀地分配固定数目的比特数。7071门限编码区域编码通常对所有子图像使用单一的固定模板进行编码,而门限编码在为每幅不同的子图像保留的变换系数的位置具有自适应性。对于任何子图像,最大量级的变换系数对于重构图像的品质具有重大的影响。它是实际中最常用的一种自适应变换编码方式。7273有三种方法可以对子图像进行门限处理:1、对所有的子图像使用单一的全局门限;2、对每幅子图像使用不同的门限;3、门限可以随子图像中每个系数的位置变化而变化。第一种方法,对不同图像的压缩等级是不同的;第二种对每幅子图都丢弃相同数据的系数,则编码率是恒定的。74第三种方法与第一种方法类似,得到的编码率是变化的,但是它可以通过下面的方式实现门限处理和量化过程的结合。反变换过程:75Z(u,v)被分配了一个特定值c,当且仅当下式成立时,是整数如果,则且变化系数被完全丢弃。因此Z的元素可以成比例地在不同的压缩等级上进行缩放。767778798.6图像压缩标准图像压缩技术目前已经发展的较为成熟,已经出现了许多优秀的压缩算法。并由国际标准化组织(ISO)和国际电话与电报咨询委员会(CCITT)提出了多个国际标准,适用于二值图像、连续静态图像(单色和彩色)以及视频图像压缩。80二值图像压缩标准:JBIG,JBIG2静态图像压缩标准:JPEG,JPEG2000视频图像压缩标准:MPEG1,MPEG2,MPEG4,MPEG7,H.261,H.262,H.263,H.26481JPEGJointPhotographicExpertsGroup(联合图像专家小组)。此专家组创立于1986年,于1992年发布了JPEG的标准而在1994年获得了ISO109918-1的认定。82JPEG是目前使用最普遍且易于理解的静态图像压缩国际标准。这个标准定义了三种不同的编码系统:1、一个有损基本编码系统,这个系统是以DCT为基础的,足以应付大多数压缩方面的要求。2、一种扩展到编码系统。这种系统面向的是更大规模的压缩、更高的精确性或逐渐递增的重构应用系统。3、一种面向可逆压缩的无损独立编码系统。83

在基本编码系统中,输入和输出数据的精度限制为8比特,而量化的DCT系数值限制为11比特。压缩过程包括三个步骤:DCT计算,量化和变长编码。图像首先被分割为8×8的小图像块。对这些图像块进行从左到右,从上到下的处理。84

当对每个8×8的图像块进行处理时,对64个像素的灰度都减去2n-1,其中2n是灰度级的取值最大值。然后计算这个经过灰度偏移操作的图像块的DCT变换,根据下式对他进行量化处理,并用z形模式将这些量化系数形成一个一维序列。85868×8图像块87灰度偏移-12888DCT变换结果89量化系数90JPEG对DC系数采用差分脉冲编码(DPCM)调制方式进行编码压缩处理。DPCM是一种预测编码方式。JPEG采用DPCM对DC系数进行压缩,主要是考虑了相邻图像块之间的平均灰度的高相关性。9192设前一个图像块的DC系数为-17,则当前的DC系数预测误差为(-26)-(-17)=-9.通过查找前表,可知它属于第四类。它的编码应该是101,长度为7,剩下的4位通过差值的最低有效位(LSB)生成,它是将正差或负差的4个LSB位进行减一运算得到。-9的LSB为(0111)-1=0110,所以完整的DPCM编码的DC码字是1010110.9394重构回的量化系数95逆量化操作96逆DCT97加上灰度偏移量128后得到的重构图像块98解压缩图像块与原始图像块之间的差异99JPEG2000JPEG2000是基于小波变换的图像压缩标准,由JointPhotographicExpertsGroup组织创建和维护。JPEG2000通常被认为是未来取代JPEG(基于离散余弦变换)的下一代图像压缩标准。JPEG2000文件的后缀名通常为.jp2,100JPEG2000的压缩比要比JPEG更高,而且不会产生原先的基于离散余弦变换的JPEG标准产生的块状模糊瑕疵。JPEG2000同时支持有损数据压缩和无损数据压缩。另外,JPEG2000也支持更复杂的渐进式显示和下载。101JPEG2000是国际标准化组织(ISO)发布的标准,文档代码为ISO/IEC15444-1:2000。虽然JPEG2000在技术上有一定的优势,但是到目前为止(2006年),互联网上采用JPEG2000技术制作的图像文件数量仍然很少,并且大多数的浏览器仍然没有缺省支持JPEG2000图像文件的显示。102JPEG2000存在版权和专利的风险。这也许是目前JPEG2000技术没有得到广泛应用的原因之一。JPEG2000标准本身是没有授权费用,但是,因为编码的核心部分的各种算法被大量注册专利,所以一般认为,不太可能避开这些专利费用开发出免授权费的商用编码器。103JPEG2000的特点:(1)压缩效率高,图像还原质量好。JPEG2000的图像压缩率可在JPEG基础上再提高30%,而且压缩后的图像显得更加细腻平滑。也就是说,我们将JPEG图片换成以JPEG2000编码方式的图片,在同样的网络带宽下,我们的对于图片下载的等待时间将大大缩短。104(2)无损和有损压缩。在一个JPEG2000码流中,可以同时存在有损压缩和高性能的无损压缩数据,并且对图像的无损恢复可以利用渐进式解码自然得到。而JPEG基本编码系统只能做到有损压缩,压缩后数据不能还原。因此JPEG2000保存了原始信息,即使在较小的图像文件大小的情况下,也不会有信息丢失。105(3)渐进传输,这是JPEG2000的重要特征之一。它在同一影像文件中融合不同质量级别的数据,这一特性允许图像重建根据目标设备的需求进行,从而在传输和带宽利用上具有更大的灵活性。也就是说,它先传输图像的大体轮廓,然后逐步传输其他数据,不断地提高图像质量。这样图像就由朦胧到清晰显示出来,从而节约、充分利用有限的带宽。106(4)感兴趣区域压缩。JPEG2000的另一个技术特点是提供一个能让用户控制的、可选择分辨率的影像数据,即ROI(RegionsofInterest)技术。你可以指定感兴趣区域,在这些区域,你可以在压缩时指定特定的压缩质量,或在恢复时指定特定的解压缩要求。这是因为小波在空间和频率域上具有局域性,要完全恢复图像中的某个局部,并不需要所有编码都被精确保留。107(5)基于内容的描述。JPEG2000允许在压缩的图像文件中包含对图像内容的说明,这是因为除了存储和传输之外,运行用户在一个大的数据库中迅速找到感兴趣的图像也是图像处理中一个非常重要的问题。108(6)JPEG2000在颜色处理上,具有更优秀的内涵。与JPEG相比,JPEG2000同样可以用来处理多达256个通道的信息。而JPEG仅局限于RGB数据。也就是说,JPEG2000可以用单一的文件格式来描述另外一种色彩模式,比如CMYK

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论