光电图像处理-图像编码_第1页
光电图像处理-图像编码_第2页
光电图像处理-图像编码_第3页
光电图像处理-图像编码_第4页
光电图像处理-图像编码_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

光电图像处理

(六)图像编码电子工程学院光电子技术系16.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容26.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容36.1

图像编码概述6.1.1

图像编码技术的研究背景

6.1.2图像编码基本原理

6.1.3图像编码的方法

6.1.4图像编码新技术

6.1.5图像编码评价4

6.1.1图像编码技术的研究背景通信方式的改变

文字+语音

图像+文字+语音通信对象的改变

人与人

人与机器,机器与机器1.信息传输方式发生了很大的改变5

(a)彩色视频信息对于电视画面的分辨率640

480的彩色图像,每秒30帧,则一秒钟的数据量为:

640

480

24

30=221.184Mbit

所以播放时,需要221Mbps的通信回路。参考数据:宽带网为512K,电话线为56K。存储时,1张CD可存640M,则仅可以存放2.89秒的数据。2.图像传输与存储需要的信息量空间6

(b)传真数据如果只传送2值图像,以200dpi的分辨率传输,一张A4稿纸的内容的数据量为:3888768bit

按目前14.4K的电话线传输速率,需要传送的时间是:270秒(4.5分)

按每分钟4元计算:18元

由于通信方式和通信对象的改变带来的最大问题是:

传输带宽、速度、存储器容量的限制。给我们带来的一个难题,也给了我们一个机会:

如何用软件的手段来解决硬件上的物理极限。7图像信息源图像预处理图像信源

编码信道编码调制信道传输解调信道解码图像信源

解码显示图像

图像通信系统模型81.数字图像的冗余的概念6.1.2图像编码基本原理

你的妻子,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。

(23

2+10=56个半角字符)

你的妻子将于明天晚上6点零5分在虹桥机场接你。

(20

2+3=43个半角字符)

Helen将于明晚6点在虹桥接你。

(10

2+7=27个半角字符)结论:只要接收端不会产生误解,就可以减少承载信息的数据量。9描述语言

(1)“这是一幅2

2的图像,图像的第一个像素是红的,第二个像素是红的,第三个像素是红的,第四个像素是红的”。

(2)“这是一幅2

2的图像,整幅图都是红色”。

由此我们知道,整理图像的描述方法可以达到压缩的目的。10图像冗余无损压缩的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB从原来的16

3

8=384bits压缩为:(1+3)

8=32bits11图像冗余有损压缩的原理3635343434343432343433373034343434343434343534343134343434343434343434343434343434343434343434343434253412

空间冗余:图像内部相邻像素之间存在较强的相关性所造成的冗余。

时间冗余:视频图像序列中的不同帧之间的相关性所造成的冗余。视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。2.数字图像冗余的分类13信息熵冗余:也称编码冗余,如果图像中平均每个像素使用 的比特数大于该图像的信息熵,则图像中存在冗 余,这种冗余称为信息熵冗余。结构冗余:是指图像中存在很强的纹理结构或自相似性。知识冗余:是指在有些图像中还包含与某些先验知识有关的信 息。图像编码的目的:充分利用图像中存在的各种冗余信息,特别是空间冗余、时间冗余以及视觉冗余,以尽量少的比特数来表示图像。14几种常见应用的码率15有损压缩:存在信息损耗,不能精确重建原始图像,存在一定程度的失真。包括哈夫曼编码、行程编码和算术编码无损压缩:不存在信息损失,解压缩时能够从压缩数据精确地恢复原始图像。包括预测编码、变换编码等等。6.1.3图像编码的方法

1.根据编码过程是否存在信息损耗16熵编码:基于信号统计特性的编码技术,无损编码。基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。包括行程编码(RunLengthEncoding)、哈夫曼编码和算术编码等。预测编码:基于图像数据的空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。可分为帧内预测和帧间预测,常用的预测编码有差分脉冲码调制(DifferentialPulseCodeModulation,DPCM)和运动补偿法。2.根据编码原理17变换编码:是将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。图像变换本身并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码就可以有效地压缩图像。混合编码:混合编码是指综合了熵编码、变换编码或预测编码的编码方法,如JPEG标准和MPEG标准。18信息保持编码:也称无失真编码,它要求在编解码过程中保证图像信息不丢失,从而可以完整地重建图像。保真度编码:利用人眼的视觉特性,在允许的失真(Lossy)条件下或一定的保真度准则下,最大限度地压缩图像。特征提取:在图像识别、分析和分类等技术中,往往并不需要全部图像信息,而只要对感兴趣的部分特征信息进行编码即可压缩数据。3.根据对压缩编码后的图像进行重建的准确程度196.1.4

图像编码新技术

分形编码(FractalCoding):最大限度地利用了图像在空间域上的自相似性(即局部与整体之间存在某种相似性),通过消除图像的几何冗余来压缩数据。小波编码(WaveletCoding):经过小波变换后的图像,具有良好的空间方向选择性,而且是多分辨率的,能够保持原图像在各种分辨率下的精细结构,与人的视觉特性十分吻合。模型编码(ModelBasedCoding):在编、解码两端分别建立起相同的模型,编码时利用先验模型抽取图像中的主要信息并用模型参数的形式表示,解码时则利用所接收的模型参数重建图像。

206.1.5

图像编码评价

1.

算法的编码效率2.

编码图像的质量3.

算法的适用范围4.

算法的复杂程度

一般来说,评价图像压缩算法的优劣主要有以下4个参数:21R——平均码字长度r——图像的压缩比(rate)bps——每秒钟所需的传输比特数(bitspersecond)η——图像熵与平均码长之比1.

算法的编码效率

22

设一幅灰度级为N的图像,图像中第k级灰度出现的概率为Pk,图像大小为Nx

Ny,每个像素用d比特表示,每两帧图像间隔Δt。

对于一种图像编码方法,设第k级灰度的码字长度为Bk,则该图像的平均码字长度R为:则按信息论中信息熵的定义,则数字图像的熵H为:由此可见,图像熵H表示各灰度级比特数的统计平均值。23编码效率η为:

每秒钟所需的传输比特数bps为:压缩比r为:

由于同一压缩算法对不同图像的编码效率会有所不同,因此常需定义一些“标准图像”,一般通过测量不同压缩算法对同一组“标准图像”的编码性能来评价各图像压缩算法的编码效率。

未压缩前信源的码长242.编码图像的质量图像质量评价可分为:客观质量评价和主观质量评价。最常用的客观质量评价指标是:均方误差(MSE)和峰值信噪比(PSNR)。25

主观质量评价是指:由一批观察者对编码图像进行观察并打分,然后综合所有人的评判结果,给出图像的质量评价。客观质量评价能够快速有效地评价编码图像的质量,但符合客观质量评价指标的图像不一定具有较好的主观质量。主观质量评价能够与人的视觉效果相匹配,但其评判过程缓慢费时。

26

特定的图像编码算法具有其相应的适用范围,并不对所有图像都有效。一般说来,大多数基于图像信息统计特性的压缩算法具有较广的适用范围,而一些特定的编码算法的适用范围较窄,如分形编码主要用于自相似性高的图像。

3.算法的适用范围27

算法的复杂度即指完成图像压缩和解压缩所需的运算量和硬件实现该算法的难易程度。优秀的压缩算法要求有较高的压缩比,压缩和解压缩快,算法简单,易于硬件实现,还要求解压缩后的图像质量较好。选用编码方法时一定要考虑图像信源本身的统计特性、多媒体系统(硬件和软件产品)的适应能力、应用环境以及技术标准。4.算法的复杂程度

286.1图像编码概述

6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容296.2哈夫曼编码

1.哈夫曼编码的理论基础

R≥H——总可设计出一种无失真编码;R>>H时,表明该编码方法效率很低;R等于或很接近于H时——最佳编码,无失真;R<H时,压缩比较高,但会引起图像失真。

30设D为编码所使用的数制,则变长最佳编码的平均码字长度R的范围为:

变长最佳编码定理:在变长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列,则其平均码字长度为最小,这就是变长最佳编码定理。变长最佳编码定理是哈夫曼编码的理论基础。31

2.哈夫曼编码算法

首先,统计信源中各符号出现的概率,按符号出现的概率从大到小排序。把最小的两个概率相加合并成新的概率,与剩余的概率组成新的概率集合。对新的概率集合重新排序,再次把其中最小的两个概率相加,组成新的概率集合。如此重复进行,直到最后两个概率的和为1。32

分配码字。码字分配从最后一步开始反向进行,对于每次相加的两个概率,给大的赋“0”,小的赋“1”(也可全部相反)读出时由该符号开始一直走到最后的概率和“1”,将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的哈夫曼编码。33

例:设一幅灰度级为8(分别用S0、S1、S2、S3、S4、S5、S6、S7表示)的图像中,各灰度所对应的概率分别为0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。现对其进行哈夫曼编码:

34035下面来看一下哈夫曼编码的编码效率。平均码长R为:36数字图像的熵H为:

则哈夫曼编码的编码效率η为:

37

对不同概率分布的信源,哈夫曼编码的编码效率有所差别。根据信息论中信源编码理论,对于二进制编码,当信源概率为2的负幂次方时,哈夫曼编码的编码效率可达100%,其平均码字长度也很短,而当信源概率为均匀分布时,其编码效果明显降低。38哈夫曼编码在不同概率分布下的编码效果对比39哈夫曼编码的特点:1)哈夫曼编码构造出来的编码值不是唯一的。原因是在给两个最小概率的图像的灰度值进行编码时,可以是大概率为“0”,小概率为“1”,也可相反。当两个灰度值的概率相等时,“0”、“1”的分配也是人为定义的,这就造成了编码的不唯一性。但不影响解码的正确性。

2)当图像灰度值分布很不均匀时,哈夫曼编码的效率就高。当信源概率是2的负幂次方时,编码效率为100%,而在图像灰度值的概率分布比较均匀时,其编码效果最差。

3)哈夫曼编码必须先计算出图像数据的概率特性,再形成编码表后,才能对图像数据编码,因此,哈夫曼编码缺乏构造性。即不能使用某种数学模型建立信源符号与编码之间的对应关系,而必须通过查找的方法,建立起他们之间的对应关系。如果信源符号很多,那么码表就会很大,这势必会影响到存储与传输。40Step1:精确地统计出原始图像中每个灰度值出现的概率;Step2:建立哈夫曼树并进行编码。在计算哈夫曼编码表时需要对原始的图象扫描两遍:

由于需要建立二叉树并遍历二叉树生成编码,数据压缩和还原速度都较慢。但是该编码方法简单有效,而且编码效率相当高,因而应用非常广泛。41

我们知道,对一幅图像进行编码时,如果图像的大小大于256时,这幅图像的不同的码字就有可能是很大,例如极限为256个不同的码字。对整幅图直接进行Huffman编码时,小分布的灰度值,就有可能具有很长的编码。如:100位以上,这样不但达不到压缩的效果反而会使数据量加大,应该如何处理?Question??42

常用的且有效的方法是:将图像分割成若干的小块,对每块进行独立的Huffman编码。例如:分成8×8的子块,就可以大大降低不同灰度值的个数(最多是64而不是256)。436.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容446.3

香农-范诺编码

香农-范诺(Shannon-Fannon)编码也是一种常见的可变字长编码。与哈夫曼编码相似,当信源符号出现的概率正好为2-i(i>0)时,采用香农-范诺编码同样能够达到100%的编码效率。香农-范诺编码的理论基础是符号的码字长度Ni完全由该符号出现的概率来决定,即式中,D为编码所用的数制。

45香农-范诺编码的步骤如下:

(1)将信源符号按其出现概率从大到小排序;(2)计算出各概率对应的码字长度Ni;(3)计算累加概率Ai,即

Ai=Ai-1+Pi-1i=1,2,…,N-1;A0=0

(4)把各个累加概率Ai由十进制转化为二进制,取该二进制数的前Ni位作为对应信源符号的码字。46香农-范诺编码47二分法香农-范诺编码方法:

(1)首先统计出每个符号出现的概率;(2)对上述概率从大到小排序;(3)从这个概率集合中的某个位置将其分为两个子集合,并尽量使两个子集合的概率和近似相等,给前面一个子集合赋值为0,后面一个子集合赋值为1;(4)重复步骤3,直到各个子集合中只有一个元素为止;(5)将每个元素所属的子集合的值依次串起来,即可得到各个元素的香农-范诺编码。48二分法香农-范诺编码496.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码

6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容506.4

行程编码

将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。例如

aaaa

bbb

cc

d

eeeee

fffffff(共22

8=176bits)

4a3b2c1d5e7f

(共12

8=96bits)

1.行程编码基本原理和方法

行程编码——行程长度编码(RunLengthEncoding,RLE)51

定长编码:编码的行程长度所用的二进制位数固定。

变长行程编码:对不同范围的行程长度使用不同位数的二进制位进行编码。使用变长行程编码需要增加标志位来表明所使用的二进制位数。

2.行程编码的分类3.

行程编码的应用1)行程编码比较适合于二值图像的编码,一般用于量化后出现大量零系数连续的场合,用行程来表示连零码。

2)如果图像是由很多块颜色或灰度相同的大面积区域组成的,那么采用行程编码可以达到很高的压缩比。

3)如果图像中的数据非常分散,则行程编码不但不能压缩数据,反而会增加图像文件的大小。这时一般和其他编码结合使用。52传真件中一般都是白色比较多,而黑色相对比较少。所以可能常常会出现如下的情况:

600w3b100w12b4w3b200w

上面的行程编码所需用的字节数为:7

因为:512<600<1024

所以:计数值必须用10bit来表示

10

7=70bit在传真中的应用53

现在我们就希望对其有一个改善。白色:10bit,黑色:4bit

600W3b100w12b4w3b200w

所需字节数为:

4

10+3

4=52bit

比原来的方式10

7=70bit减少了18bit54PCX文件:文件头+图像压缩数据+256色调色板。文件头全长128字节,包含了图像的大小和颜色以及PCX文件的版本标识等信息。图像压缩数据紧跟在文件头之后。按颜色平面和扫描行存储。如果没有使用调色板,那么图像压缩数据存储的是实际像素值;否则,存储的是调色板的索引值。4.PCX文件中的行程编码PCX格式是ZSOFT公司在开发图像处理软件Paintbrush时开发的一种格式,基于PC的绘图程序的专用格式,一般的桌面排版、图形艺术和视频捕获软件都支持这种格式。PCX支持256色调色板或全24位的RGB,图像大小最多达64K

64K像素。不支持CMYK或HSI颜色模式,photoshop等多种图像处理软件均支持PCX格式。PCX压缩属于无损压缩。551)图像数据以字节为单位进行编码的,每行填充到偶数字节.2)PCX文件规定编码时的最大行程长度为63,如果行程长度大于63,则必须分多次存储。对于长度大于1的行程,编码时先存入其行程长度(长度L加上192即0xC0),再存入该行程的代表值,行程长度和行程的代表值分别占一字节。

3)如果遇到不重复的像素值,如果该像素值小于等于0xC0,则直接存入该像素值。否则首先存入一个0xC1,然后再存入该像素值。这样做是为了避免该像素值被误认为是数据长度。

4)对于连续重复的像素值,统计其连续出现的次数iCount(最大取值为63),先存入长度信息(iCount|0xC0),然后再存入像素值。如果连续次数超过63次,则必须分多次处理。例如,连续132个0x98,编码时必须分三次处理,编码结果为:0xFF0x980xFF0x980xC60x98。编码原则:56从压缩数据部分读取一个字节,判断该值是否大于0xC0如果大于0xC0,则表明该字节是行程长度信息,取其低六位(相当于减去0xC0)作为行程长度L,读取下一个字节作为像素值并重复L次存入图像数据缓冲区如果小于等于0xC0,直接将该字节存入图像数据缓冲区。256色PCX文件解码:虽然几乎所有的图像应用软件都支持PCX文件格式,但由于它的压缩比不高,因而现在用得不是很多。576.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容586.5LZW编码

LZW(Lempel-Ziv&Welch)——又称字串表编码,无损编码。

LZW编码与行程编码类似,也是对字符串进行编码从而实现压缩,但它在编码的同时还生成了特定字符串以及与之对应的索引字符串表。59对文件进行编码的同时,生成了特定字符序列的表以及它们对应的代码。比如8位图像编成12位码,除了256代表原来8位字符,其他代码分配给在压缩过程中出现的字符串。(如字符对)当表中没有的字符串第一次出现的时候,原样保存,同时将分配它的代码也一起保存。只有如果这个字符串再次出现,只存储代码。字符串表在压缩中动态生成,而且也不用存储,解压时可以由压缩文件中信息重构它。LZW编码原则:60

GIF(GraphicsInterchangeFormat)是由CompuServe公司开发的一种压缩位图格式。它可支持多达256种的颜色,具有极佳的压缩效率,已成为Internet上一种流行的文件格式。GIF图像文件采用的是一种改良的LZW压缩算法,通常称为GIF-LZW压缩算法。GIF-LZW压缩编码61S1、S2——两个存放字符串的临时变量LZW_CLEAR——字符表初始化标志LZW_EOI编码结束标志设:(1)根据图像中使用的颜色数初始化一个字串表,字串表中的每个颜色对应一个索引。在初始字串表的末尾再添加两个符号(LZW_CLEAR和LZW_EOI)的索引。设置字符串变量S1、S2并初始化为空。(2)接着输出LZW_CLEAR在字串表中的索引。编码步骤:62(3)从图像数据流中第一个字符(假设数据以字符串表示)开始,每次读取一个字符,将其赋给字符串变量S2。(4)判断“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,则S1=S1+S2;否则,输出S1在字串表中的索引,并在字串表末尾为“S1+S2”添加索引,同时,S1=S2。(5)重复第3和第4步,直到所有字符读完为止。(6)输出S1中的字符串在字串表中的索引,然后输出结束标志LZW_EOI的索引,编码完毕。63GIF-LZW解码流程

64

设有一来源于4色(以a、b、c、d表示)图像的数据流aabcabbbbd,现对其进行LZW编码。编码过程如下:编码前,首先需要初始化一个字符串表。

LZW编码实例字符串索引a0Hb1Hc2Hd3HLZW_CLEAR4HLZW_EOI5H65GIF-LZW编码过程编码结果:4001271B35(十六进制表示)b66GIF-LZW解码过程676.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容686.6算术编码

基于信源概率统计特性的固定编码模式针对未知信源概率模型的自适应模式基本原理:将被编码的数据序列表示成0和1之间的一个间隔(即一个小数范围),该间隔的位置与输入数据的概率分布有关。

算术编码有两种模式:69例:设一待编码的数据序列(即信源)为“dacab”,信源中各符号出现的概率依次为P(a)=0.4,P(b)=0.2,P(c)=0.2,P(d)=0.2。首先,数据序列中的各数据符号在区间[0,1]内的间隔(赋值范围)设定为a=[0,0.4),b=[0.4,0.6),c=[0.6,0.8),d=[0.8,1.0)StartN=StartB+LeftC×L

EndN=StartB+RightC×L

70

第一个被压缩的符号为“d”,其初始间隔为[0.8,1.0);第二个被压缩的符号为“a”,由于前面的符号“d”的取值区间被限制在[0.8,1.0)范围内,所以“a”的取值范围应在前一符号间隔[0.8,1.0)的[0,0.4)子区间内,根据上式可知:StartN=0.8+0×(1.0-0.8)=0.8EndN=0.8+0.4×(1.0-0.8)=0.88即“a”的实际编码区间在[0.8,0.88)之间。71

第三个被压缩的符号为“c”,其编码取值范围应在[0.8,0.88)区间的[0.6,0.8)的子区间内,据上式可知

第四个被压缩的符号为“a”,其编码取值范围应在[0.848,0.864)区间的[0,0.4)的子区间内StartN=0.848+0×(0.864-0.848)=0.848

EndN=0.848+0.4×(0.864-0.848)=0.854472

第五个被压缩的符号为“b”,其编码取值范围应在[0.848,0.8544)区间的[0.4,0.6)的子区间内StartN=0.848+0.4×(0.8544-0.848)=0.85056

EndN=0.848+0.6×(0.8544-0.848)=0.85184至此,数据序列“dacab”已被描述为一个实数区间[0.85056,0.85184],或者说在此区间内的任一实数值都唯一对应该数据序列。这样,就可以用一个实数表示这一数据序列。我们把区间[0.85056,0.85184]用二进制形式表示为[0.110110011011,

0.110110100001]。73

在这个区间中,0.1101101位于这个区间内并且其编码最短,故把其作为数据序列“dacab”的编码输出。考虑到算术编码中任一数据序列的编码都含有“0.”,所以在编码时,可以不考虑“0.”,于是把1101101作为本例中的数据序列的算术编码。由此可见,数据序列“dacab”用7比特的二进制代码就可以表示,平均码长为1.4比特/字符。

746.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容756.7预测编码预测:根据过去时刻的样本序列,采用一种模型预测当前的样本值;预测编码的基本思想:通过仅提取每个像素中的新信息并对它们编码来消除像素间的相关性和冗余性。1个象素的新信息——该像素的当前或现实值与预测值的差。前提:像素间具有相关性。1.无损预测编码2.有损预测编码76输入图像预测器整数舍入符号编码器fn+-en压缩图像1.无损预测编码预测器符号解码器fn+en压缩图像+解压图像772.

有损预测编码输入图像预测器符号编码器fn+-en压缩图像量化器++预测器符号编码器+压缩图像+解压图像786.1图像编码概述6.2哈夫曼编码6.3香农-范诺编码6.4行程编码6.5

LZW编码6.6算术编码6.7预测编码6.8图像编码的国际标准主要内容796.8图像编码的国际标准1.静止图像压缩标准

JPEG2.运动图像压缩标准

MPEG

近十年来,图像编码技术得到了迅速发展和广泛应用,并且日臻成熟,其标志就是几个图像压缩国际标准的制定。即关于静止图像的编码标准JPEG和JPEG2000、关于电话/会议电视的视频编码标准H.261,H.263和关于活动图像的编码标准MPEG-1,MPEG-2,

MPEG-4和H.264等。JPEG(JointPhotographicExpertGroup);MPEG(MotionPictureExpertsGroup)80图像压缩国际标准标准标题起止日期目标比特率应用场合主要编码技术JPEG连续色调静态图像1986.3~1992.10压缩比为2~30·因特网·数字照相·图像/视频编辑·DCT·知觉量化·霍夫曼编码·算术编码JPEG2000新一代静态图像编码标准1996.2~2000.12压缩比为2~50·因特网·移动通信·数字照相·遥感·传真·数字图书馆·JPEG所有技术·小波变换·EBCOTROI编码·可扩展编码81标准标题目标比特率应用场合主要编码技术MPEG-1运动图像及其伴音不超过1.5Mb/s·光盘存储·VCD·视频监控·JPEG所有技术·自适应量化·运动补偿预测MPEG-2运动图像及其伴音1.5~35Mb/s·数字高清晰度电视·高品质视频·卫星/有线电视·地面广播·MPEG-1所有技术·基于帧/场的运动补偿·扩展编码·容错编码82标准标题目标比特率应用场合主要编码技术MPEG-4音视频对象的通用编码8kb/s~35Mb/s·因特网·交互式视频·2D/3D计算机图形·移动通信·MPEG-2所有技术·小波变换·运动估计/补偿·可扩展编码·位图形状编码·对象编码·动态网络编码MPEG-7多媒体描述接口·多媒体数据库等MPEG-21多媒体框架83标准标题目标比特率应用场合主要编码技术H.261Px64kb/s的音视频服务Px64kb/s(p:1~30)·ISDN视频会议·DCT·自适应量化·运动补偿预测·运动估计·霍夫曼编码H.263低比特率通信的视频编码8kb/s~1.5Mb/s·POTS视频电话·桌面视频电话·移动视频电话·H.261所有技术·双向运动补偿·半像素运动估计·高级运动估计·重叠运动补偿·算术编码84JPEG(jointpictureexpertgroup)——面向静态图像编码的标准。在相同图像质量条件下,JPEG文件拥有比其他图像文件格式更高的压缩比。JPEG目前被广泛应用于多媒体和网络程序中,是现今万维网中使用最广泛的两种图像文件格式之一。JPEG是一种有损压缩,即在压缩过程中会丢失数据,每次编辑JPEG图像后,图像就会被重复压缩一次,损失就会有所增加。

1.静止图像压缩标准——JPEG851)顺序式(Sequential)DCT方式

2)渐进式(Progressive)DCT方式JPEG允许的四种编码模式:

频谱选择法逐次逼近法3)无失真(Lossless)方式

4)分层(Hierarchical)方式861)顺序式(Sequential)DCT方式:从左到右、从上到下对图像顺序进行基于离散余弦变换(DCT)的编码。DCT理论上是可逆的,但在计算时存在误差,因而基于DCT的编码模式是一种有损编码。2)渐进式(Progressive)DCT方式:基于DCT,对图像分层次进行处理,从模糊到清晰地传输图像(与GIF文件的交错方式类似)。有两种实现方法,一种是频谱选择法,即按Z形扫描的序号将DCT量化序数分成几个频段,每个频段对应一次扫描,每块均先传送低频扫描数据,得到原图概貌,再依次传送高频扫描数据,使图像逐渐清晰;另一种是逐次逼近法,即每次扫描全部DCT量化序数,但每次的表示精度逐渐提高。873)无失真(Lossless)方式:使用线性预测器,如DPCM,而不是基于DCT。4)分层(Hierarchical)方式:在空间域将源图像以不同的分辨率表示,每个分辨率对应一次扫描,处理时可以基于DCT或预测编码,可以是渐进式,也可以是顺序式。差分脉冲编码调制88

1)基本系统(BaselineSystem)

2)扩展系统(ExtendedSystem)

3)无失真压缩系统(LosslessSystem)一个符合JPEG标准的编解码器至少要满足基本系统的技术指标。基本的JPEG算法属于变换类编码,下面针对基于DCT的顺序式基本系统编码来说明JPEG的编码方法。

JPEG定义了三种系统:89JPEG编码/解码的流程图

熵编码即编码过程中按熵原理不丢失任何信息的编码。信息熵为信源的平均信息量(不确定性的度量)。常见的熵编码有:香农(Shannon)编码、哈夫曼(Huffman)编码和算术编码(arithmeticcoding)。在视频编码中,熵编码把一系列用来表示视频序列的元素符号转变为一个用来传输或是存储的压缩码流。输入的符号可能包括量化后的变换系数,运动向量,头信息(宏块头,图像头,序列的头等)以及附加信息(对于正确解码来说重要的标记位信息)。901)数据分块

将图像从RGB空间转换到YCbCr空间。将每个分量图像分割成不重叠的8×8像素块——DU(DataUnit)。在YCbCr空间中压缩图像的每个彩色分量。二次采样——采用不同的采样频率对图像采样。由于亮度比色彩更重要,因而对Y分量的采样频率可高于对Cb、Cr的采样频率,这样有利于节省存储空间。YCbCr其中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。

91把采样频率最低的分量图像中一个DU所对应的像区上覆盖的所有各分量上的DU按顺序编组为一个最小编码单元(MCU)。

对灰度图像而言,只有一个Y分量,MCU就是一个数据单元。对彩色图像而言,以4:1:1的采样方案为例,则一个MCU由4个Y分量的DU、1个Cb分量的DU和1个Cr分量的DU组成。92

以MCU为单位顺序将DU进行二维离散余弦变换。对以无符号数表示的具有P位精度的输入数据,在DCT前要减去2P-1,转换成有符号数,而在IDCT后,应加上2P-1,转换成无符号数。对每个8×8的数据块DU进行DCT后,得到的64个系数代表了该图像块的频率成分,其中低频分量集中在左上角,高频分量分布在右下角。系数矩阵左上角的叫做直流(DC)系数,它代表了该数据块的平均值,其余63个叫交流(AC)系数。2)DCT处理93

在DCT处理中得到的64个系数中,低频分量包含了图像亮度等主要信息。在从空间域到频域的变换中,图像中的缓慢变化比快速变化更易引起人眼的注意,所以在重建图像时,低频分量的重要性高于高频分量。因而在编码时可以忽略高频分量,从而达到压缩的目的,这也是量化的根据和目的。3)系数量化94亮度量化表色度量化表95DCT系数量化后,构成一个稀疏矩阵,用Z(Zigzag)形扫描将其变成一维数列,将有利于熵编码。Z形扫描的顺序如图所示。DCT系数的Z形扫描顺序

4)Z形扫描

96DC系数反映了一个8×8数据块的平均亮度,一般与相邻块有较大的相关性。

JPEG对DC系数作差分编码,即用前一数据块的同一分量的DC系数作为当前块的预测值,再对当前块的实际值与预测值的差值作哈夫曼编码。

5)DC系数编码97

若DC系数的动态范围为-1024~+1024,则差值的动态范围为-2047~+2047。如果为每个差值赋予一个码字,则码表过于庞大。采用“前缀码(SSSS)+尾码”来表示。前缀码指明了尾码的有效位数B,可以根据DIFF(DC系数的差值)从对应表中查出前缀码对应的哈夫曼编码。尾码的取值取决于DC系数的差值和前缀码。如果DC系数的差值DIFF大于等于0,则尾码的码字为DIFF的B位原码;否则,取DIFF的B位反码。98

经Z形排列后的AC系数,更有可能出现连续0组成的字符串,——行程编码将有利于压缩数据。

JPEG将一个非零DC系数及其前面的0行程长度(连续0的个数)的组合称为一个事件。将每个事件编码表示为“NNNN/SSSS+尾码”,

NNNN——0行程的长度

SSSS——尾码的有效位数B(即当前非0系数所占的比特数),如果非零AC系数大于等于0,则尾码的码字为该系数的B位原码,否则,取该系数的B位反码。6)AC系数编码992.运动图像压缩标准H.261:主要为电视会议等应用制订。也称P×64标准。可允许通过T1线路(带宽为1.544Mbit/s)以小于150ms的延迟传输运动视频。

MPEG-1:娱乐质量的视频压缩标准,主要用于数字媒体上压缩图像数据的储存和提取。

MPEG-2:用于视频传输的压缩标准,适用于从普通电视直到高清晰度电视的带宽范围。

MPEG-4:适应在窄带宽上对动态图像进行传输的要求。可对各种音频视频AV进行有效的编码,同时支持固定码流和变码流。100一、MPEG-1视频压缩标准

MPEG-1是由ISO/IEC于1991年提出的,正式名称为“用于数字存储媒体的1.5Mbit/s以下的活动图像及相关音频编码”(ISO/IEC11172)。其中的数字存储媒体包括光盘(CD),视频光盘(VCD),其中分配比特的方案是在1.5Mbps的数据传输中1.2Mbps用于编码视频,256Kbps用于立体声。MPEG-1包括五个部分:系统、视频、音频、一致性、及软件。在MPEG-1只采用逐行扫描方式,采用4:2:0的亚采样格式,其源输入格式是SIF,有352x288x25和352x288x30两种格式。101MPEG-1采用两种压缩方法:帧内压缩算法:采用与JPEG压缩算法大致相同的方法,即基于DCT的变换编码技术,用以减少空间冗余信息。帧间压缩算法:采用运动补偿算法、预测编码方法、以及差补法等编码方法。帧间编码技术可以减少时间冗余信息。102MPEG-1视频压缩编码算法在MPEG-1编码中,为了支持随机访问与高效压缩的要求,定义了四种编码类型:

I帧图像编码(帧内图像)、

P帧图像编码(预测图像)、

B帧图像编码(差补图或双向预测图像)。

D帧图像编码(直流分量图像)这四种类型的帧按某种方式组织在一起就构成了GOP。103I帧图像的编码

I帧图像是利用图像的空间相关性进行压缩,其压缩编码采用类似JPEG压缩算法,同时I帧图像又是P帧图像和B帧图像的参考图像,所以I帧图像压缩率不高,压缩倍数在8倍左右。

帧内图像I不参照任何过去的或者将来的其它图像帧,压缩编码采用类似JPEG压缩算法:如果电视图像是用RGB空间表示的,则首先把它转换成YCrCb空间表示的图像。每个图像平面分成8×8的图块,对每个图块进行离散余弦变换DCT。DCT变换后经过量化的交流分量系数后进行Z扫描,然后再使用无损压缩技术进行编码。104DCT变换后经过量化的直流分量系数采用差分脉冲编码DPCM,交流分量系数采用游程编码RLE,然后再采用哈夫曼(Huffman)编码或者用算术编码。105P帧图像的编码

P帧图像是参考过去的I帧图像(帧内图像)或者过去的预测得到P帧图像用运动补偿预测技术进行编码,这些预测图像通常作为进一步预测的参考帧,预测图像的编码效率较高。

P帧图像的编码也是以图像宏块为基本编码单元。预测编码的基础是运动估值,它将直接影响到整个系统的编码效率和压缩性能,因此希望找到一种预测精度高同时计算量又小的运动估值算法。106P帧编码时,编码器需要对每一个宏块作以下选择:(1)决定是否作运动补偿(MC/No-MC),即是将运动矢量发送出去,还是设其为0。在许多情况下,使用非零的运动矢量并不比使用零值的运动矢量所形成的误差少多少。而非零运动矢量需要额外的编码比特,因此这时可设运动矢量为0,这样可以提高编码效率。(2)决定采用帧内编码还是帧间编码,即是采用帧内宏块编码还是利用运动矢量预测编码。在许多情况下,某些宏块采用帧内编码方式也许会用更少的比特。这通常发生在由于运动十分剧烈而导致运动估计失败的情况。107(3)决定宏块要不要编码。有时在量化后,宏块中所有的DCT系数都是0,这种宏块就不需要被编码。在对这种宏块解码时,只需要从过去的帧中把对应的宏块复制到这个宏块就行了。(4)决定量化等级是否符合要求,是否需要改变。108B帧图像的编码

B帧图像(或称双向图)在预测时,既可使用前向预测方式,也可使用后向预测方式,或同时使用双向预测后取平均方式(双向帧间预测),取决于哪一种方式下表示该宏块所需的信息量为最少。使用双向预测后,可以使那些在前一帧中预测不到的内容很好地在后一帧中预测到,而且通过预测后取平均,非常有效地减少了预测噪声的影响。它的压缩效率最高,但双向预测图像不作为预测的参考图像。109类似于P帧,B帧在编码前同样要作一系列的决定,其流程如下:(1)决定运动补偿模式,即前向,后向及插值

运动补偿中哪个能达到最佳。

宏块运动补偿模式的选择是基于代价函数的最小值。代价函数是运动补偿宏块和当前宏块的亮度差的均方误差。解码器通过一种简单的方法为前向运动补偿计算最佳运动补偿宏块。然后再为后向运动补偿计算最佳运动补偿宏块。最后再求两种运动补偿

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论