多媒体计算机技术_第1页
多媒体计算机技术_第2页
多媒体计算机技术_第3页
多媒体计算机技术_第4页
多媒体计算机技术_第5页
已阅读5页,还剩157页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体计算机技术

鲁宏伟编著

电子工业出版社2004年7月第2版

任沐我川J:m亮

华中科技大学计算机学院

信息存储国家重点实验室

武汉430074XLZM6610@163.com

联系电话/p>

第三章数字图像处理技术

:•信号处理的基本术语思

X•图像数据压缩基础题

2•图像数据压缩算法

••常用图形、图像文件的格式

2•静态图像压缩标准

X•动态图像压缩标准

Z•H.261和H.263标准

信号处理的基本术语

•采样与量化

•DFT和IDFT

・小波变换

采样和量化

Z•信号的数字化处理包括两个步骤,一个是信号在时间

・上的离散化,即采样;另一个是幅度上的离散化,即

Z量化。

Z•采样也称抽样,是信号在时间上的离散化,即按照一

♦定时间间隔At在模拟信号x(t)上逐点采取其瞬时值。

二它是通过采样脉冲和模拟信号相乘来实现的

采样和量化BaeU

•量化是对幅值进行离散化,即将振动幅值用二进制量

化电平来表示。量化电平按级数变化,实际的幅度值

是连续的物理量。具体幅度值用舍入法归到靠近的量

化电平上。

•对模拟信号采样首先要确定采样间隔。如何合理选择

△t涉及到许多需要考虑的技术因素。

DFT和IDFT

••傅立叶分析是将原始信号分解成不同频率成分的正弦

・波,将时域信号转变为频域信号的一种数学方法,在

Z信号的分析和处理中有着十分重要的作用

:•对数字信号,需要采用相关的离散化方法,这就是由

:傅立叶分析得到的离散傅立叶变换DFT,其逆变换表

Z示为IDFT。

DFT和IDFTBacU

:­设是连续函数力(。的N个采样值,则这小个点的

Z宽度为N的DFT定义为

N-1

jMIN0,1,…,N-1

■Xk=£xne-,k=

:•IDFT定义为“

1N-\

7m

・Xn=^£x/2k,N,n=0,l,…,N—1

35称为N点、DFT的变换核函数

j2mk/N称为N点IDFT的变换核函数

小波变换

•一个小波是一个在有限周期内的波形,它的平均值为

°

•比较正弦波形和小波,正弦信号正是Fourier分析的基

础,它没有限定的周期,它可以从负无穷扩展到正无

穷,正弦信号是平滑并且是可预知的,小波信号是不

规则的并且不对称。

正弦波

图3.3正弦信号和小波信号

小波变换

傅立叶分析是将信号分解为各种频率的正弦信号,类

似地,小波分析是将信号分解为滑动的、与母系小波

成比例的各种子波。

傅立叶i

变换

信号不同频率的连续正弦子波

小波变换BacU

:•小波变换可以使得信号的低频长时特性和

:高频短时特性同时得到处理,具有良好的

:局部化性质,能有效地克服傅氏变换在处

•理非平稳复杂信号时存在的局限性,具有

X极强的自适应性。

:•由于小波变换能够有效地解决方块效应和

Z基本上解决蚊式噪声,所以小波变换已经

:成为当今图像压缩编码的主要研究方向。

图像数据压缩基础

色彩的基本概念

视觉系统对颜色的感知

•彩色空间及其变换

-RGB颜色模式图像数据压缩的可能性

-Lab颜色模式-统计冗余

-HSB颜色模式-信息谷冗余

-CMYK颜色模式-结构冗余

-颜色模型的色域-知识冗余

-视觉冗余

-彩色空间的线件变换标准

图像的种类

色彩的基本概念-

:•从人的视觉系统看,色彩可用的调、饱

:和度和亮度来描述。人眼看到的任一彩

:色光都是这三个特性的综合效果,这三

:个特性可以说是色彩的三要素,其中色

•调与光波的波长有直接关系,亮度和饱

:和度与光波的幅度有关。

I•图像深度与色彩类型

••图像深度与显示深度

:图像深度与色彩类型S

••图像深度是指位图中记录每个像素点所

:占的位数,它决定了彩色图像中可出现

:的最多颜色数,或者灰度图像中的最大

•灰度等级数。

z•每个像素点的图像深度的分配还与图像

:所用的色彩空间有关。以最常用的RGB

:色彩空间为例,图像深度与色彩的映射

:关系主要有真彩色、伪彩色和调配色。

真彩色

BaeU

••真彩色(true-color)是指图像中的每个像

:素值都分成R、G、B三个基色分量,每个基

:色分量直接决定其基色的强度,这样产生的

•色彩称为真彩色。例如图解深度为24,用R:

ZG:B=8:8:8来表示色彩,则R、G、B各占

Z用8位来表示各自基色分量的强度,每个基色

:分量的强度等级为28=256种。图像可容纳224

•=16M种色彩。这样得到的色彩可以反映原

Z图的真实色彩,故称真彩色

:伪彩色-I

,•伪彩色(pseudo-color)图像的每个像素值实际上是

・一个索引值或代码,该代码值作为色彩查找表CLUT

:(ColorLook-UpTable)中某一项的入口地址,根据

■该地址可查找出包含实际R、G、B的强度值。

Z•用这种方式产生的色彩本身是真的,不过它不一定反

,映原图的色彩。在VGA显示系统中,调色板就相当于

■色彩查找表。从16色标准VGA调色板的定义可以看出

Z这种伪彩色的工作方式

,•伪彩色一般用于65K色以下的显示方式中。标准的调

Z色板是在256K色谱中按色调均匀地选取16种或256种

•色彩。一般应用中,有的图像往往偏向于某一种或几

z种色调,此时如果采用标准调色板,则色彩失真较多。

.因此,同一幅图像,采用不同的调色板显示可能会出

•现不同的色彩效果。

16色标准VGA调色板

EacU

16色VGA调色板

代码RGB颜色名称效果

0000黑(Black)

]0°128深蓝(哈vy);

201280深绿(DarkGreen)

30128128深青(DarkCyan)

4128o0深红(Maroon)

51280128紫(Purple)

61281280橄榄绿(Olive)

7192192192灰白(Lightgray)

8128128128深灰(Darkgray)

900255蓝(blue)

1002550绿(green)

110255255青(cyan)

1225500红(red)

132550255品红(magenta)

142552550黄(Yellow)

采用不同的调色板显示同一幅

图像的效果实例1-

Baeu

S果

:调配色S

■=EacU

••调配色(direct-color)的获取是通过每个像素点的R、

・G、B分量分别作为单独的索引值进行变换,经相应的

Z色彩变换表找出各自的基色强度,用变换后的R、G、

yB强度值产生的色彩。

调配色与伪彩色相比,相同之处是都采用查找表,不

♦同之处是前者对R、G、B分量分别进行查找变换,后

二者是把整个像素当作查找的索引进行查找变换。因此,

.调配色的效果一般比伪彩色好。

••调配色与真彩色比,相同之处是都采用R、G、B分量

Z来决定基色强度,不同之处是前者的基色强度是由R、

・G、B经变换后得到的,而后者是直接用R、G、B决定。

,在VGA显示系统中,用调配色可以得到相当逼真的彩

Z色图像,虽然其色彩数受调色板的限制而只有256色

图像深度与显TJX深度f—

BacU

•显示深度表示显示缓存中记录屏幕上一个点

的位数(bit),也即显示器可以显示的色彩

数。因此,显示一幅图像时,屏幕上呈现的

色彩效果与图像文件所提供的色彩信息有关,

也即与图像深度有关;同时也与显示器当前

可容纳的色彩容量有关,也即与显示深度有

才:关。

3Z-显示深度大于图像深度

1:-显示深度等于图像深度

显示深度小于图像深度

:显示深度大于图像深度J

--在这种情况下屏幕上的色彩能较真实地

:反映图像文件的色彩效果。如当显示深

:度为24位,图像深度为8位时,屏幕上

:可以显示按该图像的调色板选取的256

二种颜色;图像深度为4位时可显示16色。

:这种情况下,显示的色彩完全取决于图

:像的色彩定义

:显示深度等于图像深度J

:­在这种情况下,如果用真彩色显示模式

:来显示真彩色图像,或者显示调色板与

:图像调色板一致时,屏幕上的色彩能较

:真实地反映图像文件的色彩效果。反之,

:如果显示调色板与图像调色板不一致,

:则显示色彩会出现失真

:显示深度小于图像深度J

••此时显示的色彩会出现失真。例如,若

Q显示深度为8位,需要显示一幅真彩色

:的图像时显然达不到应有的色彩效果。

:在这种情况下不同的图像软件有不同的

:处理方法

:色调与色相I

••绘画中要求有固定的色彩感觉,有统一

:的色调,否则难以表现画面的情调和主

:题。例如我们说一幅画具红色调,是指

:它在色彩上总体偏红。计算机在图像处

:理上采用数字化,可以非常精确地表现

:色彩的变化,色调是相对连续变化的。

:用一个园环来表现色谱的变化,就构成

:了一个色彩连续变化的色环。

色彩连续变化的色环I

BseU

•太阳光带中的六标准

色与六个中间色,即

红橙,黄橙,黄绿,

蓝绿(青),蓝紫,

红聚(品红),合称

十二色相或色调。

•把不同的色调按红橙

黄绿蓝展的顺序衔接

起家,就形成了一个

色词连续变化过渡由

圆环,称作为色环。

亮度与明度

BaeU

:­同一物体因受光不同会产生明度上的变化

••不同颜色的光,强度相同时照射同一物体也

Z会产生不同的亮度感觉。

:­明度也可以说是指各种纯正的色彩相互比较

:所产生的明暗差别。在纯正光谱中,黄色的

2明度最高,显得最亮;其次是橙、绿;再其

•次是红、蓝;紫色明度最低,显得最暗。

同一物体因受光不同会产生明度上的变化

Baeu

•照射的光越强,反射光也越强,看起来越亮。

显然,如果彩色光的强度降到使人看不到了,

在亮度标尺上它应与黑色对应。

•同样,如果其强度变得很大,那么亮度等级

应与白色对应。亮度是非彩色属性,彩色图

像中的亮度对应于黑白图像中的灰度

:饱和度与纯度

••淡色的饱和度比浓色要低一些。

:•饱和度还和亮度有关,同一色调越亮或

X越暗越不纯。

:•饱和度越高,色彩越艳丽、越鲜明突出,

:越能发挥其色彩的固有特性。但饱和度

:高的色彩容易让人感到单调刺眼。饱和

:度低,色感比较柔和协调,可混色太杂

•则容易让人感觉浑浊,色调显得灰暗。

饱和度与纯度

BaeU

•对于同一色调的彩色光,饱和度越深,颜色

越鲜明或说越纯,相反则越淡

饱和度和亮度

BaeU

不饱和N-----------------纯饱和--------------->不饱和

*在饱和的彩色光中增加白光的成分,相当于

增加了光能,因而变得更亮了,但是它的饱

和度却降低了。若增加黑色光的成分,相当

于降低了光能,因而变得更暗,其饱和度也

降低了

加帝素妹对颜佰的感知

硼电5m确0700

龄笠.邰土北k炳蹦x■51》

视觉系统对颜色和亮度的响应特性

视觉系统对颜色的感知

产生波长不同的光所需要的三基色值

:人眼对图像的亮度信息敏感、

2对颜色分辨率弱北

:•由于人眼对色彩细节的分辨能力远比对亮度

一细节的分辨能力低,若把人眼刚能分辨的黑

Z白相间的条纹换成不同颜色的彩色条纹,那

•么眼睛就不再能分辨出条纹来。如图所示,

:等宽的蓝红相间的彩条,蓝绿相间的彩条和

一黑白相间的条纹比较。使眼睛逐渐远离屏幕,

:当你分辨不出彩条时,黑白条还能分辨出来

:•彩色空间及其变换

Z-RGB颜色模式

Z-Lab颜色模式

:-HSB颜色模式

Z-YUV颜色模式

Z-CMYK颜色模式

RGB颜色模式NEXT

.•自然界中所有的颜色都可以用红、绿、蓝(RGB)

・这三种波长颜色的不同的强度组合而得,这就是

Z人们常说的三基色原理。

Z•因为RGB颜色合成产生白色,它们也叫作加色

:•把三种整、色交互重叠,就产生了次混合色:青

:(cyan)>洋红(magenta)、黄(yellow)

:•在数字视频中,对RGB三基色各进行8位编码就

Z构成了大约16.7万种颜色,这就是我们常说的真

•彩色。

:•电视机和计算机的监视器都是基于RGB颜色模式

二来创建其颜色的。

目录返回

RGB颜色模式

自然界中所有的颜色都可以用

红、绿、蓝(RGB)这三种颜色

的光(红光波长700nm、绿光绿

4

波长546.1nm>蓝光波长435.8A

黄青

nm)按不同的强度叠加而成,

这就是人们常说的三基色原理。

当三基色等量相加时,得到

红蓝

色;等量的红绿相加而蓝为0

品红

值时得到黄色;等量的红蓝相

加而绿为0时得到品红色;等

量的绿蓝相加而红为0时得到

色。

目录返回

彩色空间

•当三基色按不同强度相叠加

时,可得到任何一种颜色。

任一颜色和这三种颜色之间

的关系可用下面的式子来描

述:

■颜色=R(红色的百分山+

G(绿色的百分比)+(族色的

百分*比)

•任一颜色可以想象成RGB三

车空间中的一个点,该点的

史标为(r,g,b),其中r、

g>b分别为该颜色中红、绿、

熊三基色所占的百分比。自

然界的所有颜色构成一个

“彩色空间”。

目录返回

颜色的显示

电视机和计算机的监视器都是基于RGB颜色模式来创

建其颜色的。它们使用的阴极射线管CRT(cathoderay

tube)是一个有源物体。CRT使用3个电子枪分别产生红

(Red)>绿(Green)和蓝(Blue)三种波长的光,并以各种

不同的相对强度综合起来产生颜色

••□•”

电子枪

掩蔽罩

荧光涂层屏幕

.

L

X

IZU

WW小川川I川

RGB相加混色模型

RGB相加色示例NEXT

RGB强度颜色

000黑(Black)

001蓝(Blue)

010绿(Green)

011青(Cyan)

100红(Red)

101品红(Magenta)

110黄(Yellow)

111白(White)

N

Lab颜色模式NEXT

■该颜色模式由一个发光率

(luminance)和两个颜色(a,b)

轴组成。它由颜色轴所构成

的平面上的环形线来表示颜

色的变化,其中径向表示色

饱和度的变化,自内向外,

饱和度逐渐增高;圆周方向

A.光度=100(白)表示色调的变化,每个圆周

B.绿到红分量形成一个色环;而不同的发

光率表示不同的亮度并对应

蓝到黄分量

C.不同环形颜色变化线。

D.光度=0(黑)到红

分量

:Lab颜色模式《■

■QEacL

:•Lab颜色是由RGB三基色转换而来

Z的

:•它是一种具有“独立于设备”的颜

:色模式,既不论使用任何一种监视

:器或者打印机,Lab的颜色不变。

HSB颜色模式

,•从心理学的角度来看,

颜色有三个要素:色

相、饱和度和亮度。

HSB颜色模式便是基

于人对颜色的心里感

受的颜色模式。

A.饱和度B.色相C.亮度D.所有色相

HSB色彩空间可以用一个圆锥空间模型来描述o

锥空间模型

QnEacL

(A)HSI圆锥空间模型

(B)线条示意图:圆

.锥上亮度、色度和饱和

/饱和度|I度的关系。

色调I(C)纵轴表示亮度

亮I(D)圆锥纵切面:描

(C送了同一色调的不同亮

(B)度和饱和度关系。

尸・(E)圆锥横切面:色调H为绕着圆

、融截面度量的色环,圆周上的颜色

为完全饱和的纯色,色饱和度为穿

-过中心的半径横轴。

彩色空间的线性变换标准

[NEXT

♦为了使用人的视角特性以降低数据量,通常把RGB

Z空间表示的彩色图像变换到其他彩色空间。

Z彩色空间变换有三种:YIQ,YUV和YCrCb

•・YIQ适用于NTSC彩色电视制式

Z・YUV适用于PAL和SECAM彩色电视制式

:•而YCrCb适用于计算机用的显示器

彩色空间的线性变换标准

[NEXT

ZYUV与YIQ模型

•在彩色电视制式中,使用YUV和YIQ模型来表示彩色

:图像。在PAL彩色电视制式中使用YUV模型,Y表示亮度,

•UV用来表示色差,U、V是构成彩色的两个分量;在NTSC

;彩色电视制式中使用YIQ模型,其中的Y表示亮度,I、Q

,是两个彩色分量。

xYUV/YIQ特点

:•亮度信号(Y)和色度信号(U、V)是相互独立的

••可以利用人眼的特性来降低数字彩色图像所需要的存储

:容量。

彩色空间的线性变换标准[NEXT

人眼对彩色细节的分辨能力远比对亮度细节的分辨能力低。例如,

要存储RGB8:8:8的彩色图像,即R、G和B分量都用8位二进制数表

示,图像的大小为640X480像素,那末所需要的存储容量为

921600字节。如果用YUV来表示同一幅彩色图像,Y分量仍然为

640X480,并且Y分量仍然用8位表示,而对每四个相邻像素(2X2)

的U、V值分别用相同的一个值表示,那末存储同样的一幅图像所

需的存储空间就减少到460800字节。这实际上也是图像压缩技术

的一神方法。

与YUV颜色模式类似的一种称为YCrCb模式,主要适用于计算机用

的显示器。

扫描绫

5/318

⑥计算所得的Cb,Cr样本

•Y样本

目录返回

YUV颜色模式

:•一幅彩色图像和它对应的亮度信号(Y

:分量)图像YUV表示法的重要性是它的

Z亮度信号(Y)和色度信号(U、V)是相互

:独立的,也就是说Y信号分量构成的黑

•白灰度图与用U、V信号构成的另外两幅

;单色图是相互独立的。由于Y、U、V是

:独立的,所以可以对这些单色图分别进

:行编码。黑白电视能接收彩色电视信号

就是利用了YUV分量之间的独立性。

目录返回

YUV颜色模式

:•一幅彩色图像和它对应的亮度信号(Y

:分量)图像

:彩色空间RGB-YUV

NEXT

:YUV与RGB彩色空间变换

:Y=0.299R+0.587G+0.114B

2U=-0.147R-0.289G+0.436B

ZV=0.615R-0.515G-0.100B

写成矩阵的形式:

Y0.2990.5870.114R

U=-0.147-0.2890.436G

V0.615-0.515-0.100B

彩色空间RGB-YIQfNEXf

YIQ与RGB彩色空间变换

Y=0.299R+0.587G+0.114B

I=0.596R-0.275G-0.321B

Q=0.212R-0.523G+0.3nB

写成矩阵的形式:

11

1.1J.

:彩色空间RGB-YCrCb-

:EacL

•YCrCb与RGB彩色空间变换

:数字域中的彩色空间变换与模拟域的彩色空间变换

•不同。它们的分量使用Y、Cr和Cb来表示,与RGB空间的

Z转换关系如下:

2Y=0.299R+0.578G+0.114B

ZCr=(0.500R-0.4187G-0.0813B)+128

2Cb=(-0.1687R-0.3313G+0.500B)+128

•写成矩阵的形式:

CMYK颜色模式NEXT

z•这是彩色印刷使用的一种颜色模式。它由青

■(cyan)>洋红(magenta)、黄(yellow)和黑(black)

Z四种颜色组成。

Z­这种模式的创建基础和RGB不同,它不是靠

X增加光线,而是靠减去光线。这是因为与监

•视器或者电视机不同,打印纸不能创建光源,

:即它不会发射光线,而只能吸收和反射光线,

・即它只能够吸收特定波长而反射其它波长。

:•通过对上述四种颜色的组合,可以产生可见

2光谱中的绝大部分颜色。

CMYK颜色模式BacU

CMYK模型以打印在纸张上

油墨的光线吸收特性为基础,

白光照射到半透明油墨上时,

部分光谱被吸收,部分被反射

回眼睛。

理论上,青色(C)、洋红

(M)和黄色(Y)色素能合成吸收

CMYK相减混色模型所有颜色并产生黑色。由于这

个原因,这些颜色叫作减色。

因为所有打印油墨都会包含一些杂质,这三种油墨实际上

产生一种土灰色,必须与黑色(K)油墨混合才能产生真正的

黑色。将这些油墨混合产生颜色叫作四色印刷。

颜色模型的色域BacU

色域是一个色系能够显示或打

印的颜色范围。人眼看到的色谱比

任何颜色模型中的色域都宽。

在颜色模型中,Lab具有最宽的

色域,它包括RGB和CMYK色域中的所

有颜色。通常RGB色域包含能在计算

机显示器或电视屏幕(发出红、绿

和蓝光)上所有能显示的颜色。因

而一些诸如纯青或纯黄等颜色不能

:A.Lab色域B.RGB色域C.CMYK色域在显示器上精确显示。

:CMYK色域较窄,仅包含使用印刷色油墨能够打印的颜色。当

■不能被打印的颜色在屏幕上显示时,它们称为溢色一一即超出CMYK

,色域之外。

:­图像数据压缩的可能性

z-统计冗余

z-信息燧冗余

•-结构冗余

Z-知识冗余

Z-视觉冗余

图像的种类

NEXT

标准单色图标准灰度图

图像的种类

NEXT

256色标准图像24位标准图像

图像的种类

256色标准图像转换成的灰度图24位标准图像转换成的灰度图

统计冗余

••图像数据存在大量的统计特征的重复,这种

Z重复包括静态单帧图像数据在空间上的冗余

:和音频、视频数据在时间上的冗余。

:­在动态图像序列中,前后两帧图像之间具有

z较大的相关性,表现出帧与帧之间的重复,

:因而存在时间冗余。

信息燧冗余

••信息嫡定义为一组数据所表示的信息量,即

0N-1

:£=-工小1吗,

・j=0

Z式中,£为信息嫡,N为数据的种类(或称码元)个数,

■为第,.个码元出现的概率。

:•一组数据的数据量显然等于各记录码元的二进制位数

,(即编码长度)与该码元出现的概率乘积之和,即

_N-T

:式中,〃为数据量,为第,个码元的二进制位数。

Z•一般取%…(如ASCII编码把所有码元都编码为

・7比特),这样得到的〃必然大于昆这种因码元编码长

Z度的不经济带来的冗余称为信息燧冗余或编码冗余。

信息燧冗余«

图26个英文字母相对频率

结构冗余.

有些图像从大面积上或整体上看存

在着重复出现的相同或相近的纹理结构,

例如布纹图像和草席图像,被称为结构

冗余。

知识冗余

BacU

有许多图像的理解与图像

所表现内容的基础知识(先

验或背景知识)有相当大的

相关性,从这种知识出发

可以归纳出图像的某种规

律性变化,这类冗余称为

知识冗余。知识冗余的一

个典型例子是对人像的理

解,比如,鼻子上方有眼

睛,鼻子又在嘴的上方等。

目录返回

视觉冗余

;人类的视觉系统

・实际上只在一定程度

Z上对图像的变化产生

•敏感,即图像数据中

Z存在着大量人类视觉

♦觉察不到的细节。事

z实上,人类视觉系统24比特标准图像转换成的灰度图

•的一般分辨力为64灰

z度级,而一般图像量

♦化采用的是256灰度

z级,这类冗余称为视

2觉冗余。

256色标准图像转换成的灰度图

第三章数字图像处理技术

••J信号处理的基本术语考

z,J图像数据压缩基础题

Z•图像数据压缩算法

Z•常用图形、图像文件的格式

Z•静态图像压缩标准

Z•动态图像压缩标准

:•H.261和H.263标准

图像数据压缩算法

评价压缩算法的指标

压缩算法分类

行程长度编码•预测编码

哈夫曼编码•变换编码

算术编码•模型法编码

词典编码•混合编码

:评价压缩算法的指标.■

:•压缩比指压缩编码后的数据量与原始

:数据大小的比值;

:•算法的复杂性和运算速度;

:•失真度。

♦压缩前:Synthetic.bmp393,270B压缩后:Synthetic.jpg18,756B

压缩比:18756/393270-1/21

♦将16M色的真彩图像(图A)转变为256色(图B),数据量减少了约3倍,压

・缩比为1:3.当然这时产生了色彩失真,但如果选择原图的色彩范围定义

・调色板,色彩失真较小,人眼一般都还能接受.如果把图像深度从8位再

:压缩到4位,即从256色再压到16色(图C),虽然数据量只减少了2倍,压缩

Z比为1:2,但这时的人眼所看到的色彩失真比第一次大得多,效果很差

压缩算法分类

BaeU

根据对编码数据进行解码后与编码

前的数据是否一致可以把数据编码方法

分为两类:

-无损编码。解码后的数据与编码前的数据

完全一致,没有任何失真。

-有损编码。解码后的数据与原始数据有一

定程度的偏差或失真,但一般不影响听觉

或视觉效果。

行程长度编码NEXT

:•把一系列的重复值(例如图像象素的灰

X度值)用一个单独的值再加上一个计数

2值来取代。

:•比如有这样一个字母序列一、

Zaabbbccccccccdddddd它的行程长度编码

:就是2a3b8c6d。

:■很多位图文件格式都用行程长度编码,

・例如TIFF,PCXo

行程长度编码例

BacU

•有一线状图像,其灰度随长度坐标

一的关系如图3.1所示。描述这个一维4«一

Z图像可以用顺序的七个3bit的二进

2*~

.制数表示:011,011,011,011,1*~

Z101,101,101,共21比特。IIIiIII

0«1l*12+13r4,5+6,7。

z如果用行程编码方法对其编码,其图3」一维图像的例子"

,编码就变成了100,011;011,101,

:共用了12比特,比前一种编码节约

・了9个比特。

香农-范诺算法NEXT

信源(消息集)编码输出集

I编码器

Z=屹],...,Z[]

X={X1,・・.,xn}

符号集Am=d,…,am}

嫡(Entropy)的概念

嫡是信息量的度量方法,它表示某一事件出现的

消息越多,事件发生的可能性就越小,数学上就是概

率越小。

某个事件的信息量用4曰=崛名然表示,其中Pi

为第i个事件的概率,0<Pi«L

哈夫曼编码INEXT

(1)统计信源符号出现的概率;

⑵将信源符号按概率递减顺序排列;

(3)把两个最小的概率值加起来,作为一个新组合符号

的概率;

(4)重复步骤(2)、(3),直到概率和达到1为止;

⑸在每次合并信源时,将合并的信源分别标记“1”和

“0”(例如,概率小的标记为“1”,概率大的标记

为“0”);

(6)寻找从每一信源符号到概率为1的路径,记录下路径

上的“1”和“0”;

(7)对每一符号写出“1”和“0”序列;

哈夫曼编码的例子NEXT

Xjxxxxx

・考虑信源23456

0.250.250.200.150.100.05

进行哈夫曼编码的过程如下:

信源符号概率编码过程码长

0

0

0.2501

10.55

1.00编码前:平均码长为3

0

0.25

102

1编码后:平均码长为2.45

x0.20

30.4511压缩比:

12.45/3

0

x40.150003

0.30

x50.1000104

10.0500114

:哈夫曼编码的不足S

二•它必须精确地统计出原始文件中每个值的出现

:频率,如果没有这个精确统计,压缩的效果就

z会大打折扣,甚至根本达不到压缩的效果。因

•此哈夫曼编码通常要经过两遍操作,第一遍进

二行统计,第二遍产生编码,所以编码的过程是

:比较慢的。

:•另外由于各种长度的编码的译码过程也比较复

:杂,因此解压缩的过程也比较慢。

z•它对于位的增删比较敏感。

算术编码

INEXT

・算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角

:色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到

.两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定

・压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包

■含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。

Z算法举例

■假设信源符号为{00,01,10,11),这些符号的概率分别为{0.1,

:0.4,0.2,0.3),根据这些概率可把间隔[0,1)分成4个子间隔:

•[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二进制消息序列

■的输入为:10001100101101

Z需要注意的几个问题..

:EaeL

•1.由于实际计算机精度不可能无限长,运算中溢出是明显的问题,

:但多数机器都有16位、32位或者64位的精度,因此可使用比例缩放

■法解决。

-2.算术编码器对消息只产生一个码字,这个码字是在[0,1)中的一

.个实数,因此译码器在接受到表示这个实数的所有位之前不能进行

工译码。

-3.算术编码也是一种对错误很敏感的编码方法,如果有一位发生错

,•误就会导致整个消息译错。

•算术编码可以是静态的或者自适应的。在静态算术编码中,信源

;符号的概率是固定的。在自适应算术编码中,信源符号的概率根据编

.码时符号出现的频繁程度动态地进行修改,在编码期间估算信源符号

--概率的过程叫做建模。需要开发动态算术编码的原因是因为事先知道

,精确的信源概率是很难的,而且是不切实际的。当压缩消息时,我们不

2能期待一个算术编码器获得最大的效率,所能做的最有效方法是在编

■码过程中估算概率。因此动态建模成为确定编码器压缩效率的关键。

词典编码

,词典编码的思想

,第一类词典法的想法是企图查找正在压缩的字符序列

・是否在以前输入的数据中出现过,然后用已经出现过的字

:符串替代重复的部分,它的输出仅仅是指向早期出现过的

■字符串的“指针”O

词典编码

LZ77算法

算法中用到的几个术语:

:1.输入数据流(inputstream):要被压缩的字符序列。

-2.字符(character):输入数据流中的基本单元。

*3.编码位置(codingposition):输入数据流中当前要编码的字符位

上.置,指前向缓冲存储器中的开始字符。

:4.前向缓冲存储器(Lookaheadbuffer):存放从编码位置到输入数据

:♦流结束的字符序列的存储器。

・5.窗口(window):指包含W个字符的窗口,字符是从编码位置开始向

后数也就是最后处理的字符数。

16.指针(pointer):指向窗口中的匹配串且含长度的指针。

词典编码

•LZ77编码算法的核心是查找从前向缓冲存储器开始的最

:长的匹配串。编码算法的具体执行步骤如下:

-1.把编码位置设置到输入数据流的开始位置。

Z2.查找窗口中最长的匹配串。

・3.以“(Pointer,Length)Characters”的格式输出,

:其中Pointer是指向窗口中匹配串的指针,Length表

•示匹配字符的长度,Characters是前向缓冲存储器中

Z的不匹配的第1个字符。

・4.如果前向缓冲存储器不是空的,则把编码位置和窗

:口向前移(Length+1)个字符,然后返回到步骤2。

词典编石马-LZ77算法

词典编码-LZSS算法

■•LZ77通过输出真实字符解决了在窗口中出现没有匹配

•串的问题,但这个解决方案包含有冗余信息。冗余信

Z息表现在两个方面,一是空指针,二是编码器可能输

・出额外的字符,这种字符是指可能包含在下一个匹配

:串中的字符。

:LZSS算法以比较有效的方法解决这个问题,它的思

,想是如果匹配串的长度比指针本身的长度长就输出指

z针,否则就输出真实字符。

词典编码-LZSS算法

编码算法的具体执行步骤如下:

♦1.把编码位置置于输入数据流的开始位置。

»2.在前向缓冲存储器中查找与窗口中最长的匹配串

:①Pointer:=匹配串指针。

,■②Length:=匹配串长度。

-3.判断匹配串长度是否大于等于最小匹配串长度(Lengths

•.MIN-LENGTH),

:如果“是":输出指针,然后把编码位置向前移动Length个字符

如果“否”:输出前向缓冲存储器中的第1个字符,然后把编码

--位置向前

三:移动一个字符。

.4.如果前向缓冲存储器不是空的,就返回到步骤2。

词典编码-LZSS算法

词典编码-LZSS算法

■•在相同的计算机环境下,LZSS算法比LZ77可获得比较

*高的压缩比,而译码同样简单。这也就是为什么这种

Z算法成为开发新算法的基础,许多后来开发的文档压

・缩程序都使用了LZSS的思想。例如,PKZip,ARJ,

:LHArc和ZOO等等,其差别仅仅是指针的长短和窗口的

:大小等有所不同。

:•LZSS同样可以和嫡编码联合使用,伤|如ARJ就与霍夫

:曼编码联用,而PKZip则与Shannon-Fano联用,它的

・后续版本也采用霍夫曼编码。

第二类词典编码

输入第二类算法的

数据流想法是企图从输入

的数据中创建一个

“短语词典

(dictionaryof

数据流

thephrases),,,

这种短语可以是任

意字符的组合。编

码数据过程中当遇

到已经在词典中出

现的“短语”时,

编码器就输出这个

词典中的短语的

“索引号”,而不

是短语本身。

LZ78算法

■•LZ78的编码思想是不断地从字符流中提取新的缀-符

:串(String),通俗地理解为新“词条”,然后用“代

:号”也就是码字(Codeword)表示这个“词条”。这

•样一来,对字符流的编码就变成了用码字(Codeword)

:去替换字符流(Charstream),生成码字流(Code

:stream),从而达到压缩数据的目的。

:•LZ78编码器的输出是码字-字符(W,C)对,每次输出一

X对到码字流中,与码字W相对应的缀-符串(String)用

•字符C进行扩展生成新的缀-符串(String),然后添加

T到词典中。

LZ78算法

[W]123456789

与LZ77相比,LZ78

的最大优点是在每个编

步位置词典■wi

|彝码步骤中减少了缀-符

11串(String)比较的数目,

22而压缩率与LZ77类似。

33

5

58

预测编码INEXT

z•一般在图像中局部区域的象

:素是高度相关的,因此可以

A用先前象素的有关灰度知识

:来对当前象素的灰度进行预

♦计,这就是预测。

:*预测编码可分为线性预测编

:码和非线性预测编码。前者

・常被称为差分脉冲编码调制,

:即DPCM(DifferentialPulse

0CodeModulation)。

的原理框图

DPCMNEXT

DPCM原理:图像中相邻像素值具有相关性。每个

向素值可用与之相关的几个向素值来做预测。

(b)DPCM译码框图

:DPCM编码示例

ZDPCM系统如图所示,预测器的预输入k仇)输出或理)

•测值为前一个样值(图中D表示单位二咚

Z延迟)。假设输入信号已经量化,一:+

・差值不再进行量化。若DPCM系统.

Z的输入为{0,1,2,1,123,3,4,4,...},贝IjL

一编码过程如下:

9)0121123344•••

Q?)0012112334•■•

d{n}LI11-1011010•■•

变换编码

INEXT

139144149153155155155155

变换编码就是将时域信号144151153156159156156156

150155160163158156156156

(如图像光强矩阵)变换到频159161162160160159159159

159160161162162155155155

域信号(系数空间)上进行处161161161161160157157157

理的方法。162162161163162157157157

162162161161163158158158

在空间上具有强相关的信源图象样本

号,反映在频域上是某些

?[X⑵COS空3]

特定的区域内能量常常被4iU)>016

集中在一起,或者是系数

235.6-1.0-12.1-5.202.1-1.7-2.71.3

矩阵的分布具有某些规律。-22.6-18.5-6.2-3.2-2.9-0.10.4-1.2

-10.9-9.3-1.61.50.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论