计算机图形图像及其压缩_第1页
计算机图形图像及其压缩_第2页
计算机图形图像及其压缩_第3页
计算机图形图像及其压缩_第4页
计算机图形图像及其压缩_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、v常用的图形图像格式v图形图像的数据类型v图形图像的颜色模型v图形图像压缩的基础v图形图像的压缩算法v图形图像的编辑工具v相同的内容,不同的格式,其效果和用途往往大不相同,说说你所知道的图像文件格式。v相同的内容,不同的格式,其效果和用途往往大不相同,说说你所知道的图像文件格式。BMP图像文件格式尺寸:450*335容量:442KBJPEG图像文件格式尺寸:450*335容量:31.1KBv常用图形图像文件格式文件格式文件格式说明说明文件格式文件格式说明说明BMPWMFGIF?JPGPNGPSDTGATIFFvJPEGJPEG是国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)关于

2、静止图像编码的联合专家组(Joint Photographic Experts Group)推出的标准。该标准规定了顺序和渐进两种工作方式,基本系统、扩展系统和无失真系统三种编码算法。JPEG标准综合了很多图像压缩编码的研究成果,以DCT为核心,集成了DPCM、自适应量化、行程编码等多种技术。vJPEGvJPEGJPEG2000将JPEG的以离散余弦为核心转化为以离散小波变换为核心。JPEG2000比JPEG有更高的质量、更高的压缩率、更快的传输速度。JPEG2000可以方便地实现无损压缩和渐进传输,方便网络环境和图像显示高质量的要求。JPEG2000可以对图像不同的区域采取不同的压缩率。vJ

3、PEGv图像的三个属性分辨率,又分显示分辨率和图像分辨率两种;显示分辨率:指显示屏上能够显示出的像素数目,如显示分辨率为1024*768,表示显示屏分成768行,每行显示1024个像素,整个屏幕有786432个显像点;图像分辨率:指组成一幅图像的像素密度,在相同尺寸时,构成图像的像素越多,图像分辨率就越大。v图像的三个属性像素深度:指图像中每个像素存储时所用的位数,它决定了图像的每个像素可以显示的颜色数目;如每个像素用RGB三个分量表示,每个分量用8位(1个字节),则每个像素可以表示224种颜色;如RGB各用5位表示,则加上一个属性位后,图像的详述深度就成了16位,属性为可用于控制是否透明;如

4、RGB用8位,再加上8位alpha通道,则可以构成32位像素深度。v图像的三个属性真/伪彩色:真彩色指图像中的每个像素都分成RGB三基色分量,每个基色分量直接决定其基色的强度,这样产生的色彩称为真彩色;伪彩色:伪彩色图像每个像素的颜色不是由每个基色分量的数值直接决定,每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表(Color Look-Up Table,CLUT)中某一项的入口地址,根据该地址查找到包含实际RGB的值。v1位图像1位图像仅仅由“开”位和“关”位组成,即图像的每个像素作为一个位存储(0或者1),也称为二值图像(binary image)或单色图像。一幅分辨率为640*

5、480的一位图像需要38.4KB(640*480/8)存储空间。v8位灰度图像每个像素有一个在0-255之间的灰度值(gray value),用一个字节表示。整幅图像可以看做由像素值组成的二维数组,称之为一幅位图(bitmap)。一幅640*480的灰度图需要300KB存储空间。v24位彩色图像每个像素用三个字节表示RGB,支持1千6百多万种颜色。1幅640*480的24位彩色图像,如果不经压缩,需要921.6KB存储空间。v8位彩色图像这种图像文件采用查找表(lookup table)来存储颜色信息。图像中存储的不是颜色而是字节的集合,每个字节是指向一个表的索引。有点像小孩按序号画图的绘画册

6、,如1代表橙色,2代表绿色等。v颜色:一种是发光体所呈现的颜色,另一种是物体反射或透射的颜色;v亮度:指作用于物体表面的光反射系数;v色调:物体反射光的波长,光谱成分、周围光强;红色加上另一种颜色的光,则色调发生变化;v饱和度:颜色渗入白光的程度,即颜色的深浅度;如红色加上白光,呈粉红色,饱和度下降;v人眼视觉暂留:在观察过物体之后,物体的映像将在人眼的视网膜上保留一短暂的时间,1/20-1/10秒,25-30帧;v人眼对亮度比对颜色更敏感;v人眼的视野:左右180,上下60。v连续色调:指一幅图像上,由淡到浓(深到浅)的色调变化,浓淡或深浅由单位面积成像物质颗粒密度构成。v半色调:指经过特殊

7、加工后形成的由浅到深(浓到淡)的变化,由印刷网点面积大小构成来表现的。一个22点阵的区域可以表现出5种颜色等级。(参见教材中的“抖动”)256色原始图像16色半色调图像16色非半色调图像vRGB颜色模型:通过将R红色、G绿色、B蓝色三种颜色分量进行混合,产生自然界中所有颜色的效果,是一种相加混色模型,用于计算机显示器、电视机等自发光设备中;在计算机应用中,红色、绿色、蓝色分别用一个字节(8位)表示,产生224种颜色。vRGB颜色模型:vHSB颜色模型:主要考虑人在观察、设置或调整颜色时的心理感受,从日常生活中画家调整颜色的方法中产生的颜色模型。H(hue)色泽、S(Saturation)饱和度

8、、B(Brightness)亮度。vCMYK颜色模型:生活中看到物体的颜色是物体被太阳光照射后反射光的颜色,即吸收太阳光(白色)中特定波长的光,对其他波长的光进行反射,如绘画中颜料的颜色,因此CMY颜色模型与画画时用的颜料三基色相同,即用青、洋红、黄来混合产生颜色,黑色K可以在打印或印刷过程中方便产生黑色。v增色模型和减色模型:vYUV颜色模型:这种颜色模型早期主要用于PAL模拟电视系统,现在也用于数字电视;Y表示亮度,U和V表示色度。利用人眼对亮度敏感而对色彩细节相对不敏感的特点,将原本需要用RGB三基色表示的图像用YUV分量来表示,降低色彩分量的精度,减少传输带宽或存储容量。Y = 0.2

9、99R + 0.587G + 0.114B U = B - Y V = R - Y vYUV颜色模型:5.5 MHz带宽分配给Y, U 、 V分别为 1.8 MHz ; YUVvYIQ颜色模型:由YUV颜色模型衍生出来的模型,主要用于NTSC电视系统,IQ指色调,YIQ颜色模型经常用于计算机图像处理。vYCbCr颜色模型:国际电联ITU制定的数字视频标准,解决两种不同电视制式的兼容。主要用于JPEG和MPEG,和YUV颜色模型关系密切;Y为亮度分量,Cb为蓝色色度分量,Cr为红色色度分量;Cb = (B - Y) / 1.772 + 0.5 Cr = (R - Y) / 1.402 + 0.5

10、 v数据冗余对于多媒体数据,数据量远远大于其所携带的信息量;如180个汉字,文本数据量为360B。而广播员朗读使用1分钟,采样数据量为800060480KB,其数据有1300倍冗余;数学描述:IDdu其中I为信息量,D为数据量,du为冗余量。v统计冗余:图像数据存在大量的统计特征的重复,这种重复包括静态单帧图像数据在空间上的冗余和音频、视频数据在时间上的冗余。如静态图像中规则物体和规则背景,动态图像中前后两帧图像之间存在较大的相关性。v信息熵冗余数据携带的信息量少于数据本身;信息熵定义为一组数据所表示的信息量:其中,E为信息熵,N为数据种类的个数,pi为第i个数据的出现概率。一组数据的实际数据

11、量为各个数据的二进制位数与该数据出现的概率之积的和:其中,D为数据量,bi为第i个数据的二进制位数。102logNiiippE10NiiibpDv信息熵冗余如果希望不出现冗余,则冗余量d=D-E=0,则:即bi根据不同数据元素出现概率的不同而变化,可操作性很差。如英文26个字母在文章中的出现概率,已有研究发现差异很大,如果不希望出现冗余,则每个字母在计算机中表示的二进制长度不同,但现实是统一用ASCII码(7位)。iipb2logv结构冗余有些图像从大面积上或整体上看存在重复出现的相同或相近的纹理结构,称为结构冗余。v知识冗余有许多图像的理解和图像所表现内容的基础知识有相当大的相关性,从这种知

12、识出发可以归纳出图像的某种规律性变化。如人像的理解,鼻子上有眼,嘴上有鼻子。v视觉冗余人类的视觉系统实际上只在一定程度上对图像的变化存在敏感,图像中有很多细节人的视觉系统无法感觉或分辨。同时人类的视觉系统由于生理或环境等因素会出现偏差或不敏感。种类原因主要方法统计冗余空间冗余像素间相关性变换编码、预测编码时间冗余时间方向上的相关性帧间预测、运动补偿信息熵冗余编码造成的冗余统计编码结构冗余图像本身的构造包含的冗余轮廓编码、区域分割知识冗余收发两端对事物的共同认识导致的冗余基于知识的编码视觉冗余人的视觉特性导致的冗余非线性量化、比特分配其它其他因素形成的冗余v三代压缩技术v第一代压缩技术:以去除信

13、源信号的冗余为出发点,产生了预测编码、变换编码和统计编码为主的经典编码方法。v第二代压缩方法:突破了信息论的框架,充分利用了人类的视觉和听觉的感知机理和信源信号的各种特征,由波形编码逐渐向模型编码方向发展。v第三代编码技术:更侧重媒体数据的检索和利用效率,将内容描述等方面也加入到编码体系之中。v评价压缩算法的指标:压缩比:压缩倍数;如1024768图像,每像素8bit,将其分辨率降为512384,再使每像素用0.5bit,则其压缩倍数为64倍,压缩比为1:64。算法的复杂性和运算速度失真度v压缩算法数据编码的分类:无损压缩有损压缩v图像保真度(图像重建质量):客观评价:均方根误差、均方根信噪比

14、。主观评价:电视图像质量评价尺度。评分评价说明1优秀图像质量非常好,是人能想象出的最好质量。2良好图像质量高,观看舒服,有干扰但不影响观看。3可用图像质量可接受,有干扰但不太影响观看。4刚可看图像质量差,干扰有些妨碍观看,观察者希望改进。5差图像质量很差,妨碍观看的干扰始终存在,几乎无法观看。6不能用图像质量极差,不能使用。电视图像质量评价v无损压缩:又称无失真压缩,在压缩过程中信息没有任何损失,只是去掉数据中的冗余,解压缩时,这些去除的冗余可以重新插入到数据中,是可逆的;v有损压缩:利用人类视觉和听觉器官对图像或声音中某些频率成分不敏感的特性,允许在压缩过程中损失一定的信息,以换取更大的压缩

15、比,广泛用于图像、语音和视频数据的压缩编码过程。v压缩和解压缩的速度对称压缩:压缩与解压的算法基本相同,是相互可逆的;压缩和解压缩需要实时进行,如电视会议的图像传输,压缩和解压缩速度相同;非对称压缩:压缩与解压的算法不同,解压缩实时,压缩非实时,如CDROM的制作与播放,压缩比解压缩速度慢;数据的计算量:压缩和解压缩都需要大量的计算,通常解压缩比压缩的计算量小。v行程长度编码:行程长度编码RLE又称为游程编码,是压缩文件最简单的方法之一。将一系列的重复值用单个值加上一个计数值来取代。如aabbbccccccccdddddd的编码为2a3b8c6d。00000000000000011111110

16、0000000015 0 7 1 9 015 7 9。 应用:一些图像文件格式如TIFF、PCX使用行程长度编码。101,101,101,011,011,011,011101,011,011,100节约了9比特v哈夫曼编码:哈夫曼1952年提出,即在变字长编码中,对于出现概率大的信息符号编以短字长的码,对于概率小的符号编以长字长的码。如果码字长度严格按所对应符号出现概率大小逆序排列,则平均码字长度一定小于其他以任何符号顺序排列方式得到的平均码字长度。出现频率越高,使用的编码字长越短。哈夫曼编码通常要经过两遍操作,首先进行统计,然后进行编码。0.450.300.150.050.030.010.0

17、11.000.550.250.100.050.02010101010101v哈夫曼编码:初始化,根据符号概率的大小按由大到小顺序对符号进行排序。 把概率最小的两个符号组成一个节点。 重复步骤2,形成一棵树。 从根节点开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的编码不同,而编码的平均长度是相同的。 从根节点开始顺着树枝到每个叶子分别写出每个符号的编码。 v哈夫曼编码:符号出现的次数log2(1/pi)分配的编码需要的位数A15(0.3846)1.38015B7(0.1795)2.4810021C6(0

18、.1538)2.7010118D6(0.1538)2.7011018E5(0.1282)2.961111523. 231282. 031538. 031538. 031795. 013846. 081iiiPR平均码长v哈夫曼编码优点:哈夫曼码的码长虽然是可变的,但却不需要另外附加同步代码。例如,码串中的第1位为0,那末肯定是符号A,因为表示其他符号的编码没有一个是以0开始的,因此下一位就表示下一个符号编码的第1位。如果事先编写出一本解释各种编码意义的“词典”,即码簿,那么就可以根据码簿一个码一个码地依次进行译码。v哈夫曼编码缺点:霍夫曼码没有错误保护功能,译码时如果没有错误,那么就能顺利地译

19、出编码。但如果有错误,哪怕是1位出现错误,就会一错一大串,完全乱套。 v算术编码:算术编码在图像数据压缩标准如JPEG中扮演了重要的角色。在算术编码中,信源符号用0到1之间的实数进行编码,算术编码用到两个基本的参数:信源符号出现的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。 v算术编码:算术编码举例:假设信源符号为00, 01, 10, 11,这些符号的概率分别为 0.1, 0.4, 0.2, 0.3 ,根据这些概率可把间隔0, 1)分成4个子间隔:0, 0.1), 0.1, 0.5)

20、, 0.5,0.7), 0.7, 1),其中表示半开放间隔。 信源符号00011011概率0.10.40.20.3初始编码间隔0,0.1)0.1,0.5)0.5,0.7)0.7,1.0)v算术编码:v算术编码:步骤 输入符号编码间隔 编码判决1100.5, 0.7)符号的间隔范围0.5, 0.7) 2000.5, 0.52)0.5, 0.7)间隔的第一个1/103110.514, 0.52)0.5, 0.52)间隔的最后一个3/104000.514, 0.5146)0.514, 0.52)间隔的第一个1/105100.5143, 0.51442)0.514, 0.5146)间隔的第五个1/10

21、开始,二个1/106110.514384, 0.51442)0.5143, 0.51442)间隔的最后3个1/107010.5143836, 0.514402)0.514384, 0.51442)间隔的4个1/10,从第1个1/10开始8从0.5143876, 0.514402中选择一个数作为输出:0.5143876v算术编码:步骤 间隔译码符号 译码判决 10.5, 0.7)100.51439在间隔 0.5, 0.7)20.5, 0.52)000.51439在间隔 0.5, 0.7)的第1个1/1030.514, 0.52)110.51439在间隔0.5, 0.52)的第7个1/1040.514, 0.5146)000.51439在间隔0.514, 0.52)的第1个1/1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论