多媒体中有关JPEG方面的知识_第1页
多媒体中有关JPEG方面的知识_第2页
多媒体中有关JPEG方面的知识_第3页
多媒体中有关JPEG方面的知识_第4页
多媒体中有关JPEG方面的知识_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、5.3 JPEG标准的主要内容 ISO/IEC 10918号标准“多灰度连续色调静态图像压缩编码”即JPEG标准, 选定ADCT作为静态图像压缩的标准化算法。该标准为保证通用性,包含以下两种方式:空间方式 可逆编码 空间方式对于基本系统和扩展系统来说,被称为独立功能。DCT方式 非可逆编码, 包含基本系统(必须保证的功能)和扩展系统(扩充功能)1基本系统是实现DCT编码与解码所需的最小功能集, 大多数的应用系统只要用此标准, 就能基本上满足要求。扩展系统是为了满足更为广阔领域的应用要求而设置的。25.3.1 JPEG静态图像压缩算法 1. 基于DPCM的无失真编码 预测器熵编码器表说明无失真编

2、码器源图像数据压缩图像数据图5.1 无失真编码简化框图3基于DPCM的无失真编码优点是硬件易实现,重建图像质量好。缺点是压缩比太低, 大约为2:1。 4工作原理是对X的预测值X,将X-X进行无失真熵编码。对X的求法见图给出的预测方式。 选择值预测选择值预测 0 1 2 3非预测 a b c 4 5 6 7a+b-ca+(b-c)/2b+(a-c)/2(a+b)/2(a) X邻域(b) 预测方式图5.2 预测器52. 基于DCT的有失真压缩编码 离散余弦变换量化处理DC系数的编码和AC系数的行程编码 熵编码6图5.3 基于DCT编码过程FDCT熵编码器表说明无失真编码器源图像数据压缩图像数据量化

3、器表说明88块(YUV每个分量)7图5.4 解码过程熵解码器IDCT表说明解码器逆量化器表说明88块压缩图像数据恢复的图像数据8离散余弦变换 (1)首先把原始图像顺序分割成88子块;(2)采样精度为P位(二进制), 把0, 2P-1范围的无符号数变换成-2P-1,2P-1范围的有符号数, 作为离散余弦正变换(FDCT)的输入;(3)在输出端经离散余弦逆变换(IDCT)后又得到一系列88子块, 需将数值范围-2P-1,2P-1变换回0, 2P-1来重构图像。9量化处理 量化是一个“多到一”的过程,失真原因关键是找最小量化失真的量化器, JPEG采用线性均匀量化器,定义为对64个DCT系数除以量化

4、步长, 然后四舍五入取整:FQ(u, v)=Integer RoundF(u, v)/Q(u, v)Q(u,v)是量化器步长,它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值,量化表尺寸为88与64个变换系数一一对应。这个量化表应由用户规定(JPEG给出参考值-见表2.2,2.3), 并作为编码器的一个输入。10161110162440516112121419265860551413162440576956141722295187806218223756681091037724355564811041139249647887103121120101729295981121

5、0010399表5.1 亮度量化表1117182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999表5.2 色度量化表12量化的作用是在一定主观保真度图像质量前提下,丢掉那些对视觉影响不大的信息,通过量化可调节数据压缩比。 13 DC系数的编码 64个变换系数经量化后, 坐标u=v=0的F(0, 0)称DC系数(直流分量), 它即64个空域图像采样值的平均值。相邻88块之间DC系数有强相关性。JPEG

6、对量化后的DC系数采用DPCM 编码, 即对DIFF= DCi-DCi-1编码。 blocki-1blockiDCi-1DCi图5.5 DC系数差分编码14AC系数的行程编码 其余63个交流系数(AC)采用行程编码。从左上方AC0,1开始沿对角线方向“Z”字形扫描直到AC7,7扫描结束, 这样可增加行程中连续0的个数。AC系数编码的码字用两个字节表示,如图所示: 图5.6 Z字形扫描15图5.7 AC系数行程编码码字两个非0值间连续0的个数 表示下一个非0值需要的bit数 下一个非0实际值7430字节1字节2例子:对“,3,0,0,0,0,0,12,0,0,”编码 ,(5,4),(12),.1

7、6熵编码 为了进一步压缩数据,需对DC码和AC行程编码的码字再做基于统计特性的熵编码。JPEG建议的熵编码是Huffman编码和自适应二进制算术编码。熵编码可分成两步进行:把DC码和AC行程码转换为中间符号序列给这些符号赋以变长码字 17行程取值范围为115, 超过15时用扩展符号1 (15, 0)来扩充, 63个AC系数最多增加3个扩展符号1。编码结束时用(0,0)表示。“尺寸”取值范围为010。 “幅值”用以表示非0的AC系数的值, 范围为-210, 210-1(最长10bit), 结构形式如表5-5所示。181 -1,12 -3.-2,2.33 -7.-4,4.74 -15.-8,8.1

8、57 89 -511.-256,25651110 -1023.-512,5121023表5.5 符号2结构19DC系数的熵编码对于直流分量DC也有类似于AC系数的编码格式符号1:(尺寸)符号2:(幅值)“尺寸”表示DC差值的幅值编码所需的比特数, 而“幅值”表示DC差值的幅值, 范围为-211,211-1。可在表5.5中多加一级, 幅值尺寸以1到11比特表示。 将63个AC系数表示成为符号1和符号2序列,其中连续0的长度超过15时,有多个符号1; 块结束(EOB)时仅有一个符号1(0,0)。20 “4,0,0,0,0,0,0,0,0,3,0”. 4,3之间有31个0. (15,0),(15,0

9、),(1,2),(3)可变长度熵编码就是对上述序列进行变长编码。对DC系数、AC系数中的符号1采用Huffman表中的变长码编码(VLC),这里Huffman变长码表必须作为JPEG编码器输入。符号2用码字长度在表2.4中给出的变长整数VLI码编码。VLI是变长码,但不是Huffman码。VLI的长度存放在VLC中, JPEG提供VLI码字表供用户使用21表5.6 JPEG压缩效果评价压缩效果(比特/像素) 质 量 0.250.50 中好 0.500.75 好很好 0.751.5 极好 1.22.0 与原始图像分不出来22MPEG视频数据流的结构MPEG-1数据体系结构运动图像序列图片组图片图

10、片切片宏块块8像素23帧间预测1I2B3B4B5P6B7B8B1I前向预测双向预测24运动序列流的组成典型的图像类型的显示次序1秒参照帧间有2个B图像 每0.5秒1帧I图像 I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B25传输顺序MPEG编码器需对上述图像重新排序, 以便解码器高效工作, 因为参照图像必须先于B图像恢复之前恢复。上述17帧图像重排后图像组次序为:4213756IPBBPBB26图像处理 对图像进行一系列的操作以达到预期的目的的技术称作图像处理。图像处理可分为模拟图像处理和数字图像处理两种方式。 利用光学、

11、照相和电子学方法对模拟图像的处理称为模拟图像处理。目前,许多军用、宇航的处理仍采用光学模拟处理。 利用计算机对数字图像进行系列操作,从而获得某种预期的结果的技术称为数字图像处理,又称计算机图像处理。通常,也简称为图像处理。27 图像处理的内容相当丰富,包括狭义的图像处理、图像分析与图像理解。狭义的图像处理着重强调在图像之间进行的变换,是一个从图像到图像的过程,是比较低层的操作。狭义的图像处理主要满足对图像进行各种加工,以改善图像的视觉效果,或对图像进行压缩编码以减少所需存储空间或传输时间,达到传输通路的要求。特点:主要在像素级进行处理,处理的数据量非常大。28图像分析 图像分析主要是对图像中感

12、兴趣的目标进行检测和测量,从而建立对图像的描述。图像分析主要研究用自动或半自动装置和系统,从图像中提取有用的测度、数据或信息,生成非图像的描述或者表示。图像分析的内容分为特征提取、符号描述、目标检测、景物匹配和识别等几个部分。特点:是一个从图像到数据的过程,可以看作是中层处理。29图像理解图像理解是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。图像理解有时也叫景物理解。图像理解主要是高层操作,其处理过程和方法与人类的思维推理有许多类似之处。30与相关学科的关系数字图像处理是一门新的交叉学科。它与数学

13、、物理学、生理学、心理学、电子学、计算机科学等许多学科可以相互借鉴。从它的研究范围来看,它与模式识别、计算机视觉、计算机图形学等多个专业又互相交叉。31宏观世界图像图像数据(人)符号新技术新理论新工具图像处理模式识别图像分析计算机视觉计算机图形学图像理解图像理解(转换)图像处理与相关学科的联系和区别32数字图像处理方法数字图像的处理方法种类繁多,根据不同的分类标准可以得到不向的分类结果。根据对图像作用域的不同,数字图像处理方法大致可分为两大类,即:空域算法和变换域算法。33空域处理方法空域处理方法是指在空间域内直接对数字图像进行处理。在处理时,既可以直接对图像各像素点进行灰度上的变换处理,也可

14、以对图像进行小区域模板的空域滤波等处理,以充分考虑像素邻域像素点对其的影响。空域处理法主要有两大类: (1)邻域处理法 (2)点处理法34变换域处理方法 变换域处理方法首先主要是通过傅立叶变换、离散余弦变换、沃尔什变换或是比较新的小波变换等变换算法,将图像从空域变换到相应的变换域,得到变换域系数阵列,然后在变换域中对图像进行处理,处理完成后再将图像从变换域反变换到空间域,得到处理结果。35数字图像处理的主要研究内容1 图像变换2 图像增强3 图像编码与压缩4 图像复原5 图像重建361 图像变换图像变换是图像处理和图像分析的一个重要分支,它将图像从空间域变换到变换域,然后在变换域对图像进行处理

15、和分析。图像变换是许多图像处理和分析技术的基础,是图像增强和复原的基本工具,也是图像特征提取的重要手段。常用的图像变换有傅立叶变换、DCT变换,小波变换等。372 图像增强图像增强是指根据一定的要求,突出图像中感兴趣的信息,而减弱或去除不需要的信息,从而使有用信息得到加强的信息处理方法。根据增强处理过程所在的空间不同,图像增强技术可分为基于空间域的增强方法和基于频率域的增强方法两类。图像增强主要方法有直方图增强、空域滤波法、频率域滤波法以及彩色增强法等。38图像灰度变换前后效果对比图:变换前 变换后39线性灰度变换法假定原始输入图像的灰度取值范围为fmin, fmax,输出图像的灰度取值范围g

16、min, gmax,其变换公式为: 一般要求gmin fmax40直方图变换法 直方图是多种空间域处理技术的基础。直方图操作能有效地用于图像增强。灰度直方图灰度直方图是灰度值的函数,它描述了图像中各灰度值的像素个数。通常用横坐标表示像素的灰度级别,纵坐标表示对应的灰度级出现的频率(像素的个数)。频率的计算公式为: p(r)=nr nr是图像中灰度为r的像素数 。41常用的直方图是规格化和离散化的,即纵坐标用相对值表示。设图像总像素为N,某一级灰度像素数为nr,则直方图表示为: p(r)= nr /N 原始图象 对应的直方图42灰度直方图反映了一幅图像的灰度分布情况。 (a) (b)(a)大多数

17、像素灰度值取在较暗区域,图像肯定较暗.一般 在摄影过程中曝光过强就会造成这种结果。(b)图像的像素灰度值集中在亮区,图像将偏亮.一般在摄影中曝光太弱将导致这种结果。 从两幅图像的灰度分布来看图像的质量均不理想。 43443 图像编码与压缩图像编码就是利用图像信号的统计特性及人类视觉的生理学和心理学特性对图像信号进行高效编码,以解决数据量大的矛盾。图像编码的目的有三个:尽量减少表示数字图像时需要的数据量。降低数据率以减少传输带宽;压缩信息量,便于特征抽取,为识别作准备。根据解压重建后的图像和原始图像之间是否具有误差,图像编码压缩分为无误差编码和有误差编码两大类。根据编码方法作用域不同,图像编码分为空间域编码和变换域编码两大类。454 图像复原图像复原也叫图像恢复。其目的是找出图像降质的起因,并尽可能消除它,使图像恢复本来面目。常用的恢复有纠

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论