多媒体技术之压缩标准课件_第1页
多媒体技术之压缩标准课件_第2页
多媒体技术之压缩标准课件_第3页
多媒体技术之压缩标准课件_第4页
多媒体技术之压缩标准课件_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、图像、视频压缩标准Technology of Multimedia Computer1西南科技大学计算机学院软件教研室静态图象压缩标准JPEGJPEG标准的主要内容JPEG静态图象压缩算法基于DPCM的无失真编码基于DCT的有失真压缩编码基于DCT的累进操作方式编码JPEG2000简介2西南科技大学计算机学院软件教研室JPEG概述JPEG(Joint Photographic Experts Group,联合图片专家组)是ISO和CCITT联合工作委员会成立的,专门致力于静止图像压缩。JPEG是一种静止彩色图象和灰度图像(连续图像)的压缩标准,它分为两部分:详细规定了操作模式、格式转换和这些模

2、式的编码器/解码器以及实现的具体指导。描述了符合测试,可确定编码器或解码器的实现是否符合第一部分的标准细则,以便确保与遵守JPEG标准系统的互操作性。3西南科技大学计算机学院软件教研室JPEG提出的要求设计必须将图象质量控制在这样的范围:可视保真度非常高,同时编码器可以被参数化,允许用户设置压缩或质量水平。压缩标准必须可应用于实践中任何一类连续色调数字源图象,并且不受到维数、颜色、画面长宽比、类、图像或布景内容、颜色或影调范围的限制。必须是从完全无损到有损范围内都可以伸缩的,使他适应不同的存储器、CPU和显示要求。提供顺序编码。每个图象成分都以单一的从左到右、从上到下的扫描方式进行编码。4西南

3、科技大学计算机学院软件教研室JPEG提出的要求(续)必须提供渐进编码(由多次扫描得到),图像解压时,较粗糙的图像先显示,随后更多图像成分被解压并补充过来,以提供更精细的图像。必须提供分层编码(由一次扫描得到) ,图像压缩为多个分辨率水平,这样低分辨率水平可被低分辨率目标系统访问,不用解压全分辨率图像。必须提供无损压缩选项,图像在解压时能保证提供所选分辨率下的全部细节。5西南科技大学计算机学院软件教研室JPEG算法的两种方式DCT方式(非可逆编码)包含基本系统和扩展系统。可采用的算法有:顺序算法、界进算法、分层算法,根据算法可压缩比调节在10:1100:1之间空间方式(可逆编码)分为以DCT为基

4、础和以二维空间DPCM为基础两类。一般不会产生误差,采用熵编码。7西南科技大学计算机学院软件教研室JPEG标准的特点编码器和解码器参数化(用户可调节)适用任何一种连续色调的图像对硬件的要求都很低,不需要专用的DSP芯片提供了四种工作方式8西南科技大学计算机学院软件教研室基于DCT的有失真压缩编码量化器熵编码器表说明编码器源图像数据压缩图像数据8*8块FDCT表说明基于DCT的编码过程压缩图像数据逆量化器IDCT表说明解码器熵解码器表说明源图像数据8*8块解码过程10西南科技大学计算机学院软件教研室离散余弦变换首先把原始图像分割成8*8的子块采样精度为P位(二进制),把0,2P-1范围的无符号数

5、变换成-2p-1,2p-1范围的有符号数,作为离散余弦正变换(FDCT)的输入在输出端经离散余弦逆变换(IDCT)后又得到一系列8*8子块,需将数值范围-2p-1,2p-1变换回0,2P-1来重构图像。11西南科技大学计算机学院软件教研室离散余弦变换(续)8*8的FDCT的数学定义为:F(u,v)=C(u)C(v) f(x,y)*cos(2x+1)*u)/16)* cos(2y+1)*u)/16)8*8的IDCT的数学定义为:F(u,v)=C(u)C(v)f(x,y)*cos(2x+1)*u)/16)* cos(2y+1)*u)/16)x=0y=077x=0y=077其中:C(u),C(v)=

6、1/1.414当u,v=0 C(u),C(v)=1其他12西南科技大学计算机学院软件教研室DC系数的编码64个系数经量化后,F(0,0)称为DC系数(直流分量),是64个空域图像采样的平均值,它反映了每个8*8块的直流成分,不会发生剧烈的跳变。JPEG对DC系数采用DPCM(差分编码)单独传送。Blocki-1BlockiDCi-1DCiDIFF=Dci- DCi-114西南科技大学计算机学院软件教研室AC系数的行程编码其余的63个交流系数(AC)采用行程编码。从左上方AC01开始沿对角线方向“Z”字行扫描直到AC77结束,这样可增加行程中0的个数。用两个字节表示:两个非0值间连续0的个数表示

7、下一个非0值所需要的比特数下一个非0实际值743070例:对700000006进行行程编码0111001111015西南科技大学计算机学院软件教研室压缩比和图像的质量压缩效果(比特/像素)质 量0.250.500.500.750.751.51.22.0中好好很好极好与原始图像分辨不出17西南科技大学计算机学院软件教研室基于DCT的累进操作方式编码累进模式是将DCT系数按照一定的顺序进行编码和传输,达到随着解码的进展,图象逐渐清晰的效果,有下列两种累进方式频谱选择法:DCT系数被以频率高低的顺序排序,先编码和传送低频带的DCT系数,再进行高频带的编码和传输,最终达到的效果和基本算法一样逐次逼近法

8、:先发送DCT系数的最高位,接着再发送逐次的低位,使DCT系数的精度越来越高分层模式可以认为使累进传输的一种特殊情况,它是在累进阶段增加空间分辨率18西南科技大学计算机学院软件教研室JPEG2000简介随著多媒体应用领域的激增,传统JPEG压缩技术已无法满足人们对多媒体图像资料的要求。因此,更高压缩率以及更多新功能的新一代静态图像压缩技术 JPEG 2000 就诞生了。JPEG 2000 正式名称为 ISO 15444 该标准是由联合摄影专家组于1997年开始征集提案,把它作为JPEG标准的一个更新换代标准。它的目标是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗图像、电子

9、图书馆、传真、Internet网上服务和保安等方面的应用。国际标准化组织的WG1小组已于2000年8月制定了最终的国际标准化草案(The Final Draft International Standard,简称FDIS) 19西南科技大学计算机学院软件教研室JPEG2000工作原理JPEG 2000 与传统 JPEG 最大的不同,在于它放弃了 JPEG 所采用的以离散馀弦转换(Discrete Cosine Transform) 为主的区块编码方式,而改采以小波转换(Wavelet transform) 为主的多解析编码方式。小波转换的主要目的是要将图像的频率成分抽取出来。20西南科技大学计

10、算机学院软件教研室JPEG2000特征及应用高压缩率由于在离散子波变换算法中,图像可以转换成一系列可更加有效存储像素模块的“子波”,因此,JPEG2000格式的图片压缩比可在现在的JPEG基础上再提高1030,而且压缩后的图像显得更加细腻平滑,这一特征在互联网和遥感等图像传输领域有着广泛的应用。无损压缩和有损压缩JPEG2000提供无损和有损两种压缩方式,无损压缩在许多领域是必须的,例如医学图像中有时有损压缩是不能忍受的,再如图像档案中为了保存重要的信息较高的图像质量是必然的要求。同时JPEG2000提供的是嵌入式码流,允许从有损到无损的渐进解压。 21西南科技大学计算机学院软件教研室JPEG

11、2000特征及应用渐进传输现在网络上的JPEG图像下载时是按“块”传输的,因此只能一行一行地显示,而采用JPEG 2000格式的图像支持渐进传输(Progressive Transmission)。所谓的渐进传输就是先传输图像轮廓数据,然后再逐步传输其他数据来不断提高图像质量。互联网、打印机和图像文档是这一特性的主要应用场合。 感兴趣区域压缩可以指定图片上感兴趣区域(Region of Interest),然后在压缩时对这些区域指定压缩质量,或在恢复时指定某些区域的解压缩要求。这是因为子波在空间和频率域上具有局域性,要完全恢复图像中的某个局部,并不需要所有编码都被精确保留,只要对应它的一部分编

12、码没有误差就可以了。 22西南科技大学计算机学院软件教研室JPEG2000特征及应用开放的框架结构为了在不同的图像类型和应用领域优化编码系统,提供一个开放的框架结构在是必须的,在这种开放的结构中编码器只实现核心的工具算法和码流的解析,如果需要解码器可以要求数据源发送未知的工具算法。 基于内容的描述图像文档、图像索引和搜索在图像处理中是一个重要的领域,MPEG-7就是支持用户对其感兴趣的各种“资料”进行快速、有效的检索的一个国际标准4。基于内容的描述在JPEG2000中是压缩系统的特性之一。 24西南科技大学计算机学院软件教研室JPEG2000的基本框架首先对源图像数据进行离散小波变换,然后对变

13、换后的小波系数进行量化,接着对量化后的数据熵编码,最后形成输出码流。解码器是编码器的逆过程,首先对码流进行熵解码,然后解量化和小波反变换,最后生成重建图像数据。 25西南科技大学计算机学院软件教研室JPEG和JPEG2000比较27西南科技大学计算机学院软件教研室运动图像压缩标准MPEGMPEG运动图象专家组MPEG成立于1988年,旨在制定运动图象及其伴音的压缩、解压缩、处理和编码表示的国际标准,已制定MPEG-1、MPEG-2和MPEG-4MPEG-4后续版本和MPEG-7处于制定中,目前正启动MPEG-21MPEG-4是基于媒体对象的规范,它规定了媒体对象的描述、表达、组织等问题。MPE

14、G-7是针对媒体内容检索而提出的多媒体内容描述接口,它的目标是建立一套视听特征的量化标准描述器、结构以及它们相互之间的关系, 这被称为描述方案。28西南科技大学计算机学院软件教研室MPEG-1的的目标音像质量应高于可视电话,达到VHS录象机的质量可以存储在光盘、数字录音带 DAT( Digital Audio Type)、温盘(Winchester Disk)和可读写光盘上码率应符合当前计算机网络的传输率: 1 1.5 Mbps,以 1.2 Mbps 为宜可以适应多种通信网络,如LAN、ISDN等满足不对称和对称应用不对称应用指一次编码、多次解码,如电视娱乐片、电子游戏、电子出版物等,只需解码

15、器用于播放;对称应用指同时进行编码和解码,如可视电话、双向图象邮递、同时录放的电子图象编辑。29西南科技大学计算机学院软件教研室MPEG-1MPEG-1标准由下列三部分组成系统:伴音压缩数据和图象数据的复用及同步视频:视频压缩伴音:伴音压缩,有64、128和192kbps三种码率MPEG-1的特点定义了一套标准语法用于编码流的表示及解码并不限定具体的编码算法,只要求产生有效编码流支持多种图象尺寸、宽高比、信道传输率随机访问:通过I帧定位可以迅速解码任一帧快进快退:实现快速交互30西南科技大学计算机学院软件教研室MPEG-1MPEG-1的数据结构采用层次化的数据结构,分为6个层次序列sequen

16、ce:由若干图象组构成图象组(Group Of Picture)GOP:由各种类型图象组成图象picture,分为I、P、B、D四种类型,代表了各自地压缩模式切片slice:宏块的集合,主要用于误差恢复宏块macro block:和H.261中的宏块定义相同块block:88的象素矩阵,最小的DCT编码单位31西南科技大学计算机学院软件教研室MPEG视频数据流的结构 运动图像序列图片组图片图片切片宏块块像素8像素32西南科技大学计算机学院软件教研室MPEG视频数据流的结构运动序列包括一个表头,一组或多组图像和序列结束标志码图像组由一系列图像组成,可以从运动序列中随机存取图像由三部分组成:一个亮

17、度信号Y由偶数个行和偶数个列组成,色度信号U,V分别取Y信号在水平、垂直方向的1/2。33西南科技大学计算机学院软件教研室MPEG视频数据流的结构块一个8*8的亮度信息或色度信息组成宏块由一个16*16的亮度信息和两个8*8色度信息构成图像切片由一个或多个连续的宏块构成123456YUV8*88*834西南科技大学计算机学院软件教研室MPEG-1视频编码技术图像类型I图象:使用类似JPEG算法进行帧内编码,是随机访问点P图象:是最近的前一个I图像(或P图像)预测编码得到,进行向前预测B图象:可以参考其它的I图象和P图象,进行前向、后向和双向预测35西南科技大学计算机学院软件教研室运动序列流的组

18、成I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B11630每0.5秒一祯I图像1秒参照祯之间有两个B图像编码器重新排列后得到重排后的图像组序列次序为:IPBBPBB142375636西南科技大学计算机学院软件教研室运动补偿技术主要用于消除P图像和B图像在时间上的冗于。基于块的运动补偿技术就是在其参照祯中寻找符合一定条件限制、当前被预测块的最佳匹配块。找到后,有两种方法处理:一种是在恢复被测祯块时,用匹配块代替;另一种是对预测的误差采用ADTC技术编码,在恢复被预测块时,用匹配块加上预测误差。37西南科技大学计算机学院软件教

19、研室MPEG-2一种高质量的运动图象及其伴音压缩标准最初要求图象分辨率720480,与CCIR 601演播室数字电视分辨率相同传输码率410Mbps与MPEG-1兼容,发挥设备兼容能力、降低价格后来许多提案要求囊括视频通信领域的一些应用如多点电视会议、工作站窗口显示、ATM视频通信及HDTV等,支持可分级(Scalable)视频编解码,因此最终覆盖了240Mbps的许多应用,导致MPEG-3的制定中途取消。38西南科技大学计算机学院软件教研室MPEG-2的类和级MPEG-2划分了5个类简单类(Simple Profile):除了没有B帧外与主类相同主类(Main Profile):不可分级,质

20、量尽可能地好SNR可分级类(SNR Scalable Profile):信噪比可分级空间可分级类(Spatially Scalable Profile):空间分辨率可分级高类(High Profile):支持4:2:2、4:4:4及全部的可分级性39西南科技大学计算机学院软件教研室MPEG-2的类和级4个级别低级(Low Level):对应H.261 CIF或MPEG-1 SIF。主级(Main Level):对应常规电视。高级-1440(High-1440 Level):对应HDTV-1440。高级(High Level):对应HDTV-1920。40西南科技大学计算机学院软件教研室MPEG

21、-2的类和级类与级的有效组合共有11种等级/类简单类主类SNR可分级类空间可分级类高类低级352288MPLLSNRLL主级720576SPMLMPMLSNRMLHPML高级144014401152MPH1440SSPH1440HPH1440高级19201152MPHLHPHL41西南科技大学计算机学院软件教研室MPEG-4目标制定一个基于内容/对象(Content /Object Based)的、高效的(Efficient)、灵活的(Flexible)、通用的(Universal)、可分级/伸缩的(Scalable)、可扩展的(Extensible)视频编码标准通过定制(Customizat

22、ion)便于特定应用充分利用现有的乃至未来的技术。一个重要特色是支持Internet上对音视信息有效的传输和灵活的操作。42西南科技大学计算机学院软件教研室MPEG-4的功能内容交互的功能基于内容的多媒体访问(Access)基于内容的操作、比特流编辑(Bit Stream Editing)自然/合成混合编码( SNHC: Synthetic & Natural Hybrid Coding)完善的时域访问(Temporal Access)压缩的功能高效编码:形状、纹理与运动多同步流编码(Multiple Concurrent Stream Coding)通用的访问功能健壮性(Robust)基于内容的可分级/伸缩(Scalable)43西南科技大学计算机学院软件教研室MPEG-4的应用基于Interne

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论