第8章-数字图像压缩编码_第1页
第8章-数字图像压缩编码_第2页
第8章-数字图像压缩编码_第3页
第8章-数字图像压缩编码_第4页
第8章-数字图像压缩编码_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体通信北京科技大学杨扬第8章图像压缩编码图像数据压缩基础图像压缩编码算法静态图像压缩标准动态图像压缩标准H.26X标准1、图像数据压缩基础色彩的基本概念彩色空间及其变换图像数据压缩的可能性1.1色彩的基本概念从人的视觉系统看,色彩可用色调、饱和度和亮度来描述。人眼看到的任一彩色光都是这三个特性的综合效果,这三个特性可以说是色彩的三要素。其中:色调与光波的波长有直接关系;亮度和饱和度与光波的幅度有关。1.1色彩的基本概念—色调绘画中要求有固定的色彩感觉,有统一的色调,否则难以表现画面的情调和主题。例如我们说一幅画具红色调,是指它在色彩上总体偏红。计算机在图像处理上采用数字化,可以非常精确地表现色彩的变化,色调是相对连续变化的。用一个圆环来表现色谱的变化,就构成了一个色彩连续变化的色环。1.1色彩的基本概念—亮度亮度可以说是指各种纯正的色彩相互比较所产生的明暗差别。在纯正光谱中,黄色的明度最高,显得最亮;其次是橙、绿;再其次是红、蓝;紫色明度最低,显得最暗。1.1色彩的基本概念—饱和度饱和度是指颜色色调的表现程度。饱和度越高,色彩越艳丽、越鲜明突出,越能发挥其色彩的固有特性。但饱和度高的色彩容易让人感到单调刺眼。饱和度低,色感比较柔和协调,可混色太杂则容易让人感觉浑浊,色调显得灰暗。对于同一色调的彩色光,饱和度越深,颜色越鲜明或说越纯,相反则越淡。1.1色彩的基本概念视觉系统对颜色和亮度的响应特性1.1色彩的基本概念—图像深度与色彩类型图像深度是指位图中记录每个像素点所占的位数,它决定了彩色图像中可出现的最多颜色数,或者灰度图像中的最大灰度等级数。

每个像素点的图像深度的分配还与图像所用的色彩空间有关。以最常用的RGB色彩空间为例,图像深度与色彩的映射关系主要有真彩色、伪彩色和调配色。1.1色彩的基本概念—图像深度与色彩类型真彩色(true-color)是指图像中的每个像素值都分成R、G、B三个基色分量,每个基色分量直接决定其基色的强度,这样产生的色彩称为真彩色。例如图像深度为24,用R:G:B=8:8:8来表示色彩,则R、G、B各占用8位来表示各自基色分量的强度,每个基色分量的强度等级为28=256种。图像可容纳224=16M种色彩。这样得到的色彩可以反映原图的真实色彩,故称真彩色。1.1色彩的基本概念—图像深度与色彩类型伪彩色(pseudo-color)图像的每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表CLUT(ColorLook-UpTable)中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。用这种方式产生的色彩本身是真的,不过它不一定反映原图的色彩。在VGA显示系统中,调色板就相当于色彩查找表。从16色标准VGA调色板的定义可以看出这种伪彩色的工作方式。1.1色彩的基本概念—图像深度与色彩类型调配色(direct-color)的获取是通过每个像素点的R、G、B分量分别作为单独的索引值进行变换,经相应的色彩变换表找出各自的基色强度,用变换后的R、G、B强度值产生的色彩。1.2图像编码概述能够对多媒体数据进行压缩编码的前提是因为数据存在大量的冗余,尤其是声音和图像。数据压缩的目的就是尽可能消除这些冗余。冗余一般分以下几类:统计冗余(空间冗余和时间冗余)信息熵冗余结构冗余知识冗余视觉冗余1.2图像编码概述—统计冗余图像数据存在大量的统计特征的重复,这种重复包括静态单帧图像数据在空间上的冗余和音频、视频数据在时间上的冗余。

在动态图像序列中,前后两帧图像之间具有较大的相关性,表现出帧与帧之间的重复,因而存在时间冗余。1.2图像编码概述—信息熵冗余信息熵定义为一组数据所表示的信息量,即

式中,E为信息熵,N为数据的种类(或称码元)个数,pi为第i个码元出现的概率。一组数据的数据量显然等于各记录码元的二进制位数(即编码长度)与该码元出现的概率乘积之和,即

式中,D为数据量,为第i个码元的二进制位数。一般取b0=b1=…bN-1(如ASCII编码把所有码元都编码为7比特),这样得到的D必然大于E。这种因码元编码长度的不经济带来的冗余称为信息熵冗余或编码冗余。1.2图像编码概述—结构冗余有些图像从大面积上或整体上看存在着重复出现的相同或相近的纹理结构,例如布纹图像和草席图像,被称为结构冗余。1.2图像编码概述—知识冗余有许多图像的理解与图像所表现内容的基础知识(先验或背景知识)有相当大的相关性,从这种知识出发可以归纳出图像的某种规律性变化,这类冗余称为知识冗余。知识冗余的一个典型例子是对人像的理解,比如,鼻子上方有眼睛,鼻子又在嘴的上方等。1.2图像编码概述—视觉冗余人类的视觉系统实际上只在一定程度上对图像的变化产生敏感,即图像数据中存在着大量人类视觉觉察不到的细节。事实上,人类视觉系统的一般分辨力为64灰度级,而一般图像量化采用的是256灰度级,这类冗余称为视觉冗余。1.2图像编码概述—几种常见应用的码率1.3图像编码的方法根据编码过程中是否存在信息损耗可将图像编码分为有损压缩和无损压缩。无损压缩无信息损失,解压缩时能够从压缩数据精确地恢复原始图像;有损压缩不能精确重建原始图像,存在一定程度的失真。根据编码原理可以将图像编码分为熵编码、预测编码、变换编码和混合编码等。1.3图像编码的方法(1)熵编码。熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码。熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码方法有行程编码(RunLengthEncoding)、哈夫曼编码和算术编码。1.3图像编码的方法(2)预测编码。预测编码是基于图像数据的空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。预测编码可分为帧内预测和帧间预测,常用的预测编码有差分脉码调制(DifferentialPulseCodeModulation,DPCM)和运动补偿法。1.3图像编码的方法(3)变换编码。变换编码通常是将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。图像变换本身并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码就可以有效地压缩图像。(4)混合编码。混合编码是指综合了熵编码、变换编码或预测编码的编码方法,如JPEG标准和MPEG标准。1.3图像编码的方法根据对压缩编码后的图像进行重建的准确程度,可将常用的图像编码方法分为三类:(1)信息保持编码:也称无失真编码,它要求在编解码过程中保证图像信息不丢失,从而可以完整地重建图像。信息保持编码的压缩比较低,一般不超过3:1,主要应用在图像的数字存储方面,常用于医学图像编码中。1.3图像编码的方法(2)保真度编码:主要利用人眼的视觉特性,在允许的失真(Lossy)条件下或一定的保真度准则下,最大限度地压缩图像。保真度编码可以实现较大的压缩比,主要用于数字电视技术、静止图像通信、娱乐等方面。对于这些图像,过高的空间分辨率和过多的灰度层次,不仅增加了数据量,而且人眼也接收不到。因此在编码过程中,可以丢掉一些人眼不敏感的信息,在保证一定的视觉效果条件下提高压缩比。

1.3图像编码的方法(3)特征提取:在图像识别、分析和分类等技术中,往往并不需要全部图像信息,而只要对感兴趣的部分特征信息进行编码即可压缩数据。例如,对遥感图像进行农作物分类时,就只需对用于区别农作物与非农作物,以及农作物类别之间的特征进行编码,而可以忽略道路、河流、建筑物等其他背景信息。1.4图像编码的新技术图像编码已经发展了几十年,人们不断提出新的压缩方法。如,利用人工神经网络(ArtificialNeuralNetwork,ANN)的压缩编码、分形编码(FractalCoding)、小波编码(WaveletCoding)、基于对象的压缩编码(ObjectBasedCoding)和基于模型的压缩编码(ModelBasedCoding)等等1.4图像编码的新技术1)分形编码分形编码是在波兰美籍数学家B.B.Mandelbrot建立的分形几何理论的基础上发展起来的一种编码方法。分形编码最大限度地利用了图像在空间域上的自相似性(即局部与整体之间存在某种相似性),通过消除图像的几何冗余来压缩数据。M.Barnsley将迭代函数系统(IterateFunctionSystem,IFS)用于描述图像的自相似性,并将其用于图像编码,对某些特定图像获得了10000:1的压缩比。分形编码过程十分复杂,而解码过程却很简单,故通常用于对图像编码一次,而需译码多次的信息传播应用中。1.4图像编码的新技术

2)小波编码1989年,S.G.Mallat首次将小波变换用于图像编码。经过小波变换后的图像,具有良好的空间方向选择性,而且是多分辨率的,能够保持原图像在各种分辨率下的精细结构,与人的视觉特性十分吻合。1.4图像编码的新技术3)模型编码模型编码是近几年发展起来的一种很有前途的低比特率编码方法,其基本出发点是在编、解码两端分别建立起相同的模型,编码时利用先验模型抽取图像中的主要信息并用模型参数的形式表示,解码时则利用所接收的模型参数重建图像。1.4图像编码评价随着众多图像压缩算法的出现,如何评价图像压缩算法就成为重要的课题。一般说来,评价图像压缩算法的优劣主要有以下4个参数。

1)算法的编码效率算法的编码效率通常有几种表现形式:平均码字长度(R),图像的压缩比(rate,r),每秒钟所需的传输比特数(bitspersecond,bps),图像熵与平均码长之比(η),这些表现形式很容易相互转换。下面给出与图像编码效率有关的几个定义。1.4图像编码评价

设一幅灰度级为N的图像,图像中第k级灰度出现的概率为Pk,图像大小为Nx×Ny,每个像素用d比特表示,每两帧图像间隔Δt,则按信息论中信息熵的定义,数字图像的熵H由下式定义:

由此可见,图像熵H表示各灰度级比特数的统计平均值。1.4图像编码评价对于一种图像编码方法,设第k级灰度的码字长度为Bk,则该图像的平均码字长度R为

1.4图像编码评价于是,可定义编码效率η为每秒钟所需的传输比特数bps为1.4图像编码评价

压缩比r为

由于同一压缩算法对不同图像的编码效率会有所不同,因此常需定义一些“标准图像”,如国际上流行的三幅图像Lena、Barbara和Mandrill。一般通过测量不同压缩算法对同一组“标准图像”的编码性能来评价各图像压缩算法的编码效率。1.4图像编码评价

2)编码图像的质量图像质量评价可分为客观质量评价和主观质量评价。最常用的客观质量评价指标是均方误差(MSE)和峰值信噪比(PSNR),其定义如下:

1.4图像编码评价

主观质量评价是指由一批观察者对编码图像进行观察并打分,然后综合所有人的评判结果,给出图像的质量评价。客观质量评价能够快速有效地评价编码图像的质量,但符合客观质量评价指标的图像不一定具有较好的主观质量。主观质量评价能够与人的视觉效果相匹配,但其评判过程缓慢费时。1.4图像编码评价

3)算法的适用范围特定的图像编码算法具有其相应的适用范围,并不对所有图像都有效。一般说来,大多数基于图像信息统计特性的压缩算法具有较广的适用范围,而一些特定的编码算法的适用范围较窄,如分形编码主要用于自相似性高的图像。1.4图像编码评价

4)算法的复杂度算法的复杂度即指完成图像压缩和解压缩所需的运算量和硬件实现该算法的难易程度。优秀的压缩算法要求有较高的压缩比,压缩和解压缩快,算法简单,易于硬件实现,还要求解压缩后的图像质量较好。选用编码方法时一定要考虑图像信源本身的统计特性、多媒体系统(硬件和软件产品)的适应能力、应用环境以及技术标准。2.1图像压缩编码算法—行程长度编码把一系列的重复值(例如图像象素的灰度值)用一个单独的值再加上一个计数值来取代。

比如有这样一个字母序列aabbbccccccccdddddd它的行程长度编码就是2a3b8c6d。

很多位图文件格式都用行程长度编码,例如TIFF,PCX。2.1图像压缩编码算法—行程长度编码例如:有一线状图像,其灰度随长度坐标的关系如下图所示。描述这个一维图像可以用顺序的七个3bit的二进制数表示:011,011,011,011,101,101,101,共21比特。

如果用行程编码方法对其编码,其编码就变成了100,011;011,101,共用了12比特,比前一种编码节约了9个比特。2.2图像压缩编码算法—哈夫曼编码

基本思路:出现频率越高的符号,对应的编码长度越短编码步骤如下:统计信源符号出现的概率;将信源符号按概率递减顺序排列;

把两个最小的概率值加起来,作为一个新组合符号的概率;重复步骤(2)、(3),直到概率和达到1为止;在每次合并信源时,将合并的信源分别标记“1”和“0”(例如,概率小的标记为“1”,概率大的标记为“0”);寻找从每一信源符号到概率为1的路径,记录下路径上的“1”和“0”;对每一符号写出“1”和“0”序列;2.2图像压缩编码算法—哈夫曼编码考虑信源:进行哈夫曼编码的过程如下:编码前:平均码长为3编码后:平均码长为2.45压缩比:2.45/32.2图像压缩编码算法—哈夫曼编码哈夫曼编码的不足:它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就会大打折扣,甚至根本达不到压缩的效果。因此哈夫曼编码通常要经过两遍操作,第一遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。另外由于各种长度的编码的译码过程也比较复杂,因此解压缩的过程也比较慢。它对于位的增删比较敏感。

2.2图像压缩编码算法—辞典编码辞典编码是一种通用编码技术,属于无损压缩技术。—辞典编码的思想辞典编码的根据是数据本身包含的重复代码,如文本文件和光栅图像就具有这种特性。辞典编码归纳起来有两类。第一类辞典编码的想法是:查找压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串代替重复的部分,它的输出仅仅是指向早期出现过的字符串的“指针”。2.2图像压缩编码算法—辞典编码第二类算法的思想是,从输入的数据中创建一个“短语辞典”,编码数据过程中,遇到已经在辞典中出现的“短语”时,编码器就输出这个词典中该短语的“索引号”,而不是短语本身。J.Ziv和A.Lempel在1978年首次发表了介绍这种编码的文章,在他们研究的基础上,TerryA.Weltch在1984年发表了改进这种编码算法的文章,因此这种编码方法称为LZW压缩编码。2.3图像压缩编码算法—LZW编码LZW(Lempel-Ziv&Welch)编码又称字串表编码,属于一种无损编码,是Welch将Lempel和Ziv所提出的无损压缩技术改进后的压缩方法。LZW编码的基本思想是:在编码过程中,将所遇到的字符串建立一个字符串表,表中的每个字符串都对应一个索引,编码时用该字符串在字串表中的索引来代替原始的数据串。2.3图像压缩编码算法—LZW编码例如,一幅8位的灰度图像,我们可以采用12位来表示每个字符串的索引,前256个索引用于对应可能出现的256种灰度,由此可建立一个初始的字符串表,而剩余的3840个索引就可分配给在压缩过程中出现的新字符串,这样就生成了一个完整的字符串表,压缩数据就可以只保存它在字符串表中的索引,从而达到压缩数据的目的。字符串表是在压缩过程中动态生成的,不必将它保存在压缩文件里,因为解压缩时字符串表可以由压缩文件中的信息重新生成。2.4图像压缩编码算法—算术编码算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。2.4图像压缩编码算法—算术编码算法举例假设信源符号为{00,01,10,11},这些符号的概率分别为{0.1,0.4,0.2,0.3},根据这些概率可把间隔[0,1)分成4个子间隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二进制消息序列的输入为:10001100101101算术编码过程如下页图所示:2.4图像压缩编码算法—算术编码3、静态图像压缩标准JPEGJPEG20003、静态图像压缩标准JPEG是国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)关于静止图像编码的联合专家组(JointPhotographicExpertsGroup)名称的缩写。该标准可用于自然景象或任何连续色调图像的数字数据的压缩编码和解码。对于数字化精度为每种彩色分量每个样点4至16比特的数字图像有良好的压缩效果,但不适用于二值图像。3、静态图像压缩标准JPEG标准综合了多年来图像压缩编码的研究成果,是一种集大成的算法。该标准规定了两种工作方式,即顺序方式和渐进方式;还规定了三种级别的编码算法,即基本系统(Baselinesystem)、扩展系统(Extendedsystem)和无失真系统(Losslesscoding)。3.1JPEGJPEG是面向静态图像编码的国际标准。在相同图像质量条件下,JPEG文件拥有比其他图像文件格式更高的压缩比。JPEG目前被广泛应用于多媒体和网络程序中,是现今万维网中使用最广泛的两种图像文件格式之一。JPEG是一种有损压缩,即在压缩过程中会丢失数据,每次编辑JPEG图像后,图像就会被重复压缩一次,损失就会有所增加。3.1JPEG顺序(Sequential)方式:从左到右、从上到下对图像顺序进行基于离散余弦变换(DCT)的编码。DCT理论上是可逆的,但在计算时存在误差,因而基于DCT的编码模式是一种有损编码。3.1JPEG渐进方式(Progressivemode):整个图像首先以一种低于最终质量要求的质量标准(如分辨率或数据精度)进行编码,完成后再以较上次高一级的质量要求再进行一次编码,但仅传送为改善质量所需增加的那部分信息。这种过程可以重复若干次直至达到所需的最终质量要求。每个子过程中的编码则还是顺序方式的。3.1JPEG---基本系统以离散余弦变换为核心,采用顺序工作方式,适用于一般精度(每种分量每个样点8比特)的图像,有良好的压缩效果,压缩比可调。标准规定,每个JPEG静止图像压缩编解码器都必须具有实现基本系统的功能。3.1JPEG---基本系统流程基本系统3.1JPEG---基本系统流程通过离散余弦变换减少图像数据的相关性;利用人眼视觉特性对系数进行自适应量化;对每个子块量化后的系数矩阵进行Z形扫描,将系数矩阵变换成符号序列;用哈夫曼变长码对符号进行熵编码。3.1JPEG---基本系统流程Z形扫描3.1JPEG---渐近方式渐进方式的基本实现有三种方式(1)频谱选择法,即按Z形扫描的序号将DCT量化序数分成几个频段,每个频段对应一次扫描,每块均先传送低频扫描数据,得到原图概貌,再依次传送高频扫描数据,使图像逐渐清晰;(2)逐次逼近法,即每次扫描全部DCT量化序数,但每次的表示精度逐渐提高。(3)阶梯方式,图像以数种分辨率来压缩,其目的是为了让具有高分辨率的图像也可以在较低分辨率的设备上显示。3.1JPEG---压缩效果采用JPEG算法所能达到的压缩效果,与被压缩图像的特性有关。对于在开发和测试本算法标准时所用的那些内容是彩色自然景物和人像的测试图片,压缩到0.15比特/像素时,图像可识别;0.25比特/像素时,解码后的图像可评价为“有用(usefulimage)”;约0.75比特/像素时,被认为是“极佳(verygood)”;大约1.5比特/像素时基本上与原图像无法区别。用无失真算法对这些测试图片进行压缩编码,大致可以得到2:1的压缩比。3.2JPEG2000JPEG2000的核心JPEG2000的优势JPEG2000的应用3.2JPEG2000---核心放弃了JPEG所采用的以离散余弦变换算法为主的区块编码方式,而改用以离散小波变换算法为主的多解析编码方式。JPEG2000还将彩色静态画面采用的JPEG编码方式、2值图像采用的JBIG(JointBinaryImageGroup)编码方式及低压缩率采用JPEGLS统一起来,成为对应各种图像的通用编码方式。3.2JPEG2000---优势高压缩率无损压缩渐进传输感兴趣区域压缩3.2JPEG2000---应用目前,支持JPEG2000的软件已经出现,如LuraWaveSmartCompressFreewareforWindows为ACDSee3.0提供JPEG2000LWF格式的外挂插件,这样只要安置了这个插件就可以观看和制作采用JPEG2000编码的LWF格式文件。在不久的将来,JPEG2000无论是在传统的JPEG市场(如数码相机、扫描仪等)还是在新兴应用领域(如网路传输、无线通讯、医疗影像等)都将大有用武之地。4、动态图像压缩标准MPEG是运动图像专家组(MotionPictureExpertsGroup)的缩写,是国际标准化组织中IEC/JTC1/SC2/WG11的一个小组。MPEG下分三个小组:视频组(MPEG-Video)的任务是研究压缩传输速度上限为1.5Mbps的视频信号;音频组(MPEG-Audio)的任务是研究压缩每信道64、128和192Kbps的数字音频信号;系统组(MPEG-System)则解决多道压缩视频、音频位流的同步及合成问题。

MPEG委员会的工作始于1988年,1990年制订出标准草案。两年中MPEG工作参加单位由15家发展到150家。MPEG工作一开始就兼顾JPEG标准,CCITT的H.261标准,支持这两个标准的优秀成果。4、动态图像压缩标准MPEG标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图象的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。4、动态图像压缩标准MPEG-1标准于1992年正式出版,标准的编号为ISO/IEC11172,其标题为“码率约为1.5Mb/s用于数字存贮媒体活动图象及其伴音的编码”。MPEG-2标准于1994年公布,包括编号为13818-1系统部分、编号为13818-2的视频部分、编号为13818-3的音频部分及编号为13818-4的符合性测试部分。该标准希望囊括数字电视、图象通信各领域的编码标准。MPEG-4是基于内容的压缩编码标准。MPEG-7是“多媒体内容描述接口标准”。MPEG-21是有关多媒体框架的协议。4.1MPEG-1标准MPEG-1标准叫作“运动图像和伴随声音的编码—用于速率约在1.5Mb/s以下的数字存储媒体”,主要用于多媒体存储与再现,如VCD等。

MPEG-1采用CIF视频格式(分辨率为352×288),帧速率为25帧/秒或30帧/秒,码率为1.5Mb/s(其中视频约1.2Mb/s,音频约0.3Mb/s)。

MPEG-1将视频图像序列划分为I帧、P帧和B帧

标准草案于1991年11月完成,1992年11月正式通过。4.1MPEG-1标准MPEG-1由五个部分组成:MPEG-1Systems,规定电视图像数据、声音数据及其它相关数据的同步MPEG-1Video,规定视频数据的编码和解码,MPEG-1Audio,规定音频数据的编码和解码MPEG-1Conformancetesting,详细说明如何测试比特数据流(bitstreams)和解码器是否满足MPEG-1前3个部分(Part1,2和3)中所规定的要求MPEG-1Softwaresimulation4.2MPEG-2标准MPEG-2标准的基本算法也是运动补偿的预测和带有DCT的帧间内变长编码与MPEG-1的主要区别在于:

能够有效地支持电视的隔行扫描格式

支持可分级的可调视频编码,这适用于需要同时提供多种质量的视频业务的情况

根据MPEG-2的标准CCIR601格式(702×576×25帧)的信号可压缩到4Mb/s~6Mb/s,而HDTV格式(1280×720×60帧)的信号可压缩到20Mb/s左右。4.2MPEG-2标准---组成(1)MPEG-2Systems,规定电视图像数据、声音数据及其它相关数据的同步(2)MPEG-2Video,规定视频数据的编码和解码

(3)MPEG-2Audio,规定声音数据的编码和解码,是MPEG-1Audio的扩充,支持多个声道

(4)MPEG-2Conformancetesting4.2MPEG-2标准---组成(5)MPEG-2Softwaresimulation(6)MPEG-2数字存储媒体命令和控制扩展协议

(7)MPEG-2先进声音编码(MPEG-2AAC),是多声道声音编码算法标准

(8)MPEG-2系统解码器实时接口扩展标准

(9)MPEG-2DSM-CC一致性扩展测试

4.3MPEG-4标准MPEG-4于1998年10月定案,在1999年1月成为一个国际性标准,随后为扩展用途又进行了第二版的开发,于1999年底结束,其正式名称为ISO14496-2,是为了满足交互式多媒体应用而制定的新一代国际标准,具有更高的灵活性和可扩展性。MPEG-4主要应用于可视电话、视频邮件和电子新闻等,对传输速率要求较低,在4800bps~64000bps之间。4.3MPEG-4标准利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最小的数据获得最佳的图像质量。基于内容的压缩、更高的压缩比和时空可伸缩性,是MPEG-4最重要的三个技术特征。

MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。4.4MPEG-7标准国际标准化组织(ISO)在制定MPEG-1、MPEG-2及MPEG-4的标准基础上,推出了新的标准MPEG-7,该标准的正式名称为“多媒体内容描述接口”(MultimediaContentDescriptionInterface),其目标是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求。它既不同于基于波形和基于压缩的表示方式如MPEG-1和MPEG-2,又不同于基于对象的表示方式如MPEG-4,而是将对各种不同类型的多媒体信息进行标准化描述,并将该描述与所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论