版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、11. 简介简介Motion Picture Experts Group运动图象专家组,运动图象专家组,ISO领导下的一个小组,自领导下的一个小组,自1988年开始研究,年开始研究,1990年提年提出和建立了一个出和建立了一个MPEG标准草案,标准草案,1991年底提出用于数字存储介质的位率年底提出用于数字存储介质的位率为为1.5Mbps的运动图象及其伴音的压缩编码方案。这个方案于的运动图象及其伴音的压缩编码方案。这个方案于1992年正式年正式通过,通常称为通过,通常称为MPEG标准,此后定名为标准,此后定名为MPEG-I 标准。标准。1993年年11月,又通过了另外一个建议,定名为月,又通过
2、了另外一个建议,定名为 MPEG II标准。标准。之后,之后,MPEG小组有推出来几个后续的标准,其中较为著名的是小组有推出来几个后续的标准,其中较为著名的是MPEG 4, MPEG 7,两个标准。,两个标准。21. 简介简介MPEG标准文件的创建过程和其他的标准文件的创建过程和其他的ISO标准文件一样,有一个较长的过程。标准文件一样,有一个较长的过程。(1)工作文件(工作文件(Working Draft):由工作组提出):由工作组提出(2)委员会草案(委员会草案(Committee Draft):从工作组准备好的工作文件中):从工作组准备好的工作文件中提升上来的文件。这是提升上来的文件。这是
3、ISO文档的最初形式,它由文档的最初形式,它由ISO内部正式调查研究投内部正式调查研究投票决定。票决定。(3)国际标准草案(国际标准草案(Draft International Standard):投票成员国对):投票成员国对委员会草案的内容和说明满意之后由委员会草案提升上来的文件。委员会草案的内容和说明满意之后由委员会草案提升上来的文件。(4)国际标准(国际标准(International Standard)。)。ISO标准化组织最后出版标准化组织最后出版和发布的文件。和发布的文件。标准的推出一般都有一个较漫长的过程,需要考虑和现有系统的融合等。标准的推出一般都有一个较漫长的过程,需要考虑和
4、现有系统的融合等。31. 简介简介MPEG 压缩:压缩:多媒体数据中信息的冗余可能是由以下一些原因造成的:多媒体数据中信息的冗余可能是由以下一些原因造成的:空间冗余:空间上占据位置,但不载有有效信息;空间冗余:空间上占据位置,但不载有有效信息;时间冗余:动态媒体信息,视频,音频等和时间相关的媒体信时间冗余:动态媒体信息,视频,音频等和时间相关的媒体信息,不同时刻的信息内容相同或相似;息,不同时刻的信息内容相同或相似;编码冗余:不合理的编码;编码冗余:不合理的编码;结构冗余:如对称的内容;结构冗余:如对称的内容;MPEG系列的压缩算法中,是如何去除这些冗余的?系列的压缩算法中,是如何去除这些冗余
5、的?42. MPEG -1MPEG1的标准号为的标准号为ISO/IEC 11172,名称为,名称为“信息技术信息技术用于数据速用于数据速率大约高达率大约高达1.5Mbps的数字存储媒体的电视图像和伴音信号编码。的数字存储媒体的电视图像和伴音信号编码。”(Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1.5M b/s)。 2.1 简介简介52. MPEG -1MPEG标准是一种通用标准,能支持广泛的应用,标准以一种标准是一
6、种通用标准,能支持广泛的应用,标准以一种“组合工具组合工具”的方式建立。的方式建立。标准分为标准分为5个部分:个部分:& MPEG1系统:规定电视图像数据、声音数据及其他相关数据的同步;系统:规定电视图像数据、声音数据及其他相关数据的同步;& MPEG1电视图像:规定电视数据的编码和解码;电视图像:规定电视数据的编码和解码;& MPEG1声音:规定声音数据的编码和解码;声音:规定声音数据的编码和解码;& MPEG一致性测试:在这个标准中说明了如何测试位数据流和解码器一致性测试:在这个标准中说明了如何测试位数据流和解码器是否满足是否满足MPEG1前三个部分中所规定的要求;前三个部分中所规定的要求
7、;& MPEG1软件模拟:这部分的内容不是一个标准,而是一个技术报告,软件模拟:这部分的内容不是一个标准,而是一个技术报告,给出了用软件执行标准前给出了用软件执行标准前3部分的结果。部分的结果。2.1 简介简介62. MPEG -1除了视频和音频压缩以外,标准还涉及回放时的一些有关问题,包括:除了视频和音频压缩以外,标准还涉及回放时的一些有关问题,包括:随机访问:随机访问:用户能索引信息并能随机地访问它们。用户能索引信息并能随机地访问它们。VCR模式:模式:VCR模式包括了模式包括了VCR上一些典型的控制功能,如播放、快进、倒带、正上一些典型的控制功能,如播放、快进、倒带、正向搜索和倒带搜索。
8、虽然模式很简单,但一些操作,如快进等要求比较高,例如快向搜索和倒带搜索。虽然模式很简单,但一些操作,如快进等要求比较高,例如快进搜索以及更为复杂的倒带搜索要求在正向或逆向方向中都能极快速地解压缩和回进搜索以及更为复杂的倒带搜索要求在正向或逆向方向中都能极快速地解压缩和回放,所有这些必须在不损失音频视频同步性的情况下进行。放,所有这些必须在不损失音频视频同步性的情况下进行。音频视频同步:音频视频同步:当信号朝正向运动时,是音频和视频通道同步并不太复杂,但在当信号朝正向运动时,是音频和视频通道同步并不太复杂,但在快进搜索和倒带搜索要求的高速同步就复杂得多。快进搜索和倒带搜索要求的高速同步就复杂得多
9、。MPEG标准试图在所有环境下保标准试图在所有环境下保持同步而定义接口和工具。持同步而定义接口和工具。可编辑性:可编辑性:剪切并粘贴音频和视频剪辑是剪切并粘贴音频和视频剪辑是MPEG标准中很重要的一个考虑。标准中很重要的一个考虑。2.1 简介简介72. MPEG -1MPEG视频压缩标准提供了两种基本方法:视频压缩标准提供了两种基本方法:&基于离散变换的压缩可用于减小空间冗余度;基于离散变换的压缩可用于减小空间冗余度;&基于块的运动补偿用于减少时间冗余度。运动补偿压缩是基于块的运动补偿用于减少时间冗余度。运动补偿压缩是MPEG的关键的关键特点。特点。具体的做法:采用帧内图象数据压缩和帧间图象数
10、据压缩技术。具体的做法:采用帧内图象数据压缩和帧间图象数据压缩技术。 MPEG专专家组定义了三种图像:帧内图像家组定义了三种图像:帧内图像I(intra),预测图像,预测图像P(predicted )和双向预和双向预测图像测图像B(bidirectionally interpolated )2.1 简介简介82. MPEG -12.1 简介简介92. MPEG -1帧内图像帧内图像I的压缩编码算法算法:与的压缩编码算法算法:与JPEG压缩算法大致相同,去除帧内图压缩算法大致相同,去除帧内图像的空间冗余。像的空间冗余。不用以任何图片为参考就可以对这种类型的帧编码。帧内图片可以放在序不用以任何图片
11、为参考就可以对这种类型的帧编码。帧内图片可以放在序列中的任何位置,并可用于对序列的随机访问。帧内图片由于是独立编码列中的任何位置,并可用于对序列的随机访问。帧内图片由于是独立编码的,所以它的压缩率相对来说要小一些。的,所以它的压缩率相对来说要小一些。2.2 MPEG1视频压缩视频压缩2.2.1 帧内压缩算法帧内压缩算法10112. MPEG -1运动补偿:一种预测技术。假设当前图片是前面图片的某种平移,当某帧运动补偿:一种预测技术。假设当前图片是前面图片的某种平移,当某帧图片被作为参考帧时,当前编码的帧和参考帧相比只是由于摄像机的移动图片被作为参考帧时,当前编码的帧和参考帧相比只是由于摄像机的
12、移动造成两者的不同。造成两者的不同。预测图片:预测图片分为两种,单向预测图片预测图片:预测图片分为两种,单向预测图片P和双向预测图片和双向预测图片B。预测图。预测图片的编码要参考以前的图片,被参考的图片可以是帧内图片也可以是单向片的编码要参考以前的图片,被参考的图片可以是帧内图片也可以是单向预测图片。双向预测图片永远也不能作为参考图片。预测图片。双向预测图片永远也不能作为参考图片。我们通常把帧内图片和单向预测图片成为锚图片。我们通常把帧内图片和单向预测图片成为锚图片。2.2 MPEG1视频压缩视频压缩2.2.2 帧间压缩算法帧间压缩算法运动补偿运动补偿162. MPEG -1单向预测图片单向预
13、测图片P(这里简称为(这里简称为P帧)的编码方法:帧)的编码方法:对某一个对某一个P帧进行编码时,在它之前(可以是相邻的也可以不相邻)的帧内帧进行编码时,在它之前(可以是相邻的也可以不相邻)的帧内图片或单向预测图片就作为参考,图片或单向预测图片就作为参考,P帧对照着参考图片进行编码,提高帧对照着参考图片进行编码,提高P帧帧压缩率的方法我们称为运动补偿。编码后,预测图像压缩率的方法我们称为运动补偿。编码后,预测图像P使用两种类型的参数使用两种类型的参数来表示:来表示:一种是当前要编码的图像块与参考图像的块之间的差值;一种是当前要编码的图像块与参考图像的块之间的差值;另一种参数是块的移动矢量。另一
14、种参数是块的移动矢量。编码方法:对每一块(一般来说编码方法:对每一块(一般来说1616象素),到参考帧中去寻找最佳匹象素),到参考帧中去寻找最佳匹配的块。找到这个块以后,算法如下所示。配的块。找到这个块以后,算法如下所示。2.2 MPEG1视频压缩视频压缩2.2.2 帧间压缩算法帧间压缩算法运动补偿运动补偿17182. MPEG -12.2 MPEG1视频压缩视频压缩2.2.2 帧间压缩算法帧间压缩算法运动补偿运动补偿192. MPEG -1块匹配法(块匹配法(Block Matching Algorithm)需要解决两个关键问题:)需要解决两个关键问题:(1)匹配准则:均方误差,平均绝对帧差
15、等)匹配准则:均方误差,平均绝对帧差等(2)搜索算法:)搜索算法:2.2 MPEG1视频压缩视频压缩2.2.2 帧间压缩算法帧间压缩算法运动补偿运动补偿202. MPEG -1双向预测图片双向预测图片 B(这里简称为(这里简称为B帧)的编码方法:帧)的编码方法:双向预测图片通过对前面和后面的锚图片的运动补偿方法来编码。双向预测图片通过对前面和后面的锚图片的运动补偿方法来编码。运用双向预测块可以有效预测不清楚的背景,即过去没有出现,将来会出运用双向预测块可以有效预测不清楚的背景,即过去没有出现,将来会出现的当前图像区域。双向运测在两个方面增加了预测估计的复杂性。首先,现的当前图像区域。双向运测在
16、两个方面增加了预测估计的复杂性。首先,它要在两个不同的锚图片之间进行两次运动估计。另外,锚图片可能由多它要在两个不同的锚图片之间进行两次运动估计。另外,锚图片可能由多个图像隔开,我们要在更大的运动估计范围中跟踪物体。个图像隔开,我们要在更大的运动估计范围中跟踪物体。2.2 MPEG1视频压缩视频压缩2.2.2 帧间压缩算法帧间压缩算法运动补偿运动补偿21222. MPEG -1MPEG编码器算法允许选择编码器算法允许选择I图像的频率和位置。图像的频率和位置。I图像、图像、P图像和图像和B图像数目的选择依据主要是节目的内容。图像数目的选择依据主要是节目的内容。例如,对于快速运动的图像,例如,对于
17、快速运动的图像,I图像的频率可以选择高一些,图像的频率可以选择高一些,B图像的数目图像的数目可以选择少一点;对于满速运动的图像可以选择少一点;对于满速运动的图像I图像的频率可以低一点,而图像的频率可以低一点,而B图像图像的数目可以选择多一点。此外,在实际应用中还要考虑媒体的速率。的数目可以选择多一点。此外,在实际应用中还要考虑媒体的速率。I帧帧(又称内码帧又称内码帧)的作用:随机访问,正向、逆向的快速访问的作用:随机访问,正向、逆向的快速访问2.2 MPEG1视频压缩视频压缩2.2.3 帧的编排序列帧的编排序列233. MPEG -2MPEG-2可以看成是可以看成是MPEG-1的扩充,因为它们
18、的基本编码算法是相同的,的扩充,因为它们的基本编码算法是相同的,MPEG-2增加了隔行扫描电视的编码,提供了位速率的可变性能等功能。增加了隔行扫描电视的编码,提供了位速率的可变性能等功能。MPEG-2要达到的目标是:速率为要达到的目标是:速率为49Mb/s,最高达,最高达15Mb/s。标准号:标准号:ISO/IEC 13818,标准名称:(标准名称:(Information technology-Generic coding of moving pictures and associated audio information).信息技术:电视图像和伴信息技术:电视图像和伴音信息的通用编码。音
19、信息的通用编码。3.1 MPEG-2简介简介24MPEG2 在视频部分的扩充是定义了电视图像的各种规格。以适应不同在视频部分的扩充是定义了电视图像的各种规格。以适应不同的应用。的应用。MPEG2在音频方面定义了两种声音数据压缩格式:在音频方面定义了两种声音数据压缩格式:& 一种在标准中称为一种在标准中称为MPEG2 Audio,是以,是以MPEG-1Audio兼容的,又兼容的,又称为称为MPEG-2 BC(backward compatible)。& 另一种称为另一种称为MPEG2 AAC(Advanced Audio Coding),它与,它与MPEG1声音格式不兼容。声音格式不兼容。3.
20、MPEG -23.1 MPEG-2简介简介253. MPEG -2MPEG-2 Audio和和MPEG1标准都使用相同种类的编译码器,层标准都使用相同种类的编译码器,层1,层,层2,层,层3的结构也相同。的结构也相同。 MPEG2声音标准和声音标准和MPEG1标准相比,标准相比,MPEG2做了如下扩充:做了如下扩充:&增加了采样频率;增加了采样频率;&扩展了编码器的输出速率范围;扩展了编码器的输出速率范围;&增加了声道数,支持增加了声道数,支持5.1声道和声道和7.1声道的环绕声;声道的环绕声;&MPEG2 还支持还支持Linear PCM(线性线性PCM)和和Dolby AC3 编码。编码。
21、3.2 MPEG-2音频音频263. MPEG -2MPEG2Audio的的“5.1环绕声环绕声”也称为也称为“3/2立体声加立体声加LFE”,其中的,其中的“.1”就是指就是指LFE声道。左、中、右、两个环绕、声道。左、中、右、两个环绕、LFE(low frequency effects,低频音效)。低频音效)。3.2 MPEG-2音频音频2728293. MPEG - 2MPEG2 AAC是是MPEG2标准中的一种非常灵活动声音感知编码标准。标准中的一种非常灵活动声音感知编码标准。MPEG2AAC主要使用听觉系统的屏蔽特性来减少声音的数据量,并且通主要使用听觉系统的屏蔽特性来减少声音的数据
22、量,并且通过把量化噪声分散到各个子带中,减少噪声的影响。过把量化噪声分散到各个子带中,减少噪声的影响。ACC提供更广泛的支持,支持的频率可从提供更广泛的支持,支持的频率可从8KHz到到96kHz,AAC编码器的音编码器的音源可以是单声道的、立体声的和多声道的声音。源可以是单声道的、立体声的和多声道的声音。MPEG2AAC提供很高的压缩率,与提供很高的压缩率,与MPEG1 的的layer3相比,在质量相相比,在质量相同的条件下,数据率是它的同的条件下,数据率是它的70%左右。左右。3.2 MPEG-2音频音频304. MPEG - 4一种低速度音频、视频编码标准。一种低速度音频、视频编码标准。名
23、称:名称: very-low-bit-rate audio visual coding。极低速率视听编码。极低速率视听编码。MPEG-4 与与 前两个前两个MPEG压缩算法最基本的区别在于,压缩算法最基本的区别在于,MPEG-4是基于内是基于内容的压缩编码方法。为了达到在低速率的环境工作,容的压缩编码方法。为了达到在低速率的环境工作,MPEG4引入了基于引入了基于对象的表达方式,对象的表达方式,object-based representation。MPEG-4 Video算法的核心是支持内容基算法的核心是支持内容基(content-based)的编码和解码功的编码和解码功能,也就是对场景中使
24、用分割算法抽取的单独的物理对象进行编码和解码。能,也就是对场景中使用分割算法抽取的单独的物理对象进行编码和解码。MPEG-4 Video还提供管理这些电视内容的最基本方法。还提供管理这些电视内容的最基本方法。4.1 MPEG-4简介简介314. MPEG - 4MPEG4标准是对一幅图像按内容切分块,如图像的场景,画面上的物体标准是对一幅图像按内容切分块,如图像的场景,画面上的物体(物体(物体1,物体,物体2),被分割成不同的子块,将感兴趣的物体从场景中),被分割成不同的子块,将感兴趣的物体从场景中截取出来,进行编码处理。截取出来,进行编码处理。子块的起始位置和子块的大小,取决于所截取物体的形
25、状和尺寸。子块的起始位置和子块的大小,取决于所截取物体的形状和尺寸。基于内容或物体截取的子块内信息相关性强,可以产生高压缩比的效果。基于内容或物体截取的子块内信息相关性强,可以产生高压缩比的效果。4.1 MPEG-4简介简介324. MPEG - 44.1 MPEG-4简介简介334. MPEG - 44.1 MPEG-4简介简介34MPEG-1, MPEG 2 不关心帧中图象的整体内容,只是将其划分成子块。不关心帧中图象的整体内容,只是将其划分成子块。而而MPEG-4标准是对一帧中的图象按内容分开,分成块。标准是对一帧中的图象按内容分开,分成块。MPEG4,将感兴趣的物体从场景中截取出来,以
26、后的操作就针对这些物,将感兴趣的物体从场景中截取出来,以后的操作就针对这些物体来进行。体来进行。为了将感兴趣的物体从场景中截取出来,引入了视频物体,视频物体平面为了将感兴趣的物体从场景中截取出来,引入了视频物体,视频物体平面等概念来实现基于内容的表示。等概念来实现基于内容的表示。视频对象(视频对象(VO): Video Object,视频对象区(视频对象区(VOP): Video Object Plane4. MPEG - 44.1 MPEG-4简介简介35VO的选择依赖于具体应用和系统实际所处的环境,若不关心内容,的选择依赖于具体应用和系统实际所处的环境,若不关心内容,VO可可以是一个矩形框
27、,这样的话,和以是一个矩形框,这样的话,和MPEG-1,MPEG-2兼容。对于要求较高的兼容。对于要求较高的应用,可以使场景中的物体,实现基于物体的编码。应用,可以使场景中的物体,实现基于物体的编码。4. MPEG - 44.2 VO和和VOP 36当当VO被定义为场景中被截取出来的不同物体时,每个被定义为场景中被截取出来的不同物体时,每个VO有三类信息来描有三类信息来描述:述:运动信息,形状信息,纹理信息。运动信息,形状信息,纹理信息。也就是说,也就是说,MPEG4标准的视频编码是针对这三种信息的编码技术。标准的视频编码是针对这三种信息的编码技术。 4. MPEG - 44.2 VO和和VO
28、P 37第一步:第一步:VO的形成。先要从原始的视频流中分割出的形成。先要从原始的视频流中分割出VO。第二步:编码。对各个第二步:编码。对各个VO分别独立的编码,即包括分别独立的编码,即包括VO的三类信息,(运的三类信息,(运动信息,形状信息,纹理信息)分别编码,分配不同码字。动信息,形状信息,纹理信息)分别编码,分配不同码字。第三步:复合。将各个第三步:复合。将各个VO的码流复合成一个符合的码流复合成一个符合MPEG-4标准的位流。标准的位流。在编码和复合阶段可以加入用户的交互控制或由智能化算法进行控制。在编码和复合阶段可以加入用户的交互控制或由智能化算法进行控制。MPEG4标准提供灵活的框
29、架和开放的工具集,它通过工具集和句法描述标准提供灵活的框架和开放的工具集,它通过工具集和句法描述语言不同的组合,支持功能的不同组合。语言不同的组合,支持功能的不同组合。4. MPEG - 44.3 编码方法编码方法 38VO是场景中的某个物体,它由时间上连续的帧画面序列构成。是场景中的某个物体,它由时间上连续的帧画面序列构成。VOP是某一是某一时刻某一帧画面的时刻某一帧画面的VO,VOP编码即针对某一时刻该帧画面编码即针对某一时刻该帧画面VO的形状、的形状、运动、纹理等三类信息进行编码。运动、纹理等三类信息进行编码。4. MPEG - 44.4 基于基于VOP的编码的编码39形状编码形状编码V
30、OP是一个不规则的形状。表示是一个不规则的形状。表示VOP的形状可用二值图表示,或者用灰度的形状可用二值图表示,或者用灰度图表示。图表示。如果采用一位表示,约定如果采用一位表示,约定0表示非表示非VOP区域,也就是背景,区域,也就是背景,1表示表示VOP区域。区域。对于用灰度图表示的对于用灰度图表示的VOP形状,形状,0表示非表示非VOP区域,区域,1255表示表示VOP区区域,以灰度表示域,以灰度表示VOP形状时,物体与背景的边界轮廓线比二值表示方式形状时,物体与背景的边界轮廓线比二值表示方式要柔和。要柔和。4. MPEG - 44.4 基于基于VOP的编码的编码40形状编码形状编码MPEG
31、-4标准形状编码方法是用位图法,标准形状编码方法是用位图法,VOP被一个边框框注,边框长、被一个边框框注,边框长、宽均为宽均为16的整数倍,同时保证边框最小。位图表示法实际上就是一个边的整数倍,同时保证边框最小。位图表示法实际上就是一个边框矩阵,矩阵元素为框矩阵,矩阵元素为0255(或(或0,1),编码变为对这个矩阵的编码,),编码变为对这个矩阵的编码,边界信息包含在边界信息包含在1616的形状块中。的形状块中。4. MPEG - 44.4 基于基于VOP的编码的编码41运动编码:运动估计和运动补偿运动编码:运动估计和运动补偿MPEG4标准中的标准中的VOP运动估计和运动补偿与以前的压缩标准一
32、样。类似运动估计和运动补偿与以前的压缩标准一样。类似于以前的压缩标准的三种帧格式:于以前的压缩标准的三种帧格式:I(帧内)帧,(帧内)帧,P(预测)帧,(预测)帧,B(双向预(双向预测帧)帧,测帧)帧,MPEG4中也有相应的帧格式,中也有相应的帧格式,IVOP,PVOP,BVOP,一表示运动补偿类型的不同。一表示运动补偿类型的不同。4. MPEG - 44.4 基于基于VOP的编码的编码42纹理编码纹理编码纹理信息有两种,可能是内部编码的纹理信息有两种,可能是内部编码的I-VOP的象素值,也可能是帧间编码的的象素值,也可能是帧间编码的P-VOP,B-VOP的运动估计残差值。为了达到简单,高性能
33、,容错性好的目的运动估计残差值。为了达到简单,高性能,容错性好的目的,仍采用基于分块的纹理编码。的,仍采用基于分块的纹理编码。VOP边框仍被分成边框仍被分成1616的宏块,宏块的宏块,宏块由由88的子块构成。对每一个宏块,可以分成的子块构成。对每一个宏块,可以分成3种情况:种情况:VOP外,边框内的块:不编码;外,边框内的块:不编码;VOP内的块:传统内的块:传统DCT方法编码;方法编码;部分在部分在VOP内,部分在内,部分在VOP外的块,目前使用的方法是采用重复填充的方外的块,目前使用的方法是采用重复填充的方法将该块在法将该块在VOP外的部分进行填充,再用外的部分进行填充,再用DCT编码。这
34、样是为了增加块内编码。这样是为了增加块内数据的空域相关性从而利于数据的空域相关性从而利于DCT变换和量化后的编码。变换和量化后的编码。4. MPEG - 44.4 基于基于VOP的编码的编码43最大的特点,基于内容的交互性:最大的特点,基于内容的交互性:1基于内容的多媒体数据访问工具:通过使用各种访问工具,基于内容的多媒体数据访问工具:通过使用各种访问工具,MPEG4提供基于音像内容的数据访问,例如:索引查询等。提供基于音像内容的数据访问,例如:索引查询等。2基于内容的处理和比特流编辑:基于内容的处理和比特流编辑:MPEG4提供提供“MPEG4句法描句法描述语言述语言”和编码模式,以支持基于内
35、容的处理和比特流编辑,且不需要和编码模式,以支持基于内容的处理和比特流编辑,且不需要代码转换。这个特点使得它的应用领域得到很大的增加,例如,数字特代码转换。这个特点使得它的应用领域得到很大的增加,例如,数字特技(对某些物体进行特殊的处理)。技(对某些物体进行特殊的处理)。3改进的时间随机访问:改进的时间随机访问:MPEG4提供一种有效的方法,可以在有提供一种有效的方法,可以在有限的时间内,且以较高的分辨率,随机访问视频序列的部分内容。包括限的时间内,且以较高的分辨率,随机访问视频序列的部分内容。包括在很低的比特率下的随机访问。在很低的比特率下的随机访问。4. MPEG - 44.5 MPEG4
36、视频编码方法的应用视频编码方法的应用44微软的微软的ASF(Advanced Streaming format)格式,采用的就是)格式,采用的就是MPEG4算法思算法思想。想。ASF:微软公司为了和现在的:微软公司为了和现在的 Real player 竞争而发展出来的一种可以直接在网上竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。观看视频节目的文件压缩格式。4. MPEG - 44.5 MPEG4视频编码方法的应用视频编码方法的应用45DivX 视频编码技术是一种基于视频编码技术是一种基于MPEG4标准的数位编码标准的数位编码/解码系统,利用解码系统,利用MPEG-4视视频格式
37、与频格式与MP3音频格式结合而成的。它由美国音频格式结合而成的。它由美国DivXNetworks公司研制开发,它公司研制开发,它是为了打破是为了打破 ASF的种种协定而发展出来的,同时对的种种协定而发展出来的,同时对 DVD 造成一定威胁。造成一定威胁。DivX 的优势:的优势:& 视频质量好视频质量好& 数据量小数据量小& 伴音质量好伴音质量好4. MPEG - 44.5 MPEG4视频编码方法的应用视频编码方法的应用46MPEG-4 Audio标准可集成从话音到高质量的多通道声音,从自然声音到标准可集成从话音到高质量的多通道声音,从自然声音到合成声音。合成声音。编码方法还包括参数编码编码方
38、法还包括参数编码(parametric coding),码激励线性预测,码激励线性预测(code excited linear predictive,CELP)编码,时间编码,时间/频率频率T/F(time/frequency)编码,结构化声音编码,结构化声音SA(structured audio)编码和文本编码和文本-语音语音TTS(text-to-speech)系统的合成声音等。系统的合成声音等。 4. MPEG - 44.6 MPEG4音频音频47越来越多的声像信息以数字形式存储和传输,这为人们更灵活地使用这些越来越多的声像信息以数字形式存储和传输,这为人们更灵活地使用这些信息提供了可能
39、性。信息提供了可能性。但随之而来的问题:随着网络上信息爆炸性的增长,获取到我们感兴趣的但随之而来的问题:随着网络上信息爆炸性的增长,获取到我们感兴趣的信息,难度越来越大。传统的基于关键字或文件名的检索方法显然不适于信息,难度越来越大。传统的基于关键字或文件名的检索方法显然不适于数据量庞大,又不具有固定结构特征的声像数据。需要基于内容的检索。数据量庞大,又不具有固定结构特征的声像数据。需要基于内容的检索。5. MPEG - 75.1 产生背景产生背景48实现基于内容的检索的一个关键性的步骤:要定义一种描述声像信息内容实现基于内容的检索的一个关键性的步骤:要定义一种描述声像信息内容的格式,而这与声
40、像信息的存储形式(或者说是编码方式)又是密切相关的格式,而这与声像信息的存储形式(或者说是编码方式)又是密切相关的。的。国际标准化组织国际标准化组织ISO/IEC领导下的运动图像专家组领导下的运动图像专家组MPEG,在推出影响极大,在推出影响极大的的MPEG1,MPEG2,MPEG4之后,又制定了支持多媒体信息基于之后,又制定了支持多媒体信息基于内容检索的编码方案:内容检索的编码方案:MPEG-7。5. MPEG - 75.1 产生背景产生背景49MPEG7的正式名称:的正式名称:“多媒体内容描述接口多媒体内容描述接口”。其目标:。其目标:& 它将为各种类型的多媒体信息规定一种标准化的描述它将
41、为各种类型的多媒体信息规定一种标准化的描述& MPEG-7并不针对某种特殊的应用,相反它的标准化的要素将支持尽可能广泛的并不针对某种特殊的应用,相反它的标准化的要素将支持尽可能广泛的应用应用& MPEG7希望将标准化的描述加到任何类型的多媒体资料上。希望将标准化的描述加到任何类型的多媒体资料上。& MPEG-7标准允许对一个事物的描述有不同的细节层次。标准允许对一个事物的描述有不同的细节层次。 5. MPEG - 75.2 MPEG7的目标的目标50MPEG7 中中“描述描述”是依赖于应用的。不同用户、不同应用所使用的描述是依赖于应用的。不同用户、不同应用所使用的描述是不同的。也就是说,同一材
42、料可以使用不同类型的特征进行描述。例如:是不同的。也就是说,同一材料可以使用不同类型的特征进行描述。例如:& 视频材料的低级抽象是它的视频材料的低级抽象是它的shape, size, texture, colour, movement (trajectory) and position (where in the scene can the object be found?)等的描述等的描述. & 音频材料的低级抽象是它的音频材料的低级抽象是它的key, mood, tempo, tempo changes, position in sound space等的描述;等的描述;& 而高级的描述也
43、许是给出语义信息如而高级的描述也许是给出语义信息如: This is a scene with a barking brown dog on the left and a blue ball that falls down on the right, with the sound of passing cars in the background. 5. MPEG - 75.2 MPEG7的目标的目标51MPEG7的优势:的优势:& 达到了更高的抽象层次:达到了更高的抽象层次:& MPEG-7能独立于其他能独立于其他MPEG标准来使用标准来使用& MPEG-7标准可以用于提高先前标准可以用于提
44、高先前MPEG系列标准的功能系列标准的功能5. MPEG - 75.2 MPEG7的目标的目标52名称:名称:“Multimedia Framework”。MPEG21标准正是致力于在大范围标准正是致力于在大范围的网络上实现透明的传输和对多媒体资源的充分利用。的网络上实现透明的传输和对多媒体资源的充分利用。 产生背景:产生背景:&对于不同网络之间用户的互通问题,至今仍没有成熟的解决方案。对于不同网络之间用户的互通问题,至今仍没有成熟的解决方案。&所有所有“内容提供商(内容提供商(content creator)”都有共同的关注目标:内容的都有共同的关注目标:内容的管理、版权的保护、对非授权接入
45、和修改防范以及对于提供商和使用者隐管理、版权的保护、对非授权接入和修改防范以及对于提供商和使用者隐私的保护。私的保护。6. MPEG - 216.1 背景背景53MPEG21是一个可互操作和高度自动化的框架,而且这个框架还考虑到是一个可互操作和高度自动化的框架,而且这个框架还考虑到了了DRM(digital rights management)的要求、对象化的多媒体接入以及)的要求、对象化的多媒体接入以及使用不同网络和终端进行传输等问题。使用不同网络和终端进行传输等问题。6. MPEG - 216.1 背景背景541.DRM(digital rights management) 如果不能对系统
46、进行认真规划,那么实现网际互操作的愿望将与保护版权如果不能对系统进行认真规划,那么实现网际互操作的愿望将与保护版权拥有者的权力相冲突。实际上,如果它们使用非标准化保护机制的话,拥有者的权力相冲突。实际上,如果它们使用非标准化保护机制的话,DRM系统将难以实现网际的互操作目标。因此,一个开放的多媒体结构对系统将难以实现网际的互操作目标。因此,一个开放的多媒体结构对于在于在DRM系统中实现更多的网际互操作是至关重要的。系统中实现更多的网际互操作是至关重要的。 6. MPEG - 216.1 背景背景552.不同类型的终端和网络不同类型的终端和网络 接入到不同类型网络的需求变得愈来愈普遍;另外,终端
47、处于不同的位置接入到不同类型网络的需求变得愈来愈普遍;另外,终端处于不同的位置和不同的环境中,对于移动性也有越来越高的要求。终端和网络的不同性和不同的环境中,对于移动性也有越来越高的要求。终端和网络的不同性质使得内容提供商和服务提供商很难保证信息能在这样复杂的环境中传输。质使得内容提供商和服务提供商很难保证信息能在这样复杂的环境中传输。 6. MPEG - 216.1 背景背景563.MPEG21景象(景象(MPEG21 Vision) MPEG21致力于为多媒体传输和使用定义一个标准化的开放框架。这种致力于为多媒体传输和使用定义一个标准化的开放框架。这种框架将在开放的市场中为内容提供商和业务
48、提供商创造同等的机会。同时,框架将在开放的市场中为内容提供商和业务提供商创造同等的机会。同时,这将在一种互操作的模式下为用户提供更丰富的信息,用户将因此而受益。这将在一种互操作的模式下为用户提供更丰富的信息,用户将因此而受益。 MPEG21景象可以总结如下:一个多媒体框架,它可以在广阔的范围里,景象可以总结如下:一个多媒体框架,它可以在广阔的范围里,为不同的网络用户提供透明的和可不断扩展的多媒体资源。为不同的网络用户提供透明的和可不断扩展的多媒体资源。 6. MPEG - 216.1 背景背景57MPEG21基于两个基本概念:分布和处理基本单元基于两个基本概念:分布和处理基本单元DI(the
49、Digital Item)以及以及DI与用户间的互操作。与用户间的互操作。 MPEG21也可表述为:以一种高效、透明和可互操作的方式支持用户交也可表述为:以一种高效、透明和可互操作的方式支持用户交换、接入、使用甚至操作换、接入、使用甚至操作DI的技术。的技术。 6. MPEG - 216.2 规范规范58(1)DI DI是是MPEG-21框架中,一个具有标准表示、身份认证和相关元数据的数字框架中,一个具有标准表示、身份认证和相关元数据的数字对象。这个实体是框架中分布和处理的基本单元。对象。这个实体是框架中分布和处理的基本单元。 为定义为定义DI,MPEG-21描述了一系列抽象术语和概念以形成一
50、个实用的模型。描述了一系列抽象术语和概念以形成一个实用的模型。这些模型的目的是尽可能的灵活和通用,同时提供尽可能多的功能。这些模型的目的是尽可能的灵活和通用,同时提供尽可能多的功能。 6. MPEG - 216.2 规范规范59(2)用户用户 在在MPEG21中,一个用户是指与中,一个用户是指与MPEG21进行环境交互或者使用进行环境交互或者使用DI的的任何实体。这些用户包括个人、消费者、社团、组织、公司和政府部门。任何实体。这些用户包括个人、消费者、社团、组织、公司和政府部门。从单纯技术的角度来说,从单纯技术的角度来说,MPEG21认为认为“内容提供商内容提供商”和和“使用者使用者(cons
51、umer)”之间没有分别之间没有分别他们都是用户。一个单独的实体可以他们都是用户。一个单独的实体可以以几种方式使用网络的内容,同时所有这些与以几种方式使用网络的内容,同时所有这些与MPEG21交互的实体都被交互的实体都被平等对待。然而,一个用户可以根据与之交互的其他用户的不同来承担特平等对待。然而,一个用户可以根据与之交互的其他用户的不同来承担特定的角色,发挥不同的作用。在最基本的层次上,定的角色,发挥不同的作用。在最基本的层次上,MPEG21可以被看成可以被看成是提供用户间交互的一个框架。是提供用户间交互的一个框架。 6. MPEG - 216.2 规范规范60当前当前MPEG21标准的组成
52、部分标准的组成部分 第一部分:景象、技术和策略(第一部分:景象、技术和策略(Vision,Technologies,and Strategy) MPEG21的第一部分在的第一部分在2001年年9月正式被批准。它主要提供了框架的定月正式被批准。它主要提供了框架的定义并介绍了用户和义并介绍了用户和DI的概念。的概念。 第一部分的题目第一部分的题目“景象、技术和策略景象、技术和策略”用于反映该技术标准的根本目的。用于反映该技术标准的根本目的。 6. MPEG - 216.2 规范规范61第二部分:(第二部分:(DID)Digital Item Declaration DI包括视频、音频、文本和图形等
53、媒体源。对于所有包括视频、音频、文本和图形等媒体源。对于所有MPEG21系统来说,系统来说,DI的确切含义都是很重要的。但要想为的确切含义都是很重要的。但要想为DI定义一个精确的定义,同时满足定义一个精确的定义,同时满足如此众多的文件格式的要求,将是十分困难的。如此众多的文件格式的要求,将是十分困难的。 第三部分:(第三部分:(DII)Digital Item Identification DII以标准化的形式来描述特定地点中与之相关的以标准化的形式来描述特定地点中与之相关的DI、容器、器件和片断等。、容器、器件和片断等。在在MPEG21的框架中的框架中DI通过将统一的源标识符(通过将统一的源
54、标识符(URIUniform Resource Identifiers)压缩成标识元素来进行区分。)压缩成标识元素来进行区分。 6. MPEG - 216.2 规范规范62第四部分:第四部分:IPMP(Intellectual Property Management and Protection) MPEG21的第四部分为的第四部分为IPMP定义了一个互操作的框架。此部分包括从远定义了一个互操作的框架。此部分包括从远程位置重新获得程位置重新获得IPMP工具以及在工具以及在IPMP工具之间、工具之间、IPMP和终端之间交换信和终端之间交换信息的标准方法。它提出了息的标准方法。它提出了IPMP工具的认证,同时实现了权力数据字典工具的认证,同时实现了权力数据字典(Rights Data Dictionary)和权力表达语言()和权力表达语言(Rights Expression Language)二者的集成。)二者的集成。 6. MPEG -
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 延安大学西安创新学院《心理学》2021-2022学年第一学期期末试卷
- 烟台理工学院《移动互联网开发技术》2022-2023学年第一学期期末试卷
- 烟台大学《二维、三维CAD(SoDorks)》2021-2022学年第一学期期末试卷
- 年度工作计划的制定要点
- 面对职场变动的应对策略计划
- 餐饮店装修合同三篇
- 艺术教育的评估与反馈机制计划
- 总结前台工作中的创新案例计划
- 八年级上册英语单词鲁教版
- 设定班级学习目标的有效方法计划
- 岭南版小学五年级上册美术教案全册
- 2024新人教版七年级上册英语期中作文预测及范文
- 《实践是检验真理的唯一标准》名师教学课件
- 15建设美丽中国【中职专用】高一思想政治《中国特色社会主义》(高教版2023基础模块)
- 低空经济与市场趋势研究报告
- 国家开放大学电大《会计信息系统》期末终考题库及标准参考答案
- 2024-2024学年第一学期小学教育集团化办学工作总结
- 《中国心力衰竭诊断和治疗指南2024》解读
- 2024儿童青少年抑郁治疗与康复痛点调研报告
- 《人工智能基础》课件-6.人类与人工智能如何和平相处
- 3.15 秦汉时期的科技与文化 课件 2024-2025学年七年级历史上学期
评论
0/150
提交评论