基于MPEG-4数字视频压缩技术_第1页
基于MPEG-4数字视频压缩技术_第2页
基于MPEG-4数字视频压缩技术_第3页
基于MPEG-4数字视频压缩技术_第4页
基于MPEG-4数字视频压缩技术_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 基于mpeg-4的数字视频压缩技术研究mpeg-4除了针对一定比特率下的音频、视频码外,它还更加侧重于多媒体系统的灵活性以及交互性,mpeg-4对于传输的速率要求不高,所需的带宽也很窄,它的数据的压缩和传输都是利用帧重建技术来实现的,因此可以利用最少的数据获取最好的图像质量。本文就对mpeg-4的数字视频压缩技术做出研究。mpeg-4 数字视频 压缩技术一、mpeg-4的构成1.dmif。dmif为多媒体传送框架,其主要作用是解决广播环境、磁盘应用以及交互网络中的应用多媒体的操作问题,其服务器端与客户端的传输和接口是利用传输多路合成比特信息建立的。借助于dmif,mpeg-4就能建立一个可以

2、面向每个基本流的带宽,以及一个有特殊品质服务的信道。2.数据平面。mpeg-4的数据平面共有两个部分,即媒体关系以及传输关系。为了保证在同一场景中同时出现av对象以及基本流,mpeg-4引用了smt(流图桌面)以及od(对象描述)的概念。和特殊av对象有关的基本流信息流图通过对象描述传输,而smt则把一个cat与每个流相连接,利用cat实现流图的传输。3.实时识别与缓冲区管理.sdmmpeg-4所定义的一个系统解码模式,其所描述的是一种解码装置,是一种比较理想的处理比特流句法语义的装置,它要求特殊的实时模式以及缓冲区。4.音频编码。mpeg-4最大的优点就是它不但支持自然声,还支持各程合成声音

3、。mpeg-4的音频部分把自然声编码与音频合成编码进行结合,而且支持音频对象特征。5.视频编码。和音频编码一样,mpeg-4也支持自然视觉对象与合成视觉对象的编码,一般2d和3d动画以及人的面部表情等都属于合成视觉对象。6.景描述。在mpeg-4中,有一系列的工具用于组成场景的一组对象。场景描述就是由其中必要的合成信息组成,这些场景描述的格式通常以二进制格式bifs来表示,它和av对象一起编码和传输。场景描述的作用主要是描述av有在具体的av场景坐标下,怎样组织和同步等。二、mpeg-4的主要编码结构1.形状信息编码。形状信息编码是第一次被纳入视频编码标准。mpeg-4中的编码形状信息有两种,

4、即灰度形状信息以及二值状信息。其中二值形状信息指的是编码的vop形状采用的是0,1的方法来表示,0代表非vop形状区域,1代表vop区域。而灰度形状信息是指vop的透视程度采用0到255间的数据表示,其中0与二值形信息的0相同,也是代表非vop形状区域,而255则与二值形状信息的1相同,代表不透明区域,1-255等数字所代表的是不同透明程度的形状区域。灰度形状信息可以表现透视物体,当前景物体与背景相叠加时,边界不会太明显,经过“模糊”处理就可以减少混迭的现象。把vop用一个16*16整数倍的边框框住,并在框内再分多个长宽为16的宏块,就可以用边框矩阵表示vop,取值0,1或者0-255,vop

5、形状信息编码即可转换为边框矩阵编码。2.运动信息编码。mpeg-4利用运动预测以及运动补偿除去视频帧间时间冗余,这种运动信息编码技术从某种意义上来说,也可以看做是现有标准向任意形状vop的延伸。mpeg-4中的运动补偿和运动预测可以基于8*8的像素宏块,也能基于16*16的像素宏块。mpeg-4还引入了多边形匹配以及图像填充等技术,来更好地适应任意形状vop。可以利用传统基于块的运动预测以及补偿技术,对标准宏块进行运动预测和运动补偿。对于在vop边界轮廓宏块,就要利用灰度值对轮廓宏块中边界以外的像素进行填充,即图像填充技术,再利用多边形匹配进行运动预测及运动补偿。具体来说,图像填充技术是由ov

6、p内部像素值推出外部像素值,从而获取运动估计的参考值。多边形定义出轮廓宏块内处于vop内部的部分,将vop外部的像素排除。运动预测只是针对多边形所定义的、处于vop活动区域内的像素。把当前宏块和找到的最佳匹配块运动矢量(运动偏移)以及残差(匹配误差)进行传输,当做运动补偿时,把该匹配误差和运动偏移和经过重构的预测帧相加,就可以得出当前帧的重构帧,这个过程大幅度减少了信息传输量,从而实现有效压缩的作用。3.纹理编码。视频的纹理信息通常用两个色差成分cb、cr以及亮度y来表示。帧内环境中纹理信息直接包括色差和亮度成分,而在运动补偿情况下纹理信息则表示运动补偿后的匹配误差。不管理帧内编码模式还是帧间

7、编码模式,或者运动补偿后的残差,都可以作为纹理编码的对象。其编码方法一般还是利用8*8像素宏块的dct方法。处于帧内编码模式时,如果像素块完全处于vop内,可以采取经典dct方法,如果像素块位于vop之外则不用进行编码,如果像素块一部分在vop外另外一部在vop内部,则可以先利用图像填充获得vop外的像素值,然后进行dct编码。帧内编码模式还能实现对dct变换的ac因子以及dc进行预测的作用。帧间编码模式下如果要预测p-vop以及b-vop的运动补偿,可以把处于vop活跃区域外部的像素值设定为128。另外,vop内像素的编码还可以采取sadct方法来进行,这种方法在相同码率的情况下可以获取相对

8、高质量的编码,不过有较高的复杂度。dct因子经过变换和填充手还要进行扫描、量化和变长编码。三、mpeg-4的功能和特点1.基于内容的交互性。基于内容的码流编辑不用编码就能进行基于内容的比特流编辑及其它操作,用户可以在比特流或者图像中选择一个具体对象,然后改变其某些特性。合成数据以及自然数据的混合编码可以把自然视频图像与合成数据进行有效的结合,并且支持交互操作。时间域随即存取增强后可以提供随机存取的方法,在一定的时间间隔,按照任意形状的对象,对音、视频序列随机存取。2.高压缩率。在可比拟的速率下,mpeg-4所提供的主观视频与现有的标准相比,其质量明显要好,mpeg-4压缩标准大大的提高了编码的

9、效率。mpeg-4可以提供对同一景物进行有效的多视角编码,再加上视听同步以及多伴音声道编码,能同时对多个并发数据流进行编码。3.通用存取。mpeg-4还有在容易发生错误环境下的抗错性,以提高其抗误码的能力,特别是对于容易发生错误的低比特应用。之所以说基于内容的尺度可变性的mpeg-4的核心性能,是因为如果确定了图像中包括对象的优先级以及目标后,其它的功能相对容易实现。尺度可变性实现了自适应使用可用资源的作用,因此在甚低比特率应用中是一个非常关键的因素。参考文献:1尤会明,mpeg-4杰.mpeg-4视频编码分析m,武汉理工大学学报,2005(27).2钟玉琢,王琪,贺文玉.基于对象的多媒体数据压缩编码标准mpeg-4及其校验模型m.北

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论