版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
视频压缩编码数据压缩编码已经有很长的历史。压缩编码的理论基础是信息论。从信息的角度来看,压缩就是去除数据中的冗余。即保留不确定的信息,去除确定的信息(即可推知的信息),用一种更接近信息本质的描述来代替原有冗余的描述。视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压缩比一般指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像,因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处,但是运动的视频还有其自身的特性,因此在压缩时还应考虑其运动特性才能达到高压缩的目标。在视频压缩中常需用到以下的一些基本概念:一、有损和无损压缩:在视频压缩中有损(Lossy)和无损(Lossless)的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据率与压缩比有关,压缩比越大,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。二、帧内和帧间压缩:帧内(Intraframe)压缩也称为空间压缩(Spatialcompression)。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。采用帧间(Interframe)压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩(Temporalcompression),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值(Framedifferencing)算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。三、对称和不对称编码:对称性(symmetric)是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,而后再播放,因此可以采用不对称(asymmetric)编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要10多分钟的时间,而该片断实时回放时间只有三分钟。视频压缩编码标准主要由ITU-T和ISO/IEC开发。前者已经发布了视频会议标准H.261、H.262、H.263,并且准备进行远期编码标准H.263L的开发,以期望获得更大的编码效率。ISO/IEC的标准系列是大家熟悉的MPEG家族。包括:(1)MPEG-1(1988~1992),可以提供最高达1.5Mbps的数字视频,只支持逐行扫描。MPEG-1是ISO开发的第一个视频压缩算法。主要应用是数字媒体上动态图像与音频的存储与检索,如速率为1.15Mbps、采用SIF分辨率(352*240*29.97或者352*288*25)的VCD。MPEG-1与H.261相似,不过编码器一般需要更高的性能,以便支持电影内容的较高运动性而不是典型的可视电话功能。与H.261相比,MPEG1允许采用B帧。另外它还采用自适应感知量化,也就是说,对每个频段采用单独的量化比例因子(或等步长),以便优化人们的视觉感受。MPEG-1仅支持逐行视频,因此新标准MPEG-2已经开始做出努力,同时支持分辨率及比特率更高的逐行与隔行视频。(2)MPEG-2(1990~1994),支持的带宽范围从2Mbps到超过20Mbps,MPEG-2后向兼容MPEG-1,但增加了对隔行扫描的支持,并有更大的伸缩性和灵活性。MPEG-2专门针对数字电视而开发,很快成为了迄今最成功的视频压缩标准。MPEG-2既能够满足标准逐行视频的需求(其中视频序列由一系列按一定时间间隔采集的帧构成),又能够满足电视领域常用的隔行视频的需求。隔行视频交替采集及显示图像中两组交替的像素(每组称为一个场)。这种方式尤其适合电视显示器的物理特性。MPEG-2支持标准的电视分辨率,其中包括:针对美国和日本采用的NTSC制式隔行720*480分辨率,每秒60场,以及欧洲和其他国家采用的PAL制式的720*576分辨率,每秒50场。MPEG-2建立在MPEG-1基础之上,并具备扩展功能,能支持隔行视频及更宽的运动补偿范围。由于高分辨率视频是非常重要的应用,因此MPEG-2支持的搜索范围远远大于MPEG-1。与之前的标准相比,它显著提高了运动估计的性能要求,并充分利用更宽搜索范围与更高分辨率优势的编码器需要比H.261和MPEG-1高得多的处理能力。MPEG2中的隔行编码工具包含优化运动补偿的能力,同时支持基于场和基于帧的预测,而且同时支持基于场和基于帧的DCT/IDCT。MPEG-2在30:1左右的压缩比时运行良好。MPEG-2在4-8Mbps时达到的质量适合消费类视频应用,因此它很快在许多应用中得到普及,如:数字卫星电视、数字有线电视、DVD以及后来的高清电视等。另外,MPEG-2增加了分级视频编码工具,以支持多层视频编码,即:时域分级、空域分级、SNR分级以及数据分割。尽管MPEG-2中针对分级视频应用定义了相关类别(profile),不过支持单层编码的主类(MainProfile)是当今大众市场中得到广泛应用的唯一MPEG-2类。MPEG-2解码最初对于通用处理器及DSP具有很高的处理要求。优化的固定功能MPEG-2解码器开发已问世,由于使用量较高,成本已逐渐降低。MPEG-2证明低成本芯片解决方案的供应是视频编解码标准成功和普及的关键。(3)MPEG-4(1994~1998),支持逐行扫描和隔行扫描,是基于视频对象的编码标准,通过对象识别提供了空间的可伸缩性。MPEG-4由ISO提出,以延续MPEG-2的成功。一些早期的目标包括:提高容错能力以支持无线网、对低比特率应用进行更好的支持、实现各种新工具以支持图形对象及视频之间的融合。大部分图形功能并未在产品中受到重视,相关实施主要集中在改善低比特率压缩及提高容错性上。MPEG-4简化类(SP)以H.263为基础,为改善压缩增加了新的工具,包括:*无限制的运动矢量:支持对象部分超出帧边界时的预测。*可变块大小运动补偿:可以在16*16或8*8粒度下进行运动补偿。*上下文自适应帧内DCTDC/AC预测:可以通过当前块的左右相邻块预测压缩的视频内容无法使用另外一种标准进行解压缩。例如,MPEG-4Part2解码器就不能与H.264编码器协同运行。这是因为一种算法无法正确地对另外一个算法的输出信号进行解码,然而我们可以在同一软件或硬件中使用多种不同的算法,以支持对多种格式的文件进行压缩。
由于不同的视频压缩标准会使用不同的方法来减少数据量,因此压缩结果在比特率、质量和延时方面也各不相同。
此外,由于编码器的设计者可能会选择使用某个标准所定义的不同工具集,因此,即使是使用相同压缩标准的编码器之间,其压缩结果也可能会存在差异。不过,只要编码器的输出信号符合标准的格式以及解码器的要求,就可以采用不同的实施方式。这是非常有利的,因为不同的实施方式可实现不同的目标,满足不同的预算要求。对用于管理光介质存储的非实时专业软件编码器来说,应该能够比用于视频会议的集成在手持设备中的实时硬件编码器提供质量更高的编码视频。因此,即使是某个指定的标准也无法保证提供指定的比特率或质量。而且,如果不事先确定实施方式,一个标准就无法与其它标准进行正确的性能对比,甚至也无法与同一标准的其它实施方式进行正确的性能对比。
与编码器不同,解码器必须实施某个标准的所有必需部分,才能对符合标准的比特流进行解码。这是因为标准中明确规定了解压缩算法应如何对压缩视频的每个比特进行还原。压缩技术与电视有很大的关系,交织技术是最简单的压缩形式,它使带宽以2:1的比例降低。人的视觉系统总要用一定时间才能识别图像元素,如果在一定的刷新频率下,每帧图像的停留时间长于人眼观察所需要的时间,那么在下一帧图像的显示过程中,第一幅图像仍然会残留在人的视觉印象中。这种视觉残留可以消除画面的闪烁现象,将连续的画面呈现在人们眼前。电影的帧速率为24帧/秒,但在显示每一帧画面的中间有一次中断,所以实际的刷新率是48帧/秒。因此对电影而言画面更新率是24而刷新速率是48。电视则采用隔行扫描以获得同样的效果。电视没有采用电影的24帧而是采用了25帧与30帧是为了和电网频率同步降低对电源的要求。
用色差信号代替GBR信号是另一种压缩形式,利用了人眼对色彩细节不敏感的特性。YUV(亦称YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(PAL)。YUV主要用于优化彩色视频信号的传输,使其向后兼容老式黑白电视。与RGB视频信号传输相比,它最大的优点在于只需占用极少的带宽(RGB要求三个独立的视频信号同时传输)。其中“Y”表示明亮度(Luminance或Luma),也就是灰阶值;而“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。“亮度”是通过RGB输入信号来创建的,方法是将RGB信号的特定部分叠加到一起。“色度”则定义了颜色的两个方面—色调与饱和度,分别用Cr和CB来表示。其中,Cr反映了GB输入信号红色部分与RGB信号亮度值之间的差异。而CB反映的是RGB输入信号蓝色部分与RGB信号亮度值之同的差异。
PAL、NTSC、SECAM都是压缩的形式,称为复合视频系统(CVBS?),他们在保留了黑白电视的频道结构的同时增加了色彩信号。信号的细节取决于应用的视频标准或者“制式”--NTSC(美国全国电视标准委员会,NationalTelevisionStandardsCommittee)、PAL(逐行倒相,PhaseAlternateLine)以及SECAM(顺序传送与存储彩色电视系统,法国采用的一种电视制式,SEquentialCouleurAvecMemoire)。NTSC和PAL彩色视频信号是这样构成的--首先有一个基本的黑白视频信号,然后在每个水平同步脉冲之后,加入一个颜色脉冲和一个亮度信号。因为彩色信号是由多种数据“叠加”起来的,故称之为“复合视频”。S-Video则是一种信号质量更高的视频接口,它取消了信号叠加的方法,可有效避免一些无谓的质量损失。它的功能是将RGB三原色和亮度进行分离处理。
一般说来,在帧内以及帧与帧之间,众多的视频序列均包含很大的统计冗余度和主观冗余度。视频源码的最终目标是:通过挖掘统计冗余度和主观冗余度,来降低存储和传送视频信息所需的比特率;并采用嫡编码技术,以便编制出“最小信息组”一个实用的编码方案,是在编码特性(具有足够质量的高压缩)与实施复杂性之间的一种折衷。对于MPEG压缩算法的开发来讲,涉及到这些标准的寿命周期应考虑到现代超大规模集成电路技术的能力,这一点是最重要的。根据应用的要求,我们也许会想到视频数据的“无损失”编码和“有损失”编码“无损失”编码的目的在于:在保持原图像质量(即解码后的图像质量等同于编码前的图像质量)情况下,来减少需要存储和传送的图像或视频数据。与此相反,“有损失”编码技术(该技术跟MPEG—l和MPEG2视频标准未来的应用有关)的目的是,去符合给定的存储和传送比特串。重要的一些应用包括;利用限定的带宽或很窄的带宽,通过通信频道采传送视频信息;有效地存储视频信息。在这些应用中,高的视频压缩是以降低视频质量的办法来实施的,即跟编码以前的原始图像相比,解码后的图像“客观”质量有所降低(也就是取原始图像和再现图像之间的均方差,作为评定客观图像质量的标准)频道的目标比特率越低;那么视频所必须进行的压缩率就越大,通常可察觉的编码人工产物也越多。有损失编码技术的最终目的是:在指定的目标比特串条件下,获取最佳的图像标准。这里应服从“客观”或“主观”上的最佳标准。这里应该指出,图像的降级程度(指客观降低以及可察觉到的人工产物的数量)取决于压缩技术的复杂性——对于结构简单的画面和视频活动少的图像来讲,就是采用简单的压缩技术,也许能获得根本不带可察觉人工产物的良好的再现图像。目前监控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP)、H.264/AVC等几种视频编码技术。对于最终用户来言他最为关心的主要有:清晰度、存储量(带宽)、稳定性还有价格。采用不同的压缩技术,将很大程度影响以上几大要素。MJPEGMJPEG(MotionJPEG)压缩技术,主要是基于静态视频压缩发展起来的技术,它的主要特点是基本不考虑视频流中不同帧之间的变化,只单独对某一帧进行压缩。MJPEG压缩技术可以获取清晰度很高的视频图像,可以动态调整帧率、分辨率。但由于没有考虑到帧间变化,造成大量冗余信息被重复存储,因此单帧视频的占用空间较大,目前流行的MJPEG技术最好的也只能做到3K字节/帧,通常要8~20K!MPEG-1/2MPEG-1(1988~1992),可以提供最高达1.5Mbps的数字视频,只支持逐行扫描。MPEG-1标准主要针对SIF标准分辨率(NTSC制为352X240;PAL制为352X288)的图像进行压缩.压缩位率主要目标为1.5Mb/s.较MJPEG技术,MPEG1在实时压缩、每帧数据量、处理速度上有显著的提高。但MPEG1也有较多不利地方:存储容量还是过大、清晰度不够高和网络传输困难。MPEG-2(1990~1994),支持的带宽范围从2Mbps到超过20Mbps,MPEG-2后向兼容MPEG-1,但增加了对隔行扫描的支持,并有更大的伸缩性和灵活性;MPEG-2在MPEG-1基础上进行了扩充和提升,和MPEG-1向下兼容,主要针对存储媒体、数字电视、高清晰等应用领域,分辨率为:低(352x288),中(720x480),次高(1440x1080),高(1920x1080)。MPEG-2视频相对MPEG-1提升了分辨率,满足了用户高清晰的要求,但由于压缩性能没有多少提高,使得存储容量还是太大,也不适和网络传输。MPEG-4MPEG-4(1994~1998),支持逐行扫描和隔行扫描,是基于视频对象的编码标准,通过对象识别提供了空间的可伸缩性;MPEG-4视频压缩算法相对于MPEG-1/2在低比特率压缩上有着显著提高,在CIF(352*288)或者更高清晰度(768*576)情况下的视频压缩,无论从清晰度还是从存储量上都比MPEG1具有更大的优势,也更适合网络传输。另外MPEG-4可以方便地动态调整帧率、比特率,以降低存储量。MPEG-4由于系统设计过于复杂,使得MPEG-4难以完全实现并且兼容,很难在视频会议、可视电话等领域实现,这一点有点偏离原来地初衷。另外对于中国企业来说还要面临高昂的专利费问题,目前规定:-每台解码设备需要交给MPEG-LA0.25美元。-编码/解码设备还需要按时间交费(4美分/天=1.2美元/月=14.4美元/年)。H.264/AVC视频压缩国际标准主要有由ITU-T制定的H.261、H.262、H.263、H.264和由MPEG制定的MPEG-1、MPEG-2、MPEG-4,其中H.262/MPEG-2和H.264/MPEG-4AVC由ITU-T与MPEG联合制定。从简单来说H.264就是一种视频编码技术,与微软的WMV9都属于同一种技术也就是压缩动态图像数据的“编解码器”程序。一般来说,如果动态图像数据未经压缩就使用的话,数据量非常大,容易造成通信线路故障及数据存储容量紧张。因此,在发送动态图像时、或者把影像内容保存在DVD上时、以及使用存储介质容量较小的数码相机或相机手机拍摄映像时,就必须使用编解码器。虽然编解码器有许多种类,但DVD-Video与微波数字电视等使用的主要是MPEG2,数码相机等摄像时主要使用MPEG4。既然作为压缩视频编码技术,H.264最大的作用对视频的压缩了。我们熟悉的MPEG2也就是最常用的DVD视频编码技术已经比较落后。对于最希望看到的HDTV的节目如果播放时间在2小时左右的话,使用MPEG2最小只能压缩至30GB,而使用H.264、WMV9这样的高压缩率编解码器,在画质丝毫不降的前提下可压缩到15GB以下。上面的例子可以看出H.264的技术优势了,一般来说H.264的数据压缩率在MPEG2的2倍以上、MPEG4的1.5倍以上。从理论上来说,在相同画质、相同容量的情况下,可比目前的DVD光盘多保存2倍以上时间的影像。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年高二物理上学期期中考点大串讲(鲁科版2019)专题05 电磁场与电磁波 能量转化【考题猜想】(18题9大类型)(含答案及解析)
- 餐饮行业员工服务技能三方协议书
- 体育活动探究性方案设计
- 家校共育与社会责任融合方案
- 企业如何合法解除劳动合同
- 山塘水库承包合同样本(2篇)
- 广州-PEP-2024年10版小学3年级英语第三单元真题试卷
- 探究小学数学教学中德育教育现状与解决办法
- 学校体育器材购销合同(2篇)
- 浅谈园林建筑过程中绿化工程
- 传热学课后题答案戴锅生主编第二版
- 路基土石方数量计算表(模板)
- 高级数字信号处理大作业 2016.
- 供应商送货要求规范
- 磁带式录音机的工作原理
- 道岔专业技术术语中英文对照讲解
- 提升杆式轨道球阀制造工艺及技术特点
- 苏教版二年级(上)数学全册集体备课
- 锯齿形螺纹的压型和基本尺寸
- 葛洲坝、三峡毕业实习
- 热风炉设计说明书.doc
评论
0/150
提交评论