当前几种主流高清编码方式和文件封装格式介绍_第1页
当前几种主流高清编码方式和文件封装格式介绍_第2页
当前几种主流高清编码方式和文件封装格式介绍_第3页
当前几种主流高清编码方式和文件封装格式介绍_第4页
当前几种主流高清编码方式和文件封装格式介绍_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

当前几种主流高清编码方式和文件封装格式介绍

随着高清技术的逐渐普及,越来越多的节目都采用高清设备来制作。目前,像Avid、Sony、Panasonic、Thomson等主流厂家都有各自系列的高清设备,它们所采用的编码方式和文件的封装格式则各有不同。目前几种主流的高清编码方式有:由ITU-T和ISO/IEC联合开发的H.264/AVC/MPEG-4标准、由苹果公司开发的ProRes422、由JPEG组织负责制定的JPEG2000,以及由Avid公司开发的DNxHD等;主流的文件封装格式有TS、AVI、MKV、MOV等。下面就这几种主流的高清编码方式和文件封装格式做一个介绍。

一.编码方式

1.H.264/AVC/MPEG-4

H.264与MPEG-2格式和其他之前的格式相比,压缩效率更高。H.264标准由国际电信联盟电信标准化部门(ITU-T)和国际标准化组织/国际电工委员会(ISO/IEC)共同研究发布,因此H.264有两个名称,一个是沿用ITU-T组织的H.26×名称,叫“H.264”;另一个则是AVC(AdvancedVideoCoding高级视频编码),这个标准也被归为MPEG-4的第10部分。

H.264格式定位于覆盖整个视频应用领域,它将主要应用在具有高压缩率和分层次质量需求的方向。包括:低码率的无线应用、标准清晰度和高清晰度的电视广播应用、Internet上的视频流应用,传输高清晰度的DVD视频以及应用于数码相机的高质量视频应用等等。H.264能以较低的数据速率传送基于联网协议(IP)的视频流,在视频质量、压缩效率和数据包恢复丢失等方面,超越了现有的MPEG-2、MPEG-4和H.26×视频通讯标准,更适合窄带传输。在极低码率(32-128Kbps)的情况下,H.264与MPEG-4相比具有性能倍增效应,即:相同码率的H.264媒体流和MPEG-4媒体流相比,H.264拥有大约3个分贝的增益(画质水平倍增)。32Kbps的H.264媒体流,其信噪比与128K的MPEG-4媒体流相近。即在同样的画面质量下,H.264的码率仅仅为MPEG-4的四分之一。但是,H.264在获得优越性能的同时,带来的是计算复杂度增加,例如分层设计、多帧参论、多模式运动估计、改进的帧内预测等,因此对硬件要求是最高的。

H.264/AVC/MPEG-4采用的核心技术有以下几个部分:帧间和帧内预测、变换(和反变换)、量化(和反量化)、环路滤波、熵编码。

帧间预测

:H.264的帧间预测是改良的运动估计。运动估计用来确定和消除存在于视频流中不同图片之间的时间冗余。当运动估计搜索是根据过去方向的图片,那么被编码的图片称为“P帧图片”,当搜索是根据过去和将来两种方向的图片,那么被编码的图片被称为“B帧图片”。为了提高编码效率,为了包含和分离在“H.264运动估计-改良的运动估计”图中的运动宏块,宏块被拆分成更小的块。然后,以前或将来的图片的运动矢量被用来预测一个给定的块。H.264/MPEG-4AVC发明了一种更小的块,它具有更好的灵活性,在运动矢量方面可以有更高的预测精度。

帧内预测:对于不能运用运动估计的地方,H.264就采用帧内估计用来消除空间冗余。帧内编码用来缩减图像的空间冗余,在给定帧中充分利用相邻宏块的空间相关性,相邻的宏块通常含有相似的属性。因此,在对一给定宏块编码时,首先可以根据周围的宏块预测(典型的是根据左上角的宏块,因为此宏块已经被编码处理),然后对预测值与实际值的差值进行编码,这样,相对于直接对该帧编码而言,可以大大减小码率。

对于每个4×4块(除了边缘块特别处置以外),每个像素都可用17个最接近的先前已编码的像素的不同加权和(有的权值可为0)来预测,即此像素所在块的左上角的17个像素。显然,这种帧内预测不是在时间上,而是在空间域上进行的预测编码算法,可以除去相邻块之间的空间冗余度,取得更为有效的压缩。

变换:运动估计和内部估计后的结果通过变换被从空间域转换到频率域。H.264/AVC/MPEG-4使用整数DCT4X4变换。而MPEG-2和MPEG-4使用浮点DCT8X8变换。更小块的H.264/AVC/MPEG-4减少了块效应和明显的人工痕迹。整数系数消除了在MPEG-2和MPEG-4中进行浮点系数运算时导致的精度损失。

量化:变换后的系数被量化,减少了整数系数的预测量和消除了不容易被感知高频系数。这个步骤也用来控制输出的比特率维持在一个基本恒定的常量。

环路滤波:H.264标准定义了一个对16×16宏块和4×4块边界的解块过滤过程。在这种情况下,对宏块过滤的目的是为了消除由于相邻宏块有不同的运动估计类型(比如运动估计和内部估计)或者不同的量化参数导致的人工痕迹;块边界过滤的目的是消除可能由于变换/量化和来自于相邻块运动矢量的差别引起的人工痕迹。环路滤波就是通过一个内容自适应的非线性算法修改在宏块/块边界的同一边的两个像素。

熵编码:4×4的量化系数必须在熵编码之前被重排序。根据这些系数原来采用的预测算法为运动估计或者内部估计,来选择不同的扫描类型创建一个重排序的串行化流,按照从低频到高频的顺序排序这些系数。既然高频系数大多数趋向于零,那么利用游程编码就可以缩减零的数目,从而高效的达到熵编码的目的。在熵编码这一步骤中,是通过映射符号的波压缩将4:4:44K/24pRAW图像码流降至大约200Mbps。P2AVC-Intra格式采用了H.264帧间压缩,将全尺寸10-bit4:2:21080i60或720p60HD序列降至100Mbps。AppleProRes422提供了一种处理这些新格式的好方法:它完全保留了这些新格式中原始质量的各个方面,将这些细节存入一种为实现FinalCutPro多层实时性能而设计的格式,为那些本不支持FinalCutPro的视频格式提供了一个很好的解决方案。

4.DNxHD

AvidDNxHD™高清编码技术,是一种革命性的、10bit数字编码技术,DNxHD的设计目标就是基于利用较少的存储空间与带宽来满足多次合成需要的理念,它允许在标清处理的存贮与带宽条件下,进行协作式的高清后期处理。

AvidDNxHD编码技术致力于在后期处理及新闻广播处理的协作环境中,实现非线性的编辑及多代合成。处理未经压缩的高清媒体对带宽的要求接近1.2Gbps(gigabits/S),在处理方式上与传统的未经压缩的高清媒体处理方式不同,它在一个4:2:2的色彩空间上工作,有三个用户可选的带宽模式:分别是220Mbps/10或8bit;还有一个是高效的8bit处理模式,仅需要145Mbps的带宽。AvidDNxHD在每秒60帧的速率下,支持720p的分辨率,在每秒30,25,24帧的速率下,支持1080p/i的高清分辨率。相比之下,未压缩的10bit标清处理也得需要约200Mbps的带宽。

另外,AvidDNxHD支持所有流行的高清格式,能够实现无损的栅格转换,彻底消除了高清压缩技术中压缩前格式转换所带来的分辨率损失现象。AvidDNxHD技术支持MaterialExchangeFormat(MXF)格式,这是一种开放的媒体文件转换格式,能够实现Avid系统与第三方MXF兼容产品间的直接媒体数据交换。

5.

几种编码方式的性能比较格式码率编码支持厂家AVCIntra25-100MbpsH.264/AVC松下DNxHD220,14510bit数字编码技术AVIDJPEG200070Mbps小波变换(Wavelettransform),嵌入式优化截断编码(EBCOT)ThomsonProres422145和220MbpsVBR(可变码率编码),全I帧编码Apple

二.常用的几种文件封装格式

所谓文件封装格式也称多媒体容器(MultimediaContainer),与DivX、MP3这类编码格式不同的是,它只是为多媒体编码提供了一个“外壳”,也就是将所有的处理好的视频、音频都包装到一个文件容器内呈现给观众,这个包装的过程就叫封装。DVD是将标准清晰度的MPEG2视频文件封装到VOB文件内,Blu-ray是将H264等编码的高清晰度视频文件封装到M2T文件内,HDTV是将高清晰度视频文件封装到TS文件内。不同的厂家都有自己的封装文件格式,常见的封装格式有:TS、AVI、MKV、TP、MOV、M2T等等,它们与编码类型没有必然联系。不同的封装方式就好比是不同的盒子,高清视频要用它装起来才能呈现给观众。

1.AVI——AudioVideoInterleave即音频视频交叉存取格式。1992年初Microsoft公司推出了AVI技术及其应用软件VFW(VideoforWindows)。在AVI文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。所有的AVI文件都包括两个必须的List块。这些块定义了流和数据流的格式。AVI文件可能还包括一个索引块。只要遵循这个标准,任何视频编码方案都可以使用在AVI文件中。avi封装目前仅仅能支持如下编码方式生成的文件:Videocodecs、MPEG-4AVC、SMPTEVC-1(对其支持不够好)、Audiocodecs、DTS、AC3。

AVI的文件结构、分为头部,主体和索引三部分.主体中图像数据和声音数据是交互存放的。从尾部的索引可以索引跳到自己想放的位置。AVI中图像和声音是分开的,所以播放时需要一个图像和声音的同步过程,AVI本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编码形式。但是由于索引放在了文件尾部,所以在播放internet流媒体时已属力不从心。

2.

TS流

TS流封装是随着MPEG2的流行而占据了主流的地位。全称则是TransportStream。而电视节目是你任何时候打开电视机都能解码(收看)的,所以,MPEG2-TS格式的特点就是要求从视频流的任一片段开始都是可以独立解码的。从结构上来说,TS流是由头文件和主体所组成的,扩充过的TS流还包括时间戳。这样不管是什么格式的VBR音轨,都很容易通过时间戳来同步图像。这样就不会产生AVI格式的音像同步问题,当然,对新的声音格式来说,需要新的分离器,解码器来实现解码。目前在不断改进开发中。TS流不像AVI,从诞生那天起,就考虑到了网络播放,所以很快成为了世界标准并广泛应用于电视台数字播放,\手机等各个领域。

用TS流封装可以无损的支持所有全部HDDVD和BD所带的视频和音频编码,包括:Videocodecs、MPEG-2、MPEG-4AVC、SMPTEVC-1、Audiocodecs、LinearPCM、DolbyDigital、DolbyDigitalPlus、DolbyTrueHD、DTSDigitalSurround、DTS-HD

3.

MKV

MKV是Matroska的一种媒体文件,是一种新的多媒体封装格式。Matroska最大的特点就是能容纳多种不同类型编码的视频.音频及字幕流,即使是非常封闭的RealMedia及QuickTime也被它包括进去了,并将它们的音视频进行了重新组织来达到更好的效果。Matroska它可将多种不同编码的视频及16条以上不同格式的音频和不同语言的字幕流封装到一个MatroskaMedia文件当中!因此,MKV也称多媒体容器(MultimediaContainer),:具有良好的开放性和跨平台性,是H.264编码最重要的封装格式。Matroska定义了三种类型的文件:MKV是视频文件,它里面可能还包含有音频和字幕;MKA是单一的音频文件,但可能有多条及多种类型的音轨;MKS是字幕文件。这三种文件以MKV最为常见。MKV采用了可变帧率,在回放变化比较慢(比如说静物)时以比较低的FPS来代替,可以节省不少资源;MKV与AVI和TS相比还增加了错误检测以及修复,这无疑提供了纠错和容错性,更适合于网络传输;在字幕方面,还增加了软字幕功能。与DVDrip以及HDrip等,字幕是以其它文件形式存在不同的是,在MKV里字幕可以内嵌在封装里,但不会和视频混淆,也可以多字幕随意选择;这样在传输保存时更为方便。在传输上采用的是流式传输,这点和TS流的原因基本一致,可以通过时间戳来管理视频以及音频的同步问题,做到即下即看;

4.

MOV

MOV封装即QuickTime影片格式,它是Apple公司开发的一种音频、视频文件格式,用于存储常用数字媒体类型,如音频和视频。当选择QuickTime(*.mov)作为“保存类型”时,动画将保存为.mov文件。现在MOV格式常常被用来制作高清电影预告片,可以达到1080P的所谓全高清标准。

MOV又是一个发展很快的多媒体封装形式,它具有很多优越性。它可称为万能封装器,连多条字幕文件都可以封装进去。同时,MOV还具有良好的兼容性、跨平台性、纠错性,所要求的存储空间小等技术特点。到目前为止,它共有4个版本,其中以4.0版本的压缩率最好。这种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论