版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.H263基本原理1. H.263 简介 H.263 由 ITU 定义,为视频会议和视频电话应用程序提供图象压缩(译码)。H.263 基于 H.261,并且其带宽是由小于 20K 到 24K bit/sec 的视频流形成。作为一种一般规则,H.263 要求其半带宽要于 H.261 的对应带宽达到相同的视频质量,所以在很大程度上 H.263 取代了 H.261。H.263 使用传输视频流。 H.263 的译码算法和 H.261 中的类似,但它在 H.261 的基础上有了提高和改变,从而增强了性能和错误恢复能力。H.263 中运动补偿采用的是半象素精确
2、度,而在 H.261 中采用的是全象素精确度和环路滤波器。数据流中分层结构的某些部分是可选的,如此可以通过一个较低的数据率或较好的错误恢复能力来配置视频编译码。目前有四种能够提高性能的可选协商选项:无限制运动向量、基于语法的算法译码、前向预测和前后帧预测,类似于 MPEG,叫做 P-B 帧。2视频压缩中的一些基本概念1 有损和无损压缩在视频压缩中有损(Lossy)和无损(Lossless)的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。丢
3、失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。2 帧内和帧间压缩帧内(Intraframe)压缩也称为空间压缩(Spatial compression)。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内压缩一般达不到很高的压缩。
4、160; 采用帧间(Interframe)压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩(Temporal compression),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。3 对称和不对称编码对称性(symmetric)是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称
5、的压缩编码算法为好。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多4 H.263 帧类型A 内码帧(I帧)不能由任何其它帧构造出来,包含所有可显示它的信息。 I帧编码过程: l 每个光亮度和色差平面被分成88的块 l 各块使用DCT转
6、换成频率域 l 利用量化表进行量化。 l 对各块中最重要系数序列(DC系数)用DPCM技术进行编码,且仅编码两个相邻DC值的差 l 各块中的系数是按锯齿形次序进行行程编码 l 最后进行类哈夫曼编码
7、60; 预测帧(P帧):由前面的帧构造所得。 P帧编码: P帧编码过程: l 在基准帧中对每个宏块均查找其最正确匹配宏块 l &
8、#160; 计算实际宏块和最正确匹配宏块的差,作为运动向量 l 误差项用DCT进行转换 l 接着进行量化步,形成“锯齿形次序”行程编码,最后进行类哈夫曼平均信息量编码。注意量化表与I帧所用的不同,DC系数的编码与其他系数的编码方式相同 3. H.263的内容和特点 H.263 视频编码标准
9、是专为中高质量运动图像压缩所设计的低码率图像压缩标准。与H.261 的p×64K 的传输码率相比,H.263的码率更低,单位码率可以小于 64K,且支持的原始图像格式更多,包括了在视频和电视信号中常见的QCIF,CIF,EDTV,ITUR 601,ITUR 709 等等。 H.263 采用运动视频编码中常见的编码方法,将编码过程分为帧内编码和帧间编码两个部分。埃帧内用改进的DCT 变换并量化,在帧间采用1/2 象素运动矢量预测补偿技术,使运动补偿更加精确,量化后适用改进的变长编码表(VLC)地量化数据进行熵编码,得到最终的编码系数。
10、160; H.263的编码速度快,其设计编码延时不超过150ms;码率低,在512 K 乃至 384K 带宽下仍可得到相当满意的图像效果,十分适用于需要双向编解码并传输的场合(如:可视电话)和网络条件不是很好的场合(如:远程监控) 如下是H263的编解码图: 为了达到这些目标,H.263采用如下方法: 1)信源编码器基于通用中间格式(CIF),使其可以同时应用于625线和525线两种电视标准。视频编码器对图象的取样次数为视频信号场线的整
11、数倍,取样时钟和数字网之间的关系是异步关系,提供可以和其它各种设备信号相结合的独立的数字比特流。 2)采用可减少时间冗余的帧间预测和可减少空间冗余的残留信号编码方法。解码器具有运动补偿的能力,并允许可选择地在编码器中增加这种技术。H263运动补偿采用的是半象素精度,而不是H.261建议中的全象素精度和循环滤波器。而对待传送的符号采用了游程编码。 3)允许采用无限制运动矢量模式,在该模式中,运动矢量被允许指到图片的外部,可使用更大的运动矢量。允许采用基于句法的算术编码模式代替游程编码,可将最终的比特数显著降低。允许采用高级预
12、测模式,对P帧的亮度部分采用了块重叠运动补偿。对图片中的某些宏块采用4个8x8矢量来代替原来的1个16x16矢量。编码器必须决定使用哪一种矢量。允许采用PB帧模式,一个PB帧包含一个由前面的解得的P帧图象预测得出的P帧和一个由前一个P帧和当前解码的P帧共同预测得出的B帧。使用这种模式可以在比特率增加幅度很小的情况下大幅度增加帧频。 4)信源编码器的主要原理是预测,块变换和量化。信源格式信源编码器对每秒发生30000/1001(大约29.97)次的图象进行操作。对图象频率的允许误差为±50 ppm。采用五种图象格式,图象被编码为一个亮度信号和两个色差
13、成分(Y,CB和CR)。五种标准图象格式为: sub-QCIF, QCIF, CIF, 4CIF和16CIF。对每种图象格式而言,在正交排列时,亮度的取样结构都是dx个象素每行,dy行每幅图象。两个色差成分的取样都是dx/2个象素每行,dy/2行每幅图象。dx, dy, dx/2和dy/2的值在下表给出。 H.263各种图象格式的象素个数图象格式 亮度取样的象素个数(dx) 亮度取样的行数 (dy) 色度取样的象素个数(dx/2) 色度取样的行数(dy/2) sub-QCIF
14、; 128 96 64 48 QCIF 176 144 88 72 CIF 352 288 176 144 4CIF &
15、#160; 704 576 352 288 16CIF 1408 1152 704 576 对每种图象格式,色差取样被定位在和亮度块边界一致的块上。取样象素的纵横比和图象格式的纵横比一致,也和H.261建议中定义的QCIF和CIF一致:(4/3)*(288/352)。除了sub-QCIF格式的 纵横比为4:3。
16、; 解码器使用sub-QCIF以及QCIF格式等。编码器可对sub-QCIF和QCIF中的一种进行操作。 /H.263 支持五种分辨率。除了 H.261 支持的 QCIF 和 CIF 外,还有 SQCIF、4CIF 和 16CIF。SQCIF 的分辨率大约是 QCIF 的一半,而 4CIF 和 16CIF 的分辨率分别是 CIF 的4倍和16倍。 在译码算法上,H.261 与 H.263 的不同点列表如下: 图画格式象素亮度线条亮度H.261是否支持H.263是否支持非压缩比特率(Mbits/s)10 frames/s30 f
17、rames/s灰色彩色灰色彩色SQ_CIF12896 是1.01.53.04.4Q_CIF176144是是2.03.06.19.1CIF352288可选可选8.112.224.336.54CIF704576 可选32.448.797.3146.016CIF14081152 可选129.8194.6389.3583.9 4、编解码原理图 5、h263编解码数据结构H.263采用句法和语义学的方法对多路视频来管理的。 句法被划分为四层,四个层(从上到下)分别是图象(Picture)、块组(Group of Blocks)、宏
18、块(Macroblock)、块(Block)。图象层每帧图象的数据包含一个图象头(a picture header),并紧跟着块组数据(Group of Blocks),最后是一个end-of-sequence码和填塞位。其中包括有图象开始码(PSC) (22 bits)、时域参照(TR)(8 bits)、类型信息 (PTYPE) (13 bits) 和量化器信息 (PQUANT) (5 bits)等十三个选项。 PSC TR PTYPE PQUANT CPM PSBI TRB DBQUANT PEI PSPARE PEI Group of Blocks ESTUF EOS PST
19、UF22 8 1 5 5 1 2 3 2 0/8/16
20、160; Vari 22 Vari (structure of Picture Lay)每个块组层(GOB)包含了一个块组层头(a GOB header),紧跟着宏块数据(Macroblocks)。每个GOB包含了一行或多行宏块。对于每帧图象的第一个GOB(0号),不需要传送GOB头。而对于其它的GOB,GOB头可以为空,这决定于编码策略。译码器可以通过外部手段发送信号给远程变码器要求只传送非空GOB头,例如建议H.
21、245。 GSTUF GBSC GN GSBI GFID GQUANT Macroblock Data (structure of GOB Lay) 每个宏块(Macroblocks)中包含了一个宏块头(a macroblock header)和后续的块数据(data for blocks)。COD只出现在用PTYPE指定为"
22、INTER"的图象帧中,对于这些图象中的宏块,当COD指定或PTYPE指示为"INTRA"时会出现宏块类型 & 色度的编码块样式(MCPBC)。如果PTYPE指示了"PB帧",对于B块的宏块 (MODB)会出现。只有在MODB中指定时才会出现CBPB(指示将传送宏块的B系数)和B宏块的运动矢量数据 (MVDB) (变长)。当MCPBC和CBPY中指定时会出现"块数据"。 COD MCBPC MODB CBPB CBPY DQUANT MVD MVD2 MVD3 MVD4 MVDB Block Data
23、160; (structure of macroblock layer)块层如果不在PB帧模式,一个宏块包含四个亮度块和两个色差块。在PB帧模式下,一个宏块包含12个块。在缺省H.263模式下,首先传送6个P块数据,然后是6个B块数据。 5、RTP PAYLOAD FOR H263 STREAM 协
24、议结构(在RTP中传输h263数据流) 当在网络中传输H263视频数据流时,可直接封装编码器的输出数据,对于每一视频帧,H263数据比特流无改变的封装在RTP中被传输,包括图片开始处理、整个图片头,还有混合长度处理,可变长度处理。被编码后的数据并没有加上装帧信息,所以多元的音频、视频信号不适合被封装在同一个包中,UDP和RTP提供了一个更加有效的方法来处理多元化。RTP并不能提供一个可靠的、有次序的数据传输,因此数据包有可能丢失。为了使丢包得到最大程度的恢复,解码器必须能够处理已经到达的数据包。因而,能够独立处理每一个数据包是符合要求的。一些帧信息包含在每个数据包中,例如:sourc
25、e format 和 flag for optional features 能够帮助解码器在丢失数据包的情况下正确、高效的处理帧。在RTP中H263视频数据流将被装载成payload data,一个新的H263载荷头部被定义在载荷头部第5个区域(section 5),这个区域定义了RTP头和H263视频数据包结构。 每一个RTP封包都有一个复合的RTP头,下面是H263视频数据的RTP封包的混合头部:Marker bit (M bit)、Payload Type(PT)、Timestamp.一个H263的TRP包如下:0 &
26、#160; 1 2 3 0
27、 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | &
28、#160; RTP header | |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |
29、0; H.263 payload header | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |
30、60; H.263 bitstream |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
31、-+-+-+-+-+-+-+-+-+-+-+-+ 每一个RTP包中只有一个H263 Video packet,H263 payload header 与 H263 video packet 一一对应。H.263 有效载荷头定义了三种格式(模式 A、模式 B 和模式 C)。在模式 A 中,在实际压缩 H.263 视频比特流之前存在4字节的 H.263 有效载荷头。这样允许在 GOB 边界有分段。在模式 B 中,使用的是8字节的 H.263 有效载荷头,且每个数据包从 MB 边界开始,没有 PB 帧选项。最后,模式 C 中使用的是12字节的 H.263 有效载荷头,采用 PB 帧选项支持
32、在 MB 边界的帧分段。 H.263 有效载荷头定义了三种格式(模式 A、模式 B 和模式 C)。在模式 A 中,在实际压缩 H.263 视频比特流之前存在4字节的 H.263 有效载荷头。这样允许在 GOB 边界有分段。在模式 B 中,使用的是8字节的 H.263 有效载荷头,且每个数据包从 MB 边界开始,没有 PB 帧选项。最后,模式 C 中使用的是12字节的 H.263 有效载荷头,采用 PB 帧选项支持在 MB 边界的帧分段。模式 A 中的头格式如下所示: 1258111213141516 bitFPSBITEBITSRCIUS
33、ARR (cont.)DBQTRBTR · F 标志位,表示有效载荷头的模式,具有以下几个值:0 模式 A;1 模式 B 或模式 C,取决于 P 位。 · P P 指定可选的 PB 帧模式。 · SBIT 起始位,指定最重要位(在第一个数据字节中忽略)的编号。 · EBIT 结束位,指定最不重要位(在最后一个数据字节中忽略)的编号。 · SRC 源格式(在 H.263 标准中 PTYPE 的位6、7和8压缩比特流)表示当前图片解析。 · I 图片编码类型(在 H.263 标准中 PTYPE 的位9压缩比特流)。 · U 在当前图片头中,如果无限制运动向量选项值为1,那么该值设置为1(在 H.263 标准中 PTYPE 的位10压缩比特流),否则该值为0。 · S 在当前图片头中,如果基于语法的算法编码选项值为1,那么该值设置为1(在 H.263 标准中 PTYPE 的位11压缩比特流),否则该值为0。 · A 在当前图片头中,如果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村产业融合市场分析
- 关于销售的实习报告范文集锦9篇
- 关于建筑工地实习日记三篇
- 天英学校家政服务员(初级)理论练习测试题附答案
- 2017年四川省绵阳市中考化学试卷(学生版)
- 2024-2025学年上海市杨浦区民办兰生中学六年级(上)月考数学试卷(10月份)(含解析)
- 语文统编版(2024)一年级上册汉语拼音-⑨y w 教案
- 广东高考英语语法完形阅读
- 会计数据分析 TestBank Richardson1e-Chapter06-TB-AnswerKey-06.12.19
- 宪法是根本法课件
- 丁香医生:2022科学饮奶趋势洞察报告
- 有机肥供货及售后服务方案(投标专用)
- 八年级语文上册期中考试卷(附带答案)
- 辊道窑窑炉设计说明书
- 军事训练课程教学设计
- 烽火悠悠乱世悲歌-春望、雁门太守行比较阅读
- 工程竣工移交单移交甲方物业
- 销售、配合、带动
- GB/T 13331-2005土方机械液压挖掘机起重量
- 职高(中职)数学(基础模块)((上册))题库完整
- 种植体及公司产品介绍课件
评论
0/150
提交评论