




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1多媒体技术基础蔡宇辉湖南大学软件学院rj_cyh@2第四章
多媒体数据压缩编码技术3第四章的内容多媒体数据压缩编码概述重要性、可能性、分类脉冲编码调制PCM统计编码:Huffman编码、算术编码预测编码:DPCM、ADPCM、帧间预测变换编码多媒体数据压缩编码的国际标准JPEG、MPEG4第一节数据压缩编码概述1.1多媒体数据压缩编码的重要性1.2多媒体数据压缩编码的可能性1.3多媒体数据压缩编码的分类51.1数据压缩编码的重要性在多媒体技术中,处理的多媒体数据都应是数字信号,传统的媒体信息需要进行采样和量化后方能在计算机中处理。ADC放大器6原始媒体信息数字化后的数据量巨大。例1:一页B5(180×255mm)大小的文件,以中等分辨率300dpi、8位色方式扫描,其数据量为6.61MB。保存一部《鹿鼎记》(1813页)需要11983.93M(650M的CD得刻19张)。7例2:立体声的激光唱盘,采样频率为44.1kHz,量化位数为16,则一秒钟的音频数据量就可达172KB。650M的CD只可存储1小时音乐。ADC8对于视频,数据量的问题则更加突出。例3:采用PAL制式,采样格式为4:4:4,24位色,则一秒钟的视频数据量就可达31.3MB。电影《龙骑士》(时长100分钟)需要约289张650M的CD存放。采集卡9由于多媒体信息的数据量十分庞大,给存储器的存储容量、通信线路的带宽资源、传输速率以及计算机的处理速度都增加了极大压力。解决方法:从硬件设备入手:增加存储器、带宽资源;研究新型线缆提高传输效率;使用快速的高档计算机……从信息内容入手:进行数据压缩编码。——根本的解决之道10数据压缩对多媒体应用的意义通过数据压缩技术可减少多媒体信息的数据量,其意义在于:提高了传输效率节约了存储空间使计算机能够实时处理多媒体信息加快了处理速度111.2数据压缩编码的可能性多媒体数据能否进行压缩?研究表明,多媒体信息中存在大量的冗余,去掉这些冗余数据便可实现数据的压缩。冗余数据可用信息原始的多媒体数据12音频中的冗余音频中的冗余信息主要有:时域冗余幅度的非均匀分布;样本间的相关性;周期之间的相关性;基音之间的相关性;静止系数(间隔);长时自相关函数。频域冗余非均匀的长时功率谱密度;语音特有的短时功率谱密度。人耳的听感觉分辨能力有限。13图像/视频中的冗余图像/视频信息中包含有大量的冗余,主要有下列不同类型的冗余信息:空间冗余时间冗余结构冗余知识冗余视觉冗余图像区域的相同性冗余纹理的统计冗余14a.空间冗余空间冗余是静态图像中最主要的一种冗余。通常的图像都描述了某个场景,其相邻像素点之间存在一定的空间连贯性。如果编码时不考虑这一相关性,就会造成空间冗余。左边的图像显示了一个规则物体,其大量像素点的亮度、饱和度、色调等参数都一样。
15b.时间冗余时间冗余是视频中常见的一种冗余。序列图像中,相邻帧往往包含有相同的背景和运动物体,只是运动物体的位置有所变化,因此相邻两帧的数据差别很小,具有时间上的连贯性。如果编码时不考虑这一相关性,就会造成时间冗余。16c.结构冗余有些图像中有规则纹理,其像素值存在明显的分布模式,只要知道分布模式,便可通过某种方法生成图像,这种数据冗余即结构冗余。规则的纹理图像17d.知识冗余对图像的理解有时与某些知识有相当大的相关性,例如人脸的图像就具有同样的五官位置。可以根据已有的知识构造基本模型,并创建特征图像库,则只需提供少量的特征参数信息便可生成图像,这种数据冗余即知识冗余。18e.视觉冗余视觉冗余是针对人眼的视觉特性而言的。人对图像的敏感性是非均匀、非线性的,而一般的编码却是线性方式,因此存在视觉冗余。视觉系统对亮度比对色度敏感。视觉系统对低频信号比对高频信号敏感。视觉系统对静止图像比对运动图像敏感。视觉系统对水平、垂直线条比对斜线条敏感。随着亮度的增加,视觉系统对量化误差的敏感度降低。(高光区可用较少的量化位数)视觉系统把图像的边缘和非边缘区域分开处理。视觉系统总是把视网膜上的图像分解成若干个空间有向的频率通道后,再做进一步处理。19f.图像区域的相同性冗余有的图像存在一些相同或相近的区域,从而产生数据的重复性存储,这就是图像区域的相同性冗余。可以只记录一个区域中各个像素的值,与其相同或相近的区域则不必记录。向量量化方法就是针对这种冗余进行数据压缩的。20g.纹理的统计冗余有些纹理并不严格服从某一分布规律,但它在统计意义上又符合该规律,这种数据冗余即纹理的统计冗余。孔雀羽毛的纹理分布211.3数据压缩编码的分类22多媒体数据压缩编码方法有很多种,根据不同的依据可产生不同的分类:按照编码算法的原理:分成脉冲编码调制、预测编码、变换编码、量化与向量量化编码、统计编码、子带编码、结构编码、模型编码、混合编码等等;根据质量有无失真:分成有损失编码和无损失编码;按照其作用域在空间或频率上:分成空间方法、变换方法和混合方法;根据是否自适应:分成自适应性编码和非适应性编码。23无损编码和有损编码实际上,信息进行数字化时,量化误差是不可避免的。此处的“无损”和“有损”是针对编码过程而言的。无损编码:也称冗余压缩法。将编码后的数据进行解码,所得数据和编码前的原始数据严格一致,压缩比约为2:1~5:1,常用的算法有:Huffman编码、算术编码、行程编码RLE、词典编码等。有损编码:也称熵压缩法。解码得到的还原数据与原始数据之间存在一定的误差,但并不影响人对原始资料表达信息的理解,压缩比从几倍到上百倍。2425压缩软件实际上就是使用上述这些算法进行压缩的。26衡量编码方法优劣的指标衡量压缩编码方法优劣的重要指标有:压缩比要高;压缩与解压的速度快;算法简单,适合于硬件实现;解压缩后还原信息的质量高。27第二节脉冲编码调制脉冲编码调制:PCM,即将连续模拟信号数字化,包括采样、量化/编码。模拟量经过A/D转换,得到二进制码的过程,也称PCM编码。其它的编码方法都是
在模拟信号经过PCM
编码后再进行的压缩
编码方法。28PCM编码过程29第三节统计编码数据压缩技术的理论基础是信息论,根据信息论的原理,可以找到最佳的数据压缩编码方法。数据压缩的理论极限是信息熵,统计编码就是利用了信息熵原理,因此也称作信息熵编码、熵保存编码或熵编码。统计编码是一种无损的压缩方法,如香农编码、Huffman编码、算术编码等。303.1统计编码的原理
——信息量和信息熵熵是信息论中的概念,是信息量的度量方法。要理解什么是“信息熵”,先得了解信息、信息量的含义。什么是“熵”?31下面以信源编码模型来说明。编码器信源(消息集)编码输出集X={x1,…,xn}Z={z1,…,zn}符号集Am={a1,…,am}X为消息集,由n个信号单元xj构成Z为输出集,由n个码字zj构成,zj与xj一一对应。Am
是符号集,由m个码元
ai构成,符号集中间的码元组成输出码字。32当信源发出某个随机事件(消息)xj后,接收端收到一个相应的码字zj。那么,接收到的这个码字中包含了多少有用的信息呢?信息是用不确定性的量度定义的。消息xj出现的可能性愈小,则其带给人们的信息就愈多;反之,消息出现的可能性愈大,则它能给人们提供的新信息(有用信息)就愈少。在数学上,一条消息所传输的信息是其出现概率的单调下降函数。33信息量信息量:从N个可能事件中选出一个事件所需要的信息度量或含量。对于计算机的二进制编码,可以这么理解:从N个事件中辨别出一个特定事件,最少需要回答多少次“yesorno”疑问。事实上,每次提问都会得到一个“yesorno”的答复,可以用0或1表示,即1bit,如果提问n次,则信息量为nbit。34示例例一:从1~64的整数中选出一个数。可先提问“是否大于32?”,以消除半数的可能,然后再进行半数的询问,这样只需6次便可确定一个数,其信息量为6bit。例二:如果只要辨别某个数是否大于32,则只需询问一次便可得出结论,其信息量只有1bit。从上两例中可看出,大于或者小于32,这种情况的概率比具体等于某一个数的概率要大,但其信息量反而小(单调下降)。35信息量的数学表述信息论定义了一种度量信息量的方法:其中:I(xj)是信源X发出xj后,接收端接收到的信息量的量度。P(xj)是信源X发出xj的先验概率,有:请用上述公式求例一的信息量。36信息熵如果将信源所有可能事件的信息量进行统计平均(即求其数学期望),就得到了信息熵。信源X发出的xj(j=1,2,…,n),xj出现的概率为P(xj),则信源X的熵为:37示例假设一幅由40个像素组成的灰度图像,共有5级灰度,每一级灰度都是一种信源发出的符号,分别用A~E表示。40个像素中有15个灰度为A,7个灰度为B,7个灰度为C,6个灰度为D,5个灰度为E。试求该灰度图像的熵。38∴该灰度图像的熵为2.196bit。39统计编码的目的统计编码就根据信源信号出现概率的分布特性进行压缩的。统计编码的目的:在信源符号和码字之间建立明确的一一对应关系;编码过程中不丢失信息量(即信息熵的大小不变),以便在恢复时能准确地再现原信号,实现无损压缩;平均码长或码率应尽量小。40熵和平均码长可用熵来衡量该编码是否为最佳编码:当,有冗余,不是最佳;当,不可能出现;当,是最佳编码(稍大于)其中表示编码器输出码字的平均码长。可见,熵值是平均码长的下限。413.2Huffman编码最佳编码定理:在变字长码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。如果码字长度严格按照符号概率的大小的相反顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式得到的码字长度。Huffman编码:利用了最佳编码定理,是最常用的一种统计编码。42Huffman编码方法先把信源符号按概率大小顺序排列,并设法按逆次序分配码字长度。
对于出现频率大的符号用较少的位数来表示;对于出现频率小的符号用较多的位数来表示。Huffman编码方法采用的码字长度是可变的,因此较难在压缩编码后的文件中进行内容的查找。43Huffman编码的思路把信源符号按概率大小顺序排列,并设法按逆次序分配码字的长度。在分配码字长度时,首先将出现概率最小的两个符号的概率相加合成一个概率。把这个合成概率看成是一个新组合符号地概率,重复上述做法直到最后只剩下两个符号概率为止。完成以上概率顺序排列后,再反过来逐步向前进行编码,每一次有二个分支各赋予一个二进制码,可以对概率大的赋为0,概率小的赋为1。44Huffman编码的步骤对每个信息符号进行概率统计;将信源符号按概率的递减顺序排列;将最后的两个小概率相加作为新符号的概率,此时概率个数将减少一个;重复第2、3步,直到只剩两个概率;将概率大的赋“0”,概率小的赋“1”;逆顺序往信源符号推,不是合并的编码不变,如果是合并的,则在编码后面按照第5步的方法添加0或1。45编码实例信源X有7个信息符号,其概率为:
请对其进行Huffman编码,写出其码树、码长,并计算平均码长和熵。X1X2X3X4X5X6X70.350.200.150.100.100.060.0446信息符号概率第1步第2步第3步第4步第5步X10.350.350.350.350.400.60X20.200.200.200.250.350.40X30.150.150.200.200.25X40.100.100.150.20X50.100.100.10X60.060.10X70.04011000100011011001011010011001001001111011100100100111101110111147码字的平均码长为:熵为:48Huffman编码小结平均码长大于熵,小于等长码的码长。Huffman编码能保证解码的唯一性,短码字不会是长码字的前缀。Huffman编码没有错误保护功能。使用Huffman编码时,接收端需保存一个与发送端完全相同的Huffman码表。Huffman编码在信源符号出现概率分布不均匀时编码效率较高,若概率分别均匀时一般不采用Huffman编码。Huffman编码的压缩比取决于信源符号出现的概率,越集中则压缩比越高。493.3算术编码20世纪60年代初,Elias首次提出了算术编码的概念。1976年,发展了算术编码的实用技术。算术编码方法比Huffman编码复杂,但它不需要接收端保存一份Huffman码表,且具有自适应能力。算术编码是目前实现高效压缩数据中很有前途的编码方法。50基本原理和编码步骤算术编码实际上是用一个浮点数代替一个输入流中的符号。将实数半开区间[0,1)进行分割,每一符号对应[0,1)上的一个子区间,区间长度为该符号出现的概率;把要编码的整段消息映射到[0,1),根据这段消息符号的顺序确定新的实数子区间;最终得到一个[0,1)上的子区间,从中任选一个实数,该实数就是对整段数据进行编码后的输出代码。51例:输入“eai”,最后得到的子区间为[0.23,0.236),取该区间的任一个数(一般取最小的值),如0.230即为”eai”的编码。52在算术编码中,一段消息是用0到1之间的一个实数来编码表示的。算术编码方法用到了两个基本的参数:信源符号的概率和编码间隔。信源符号的概率决定了压缩编码的效率,也决定了编码过程中的间隔。编码间隔最终决定了符号编码后的输出。需要编码的信息越长,则表示它的编码间隔就越小,实数的小数位就越多。53编码实例假设信源符号有4个(00,01,10,11),其概率分别为(0.1,0.4,0.2,0.3)。根据概率把间隔[0,1)分成4个子间隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)。消息序列的输入为:100011001011015455二进制的算术编码计算机中任何消息都是由0、1组合而成的,可以理解为信源符号只有0和1。即:每次分割区间时,只要分成两个子区间,一个对应0,一个对应1。例:已知二进制符号中0出现的概率为0.25,1出现的概率为0.75,试对输入流1011进行算术编码。56设C为子区间的左端起始位置,L为子区间的长度,则对于符号“0”,C=0,L=0.25;对于符号“1”,C=0.25,L=0.75。算术编码步骤如下:步骤输入符号 C L110.250.75200.250.75*0.25
=0.1875310.25+0.1875*0.250.1875*0.75 =0.296875 =0.14062541 0.296875+ 0.140625*0.75 0.140625*0.25 =0.10546875 =0.3320312557当4个字符输入完后,最终得到的子区间左端起始位置为0.33203125,终止位置为C+L=0.4375。换算成二进制为:(0.33203125)d=(0.01010101)b(0.4375)d=(0.0111)b在0.01010101和0.0111之间取一个数,要求其二进制形式的长度最短,如本例中取0.011,则该串输入“1011”最终可编码成011,数据量有所减少。58几个问题由于计算机的精度有限,算术编码的计算过程中容易发生溢出,可以采用限制小数位数的方法来解决。算术编码器对消息只产生一个码字(在区间[0,1)中的一个实数),译码器在接收到表示这个实数的所有位之前不能进行译码。算术编码对错误很敏感,如果有一位发生错误就会导致整个消息译错。59自适应能力事实上,由于人们事先无法知道精确的信源概率,因此编码算法最好具有自适应能力,解决这一问题最有效的方法是在编码过程中进行估算(动态建模)。算术编码可以是静态的,也可以是具有自适应能力的动态编码。在静态算术编码中,信源符号的概率是固定的。在自适应算术编码中,将根据编码时符号出现的频繁程度动态地修改信源符号的概率。动态建模是确定编码器压缩效率的关键。60算术编码小结不必预先定义概率模型,具有自适应能力,可根据当前接收的数据不断更改概率模型。若信源符号的概率值都很接近时,不宜使用Huffman编码,建议使用算术编码。算术编码的实现较Huffman编码更复杂,但对多幅图像进行测试的结果表明,算术编码较Huffman编码提高了5%左右的压缩率,JPEG扩展系统中采用的就是算术编码。613.4游程编码RLE:runlengthencoding,游程编码,也称行程编码。用RLE编码方法得到的代码为:
80315084180623.5词典编码词典编码是根据数据本身包含有重复内容这一特性进行压缩的。词典编码是无损的。常见的词典编码算法有:LZ77算法、LZ78算法、LZW算法等。63指针式词典如LZ77算法、LZSS算法、LZ78算法。64索引式词典如LZW算法65第四节预测编码预测编码:先利用以往的样本值对新样本进行预测,再将新样本的实际值和预测值相减得到一个误差值,最后对该误差值进行量化编码传送。如果样本的时间或空间相关性较强,则误差值的变化范围将远远小于原始信号的变化范围,量化等级可大量减少,从而实现数据压缩。66预测编码主要是利用数据在时间或空间上的相关性来进行预测的,广泛适用于音频、图像、视频等媒体的编解码。对于音频,主要利用时间上的相关性,采用时间上的前几个采样值来做预测。对于静止图像,主要利用空间上的相关性,如同一行上的前几个采样值,甚至可以是前几行上的像素。对于视频,不仅可以利用时间上的相关性(帧间预测),还可以利用空间上的相关性(帧内预测)。67684.1DPCM模拟信号进行采样量化后,如果直接使用PCM编码,则数据量将很大,此时可以使用预测编码的思想来进行二进制编码,常用的方法有线性预测LPC和非线性预测。DPCM:差分(值)脉冲编码调制,是线性预测方法。DPCM编码器记录与传送的不是样本的真实值,而是它与预测值的差。69DPCM的基本原理转入f(i,j)e(i,j)量化器预测器预测器编码器解码器信道传输e’(i,j)f’(i,j)输出f(i,j)f(i,j)f(i,j)f(i,j)发送端接收端e’(i,j)704.2ADPCMADPCM:自适应差分脉冲编码调制。在ADPCM中,预测器的预测系数和量化器的量化参数,都能够根据原数据的区域分布特点自动调整,具有自适应能力。自适应预测:增加一个预测参数,该参数可根据预测值的大小自适应调整;自适应量化:量化阶距的大小可自适应调整。实践证明,ADPCM与DPCM相比,压缩比更高,解码后的质量也更好。714.3帧间预测编码帧间预测编码技术是专门针对视频对象的,利用连续几帧之间存在的时间相关性来消除冗余。常见的帧间预测编码方法有:条件补充法:若帧间各对应像素的差值超过阈值,则传送;若没超过阈值则不传送,接收端使用上一帧相应像素值代替。运动补偿技术:跟踪画面内运动部分的位移情况,对其加以补偿后再进行帧间预测。72第五节变换编码变换编码技术较成熟,目前广泛应用于图像、视频的数据压缩。算法思想:将空间域中的图像信号映射变换到另一个正交的矢量空间中,产生一批变换系数,然后对这些变换系数进行编码。如果变换的新正交空间选择得好,则可以减少数据间的相关性,从而减少了数据的冗余度,达到数据压缩的目的。73例子有相邻的两个采样值x1和x2,各用3位来表示,即有8种可能取值。考虑到样值的相关性,x1和x2同时出现相近幅度的可能性最大,即图中的直线阴影部分。信源的相关性越大,阴影部分就越扁平。74若将坐标系旋转45度,样本值x1变换成y1,x2变换成y2。不管y1在0~7的可能等级内如何变化,y2始终只在相当小的范围内变化。可见,旋转后y1和y2的相关性减小了。75变换编码的原理图子块
1子块
2子块
n......正变换滤波量化编码信道解码逆变换综合拼接源图像(发送)恢复图像(接收)76常用的变换方法常用变换有:沃尔什(Walsh)变换傅立叶(Fouries)变换离散正弦(DST)变换离散余弦(DCT)变换哈尔(Haar)变换斜(Slant)变换K-L(Karhunen-Loeve)变换小波(Wavelet)变换…………77第六节多媒体数据压缩编码标准6.1静态图像压缩编码的国际标准
——JPEG6.2动态图像压缩编码的国际标准
——MPEG-1 ——MPEG-2 ——MPEG-4 ——MPEG-7 ——MPEG-21786.1JPEG标准JPEG:JointPhotographExpertsGroup,联合图像专家组,于1986年由CCITT和ISO联合成立。JPEG标准即多灰度连续色调静态图像压缩编码,是适用于多级灰度、连续色调、静态的数字图像压缩编码标准。实际上,JPEG不仅适用于静态图像,视频的帧内压缩就可采用JPEG编码。79JPEG是一个适用范围很广的通用标准,其研发时的目标如下:算法在图像压缩率方面应接近当前科学水平,图像的保真度在较宽的压缩范围里的评价是“很好”、“优秀”到与原图像“不能区别”。算法可实际应用于任何一类静态数字图像,对图像的大小、颜色空间、像素的长宽比、图像的内容、复杂程度、颜色数及统计特性等都不加限制。在计算的复杂程度方面可以调整,因而可根据性能和成本要求来选择用软件执行还是用硬件执行。包括四种操作方式:顺序编码、累进编码、无失真编码和分层编码。80JPEG压缩算法为了保证通用性,JPEG专家组开发了两种基本的压缩算法:基于离散余弦变换DCT的有损压缩。基于空间DPCM预测技术的无损压缩。实际上,JPEG专家组还研究了一种称做JPEG2000的标准,其采用的压缩算法为基于小波(wavelet)变换的变换编码。81JPEG的组成部分JPEG系统可分成三个组成部分:基本系统:是实现离散余弦变换DCT编码/解码所需的最小功能集。扩展系统:是为了满足更为广阔领域的应用要求而设置的。独立功能:相对于JPEG的基本系统和扩展系统来说,使用空间DPCM预测方法的部分称为独立功能。82基于DPCM的无损压缩如图,预测器对原始数据X进行预测,求得差值后再对差值进行无失真的熵编码。熵编码器常采用Huffman编码或算术编码。83基于DCT的有损压缩基于DPCM预测编码的压缩比仅能达到2:1,而DCT编码的压缩比可高达10:1~100:1。当压缩比小于40:1时,还原的图像与原始图像相比主观效果几乎一样。压缩效果(比特/像素)质量0.25~0.50中~好0.50~0.75好~很好0.75~1.5极好1.2~2.0与原始图像分不出来8485DCT变换公式8×8的子块作为DCT变换的输入。DCT变换使用下式计算:逆变换IDCT使用下式计算:86基于DCT编码的步骤基于DCT编码的计算步骤为:分割子块:通常顺序分割成8×8的子块。对子块进行正向的离散余弦变换FDCT。对获得的DCT系数进行量化处理。将量化后的DCT系数进行Z字形编排。对直流系数DC进行DPCM编码。对交流系数AC进行RLE游程编码。熵编码。876.2MPEG标准MPEG:MovingPicturesExpertsGroup,运动图像专家组,于1988年由ISO与IEC联合成立,致力于运动图像及其伴音的编码标准化。MPEG标准包括三个部分:MPEG视频:如VCD、SVCD、DVD就是采用这部分标准制作的电子产品。MPEG音频:如mp3。MPEG系统:负责视频和音频的同步。88最初,MPEG专家组的工作项目是3个:MPEG-1:在1.5Mbps传输速率下对图像编码。MPEG-2:在l0Mbps传输速率下对图像编码。MPEG-3:在40Mbps传输速率下对图像编码。l992年,MPEG-2的适用范围扩大到HDTV(高清电视),能支持MPEG-3的所有功能,于是便取消了MPEG-3。到目前为止,MPEG共包括5个项目:MPEG-1和MPEG-2。MPEG-4:针对低速率下的视频、音频编码,更注重多媒体系统的交互性和灵活性。MPEG-7:支持多媒体基于内容的检索。MPEG-21:多媒体应用框架。896.2.1MPEG-1标准MPEG-1的主要任务:将视频信号及其伴音信号以可接受的重建质量,压缩到约1.5Mbps的码率,并复合成一个单一的MPEG位流,同时保证音视频的同步。MPEG-1主要用于在CD光盘上存储视频图像(VCD),它针对标准分辨率的图像进行压缩(NTSC制为352×240,PAL制为352×288),每秒30帧,具备CD音质。90MPEG-1标准的组成MPEG-1标准包括了5个部分:MPEG系统(11172-1):定义音频、视频及有关数据的同步;MPEG视频(11172-2):定义视频信号的编解码过程,亮度信号分辨率为360×240,色度信号分辨率为180×120;MPEG音频(11172-3):定义音频的编解码过程;一致性测试(11172-4):规定如何测试编解码器,以确认是否符合前三部分的要求;软件模拟(11172-5):该部分并非标准,只是关于用软件执行前三部分的技术结果报告。91MPEG-1视频MPEG-1标准中实现视频压缩编码的基本思想:在空间上的帧内压缩:采用基于DCT变换的类JPEG算法;在时间上的帧间压缩:采用基于块的运动补偿技术。在MPEG视频中,宏块是最基本的编码单元。运动信息就包含在宏块中,每个宏块可有一至二个运动矢量。92MPEG视频数据流的结构运动图像序列图片组图片图片切片宏块块8像素8像素YUV采样格式为4:2:093运动矢量运动矢量,也称移动矢量。运动矢量94MPEG视频的图像类型MPEG将视频图像分成3种类型:I图像:也称帧内图,采用基于DCT的JPEG编码技术压缩,每像素压缩后只需1~2bit。P图像:也称预测图,用最近的前一个I图像或P图像预测得到(前向预测),也可以作为下一次预测的参照图像。B图像:也称插补图、双向预测图,预测时需要同时使用前后两个I图像或P图像作为参照图像(双向预测)。95四种预测方法:帧内预测、前向预测、后向预测、双向预测96典型的图像类型次序MPEG编码器允许选择I图像的频率和位置,一般1秒钟使用2次I图像。MPEG编码器也允许选择在一对参照图像之间的B图像的数目。1秒参照帧间有2个B图像
每0.5秒就有1帧I图像
IBBPBBPBBPBBPBBIBBPBBPBBPBBPBB典型的图像类型次序97传输顺序若接收端接收的1~7帧图像顺序不变,同样为IBBPBBP,则解码第2帧B时,由于它是由第1帧I和第4帧P预测出的,但此时第4帧尚未恢复,将无法解码。为了便于解码器,MPEG编码器需对图像重新排序后再传输,以保证参照图像先于B图像恢复。上述1~7帧传输的次序应为:4213756IPBBPBB98I图像的编码帧内图像I不参照任何其他图像,可采用类似JPEG的压缩算法。99P图像的编码P图像使用两种类型的参数来表示:当前要编码的宏块与参考宏块之间的差值;宏块的运动矢量。100B图像的编码101基于块的运动补偿技术在MPEG方案中,运动补偿技术在宏块这一等级工作,主要用来消除P图像和B图像在时间上的冗余。基于块的运动补偿技术,即:在参照帧中寻找符合一定条件、当前被预测块宏块的最佳匹配块。找到匹配块后,可直接使用匹配块作为被预测块,也可以将匹配块+预测误差(采用ADCT编码)作为被预测块。102搜索运动矢量103各种图像类型的宏块处理技术I图像的数据量最大,B图像的数据量最小。1046.2.2MPEG-2标准MPEG-2标准于1993年发布,全称为“信息技术——电视图像和伴音信息的通用编码”,是一个与数字电视广播有关的、高质量图像和声音的编码标准。MPEG-2在MPEG-1的基本编码算法基础上进行了扩充,增加了许多新功能,如对隔行扫描电视的编码、可变位速率等。MPEG-2要达到的最基本目标是:位速率为4~9Mbit/s,最高达15Mbit/s。105MPEG-2可利用网络提供的3~100Mbps的数据传输率,来支持具有更高分辨率图像的压缩和更高的图像质量。MPEG-2是DVD的指定标准,其音频编码可提供5.1声道甚至7.1声道。MPEG-2标准定义了三种质量不同的编码方式:信噪比可变性、空间分辨率可变性、时间分辨率可变性。为了向下与MPEG-1兼容,并力求满足数字存储媒体、广播、通信、电视会议
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 业务单位合伙合同范本
- 嘉定工地吊车租赁合同范例
- 双层罐合同范例
- 商场礼品采购合同范本
- 商业店铺拆装合同范本
- 啤酒提成合同范本
- 出售转让合同范本
- 厨房转让合同范本
- 团建活动场地合同范例
- 国企货采购合同范本
- 混凝土拌合站拌合运输工程合同
- 机床操作与数控编程作业指导书
- 2025云南昆明空港投资开发集团招聘7人高频重点模拟试卷提升(共500题附带答案详解)
- 2024-2025学年人教版数学六年级下册第二单元百分数(二)单元检测(含答案)
- 湖北省武汉市江汉区2024-2025学年八年级(上)期末物理试卷(含解析)
- 《寄生虫学检验》课件-结膜吸吮线虫
- 2024年江西泰豪动漫职业学院高职单招职业技能测验历年参考题库(频考版)含答案解析
- 《习近平法治思想概论(第二版)》 课件 第十六章 正确处理政治和法治的关系;第十七章 正确处理改革和法治的关系
- 《习近平法治思想概论(第二版)》 课件 18.第十八章 正确处理发展和安全的关系
- 2025年湖北孝感市直事业单位招聘现役军人随军家属20人历年高频重点提升(共500题)附带答案详解
- 2024年中国作家协会所属单位招聘笔试真题
评论
0/150
提交评论