视频压缩原理_第1页
视频压缩原理_第2页
视频压缩原理_第3页
视频压缩原理_第4页
视频压缩原理_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

--------------------------------------------------------未经压缩的数字视频的数据量巨大存储困难传输困难2.为什么可以压缩•去除冗余信息••空间冗余:图像相邻像素之间有较强的相关性•时间冗余:视频序列的相邻图像之间内容相似•编码冗余:不同像素值出现的概率不同•视觉冗余:人的视觉系统对某些细节不敏感•知识冗余:规律性的结构可由先验知识和背景知识得到3.数据压缩分类•无损压缩(Lossless)•••••••••••压缩比低(2:1~3:1)•完全一致X=X'•有损压缩(Lossy)•XX'压缩比高(10:1~20:1)利用人的视觉系统的特性4.编解码器•编码器(Encoder)••压缩信号的设备或程序•解码器(Decoder)••解压缩信号的设备或程序•编解码器(Codec)••编解码器对5.压缩系统的组成的关键技术的关键技术6.编解码器实现••••P•软件•••机顶盒•数字电视•摄像机•监控器7.视频编码标准•••不同厂家生产的编码器压缩的码流能够被不同厂家的解码器解码•••标准编解码器可以进行批量生产,节约成本。•MPEG-2•MPEG-4SimpleProfile•H.264/AVC•AVS•VC-1•ITU:InternationalTelecommunicationsUnion----------------------------------------------------------------------------------------------------------------•VECG:VideoCodingExpertsGroup•ISO:InternationalStandardsOrganization••MPEG:MotionPictureExpertsGroup8.视频传输•视频传输:通过传输系统将压缩的视频码流从编码端传输到解码端•传输系统:互联网,地面无线广播,卫星9.视频传输面临的问题•传输系统不可靠••带宽限制•信号衰减•噪声干扰•传输延迟•视频传输出现的问题••不能解码出正确的视频•视频播放延迟10.视频传输差错控制•差错控制(ErrorControl)解决视频传输过程中由于数据丢失或延迟导致的问题•••信道编码差错控制技术•编码器差错恢复•解码器差错隐藏--------------------------------------------------------••••••数据包的端到端的延数据包的端到端的延迟带宽:比特/秒数据包的流失率数据包的延迟时间的波动1.图像与视频•••人对视觉感知的物质再现。三维自然场景的对象包括:深度,纹理和亮度信息二维图像:纹理和亮度信息••。视频由多幅图像构成,包含对象的运动信息,又称为运动图像。2.数字视频•数字视频:自然场景空间和时间的数字采样表示。••空间采样••解析度(Resolution)•样••帧率:帧/秒3.空间采样•二维数字视频图像空间采样4.数字视频系统•采集••照相机,摄像机•••编解码器,传输设备•••显示器•HVS••••经••••••对高频信息不敏感对高对比度更敏感对亮度信息比色度信息更敏感对运动的信息更敏感•丢弃高频信息,只编码低频信息•提高边缘信息的主观质量•降低色度的解析度•对感兴趣区域(RegionofInteresting,ROI)进行特殊处理•••••••三原色:红(R),绿(G),蓝(B)。•任何颜色都可以通过按一定比例混合三原色产生。••••••••Y:亮度分量•UV:两个色度分量YUV义图像格式12.帧和场图像•一帧图像包括两场——顶场,底场t≠ttopbot。13.逐行与隔行图像•逐行图像:一帧图像的两场在同一时间得到,•隔行图像:一帧图像的两场在不同时间得到,14.视频质量评价•有损视频压缩使编解码图像不同,需要一种手段来评价解码图像的质量。••••••••客观质量评价•主观质量评价•基于视觉的视频质量客观评价•客观质量评价:通过数学方法测量图像质量评价的方式。••可量可量化测量结果可重复测量简单•••不完全符合人的主观感知15.客观评价的方法16.主观评价方法•主观质量评价:用人的主观感知直接测量的方式。••符合人的主观感知•••不容易量化•受不确定因素影响,测量结果一般不可重复•测量代价高常用主观评价方法••••••••••••17.基于视觉的视频质量客观评价方法•基于视觉的视频质量客观评价:将人的视觉特性用数学方法描述并用于视频质量评结合了结合了主观质量评价和客观质量评价两方面优点。常用方法:结构相似度(StructuralSIMilarity,SSIM)方法。未来重要的研究方向1.通信系统的组成信源:产生消息信源:产生消息信道:传输消息信宿:接收消息2.基本概念••••••通信中对信息的表达分为三个层次:信号,消息,信息。•消息:是信息的载体,以文字,语言,图像等人类可以认知的形式表示。的内容。3.信息熵信息的特点信息的测量条件信息量4.信息熵5.条件熵和联合熵6.熵的性质•非负性:信源熵是非负值,即H(X)>=0;XM就等••极值性(最大信息熵):对于具有M个符号的信源,只有在所有符号等概率出现的情况下,信源熵达到最大值,即•--------------------------------------------------------•••••熵不增:条件熵不大于信息熵熵不增:条件熵不大于信息熵H(X|Y)<=H(X);各信息熵的和,即H(XY)<=H(X)+H(Y)。7.互信息量8.互信息9.各种熵的关系--------------------------------------------------------信源编码•信源编码:将消息符号转变成信道可传输的信息。•••用尽可能少的信道传输符号来传递信源消息,提高传输效率;•减少由于信道传输符号的减少导致的失真。12.离散信源统计特性13.离散信源类型:简单无记忆信源和马尔可夫信源编码分类mMmcmMm平均码长16.等长码与变长码比较•等长编码将信源输出符号序列的任意一种取值(概率可能不同)都编码成相同长度性;•变长编码可以根据信源输出符号序列各种取值的概率大小不同,将他们编码成不同长度的输出码字,利用了信源的统计特性。因此又称其为熵编码。Huffman变长编码。••12nxpxn-1n这两个信源符号合并成一个新符号,并用这两个最小的概率之和作为新符号缩减信源,用S表表示。1S只含1(n-2)个符号的缩减信源S。2率之和必为1。然后从最后一级缩减信源开始,依编码路径向前返回,就得到各信源符号所对应的码字。信道编码•信道编码主要考虑如何增加信号的抗干扰能力,提高传输的可靠性,并且提高传输•一般是采用冗余编码法,赋予信码自身一定的纠错和检错能力,使信道传输的差错概率降到允许的范围之内。信道类型•根据信道连续与否分类••离散信道•连续信道•半连续信道•根据信道是否有干扰分类••无干扰信道•有干扰信道00•根据信道的统计特性分类••无记忆信道•有记忆信道•恒参信道•变参信道•对称信道•非对称信道20.信道容量•在信息论中,称信道无差错传输的最大信息速率为信道容量。••则该信道的容量为nB0还可以表示还可以表示为21.香农信道容量公式的意义•••实际传输速率一般不能大于信道容量C,除非允许存在一定的差错率。n一定,有0通过系统带宽与信噪比的互换而保持不变。•••12•••12n12n22.失真•失真:信源的消息经过编解码后不能完全复原•在实际的信源和信道编码中,消息的传输并不总是无失真的。•由由于存储和传输资源的限制噪声等因素的干扰23.率失真理论•RD)•••24.失真函数••dd(x,y),称d(x,y)为单个符号的失ijij真度或失真函数。对于连续信源连续信道的情况,常用d(x,y)表示。•••••第四章视频编码基础流•语法:码流中各个元素的位置关系••01001001…码类型(01),宏块类型(00),编码系数1001等•语义:每个语法元素所表达的意义。••例如:图像编码类型2.编码层次•序列(Sequence)•图像组(GroupofPictures,GOP)•图像(Picture)•条带(Slice)•宏块(Macroblock,MB)•块(Block)3.码流结构4.序列编码对象(1)IBBP序列•序列:一段连续编码的并具有相同参数的视频图像。•序列起始码:专有的一段比特串,标识一个序列的压缩数据的开始•EGB•序列头:记录序列信息••档次(Profile),级别(Level),宽度,高度,是否是逐行序列,帧率等。•序列结束码:专有的一段比特串,标识该序列的压缩数据的结束•EGB5.图像组编码对象6.图像编码结构•图像:•图像起始码:专有的一段比特串,标识一个图像的压缩数据的开始•PEG•图像头:记录图像信息••图像编码类型,图像距离,图像编码结构,图像是否为逐行扫描。7.图像分块编码8.条带编码结构•条带:多个宏块的组合。•条带起始码:专有的一段比特串,标识一个条带的压缩数据的开始•MPEG1(0~AF)。•条带头:记录当前图像的相关信息••条带位置,条带量化参数,宏块编码技术标识等。9.条带编码对象••宏块内容:宏块编码类型,编码模式,参考帧索引,运动矢量信息,宏块编码系数••宏块内容:宏块编码类型,编码模式,参考帧索引,运动矢量信息,宏块编码系数10.宏块编码结构宏宏块:16x16的像素块(对亮度而言)。11.宏块编码对象12.块编码结构----------------------------------------------------------------------------------------------------------------•••••••••••CBP(CodedBlockPatten):用来指示块的变换量化系数是否全为零。••每个块的变换量化系数的最后用一个EOB(EndofBlock)符号来标识。13.视频编解码关键技术预测:预测:通过帧内预测和帧间预测降低视频图像的空间冗余和时间冗余。变换:通过从时域到频域的变换,去除相邻数据之间的相关性,即去除空间冗余。量化:通过用更粗糙的数据表示精细的数据来降低编码的数据量,或者通过去除人眼不敏感的信息来降低编码数据量。扫描:将二维变换量化数据重新组织成一维的数据序列。熵编码:根据待编码数据的概率特性减少编码冗余。•空间预测:利用图像空间相邻像素的相关性来预测的方法。••帧内预测技术:利用当前编码块周围已经重构出来的像素预测当前块•Intra图像编码(I帧)•时间预测:利用时间上相邻图像的相关性来预测的方法。••帧间预测:运动估计(MotionEstimation,ME),运动补偿(MotionCompensation,MC)•Inter图像编码:前向预测编码图像(P帧),双向预测编码图像(B帧)5.帧内预测•I帧图像的每个宏块都采用帧内(Intra)预测编码模式。rax•帧内预测有多个预测方向:水平,垂直,左下,右上。•帧内预测还有直流(DC)预测。•度块预测还有平面预测。••6.帧间预测•块基运动估计:为待预测块在参考帧上找到最佳的预测块,并记录预测块在参考帧•运动矢量(MV):参考帧上的预测块与当前帧上的的待预测块的相对位置。••MV有两个分量:(x,y)•分像素运动估计••最佳的预测块不在整像素位置,而在分像素位置;,1/8像素插值得到分像素值。•••MV和参考帧,为待解码块从参考帧上获取预测块。•运动矢量编码••MV预测:用当前块的周围可得到邻块的运动矢量来预测当前块的运动矢量•运动矢量差(MVdifference,MVD):实际运动矢量与预测运动矢量的差,•运动矢量差采用变长编码。••预测残差变换编码•变换编码:通过变换将空域信号转换为频域信号来去除空间信号的冗余信息,减少•二维离散余弦变换••二维离散余弦变换•变换系数:直流(DC)系数,交流(AC)系数•量化原理:将含有大量的数据集合映射到含有少量的数据集合中。•一般情况下量化后高频部分包含大量的零系数•量化对主观质量的影响20.扫描•扫描:将二维数据转换为一维的数据序列。21.熵编码•熵编码:根据符号出现的概率,对经常出现的符号分配较短的码字,对不常出现的字。•Level-Run编码:用数据中非零值和其前面非零值之间出现零值的个数重新描述量化系数序列为(Level,Run)二元组序列••••••••变长编码••将Level-Run编码后的(level,run)变长编码成最终的比特串。22.码率控制受到缓冲区,带宽的限制,编码码率不能无限制的增长,因此需要通过码率控受到缓冲区,带宽的限制,编码码率不能无限制的增长,因此需要通过码率控制来将编码码流控制在目标码率范围内。•一般通过调整量化参数的手段控制码率•控制条带级控制宏块级控制码率控制考虑的问题••防止码流有较大的波动,导致缓冲区发生溢出,•同时保持缓冲区尽可能的充满,让图像质量尽可能的好而且稳定•CBR(ConstantBitRate)••比特率稳定,但图像质量变化大•VBR(VariableBitRate)••比特率波动大,但图像质量稳定•码率控制算法••码率分配•码率控制•码率控制属于非标准技术••编码端有,解码端没有术间冗余。•视频存在大量的空间冗余和时间冗余•----------------------------------------------------------------------------------------------------------------空间冗余:用帧内预测编码去除••基于块的帧内预测•时间冗余:用帧间预测编码去除••基于块匹配(BlockMatching)的帧间预测•预测后得到去除大部分空间或时间冗余的残差2.空间冗余•图像空间相邻像素具有很强的相关性。•帧内预测技术去除空间冗余3.亮度预测模式4.色度预测模式•••5.时间冗余•视频图像在时间上有较强的相关性,即存在时间冗余•去除时间冗余的编码技术••运动估计(MotionEstimation,ME)•为为待编码块搜索最相似的预测块记录运动矢量(MotionVector,MV)•运动补偿(MotionCompensation,MC)••根据运动矢量获取预测块算重构块:6.运动模型(1)平移7.匹配准则8.匹配准则简化•简化技术方法••分别计算当前块和预测块的象素值和•根据简化形式,比较当前块和预测块定预测效果不好,不必对预测块再进行比较。9.运动估计•去除视频图像的时间冗余•运动估计在搜索范围内为当前块寻找匹配最好的预测块•全搜索方式的运动估计计算复杂度高10.全搜索复杂度分析•搜索点个数(2R+1)2总和N2(2R+1)2NRMN(2R+1)2M2••--------------------------------------------------------•=172X5122•••••11.快速运动估计•在保持预测精度的同时减少运动估计的搜索次数。••三步搜索(ThreeStepSearch,TSS)•二维Log搜索(2DLogarithmicSearch,2DLOG)•正交搜索(OrthogonalSearchAlgorithm,OSA)•十字搜索(CrossSearchAlgorithm,CSA)•新三步搜索(NewThreeStepSearch,NTSS)•四步搜索(FourStepSearch,FSS)•共轭方向搜索(ConjugateDirectionSearch,CDS)•梯度下降搜索(GradientDescentSearch,GDS)•层次块搜索(HierarchicalBlockMatchingAlgorithm,HBMA)三步搜索--------------------------------------------------------第三步:以新的起始点为中心检查其周围步长为••2第三步:以新的起始点为中心检查其周围步长为••2R/8=1则搜索终止,最优点位置的预测块作为最优的预测块,否则重复该过程直到n三步搜索方法检查点的个数为1+8log(d+1),当d=8时,检查点个数为9+8+8=25•••••R.•每一步采用十字搜索模式如果每一步的最优点为中心点或者搜索窗的边界点,搜索步长减半,否则搜索步如果每一步的最优点为中心点或者搜索窗的边界点,搜索步长减半,否则搜索步长•两个搜索路径一个需要5+3+3+8=19,另外一个需要5+3+2+3+2+8=232正交搜索•起始搜索步长

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论