




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章视频编码技术1.视频信号的数字化2.视频文件格式3.视频压缩编码原理4.视频压缩标准1ppt课件第3章视频编码技术1.视频信号的数字化1ppt课件学习目标掌握视频数字化方法了解视频文件格式掌握视频压缩编码原理(预测编码、变换编码、统计编码原理)理解视频压缩标准(MPEG标准)2ppt课件学习目标掌握视频数字化方法2ppt课件3.1视频信号的数字化
所谓视频(videofrequency
),连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频。即视频是由一系列单独的静止图像组成,其单位用帧或格来表示;
人眼在观察景物时,光信号传入大脑神经,需经过一段短暂的时间,光的作用结束后,视觉形象并不立即消失,而能继续保留其影像0.1-0.4秒左右,这种现象被称为视觉暂留现象。1.视频相关的基本概念3ppt课件3.1视频信号的数字化所谓视频(vide帧:一帧是扫描获得的一幅完整图像的信号,是视频图像的最小单位;“帧”在动画创作当中又称“格”。帧率:就是每秒钟扫描多少帧。对于PAL制式电视系统,帧率为25帧;而NTSC制式电视系统,帧率为30帧。场:视频的一个扫描过程。有逐行扫描和隔行扫描,对于逐行扫描,一帧即是一个垂直扫描场;对于隔行扫描,一帧由两场构成:奇数场和偶数场,是用两个隔行扫描场表示一帧。1.视频相关的基本概念4ppt课件帧:一帧是扫描获得的一幅完整图像的信号,是视1.视频相关的基(1)逐行扫描图逐行扫描方式实线为行扫描的正程,左→右;虚线逆程,右→左。1.视频相关的基本概念5ppt课件(1)逐行扫描图逐行扫描方式实线为行扫描的正程,左→右;1(2)隔行扫描图隔行扫描方式1.视频相关的基本概念6ppt课件(2)隔行扫描图隔行扫描方式1.视频相关的基本概念6pp
视频信号有模拟视频信号与数字视频信号之分。模拟视频即指由连续的模拟信号组成视频图像,它的存储介质是磁带或录像带;在编辑或转录过程中画面质量会降低。数字视频是把模拟信号变为数字信号,它描绘的是图像中的单个像素,可以直接存储在电脑硬盘中,因此在编辑过程中可以最大限度地保证画面质量几乎没有损失。1.视频相关的基本概念7ppt课件视频信号有模拟视频信号与数字视频信号之分。1.视频相关的基
但数字视频的数据量是非常惊人的,按照ITU-R601标准4∶2∶2格式的PAL制数字化视频信号,每帧数据量为720×576×8×2≈6.64Mbit,每秒数据量为6.64×25≈165Mbit。ITU-R601——数字演播室标准4:2:2格式中色差信号的取样为亮度信号的一半。600Mbit的存储空间只能存储90帧的视频图像信号,或者说可以存储大约3.6s的数字电视节目。如果存储更高分辨率的高清数字电视信号,那存储时间就更短了,大约只有几秒钟。因此对视频的处理、传输、存储和显示提出了更高的要求。1.视频相关的基本概念8ppt课件但数字视频的数据量是非常惊人的,按照I
视频信息和信号特点:(1)直观性:给人印象更深刻、生动、具体。(2)确定性:“百闻不如一见”。(3)高效性:人眼是一个高度复杂的并行信息处理系统,能并行快速地观察一幅图像的细节,因此它获取视频信息的效率要比语音信息高得多。(4)广泛性:人类接受的信息,80%来自视觉。1.视频相关的基本概念9ppt课件视频信息和信号特点:(1)直观性:给人印象更深刻、生动、数字视频的获取方法:2.视频的采集及数字化从现成的数字视频库中截取。利用计算机软件制作视频。利用计算机生成的动画,如把flc或gif动画格式转换成avi等视频格式。把静态图像或图形文件序列组合成视频文件序列。通过视频采集设备获取数字视频。通过视频采集卡把模拟视频转换成数字视频,并按数字视频文件的格式保存下来。10ppt课件数字视频的获取方法:2.视频的采集及数字化从现成的数字视频库数字视频的采集系统视频源设备:录像机、电视机、影碟机等;视频采集卡:对模拟视频信号进行采样、量化和编码的设备;高性能计算机:接收和记录编码后的数字视频数据。大容量存储设备:存储经过编辑修改的数字视频文件。2.视频的采集及数字化11ppt课件数字视频的采集系统视频源设备:录像机、电视机、影碟机等;2.视频采集卡的接口复合端口色差分量接口S-Video信号端子IEEE1394接口2.视频的采集及数字化12ppt课件视频采集卡的接口复合端口2.视频的采集及数字化12ppt课件视频采集卡的接口复合端口
也称AV接口,通常都是成对的白色音频接口和黄色的视频接口,常用接头有BNC接头和莲花(RCA)接头。传输的是亮度/色度(Y/C)混合在一起的视频信号。易导致亮、色串扰、清晰度降低等问题,是最差的视频信号。2.视频的采集及数字化13ppt课件视频采集卡的接口复合端口也称AV接口,通常都
分量视频信号(ComponentVideoSignal)是指每个基色分量作为独立的视频信号。一般用亮度-色差表示,如Y和Cr、Cb,Y和I、Q,Y和U、V。使用分量视频信号是表示颜色的最好方法。
分量信号接入口视频采集卡的接口色差分量接口2.视频的采集及数字化14ppt课件分量视频信号(ComponentVideoSig视频采集卡的接口S-Video信号端子
S-Video四芯插头(座)
地(亮度)地(色度)亮度(含同步信号)色度S端子信号,它同时传送两路信号:亮度信号Y和色度信号C。由于将亮度和色度分离,色度对亮度的串扰现象也消失。其图象质量优于复合视频信号,但低于分量视频信号。
S端子用四芯插头,一些计算机显卡或非线性编辑卡也有用七芯插头,其外形与S端子一样,只是又包含了复合视频信号。2.视频的采集及数字化15ppt课件视频采集卡的接口S-Video信号端子S-Vi视频采集卡的接口2.视频的采集及数字化莲花接头16ppt课件视频采集卡的接口2.视频的采集及数字化莲花接头16ppt课件视频采集卡的接口IEEE1394接口IEEE1394是一种外部串行总线标准,800Mbps的高速。1394接口具有把一个输入信息源传来的数据向多个输出机器广播的功能,特别适用于家庭视听的连接。由于该接口具有等时间的传送功能,确保视听AV设备重播声音和图像数据质量,具有好的重播效果。2.视频的采集及数字化17ppt课件视频采集卡的接口IEEE1394接口IEEE1视频图像的数字化2.视频的采集及数字化
数字化方法(1)先从复合彩色图像中分离出彩色分量,然后数字化。(2)首先用一个高速A/D转换器对彩色全信号进行数字化,然后在数字域中进行分离,以获得所希望的YCbCr,YUV,YIQ或RGB分量数据。18ppt课件视频图像的数字化2.视频的采集及数字化数字化方法18ppt
数字化标准——ITU-RBT.601标准彩色电视图像数字化标准,称为CCIR601标准,现改为ITU-RBT.601标准。该标准规定了彩色电视图像转换成数字图像时使用的采样频率,彩色空间之间的转换关系等。视频图像的数字化2.视频的采集及数字化(1)色彩空间转换19ppt课件数字化标准——ITU-RBT.601标准视频图像的数字化视频图像的数字化2.视频的采集及数字化
(2)采样频率亮度信号采样频率fs=13.5MHZ;色度信号采样频率fc=6.75MHZ或13.5MHZ;每个扫描行的有效样本数均为720;
如图2.15(数字视频技术及应用P23)
数字信号取值范围:亮度信号220级,色度信号225级。
①对PAL制、SECAM制,采样频率fs为:
fs=625(行数/帧)×25(帧数/秒)×N=15625×N=13.5MHz,N=864
其中,N为每一扫描行上的采样数目。
②对NTSC制,采样频率fs为:
fs=525×29.97×N=15734×N=13.5MHz,N=858
其中,N为每一扫描行上的采样数目。20ppt课件视频图像的数字化2.视频的采集及数字化(2)采样频率20p视频图像的数字化
(3)亮度和色度信号的采样
Y:Cb:Cr=4:1:1
这种方式是在每4个连续的采样点上,取4个亮度Y的样本值,而色差Cb、Cr分别取其第一点的样本值,共6个样本。
Y:Cb:Cr
=4:2:2
这种方式是在每4个连续的采样点上,取4个亮度Y的样本值,而色差Cb、Cr分别取其第一点和第三点的样本值,共8个样本。这种方式能给信号的转换留有一定余量,效果更好一些。这是通常所用的方式。2.视频的采集及数字化Y:Cb:Cr
=4:4:4
在这种方式中,对每个采样点,亮度Y、色差Cb、Cr各取一个样本。这种方式对于原本就具有较高质量的信号源,可以保证其色彩质量,但信息量大。21ppt课件视频图像的数字化(3)亮度和色度信号的采样2.视频的采集及Y:U:V=4:2:0
分两种情况:
MPEG-1/H.261/H.263等标准使用的:水平方向的2个Y样本和垂直方向上的2个Y样本共用1个Cb样本和1个Cr样本。
MPEG-2标准使用的:
MPEG-2相对于MPEG-1的Cr,Cb子采样在水平方向有半个像素的偏移。22ppt课件Y:U:V=4:2:022ppt课件图ITU-TBT.601建议的取样点结构23ppt课件图ITU-TBT.601建议的取样点结构23ppt课件图ITU-TBT.601建议的取样点结构(续)MPEG-224ppt课件图ITU-TBT.601建议的取样点结构(续)MPEG-图ITU-TBT.601建议的取样点结构(续)MPEG-1/H.261/H.263××××××××××××××××××××××××××××××××eMPEG-1相对于MPEG-2的Cr,Cb子采样在水平方向有半个像素的偏移。25ppt课件图ITU-TBT.601建议的取样点结构(续)MPEG-表ITU-TBT.601建议的4∶2∶2标准26ppt课件表ITU-TBT.601建议的4∶2∶2标准26ppt课
(4)分辨率
CCITT规定了称为公用中分辨率格式CIF(CommonIntermediateFormat)和1/4公用中分辨率格式(Quarter-CIF,QCIF)格式。-QCIF:176x144-CIF:352x288-SD(标清):720x480;640x480,704x480,720x576-HD(高清):1280x720,1920x1080视频图像的数字化2.视频的采集及数字化
CCITT:InternationalTelephoneandTelegraphConsultativeCommittee,国际电报电话咨询委员会27ppt课件(4)分辨率视频图像的数字化2.视频的采集及数字化
(1)本地影像视频格式
-AVI格式,英文全称为AudioVideoInterleaved,即音频视频交错格式。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,现在几乎所有的非线性编辑系统都支持AVI格式。其缺点是体积过于庞大。压缩标准不统一是其主要问题。
-DV-AVI格式,DV的英文全称是DigitalVideoFormat,是由索尼、松下等多家厂商联合提出的一种家用数字视频格式。它可以通过电脑的IEEE1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式。3.2数字视频文件格式28ppt课件(1)本地影像视频格式3.2数字视频文件格式28ppt课
-MPEG格式,英文全称为MovingPictureExpertGroup,即运动图像专家组格式。MPEG文件格式是运动图像压缩算法的国际标准,MPEG不是一种简单的文件格式,而是编码方案。它采用了有损压缩方法减少运动图像中的冗余信息,其最大压缩比可达到200:1。目前MPEG视频格式常见的压缩标准是MPEG-1、MPEG-2、MPEG-4。家里常看的VCD、SVCD、DVD就是这种格式。
-DivX格式,是由MPEG-4衍生出的另一种视频编码(压缩)标准,也即DVDrip格式,它采用了DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩,然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD并且体积只有DVD的数分之一。3.2数字视频文件格式(1)本地影像视频格式29ppt课件-MPEG格式,英文全称为MovingPictur30ppt课件30ppt课件31ppt课件31ppt课件
-MOV格式,美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTimePlayer。具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性,即不仅能支持MacOS,同样也能支持Windows系列。
AvidMediacomposer非线性编辑软件支持该格式。(1)本地影像视频格式32ppt课件-MOV格式,美国Apple公司开发的一种视频格式,默认33ppt课件33ppt课件(2)网络影像视频格式
广泛应用于视频点播、网络演示、远程教育、网络视频广告等等互联网信息服务领域。
-ASF格式,英文全称为AdvancedStreamingFormat,是微软推出的可以直接使用Windows自带的WindowsMediaPlayer对其进行播放。它使用了MPEG-4的压缩算法,所以压缩率和图像的质量都很不错。
-WMV格式,英文全称为WindowsMediaVideo,也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、多语言支持、环境独立性、丰富的流间关系以及扩展性等。
3.2数字视频文件格式34ppt课件(2)网络影像视频格式3.2数字视频文件格式34ppt课
-RM格式,RealNetworks公司所制定的音频视频压缩规范称为RealMedia,用户可以使用RealPlayer或RealOnePlayer进行实况转播,可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放,实现在线播放。另外,RM作为目前主流网络视频格式,可以通过其RealServer服务器将其它格式的视频转换成RM视频并由RealServer服务器负责对外发布和播放。3.2数字视频文件格式(2)网络影像视频格式35ppt课件-RM格式,RealNetworks公司所制定的音频视
-RMVB格式,是一种由RM视频格式升级延伸出的新视频格式。RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,对静止和动作场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用,保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。(2)网络影像视频格式3.2数字视频文件格式36ppt课件-RMVB格式,是一种由RM视频格式升级延伸出的新视频表常用的视频格式转换软件3.2数字视频文件格式未完,见续表37ppt课件表常用的视频格式转换软件3.2数字视频文件格式未完,见表常用的视频格式转换软件(续表)3.2数字视频文件格式38ppt课件表常用的视频格式转换软件(续表3.3视频压缩编码1.视频压缩原理
视频数据之所以能被压缩,是因为在视频数据中存在着大量的冗余信息。
视频数据主要存在下列冗余:(1)空间冗余,同一帧图像中相邻的像素具有很强的相关性。(2)时间冗余,图像序列中相邻帧的对应像素具有很强的相关性。(3)结构冗余,在视频图像的纹理区,像素的亮、色度信息存在着明显的分布模式,如果知道了分布模式,就可以通过某种算法来生成图像,即存在结构冗余。空间冗余时间冗余39ppt课件3.3视频压缩编码1.视频压缩原理视频数1.视频压缩原理(4)视觉冗余,研究发现人眼的视觉特性是非均匀和非线性的。例如,人眼对视频图像色度的敏感性远低于对亮度的敏感性,对低频信息的敏感度高于对高频信息的敏感度等等。在很多场合,人眼是视频信息的最终接收者,因此,可以对人眼不敏感的信息少编码甚至不编码以压缩数据量。(5)知识冗余,指视频图像中所包含的某些信息与人们的一些先验知识有关。例如在头肩图像中,头、眼、鼻和嘴的相对位置等信息就是人类的共性知识。3.3视频压缩编码
40ppt课件1.视频压缩原理(4)视觉冗余,研究发现人眼的视觉特性是非均视频压缩编码的类型:预测编码:差分脉冲PCM等变换编码:正交变换、离散余弦变换统计编码:霍夫曼编码、游程编码、算术编码子带编码小波变换编码分形编码知识(模型)基编码3.3视频压缩编码2.视频压缩编码41ppt课件视频压缩编码的类型:3.3视频压缩编码2.视频压缩编码43.3.1预测编码1.预测编码的基本内容预测编码是基于图像数据的时间和空间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。42ppt课件3.3.1预测编码1.预测编码的基本内容42ppt课
这些相邻像素(或图像块)可以是同行扫描的,也可以是前几行或前几帧的,相应的预测编码分别称为一维、二维和三维预测,其中一维和二维预测是帧内预测,三维预测是帧间预测,即在时间轴上用前一帧的像素(或图像块)对后一帧的像素(或图像块)进行预测。
帧间预测编码主要利用活动图像序列相邻帧间的相关性,即图像数据的时间冗余来达到压缩的目的,它可以获得比帧内预测编码高得多的压缩比。43ppt课件这些相邻像素(或图像块)可以是同行扫描2.预测编码的类型
预测编码分线性预测和非线性预测两类,线性预测编码又称为差分脉冲编码调制,即DPCM(DifferentialPulseCodeModulation)。
DPCM系统又称预测量化系统。44ppt课件2.预测编码的类型预测编码分线性预测差分脉冲调制预测——原理图量化器预测器译码器预测器-++编码器发送端接收端Xndn^XnXn’dn’dn’^XnXn’45ppt课件差分脉冲调制预测——原理图量化器预测器译码器预测器-++编码差分脉冲调制预测发送端预测器带有存储器,把tn时刻以前的采样值x1,x2,x3,xn-1存储起来并据此对xn进行预测,得到预测值dn为xn与的差值,dn’为dn经量化器量化的值xn’是接收端的输出信号误差qn为
qn=xn-xn’=xn-(+dn’)=(xn-)-dn’=dn-dn’实际上就是发送端的量化器对误差量化的误差对dn’的量化越粗糙,压缩比越高,失真越大^Xn^Xn^Xn^Xn46ppt课件差分脉冲调制预测^^^^46ppt课件差分脉冲调制预测——应用示例例如,取一序列为10,12,14,16,18,20。(例如亮度变化缓慢的图像的亮度值)由于其中所有数字都不相同,但是是一个等差的数列,所以行程编码和哈夫曼对其不产生压缩效果。先用DPCM方法,其预测器的预测参数为
=Xn-1,则其误差值得到一个新的序列10,2,2,2,2,2。然后再使用行程编码方法对这个新序列进行压缩,压缩结果为10(5,2)。^Xn47ppt课件差分脉冲调制预测——应用示例^47ppt课件差分脉冲调制预测适用于输入数据为平稳的随机过程预测器设计是预测编码系统的核心,预测器的复杂程度与线性预测中使用以前的样本数有关,样本数越多,预测器越复杂对预测误差的量化是造成图像质量下降的主要原因,表现为:斜率过载:图像轮廓变模糊颗粒噪声:图像在平坦区出现颗粒状的细斑边缘忙乱:在变化不快的边缘出现闪烁不定现象伪轮廓:在图像亮度值缓慢变化区域出现伪轮廓48ppt课件差分脉冲调制预测48ppt课件3.双向预测
前向预测:就是用K-1帧来预测K帧图像。后向预测:用K帧预测前面的K-1帧图像。
双向预测:用前、后两帧来预测中间帧图像。图双向预测示意图49ppt课件3.双向预测前向预测:就是用K-1帧来预测K帧图像50ppt课件50ppt课件51ppt课件51ppt课件图I、P和B图像的依赖关系I帧:帧内图(IntraPicture),只做帧内编码P帧:预测图(PredictedPicture),前向预测帧B帧:双向图(BidirectionalPicture),双向预测帧52ppt课件图I、P和B图像的依赖关系I帧:帧内图(IntraP
(1)I帧
I帧采用类似JPEG的编码方式实现。它不以任何其他帧做参考帧,仅仅进行帧内的空域冗余压缩。53ppt课件(1)I帧53ppt课件
(2)P帧
P帧是由一个过去的I帧或P帧采用运动补偿的帧间预测进行更有效的编码方式。图像P由残差图像SAD和运动矢量MV组成。DCT+量化+RLE54ppt课件(2)P帧DCT+量化+RLE54ppt课件图5-12运动自适应帧内插55ppt课件图5-12运动自适应帧内插55ppt课件
(3)B帧
B帧是用过去的图像(I帧或P帧)和后来的图像帧(I帧或P帧),采用运动补偿的双向预测编码方式。DCT+量化+RLE56ppt课件(3)B帧DCT+量化+RLE56ppt课件4.像素块预测MPEG编码时,先将一帧图像分割成若干横条,每一横条称为一片,在625行的PAL制中,每帧图像切成18片,在525行的NTSC制中,每帧图像切成15片。每一片再纵向切割成22块,这些块称为宏块或大块,它是MPEG标准的图像处理基本单元。57ppt课件4.像素块预测MPEG编码时,先将一
每个宏块中的彩色图像,可以用一个亮度信号Y和两个色差信号Cb和Cr来表示,由于人眼对亮度信号敏感高于色度信号,因而对每个宏块的亮度信号再平均分成4个像块。每个像块在水平方向分成8个像素,垂直方向也分成8个像素,则每个像块可分成64个像素,而两个色差信号Cb、Cr宏块不再分成像块,而是直接分成64个像素,如图5-8所示。58ppt课件每个宏块中的彩色图像,可以用一个亮度信图5-8MPEG图像的格式59ppt课件图5-8MPEG图像的格式59ppt课件
在图像编码领域目前使用的运动估值算法有块匹配法、像素递归法、相位相关法以及针对由摄像机运动引起图像全局运动的全局运动参数估值等。
其中块匹配法是最常用的一种方法,在活动视频编码的国际标准H.261、MPEG-1、MPEG-2中,实际都采用块匹配法做运动估值。60ppt课件在图像编码领域目前使用的运动估值算法有
变换编码的基本原理就是将原来在空间域或时间域内描述的信号,变换到正交矢量空间(频域或变换域)中去,用变换系数来表示原始图像,并对变换系数进行编码。3.3.2变换编码
尽管变换本身并不带来数据压缩,但由于变换后信号的能量大部分集中于少数几个变换系数上,删去对信号贡献较小(方差小)的系数,就可以达到有效压缩的目的,并且不会引起明显的失真。正交变换K-L变换离散余弦DCT变换61ppt课件变换编码的基本原理就是将原来在空间域或时K-L变换只是理论上的最佳方法,由于本身没有通用的变换矩阵,计算量大,应用起来不现实。在实际编码工作中,人们更常采用离散余弦变换(DCT)。它也是正交变换,非常接近K-L变换,效果仅次于K-L变换。对大多数图像信源来说,DCT变换是在现行变换编码方法中最接近K-L变换的方法。
62ppt课件K-L变换只是理论上的最佳方法,由于本图5-16变换编码系统框图63ppt课件图5-16变换编码系统框图63ppt课件
实现变换编码可以分4个步骤完成:第1步是选择方块的大小,较好的方块尺寸是4×4(H.264)、8×8(H.261,JPEG,MPEG)或16×16;第2步是选择变换类型,DCT变换是目前应用最广泛的一种类型;第3步是选择变换系数,并对其进行高效的量化,以便传输或存储;第4步是对量化系数进行比特分配即编码,通常使用Huffman编码或游程编码。64ppt课件实现变换编码可以分4个步骤完成:第3步是选择变换系数1.二维8×8DCT变换图5-17DCT后系数65ppt课件1.二维8×8DCT变换图5-17DCT后系数65pp图5-18Z字形扫描66ppt课件图5-18Z字形扫描66ppt课件图5-208×8亮度抽样信号的DCT压缩编码实例67ppt课件图5-208×8亮度抽样信号的DCT压缩编码实例67pp图5-208×8亮度抽样信号的DCT压缩编码实例Z字形扫描和0游程编码
按顺序记录数据,直到最后一个非0数据,然后加上块结束码EOB。解码端收到EOB后自动补0,直至补够64个系数。68ppt课件图5-208×8亮度抽样信号的DCT压缩编码实例Z字形扫图5-21转换扫描示意图
转换扫描:MPEG-2中采用,适用于隔行扫描。69ppt课件图5-21转换扫描示意图转换扫描:MPEG-2中采3.3.3统计编码
根据信息码字出现的概率分布特性寻找概率与码字长度间的最优匹配,据此对信息进行压缩,这就是统计编码方法。
常用的统计编码有霍夫曼(Huffman)编码、游程编码和算术编码三种。70ppt课件3.3.3统计编码根据信息码字出哈夫曼编码最佳编码定理哈夫曼1952年提出内容:在变字长编码中,对于出现概率大的信息符号编以短字长的码,对于概率小的符号编以长字长的码。如果码字长度严格按所对应符号出现概率大小逆序排列,则平均码字长度一定小于其他以任何符号顺序排列方式得到的平均码字长度.71ppt课件哈夫曼编码最佳编码定理71ppt课件哈夫曼编码编码方法步骤1.将符号按出现概率由大到小排列,给最后两个符号赋予一个二进制码,概率大的赋1,小的赋0(反之亦可);2.把最后两个符号的概率合成一个概率,重复上一步;3.重复步骤2,直到最后只剩下两个概率为止;4.将每个符号所对应的分支的0,1反序排出即可.72ppt课件哈夫曼编码编码方法72ppt课件可以看出,概率大的符号其编码短,概率小的符号其编码长,符号使用其编码来表示,达到数据压缩目的。哈夫曼编码过程演示A1A2A3A4A5A6A70.230.210.180.150.130.070.03100.10100.23100.33100.44
1
00.56011编码01001111101011001100073ppt课件可以看出,概率大的符号其编码短,概率小的符号其编码长,符号使哈夫曼编码哈夫曼编码过程演示74ppt课件哈夫曼编码哈夫曼编码过程演示74ppt课件哈夫曼编码哈夫曼编码结果分析编码010011111010110011000码长2233344码字的平均长度_
7N=∑niP(ai)=2.72biti=1信息符号的熵值
7H(a)=∑P(ai)log2P(ai)=2.61biti=1编码效率:=
2.61/2.72≈
96%可见,哈夫曼编码结果,其平均长度接近于信息符号的熵值,但是仍有冗余。75ppt课件哈夫曼编码哈夫曼编码结果分析编码01码长2码哈夫曼编码哈夫曼编码最佳情况示例信源有四个符号:
Xa1a2a3a41/21/41/81/8
信息熵:
H(x)=-1/2log2(1/2)-1/4log2(1/4)-1/8log2(1/8)2=1.75bit/字符76ppt课件哈夫曼编码哈夫曼编码最佳情况示例76ppt课件哈夫曼编码a1
a2
a3
a4
1/21/41/81/8符号概率011/4011/2011编码010110111采用哈夫曼编码(二进制编码)
a1a2a3a4
_010110111平均码长:N=(1/2)1+(1/4)2+(1/8)6=1.75bit/字符编码效率:=1.75/1.75=100%哈夫曼编码最佳情况示例77ppt课件哈夫曼编码a11/2符号概率011/4011/20
图像的子带编码(SubbandCoding,SBC)是从语音的子带编码移植过来的。子带编码与变换编码一样,是一种在频率域中进行数据压缩的方法。3.3.4子带编码(SBC)78ppt课件图像的子带编码(SubbandCoding79ppt课件79ppt课件80ppt课件80ppt课件
取样后的信号经过量化、编码,合并成一个总的码流传送给接收端。在接收端,首先把码流分成与原来的各子带信号相对应的子带码流(分频),然后解码,将频谱搬移至原来的位置,最后经带通滤波器后,合并得到重建的信号。81ppt课件取样后的信号经过量化、编码,合并成一个总的码图5-284子带为基础的树状分裂结构二维子带编码82ppt课件图5-284子带为基础的树状分裂结构二维子带编码82pp图5-29140Mbit/sHDTV子带编码系统框图83ppt课件图5-29140Mbit/sHDTV子带编码系统框图83.4数字视频编码标准JPEG标准√
MPEG标准√ITU-RBT.601数字视频标准H.26X标准H.323可视通信系统标准
84ppt课件3.4数字视频编码标准JPEG标准√84ppt第3章视频编码技术1.视频信号的数字化2.视频文件格式3.视频压缩编码原理4.视频压缩标准85ppt课件第3章视频编码技术1.视频信号的数字化1ppt课件学习目标掌握视频数字化方法了解视频文件格式掌握视频压缩编码原理(预测编码、变换编码、统计编码原理)理解视频压缩标准(MPEG标准)86ppt课件学习目标掌握视频数字化方法2ppt课件3.1视频信号的数字化
所谓视频(videofrequency
),连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频。即视频是由一系列单独的静止图像组成,其单位用帧或格来表示;
人眼在观察景物时,光信号传入大脑神经,需经过一段短暂的时间,光的作用结束后,视觉形象并不立即消失,而能继续保留其影像0.1-0.4秒左右,这种现象被称为视觉暂留现象。1.视频相关的基本概念87ppt课件3.1视频信号的数字化所谓视频(vide帧:一帧是扫描获得的一幅完整图像的信号,是视频图像的最小单位;“帧”在动画创作当中又称“格”。帧率:就是每秒钟扫描多少帧。对于PAL制式电视系统,帧率为25帧;而NTSC制式电视系统,帧率为30帧。场:视频的一个扫描过程。有逐行扫描和隔行扫描,对于逐行扫描,一帧即是一个垂直扫描场;对于隔行扫描,一帧由两场构成:奇数场和偶数场,是用两个隔行扫描场表示一帧。1.视频相关的基本概念88ppt课件帧:一帧是扫描获得的一幅完整图像的信号,是视1.视频相关的基(1)逐行扫描图逐行扫描方式实线为行扫描的正程,左→右;虚线逆程,右→左。1.视频相关的基本概念89ppt课件(1)逐行扫描图逐行扫描方式实线为行扫描的正程,左→右;1(2)隔行扫描图隔行扫描方式1.视频相关的基本概念90ppt课件(2)隔行扫描图隔行扫描方式1.视频相关的基本概念6pp
视频信号有模拟视频信号与数字视频信号之分。模拟视频即指由连续的模拟信号组成视频图像,它的存储介质是磁带或录像带;在编辑或转录过程中画面质量会降低。数字视频是把模拟信号变为数字信号,它描绘的是图像中的单个像素,可以直接存储在电脑硬盘中,因此在编辑过程中可以最大限度地保证画面质量几乎没有损失。1.视频相关的基本概念91ppt课件视频信号有模拟视频信号与数字视频信号之分。1.视频相关的基
但数字视频的数据量是非常惊人的,按照ITU-R601标准4∶2∶2格式的PAL制数字化视频信号,每帧数据量为720×576×8×2≈6.64Mbit,每秒数据量为6.64×25≈165Mbit。ITU-R601——数字演播室标准4:2:2格式中色差信号的取样为亮度信号的一半。600Mbit的存储空间只能存储90帧的视频图像信号,或者说可以存储大约3.6s的数字电视节目。如果存储更高分辨率的高清数字电视信号,那存储时间就更短了,大约只有几秒钟。因此对视频的处理、传输、存储和显示提出了更高的要求。1.视频相关的基本概念92ppt课件但数字视频的数据量是非常惊人的,按照I
视频信息和信号特点:(1)直观性:给人印象更深刻、生动、具体。(2)确定性:“百闻不如一见”。(3)高效性:人眼是一个高度复杂的并行信息处理系统,能并行快速地观察一幅图像的细节,因此它获取视频信息的效率要比语音信息高得多。(4)广泛性:人类接受的信息,80%来自视觉。1.视频相关的基本概念93ppt课件视频信息和信号特点:(1)直观性:给人印象更深刻、生动、数字视频的获取方法:2.视频的采集及数字化从现成的数字视频库中截取。利用计算机软件制作视频。利用计算机生成的动画,如把flc或gif动画格式转换成avi等视频格式。把静态图像或图形文件序列组合成视频文件序列。通过视频采集设备获取数字视频。通过视频采集卡把模拟视频转换成数字视频,并按数字视频文件的格式保存下来。94ppt课件数字视频的获取方法:2.视频的采集及数字化从现成的数字视频库数字视频的采集系统视频源设备:录像机、电视机、影碟机等;视频采集卡:对模拟视频信号进行采样、量化和编码的设备;高性能计算机:接收和记录编码后的数字视频数据。大容量存储设备:存储经过编辑修改的数字视频文件。2.视频的采集及数字化95ppt课件数字视频的采集系统视频源设备:录像机、电视机、影碟机等;2.视频采集卡的接口复合端口色差分量接口S-Video信号端子IEEE1394接口2.视频的采集及数字化96ppt课件视频采集卡的接口复合端口2.视频的采集及数字化12ppt课件视频采集卡的接口复合端口
也称AV接口,通常都是成对的白色音频接口和黄色的视频接口,常用接头有BNC接头和莲花(RCA)接头。传输的是亮度/色度(Y/C)混合在一起的视频信号。易导致亮、色串扰、清晰度降低等问题,是最差的视频信号。2.视频的采集及数字化97ppt课件视频采集卡的接口复合端口也称AV接口,通常都
分量视频信号(ComponentVideoSignal)是指每个基色分量作为独立的视频信号。一般用亮度-色差表示,如Y和Cr、Cb,Y和I、Q,Y和U、V。使用分量视频信号是表示颜色的最好方法。
分量信号接入口视频采集卡的接口色差分量接口2.视频的采集及数字化98ppt课件分量视频信号(ComponentVideoSig视频采集卡的接口S-Video信号端子
S-Video四芯插头(座)
地(亮度)地(色度)亮度(含同步信号)色度S端子信号,它同时传送两路信号:亮度信号Y和色度信号C。由于将亮度和色度分离,色度对亮度的串扰现象也消失。其图象质量优于复合视频信号,但低于分量视频信号。
S端子用四芯插头,一些计算机显卡或非线性编辑卡也有用七芯插头,其外形与S端子一样,只是又包含了复合视频信号。2.视频的采集及数字化99ppt课件视频采集卡的接口S-Video信号端子S-Vi视频采集卡的接口2.视频的采集及数字化莲花接头100ppt课件视频采集卡的接口2.视频的采集及数字化莲花接头16ppt课件视频采集卡的接口IEEE1394接口IEEE1394是一种外部串行总线标准,800Mbps的高速。1394接口具有把一个输入信息源传来的数据向多个输出机器广播的功能,特别适用于家庭视听的连接。由于该接口具有等时间的传送功能,确保视听AV设备重播声音和图像数据质量,具有好的重播效果。2.视频的采集及数字化101ppt课件视频采集卡的接口IEEE1394接口IEEE1视频图像的数字化2.视频的采集及数字化
数字化方法(1)先从复合彩色图像中分离出彩色分量,然后数字化。(2)首先用一个高速A/D转换器对彩色全信号进行数字化,然后在数字域中进行分离,以获得所希望的YCbCr,YUV,YIQ或RGB分量数据。102ppt课件视频图像的数字化2.视频的采集及数字化数字化方法18ppt
数字化标准——ITU-RBT.601标准彩色电视图像数字化标准,称为CCIR601标准,现改为ITU-RBT.601标准。该标准规定了彩色电视图像转换成数字图像时使用的采样频率,彩色空间之间的转换关系等。视频图像的数字化2.视频的采集及数字化(1)色彩空间转换103ppt课件数字化标准——ITU-RBT.601标准视频图像的数字化视频图像的数字化2.视频的采集及数字化
(2)采样频率亮度信号采样频率fs=13.5MHZ;色度信号采样频率fc=6.75MHZ或13.5MHZ;每个扫描行的有效样本数均为720;
如图2.15(数字视频技术及应用P23)
数字信号取值范围:亮度信号220级,色度信号225级。
①对PAL制、SECAM制,采样频率fs为:
fs=625(行数/帧)×25(帧数/秒)×N=15625×N=13.5MHz,N=864
其中,N为每一扫描行上的采样数目。
②对NTSC制,采样频率fs为:
fs=525×29.97×N=15734×N=13.5MHz,N=858
其中,N为每一扫描行上的采样数目。104ppt课件视频图像的数字化2.视频的采集及数字化(2)采样频率20p视频图像的数字化
(3)亮度和色度信号的采样
Y:Cb:Cr=4:1:1
这种方式是在每4个连续的采样点上,取4个亮度Y的样本值,而色差Cb、Cr分别取其第一点的样本值,共6个样本。
Y:Cb:Cr
=4:2:2
这种方式是在每4个连续的采样点上,取4个亮度Y的样本值,而色差Cb、Cr分别取其第一点和第三点的样本值,共8个样本。这种方式能给信号的转换留有一定余量,效果更好一些。这是通常所用的方式。2.视频的采集及数字化Y:Cb:Cr
=4:4:4
在这种方式中,对每个采样点,亮度Y、色差Cb、Cr各取一个样本。这种方式对于原本就具有较高质量的信号源,可以保证其色彩质量,但信息量大。105ppt课件视频图像的数字化(3)亮度和色度信号的采样2.视频的采集及Y:U:V=4:2:0
分两种情况:
MPEG-1/H.261/H.263等标准使用的:水平方向的2个Y样本和垂直方向上的2个Y样本共用1个Cb样本和1个Cr样本。
MPEG-2标准使用的:
MPEG-2相对于MPEG-1的Cr,Cb子采样在水平方向有半个像素的偏移。106ppt课件Y:U:V=4:2:022ppt课件图ITU-TBT.601建议的取样点结构107ppt课件图ITU-TBT.601建议的取样点结构23ppt课件图ITU-TBT.601建议的取样点结构(续)MPEG-2108ppt课件图ITU-TBT.601建议的取样点结构(续)MPEG-图ITU-TBT.601建议的取样点结构(续)MPEG-1/H.261/H.263××××××××××××××××××××××××××××××××eMPEG-1相对于MPEG-2的Cr,Cb子采样在水平方向有半个像素的偏移。109ppt课件图ITU-TBT.601建议的取样点结构(续)MPEG-表ITU-TBT.601建议的4∶2∶2标准110ppt课件表ITU-TBT.601建议的4∶2∶2标准26ppt课
(4)分辨率
CCITT规定了称为公用中分辨率格式CIF(CommonIntermediateFormat)和1/4公用中分辨率格式(Quarter-CIF,QCIF)格式。-QCIF:176x144-CIF:352x288-SD(标清):720x480;640x480,704x480,720x576-HD(高清):1280x720,1920x1080视频图像的数字化2.视频的采集及数字化
CCITT:InternationalTelephoneandTelegraphConsultativeCommittee,国际电报电话咨询委员会111ppt课件(4)分辨率视频图像的数字化2.视频的采集及数字化
(1)本地影像视频格式
-AVI格式,英文全称为AudioVideoInterleaved,即音频视频交错格式。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,现在几乎所有的非线性编辑系统都支持AVI格式。其缺点是体积过于庞大。压缩标准不统一是其主要问题。
-DV-AVI格式,DV的英文全称是DigitalVideoFormat,是由索尼、松下等多家厂商联合提出的一种家用数字视频格式。它可以通过电脑的IEEE1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式。3.2数字视频文件格式112ppt课件(1)本地影像视频格式3.2数字视频文件格式28ppt课
-MPEG格式,英文全称为MovingPictureExpertGroup,即运动图像专家组格式。MPEG文件格式是运动图像压缩算法的国际标准,MPEG不是一种简单的文件格式,而是编码方案。它采用了有损压缩方法减少运动图像中的冗余信息,其最大压缩比可达到200:1。目前MPEG视频格式常见的压缩标准是MPEG-1、MPEG-2、MPEG-4。家里常看的VCD、SVCD、DVD就是这种格式。
-DivX格式,是由MPEG-4衍生出的另一种视频编码(压缩)标准,也即DVDrip格式,它采用了DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩,然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD并且体积只有DVD的数分之一。3.2数字视频文件格式(1)本地影像视频格式113ppt课件-MPEG格式,英文全称为MovingPictur114ppt课件30ppt课件115ppt课件31ppt课件
-MOV格式,美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTimePlayer。具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性,即不仅能支持MacOS,同样也能支持Windows系列。
AvidMediacomposer非线性编辑软件支持该格式。(1)本地影像视频格式116ppt课件-MOV格式,美国Apple公司开发的一种视频格式,默认117ppt课件33ppt课件(2)网络影像视频格式
广泛应用于视频点播、网络演示、远程教育、网络视频广告等等互联网信息服务领域。
-ASF格式,英文全称为AdvancedStreamingFormat,是微软推出的可以直接使用Windows自带的WindowsMediaPlayer对其进行播放。它使用了MPEG-4的压缩算法,所以压缩率和图像的质量都很不错。
-WMV格式,英文全称为WindowsMediaVideo,也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、多语言支持、环境独立性、丰富的流间关系以及扩展性等。
3.2数字视频文件格式118ppt课件(2)网络影像视频格式3.2数字视频文件格式34ppt课
-RM格式,RealNetworks公司所制定的音频视频压缩规范称为RealMedia,用户可以使用RealPlayer或RealOnePlayer进行实况转播,可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放,实现在线播放。另外,RM作为目前主流网络视频格式,可以通过其RealServer服务器将其它格式的视频转换成RM视频并由RealServer服务器负责对外发布和播放。3.2数字视频文件格式(2)网络影像视频格式119ppt课件-RM格式,RealNetworks公司所制定的音频视
-RMVB格式,是一种由RM视频格式升级延伸出的新视频格式。RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,对静止和动作场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用,保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。(2)网络影像视频格式3.2数字视频文件格式120ppt课件-RMVB格式,是一种由RM视频格式升级延伸出的新视频表常用的视频格式转换软件3.2数字视频文件格式未完,见续表121ppt课件表常用的视频格式转换软件3.2数字视频文件格式未完,见表常用的视频格式转换软件(续表)3.2数字视频文件格式122ppt课件表常用的视频格式转换软件(续表3.3视频压缩编码1.视频压缩原理
视频数据之所以能被压缩,是因为在视频数据中存在着大量的冗余信息。
视频数据主要存在下列冗余:(1)空间冗余,同一帧图像中相邻的像素具有很强的相关性。(2)时间冗余,图像序列中相邻帧的对应像素具有很强的相关性。(3)结构冗余,在视频图像的纹理区,像素的亮、色度信息存在着明显的分布模式,如果知道了分布模式,就可以通过某种算法来生成图像,即存在结构冗余。空间冗余时间冗余123ppt课件3.3视频压缩编码1.视频压缩原理视频数1.视频压缩原理(4)视觉冗余,研究发现人眼的视觉特性是非均匀和非线性的。例如,人眼对视频图像色度的敏感性远低于对亮度的敏感性,对低频信息的敏感度高于对高频信息的敏感度等等。在很多场合,人眼是视频信息的最终接收者,因此,可以对人眼不敏感的信息少编码甚至不编码以压缩数据量。(5)知识冗余,指视频图像中所包含的某些信息与人们的一些先验知识有关。例如在头肩图像中,头、眼、鼻和嘴的相对位置等信息就是人类的共性知识。3.3视频压缩编码
124ppt课件1.视频压缩原理(4)视觉冗余,研究发现人眼的视觉特性是非均视频压缩编码的类型:预测编码:差分脉冲PCM等变换编码:正交变换、离散余弦变换统计编码:霍夫曼编码、游程编码、算术编码子带编码小波变换编码分形编码知识(模型)基编码3.3视频压缩编码2.视频压缩编码125ppt课件视频压缩编码的类型:3.3视频压缩编码2.视频压缩编码43.3.1预测编码1.预测编码的基本内容预测编码是基于图像数据的时间和空间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。126ppt课件3.3.1预测编码1.预测编码的基本内容42ppt课
这些相邻像素(或图像块)可以是同行扫描的,也可以是前几行或前几帧的,相应的预测编码分别称为一维、二维和三维预测,其中一维和二维预测是帧内预测,三维预测是帧间预测,即在时间轴上用前一帧的像素(或图像块)对后一帧的像素(或图像块)进行预测。
帧间预测编码主要利用活动图像序列相邻帧间的相关性,即图像数据的时间冗余来达到压缩的目的,它可以获得比帧内预测编码高得多的压缩比。127ppt课件这些相邻像素(或图像块)可以是同行扫描2.预测编码的类型
预测编码分线性预测和非线性预测两类,线性预测编码又称为差分脉冲编码调制,即DPCM(DifferentialPulseCodeModulation)。
DPCM系统又称预测量化系统。128ppt课件2.预测编码的类型预测编码分线性预测差分脉冲调制预测——原理图量化器预测器译码器预测器-++编码器发送端接收端Xndn^XnXn’dn’dn’^XnXn’129ppt课件差分脉冲调制预测——原理图量化器预测器译码器预测器-++编码差分脉冲调制预测发送端预测器带有存储器,把tn时刻以前的采样值x1,x2,x3,xn-1存储起来并据此对xn进行预测,得到预测值dn为xn与的差值,dn’为dn经量化器量化的值xn’是接收端的输出信号误差qn为
qn=xn-xn’=xn-(+dn’)=(xn-)-dn’=dn-dn’实际上就是发送端的量化器对误差量化的误差对dn’的量化越粗糙,压缩比越高,失真越大^Xn^Xn^Xn^Xn130ppt课件差分脉冲调制预测^^^^46ppt课件差分脉冲调制预测——应用示例例如,取一序列为10,12,14,16,18,20。(例如亮度变化缓慢的图像的亮度值)由于其中所有数字都不相同,但是是一个等差的数列,所以行程编码和哈夫曼对其不产生压缩效果。先用DPCM方法,其预测器的预测参数为
=Xn-1,则其误差值得到一个新的序列10,2,2,2,2,2。然后再使用行程编码方法对这个新序列进行压缩,压缩结果为10(5,2)。^Xn131ppt课件差分脉冲调制预测——应用示例^47ppt课件差分脉冲调制预测适用于输入数据为平稳的随机过程预测器设计是预测编码系统的核心,预测器的复杂程度与线性预测中使用以前的样本数有关,样本数越多,预测器越复杂对预测误差的量化是造成图像质量下降的主要原因,表现为:斜率过载:图像轮廓变模糊颗粒噪声:图像在平坦区出现颗粒状的细斑边缘忙乱:在变化不快的边缘出现闪烁不定现象伪轮廓:在图像亮度值缓慢变化区域出现伪轮廓132ppt课件差分脉冲调制预测48ppt课件3.双向预测
前向预测:就是用K-1帧来预测K帧图像。后向预测:用K帧预测前面的K-1帧图像。
双向预测:用前、后两帧来预测中间帧图像。图双向预测示意图133ppt课件3.双向预测前向预测:就是用K-1帧来预测K帧图像134ppt课件50ppt课件135ppt课件51ppt课件图I、P和B图像的依赖关系I帧:帧内图(IntraPicture),只做帧内编码P帧:预测图(PredictedPicture),前向预测帧B帧:双向图(BidirectionalPicture),双向预测帧136ppt课件图I、P和B图像的依赖关系I帧:帧内图(IntraP
(1)I帧
I帧采用类似JPEG的编码方式实现。它不以任何其他帧做参考帧,仅仅进行帧内的空域冗余压缩。137ppt课件(1)I帧53ppt课件
(2)P帧
P帧是由一个过去的I帧或P帧采用运动补偿的帧间预测进行更有效的编码方式。图像P由残差图像SAD和运动矢量MV组成。DCT+量化+RLE138ppt课件(2)P帧DCT+量化+RLE54ppt课件图5-12运动自适应帧内插139ppt课件图5-12运动自适应帧内插55ppt课件
(3)B帧
B帧是用过去的图像(I帧或P帧)和后来的图像帧(I帧或P帧),采用运动补偿的双向预测编码方式。DCT+量化+RLE140ppt课件(3)B帧DCT+量化+RLE56ppt课件4.像素块预测MPEG编码时,先将一帧图像分割成若干横条,每一横条称为一片,在625行的PAL制中,每帧图像切成18片,在525行的NTSC制中,每帧图像切成15片。每一片再纵向切割成22块,这些块称为宏块或大块,它是MPEG标准的图像处理基本单元。141ppt课件4.像素块预测MPEG编码时,先将一
每个宏块中的彩色图像,可以用一个亮度信号Y和两个色差信号Cb和Cr来表示,由于人眼对亮度信号敏感高于色度信号,因而对每个宏块的亮度信号再平均分成4个像块。每个像块在水平方向分成8个像素,垂直方向也分成8个像素,则每个像块可分成64个像素,而两个色差信号Cb、Cr宏块不再分成像块,而是直接分成64个像素,如图5-8所示。142ppt课件每个宏块中的彩色图像,可以用一个亮度信图5-8MPEG图像的格式143ppt课件图5-8MPEG图像的格式59ppt课件
在图像编码领域目前使用的运动估值算法有块匹配法、像素递归法、相位相关法以及针对由摄像机运动引起图像全局运动的全局运动参数估值等。
其中块匹配法是最常用的一种方法,在活动视频编码的国际标准H.261、MPEG-1、MPEG-2中,实际都采用块匹配法做运动估值。144ppt课件在图像编码领域目前使用的运动估值算法有
变换编码的基本原理就是将原来在空间域或时间域内描述的信号,变换到正交矢量空间(频域或变换域)中去,用变换系数来表示原始图像,并对变换系数进行编码。3.3.2变换编码
尽管变换本身并不带来数据压缩,但由于变换后信号的能量大部分集中于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 25年公司、项目部、各个班组安全培训考试试题【达标题】
- 保障性租赁住房项目发展前景分析
- 轨道自动计轴设备行业跨境出海战略研究报告
- 金刚石刀片行业直播电商战略研究报告
- 隧道打桩工程行业直播电商战略研究报告
- 虫黄藻分子育种技术-全面剖析
- 环保印染工艺的创新与实践-全面剖析
- 4050补贴合同样本
- 公司劳保采购合同样本
- 农村旧厂转让合同样本
- 塔吊与起重机械操作安全培训课程
- 全球卫生合作国际援助与医疗外交的重要性培训课件
- 七星瓢虫课件
- 2024年英才计划笔试化学
- MySQL数据库考试试题及答案精编
- 2023研发费用加计扣除课件
- 国家开放大学《小城镇建设》形考任务1-4参考答案
- 曾国藩人生修炼日课
- 2022年全国小学生天文知识竞赛考试题库(含答案)
- 竣工结算审计服务投标方案
- 深入浅出Serverless:技术原理与应用实践课件
评论
0/150
提交评论