第三章DVB-S系统信源编码_第1页
第三章DVB-S系统信源编码_第2页
第三章DVB-S系统信源编码_第3页
第三章DVB-S系统信源编码_第4页
第三章DVB-S系统信源编码_第5页
已阅读5页,还剩122页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章DVB-S系统3.1数字通信系统的基本知识

3.2DVB-S系统信源编码

3.1数字通信系统的基本知识通信:指信息的传输与交换。通信的目的:传递消息中所包含的信息。消息(message):是物质或精神状态的一种反映,例如语音、文字、音乐、数据、图片或活动图像等。信息(information):是消息中包含的有效内容。实现通信的方式和手段:非电的:如旌旗、消息树、烽火台…电的:如电报、电话、广播、电视、遥控、遥测、因特网和计算机通信等。

单工通信:消息只能单方向传输的工作方式半双工通信:通信双方都能收发消息,但不能同时收发的工作方式全双工通信:通信双方可同时进行收发消息的工作方式

3.1.1

通信方式:单工、半双工和全双工通信并行传输和串行传输并行传输:将代表信息的数字信号码元序列以成组的方式在两条或两条以上的并行信道上同时传输

优点:节省传输时间,速度快:不需要字符同步措施 缺点:需要n条通信线路,成本高

串行传输:将数字信号码元序列以串行方式一个码元接一个码元地在一条信道上传输

优点:只需一条通信信道,节省线路; 缺点:速度慢,需要外加码组或字符同步措施3.1.2数字通信系统主要性能指标有效性和可靠性有效性:指传输一定信息量时所占用的信道资源(频带宽度和时间间隔),或者说是传输的“速度”问题。可靠性:指接收信息的准确程度,也就是传输的“质量”问题。有效性:用传输速率和频带利用率来衡量。

码元传输速率RB:定义为单位时间(每秒)传送码元的数目,单位为波特(Baud),简记为B。式中T

表示一个码元的持续时间(秒)

信息传输速率Rb:定义为单位时间内传递的比特数或平均信息量,单位为比特/秒,简记为b/s

,或bps

码元速率和信息速率的关系

对于二进制数字信号:M=2,码元速率和信息速率在数量上相等。

对于多进制,例如在八进制(M=8)中,若码元速率为1200B,,则信息速率为3600b/s。频带利用率:定义为单位带宽(1赫兹)内的传输速率,即

或可靠性:常用误码率和误信率表示。误码率误信率,又称误比特率 在二进制中有η越大,ηb越大,有效性越好;采用多进制可以提高ηb解:

依题意

得系统的误码率

例1:

已知某八进制数字通信系统的信息速率为3000bit/s,在收端10分钟内测得出现18个错误码元,试求该系统的误码率。

信道容量是指信道中信息无差错传输的最大速率。编码信道是一种离散信道,可以用离散信道的信道容量来表征。

离散信道容量

根据奈奎斯特(Nyquist)准则,带宽为B的信道,所能传送的信号最高码元速率为2B波特(Baud)。因此,无噪声离散信道的信道容量为

C=2Blog2L(bit/s)

3.1.3信道容量例2:一个四进制无噪声数字信道,带宽为3000Hz,求该信道的信道容量。解:C=2Blog2L=2×3000×log24=12000bit/s

3.2信源编码压缩的必要性以4:2:2信号格式为例,采用10比特编码,标清信号的比特率达到270Mbit/s,因此要求信道提供135MHz的带宽。信号的存储困难,一个1GB容量的光盘,仅能存约半分钟的标清电视数据。

HDTV系统中,一帧画面1280×720点,24bit真彩色,60帧/s,每秒数据量:1280×720×3×60=166MB=1.33Gb目前数字传输能力,6MHz带宽,只有30Mb/s的传输速率,需要压缩比:1330/20=44.4结论:1)如果不降低数字电视数据量和数据码率,就无法在普通的数据存储设备有效地存储数字电视信号;2)无法在适当的信道带宽内有效地传输数字电视信号;

因此,要想降低数字电视的数据量和码率,就需要对数字电视信号进行压缩。通常,将对数字电视信号进行压缩的过程称为信源编码。压缩的可能性图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性带来的数据冗余。1.图像数据的冗余度(帧内和帧间)(1)空间冗余在一幅图像中规则的物体和规则的背景都具有很强的相关性。例1静止图像信息的冗余

(相邻像素间的空间冗余)例2活动图像信息的冗余(相邻帧间)图像序列中不同帧之间存在相关性引起的时间冗余(2)时间冗余帆船在画面中航行,前后两帧图像中只是帆船向前行驶了一段路程,背景基本不变,帆船也是时间相关的(3)结构冗余:图像从大面积上看,存在着有规律的纹理结构,称之为结构冗余。如太阳是圆的,楼房建筑多为长方形,人的身体具有对称性等。

(4)知觉冗余:知觉冗余是指那些处于人们听觉和视觉分辨力以下的视音频信号,若在编码时舍去这种信号,虽然产生一定失真,但并不能为人所感知。

视觉冗余

人眼的视觉效果是图像质量的最直接也是最终的检验标准,对于人眼难以识别的数据或对视觉效果影响甚微的数据,都可认为是多余的数据,可以省去。这些多余部分就是视觉冗余。4bit量化8bit量化空间分辨力

空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。对于静止图象,视觉具有较高的空间分辨力。对于活动图象,视觉具有较低的空间分辨力,且随着运动速度的提高而迅速下降。信源编码的方框图

消除空间与时间冗余消除知觉冗余降低结构冗余消除统计(熵)冗余帧内预测帧间预测自适应预测运动补偿预测K-L变换哈尔(Haar)变换离散余弦变换(DCT)沃尔什(Walsh)变换霍夫曼编码算术编码

MPEG标准

1988年,国际标准化组织(ISO)和国际电工委员会(IEC)共同组建了运动图像专家组MPEG(MovingPictureExpertsGroup),对运动图像的压缩编码标准进行了研究。

1992年和1994年分别通过了MPEG-1和MPEG-2压缩编码标准。针对不同的应用,MPEG现在已经有了MPEG-1、MPEG-2、MPEG-3、MPEG-4、MPEG-7一系列标准。对高质量的活动图象、声音实现压缩主要用于广播电视、活动图象的压缩编码和解码数据压缩编码方法的分类根据解压重建后的图像和原始图像之间是否有误差,可以分成两类。

无损压缩编码(可逆压缩编码(ReversibleCoding))原始数据可完全从压缩数据中恢复出来,即在压缩和解压缩过程中没有信息损失。压缩比2:1左右。有损压缩编码(不可逆压缩编码(Non-ReversibleCoding))

原始数据不能完全从压缩数据中恢复出来,即恢复数据只是在某种失真度下的近似。如果视觉上能够接受甚至觉察不出质量的降低,则这种压缩就是可行的。压缩比1000:1。

根据压缩机理的不同,数据压缩编码方法可以分成:预测编码、变换编码、熵编码。1、预测编码(PredictiveCoding)

(帧间编码)

利用过去的样值对当前样值进行预测,然后当前样值的实际数与预测值相减得到一个误差值,只对这一预测误差值进行编码。编码系统主要由加法器、预测器、量化器和编码器构成。差分脉冲编码调制(DPCM:DifferentialPulseCodeModulation)是预测编码中最重要的一种编码方法。

DPCM原理

DPCM原理任一像点的灰度值可由它前面出现的若干个像素进行估计(预测)数字图像相邻像素间存在较强的相关性

求出估计值与实际值的差值对差值进行量化、编码、传输

设tk时刻的输入信号取样值为Xk;tk时刻前N个邻近像素取样序列为,现由此N个值估计,得估计值预测差值为,

对ek进行量化、编码、传输可达到压缩目的。

DPCM原理DPCM系统的性能决定于预测器与量化器的设计。DPCM系统的主要问题是存在误码扩散:若传输中产生误码,由于递归预测算法,对于帧间编码会使误差扩散到后续的若干帧中。注意:

因为静止图像前后帧空间位置对应像素完全一样,简单帧间预测对于静止图像画面压缩非常有效。存储器存储第一帧图像数据,其后连续帧可以反复读出。对于活动图像内容,前后帧相应位置像素差值很大,量化后比特数仍然很大,压缩效果不佳。

解决办法:运动估计

(MotionEstimation)

运动补偿块效应(1)运动估计简单说运动估计是对运动物体的位移作出估计。编码图象中的当前宏块相对于参考图象中的匹配宏块所移动的距离和方向,就是运动矢量(MotionVector)。求运动矢量的过程称为运动估计。abc当前帧后一帧运动矢量MV运动估计,找到匹配块前一帧(2)运动补偿最终预测图象是用两种类型的参数一起来表示:当前要编码的图象宏块和参考图象宏块之间的差值;宏块的运动矢量。考虑了运动估计而对图像进行预测编码称为运动补偿。2、变换编码

变换编码(TransformCoding)的基本思想是将在通常的空间域描写的图像信号变换到另外的向量空间(变换域)进行描写,然后再根据图像在变换域中系数的特点和人眼的视觉特性进行编码。如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中信号的能量较集中。(1)一般来说图像变换不是对整幅图像一次进行,而是在存储器中把一幅图像分成许多像块,然后依次将每个像块内的N×N个样点同时送入变换器进行变换运算。(2)变换器把输入的N×N点的像块由原空间域变换到变换域中,映射成同样大小的N×N点的变换系数矩阵,经过变换后的系数矩阵更有利于压缩。变换编码流程(3)量化器用有限个值来表示变换后的系数矩阵,通过量化器舍弃一些小幅度的变换系数。(4)编码器给量化器输出的每一个符号指定一个二进制码字,可以是定长码也可以是变长码。变换编码流程变换编码系统框图分块DCT变换量化编码解码反量化反DCT变换块组合输入数据接收输出信道右图为8×8DCT基图像示意图注:变换后的系数矩阵中,不同位置处的系数值对应不同空间频率分量的大小,低频分量处在左上角附近,高频分量处在右下角附近。

变换之后需要对DCT系数进行量化,这时可利用人眼的视觉冗余性。可对系数矩阵左上角附近的系数进行细量化(量化比特数高)而对右下角附近的系数进行粗量化(量化比特数低),即对不同的DCT系数采用不同的量化间隔。不同的量化间隔DCT编码是有损压缩对图像带来失真的主要原因如下:(1)由于量化舍去高频系数而使图像轮廓产生模糊;(2)对某些系数采用粗量化引起图像亮度缓变区在邻近的两个量化电平之间变化,造成颗粒状的杂波;(3)像块的划分使相邻像块人为地造成亮度不连续,即块效应。例:把DCT变换后的系数按一定方式读出。

Z形扫描游程编码:(0,79),(1,-2),(0,-1),(0,-1),(0,-1),(2,-1),EOBZ形读出:

3、游程编码(RLC,RunLengthCoding)游程编码的方法是将一维序列转化为一个由二元数组(run,level)组成的数组序列,其中run表示连零的长度,level表示紧接在这串连零之后出现的非零值。当剩下的所有系数都为零时,用符号EOB(EndofBlock)来代表。

游程编码(RLC,RunLengthCoding)注:游程编码一般不直接使用,为了达到较好的压缩效果,通常与其他编码方法一起使用,如和正交变换一起使用。为解决连0的表达方式采用游程编码。游程长度编码(RLC)图在量化的DCT交流(AC)系数中,将每一串连0系数与其后面的一个非0系数组成一个数组,并用一对符号表示:

符号1符号2

(游程长度Run,位长)(幅值)游程长度:非零系数前连0的个数;位长为后续非“0”系数的编码位长。

幅值:非零系数值。

DC和AC系数的统计量不一样,它们采用不同的Huffman表。符号对由符号1和符号2组成。对于直流差分系数,符号1中只有位长。符号2表示幅值,即不为0的AC系数值。其游程长度编码结果:(25),(0,4)(10),(0,2)(3),(2,2)(-2),(0,2)(2),(7,1)(-1),(0,0)第一个数是直流(DC)系数。游程编码使64个系数只需7对符号,用7个码字表示即可。游程编码后的熵编码多用霍夫曼编码(VLC)。编码标准提供霍夫曼码表,根据游程编码得到的符号直接查表,得到相应的码字。码表是根据概率分布并对大量典型图像素材进行统计制成的位长与DC差分值和AC系数对应表亮度和色度直流系数的Huffman码表亮度交流系数的Huffman码表色度交流系数的Huffman码表幅度值的可变长二进制编码表游程编码后的熵编码对符号1中的数据,从亮度和色度的系数码表查出霍夫曼编码;符号2中的数据仍用自然二进数编码,也称可变长整数(VLI)编码,码字长度也是可变的;直流系数DC采用与相邻像块DC的差值编码;对前面图中的游程编码结果进行熵编码,结果是:11011001101110100111111110010101101111101001010压缩比计算

以上由64个像点样值编码所得数据的总位数是47。可用抽样位率表示压缩程度,即用平均每个像点占用多少位来表示。对于此8×8像块的抽样位率计算如下:也可以用压缩比CR来度量压缩程度。本例按原图象用8比特量化的8×8像块计算,可得压缩比为:4、熵编码原理熵编码(EntropyCoding)是一类无损编码,编码后的平均码长接近信源的熵。

霍夫曼(Huffman)编码:变长编码,对出现概率大的信源符号分配较短的码字,对出现概率小的信源符号分配较长的码字,以获得较短的平均码长。

一、概率

概率通常是指某一事件发生的相对频数。设信息源中有k个符号{a1,a2,...ak}从这组符号中任取n次符号,而在这n次选取的符号里,取得ai的次数为m,则当n很大时,比率m/n就称为取出符号ai概率。用P(ai)表示,即

一、概率事件的概率总是正数,并总是处在0与l之间,即

o<P(ai)<1。如果P(ai)=0,说明是不可能事件;

如果P(ai)=1,则说明是必然事件。

二、信息量所谓信息量,实际是对消息中所含信息多少的一种度量。消息中所含信息量的大小与消息发生的概率有密切关系。一件事发生的概率越小,越使人感到意外和惊奇,此消息所含的信息量就越大;若消息出现的概率P(ai)→0,其消息的信息量就趋于无穷大。当消息发生的概率P(ai)→l时,则说明是一个必然事件,其所含的信息量为零。

二、信息量在信息论中,消息所含的信息量I由下式表示

单位为比特。由该式可看出:当消息发生的概率P=1/2时,消息所含的信息量I=l比特;当P=1/4时,I=2比特。若要传送8个等概率出现的消息之一,即P=1/8,I=3,至少需要三位二进制。这样,所传输消息的信息量就与传送所需要的最少二进制位数建立了一一对应关系。三、熵的概念设有2个编号为“1”的小球,编号为“1”的小球占总数6个球的1/3;有3个编号为“2”的小球,编号为“2”的小球占总数6个球的1/2;有1个编号为“3”的小球,编号为“3”的小球占总数6个球的1/6。求编号平均值方法一:求编号平均值方法二:三、熵的概念信源的平均信息量称之为熵。设有n个信号电平a1,a2...an,其对应的概率分别为Pl,P2,…Pn,信号所携带的信息量分别是log(1/P1),log(1/P2)...,log(1/Pn)

比特,则熵便可由下式求出:三、熵的概念

即:

设信源输出M个统计独立的符号x1,x2,…,xM,它们出现的概率分别为P(x1),P(x2),…,P(xM),则每个符号所含信息量的统计平均值即离散信源的平均信息量为

H(x)=-(bit/符号)信源的平均信息量又称“信源熵”。可以证明:最大信源熵发生在信源的每个符号等概独立出现时,最大信源熵为Hmax(x)=log2M(bit/符号)例一个由字母A,B,C,D组成的字,对于传输的每一个字母用二进制脉冲编码,00代表A,01代表B,10代表C,11代表D,每个脉冲宽度为5ms。(1)不同的字母是等可能出现时,试计算传输的平均信息速率;(2)若每个字母的出现可能性分别为

试计算传输的平均信息速率。

解(1)每个字母的持续时间为2×5ms,所以字母传输速率为不同的字母等可能出现时,每个字母的平均信息量为

平均信息速率为(2)每个字母的平均信息量为

所以,平均信息速率为

三、熵的概念图像信源编码中:

信源的熵是压缩编码的一个理论极限,它表示无失真编码所需的比特率的下限。

比特率是编码表示一个像素所需的平均比特数。

编码输出的平均码长要≥信源熵。

信源压缩编码的目的之一,是使平均码长尽可能的接近信源的熵。平均码长:m=20.25+20.25+20.20+30.15+40.10+40.05=2.45bit/符号熵:bit/符号编码效率:

MPEG-1/MPEG-2的视频结构

(1)视频序列(VS)

视频序列也称图像序列,它是随机选取节目的一个基本单元。从节目内容看,一个视频序列大致对应于一个镜头,切换一个镜头,即表示开始一个新的序列。

(2)图像组(GOP)

图像组由几帧连续图像组成,简称为GOP。它是对编码后的视频码流进行存取的基本单元。其第一帧总是I帧。大的图像组包含10~15帧图像。小图像组只有2~3帧图像。(3)图像(P)

图像是一个独立的显示单元,也是图像编码的基本单元。可分为IPB三种编码图像,分别对应三种压缩编码模式,即帧内压缩编码(I帧编码)前向预测编码(P帧编码)和双向预测编码(B帧编码)。

(4)像条(SLICE)

像条由一系列连续的宏块组成。就是行(5)宏块(MB)

宏块是运动估计的基本单元。运动估计以宏块为单位得到最佳匹配宏块的运动矢量。运动估计只对亮度数组进行,色差数组使用和亮度数组相同的运动矢量。

(6)块

块是DCT变换的基本单元。一幅图像以亮度数据数组为基准被分成为若干个8×8像素的数组,简称为块。可以是亮度块或色差信号块。

1234597116108124:2:0宏块结构4:2:2宏块结构4:4:4宏块结构GOP1GOPSCGOP头图像1图像2图像3…图像N图像SC图像头条1条2条3…条m条SC条头宏块1宏块2宏块3…宏块nY1宏块编码信息Y2Y3Y4C1C28×8系数块序列层GOP层图像层宏块层像块层序列SC序列扩展序列头GOP2…序列EC0x000001B3视频基本码流结构MPEG标准中三种类型图像I帧/P帧/B帧

I帧:帧内编码图像,仅利用该帧图像本身信息进行预测编码,压缩比不高;

帧内预测编码预测值由同一行前面的相临像素和上面相临行的相关像素来产生时,称为二维预测。二维预测可去除空间冗余。预测精度越高,编码效率越高。MPEG标准中三种类型图像P帧:预测编码图像,根据前面最靠近的I帧或者另一个P帧进行预测,属于前向预测;

由于使用运动补偿,P帧比I帧压缩更大,并可作为后面P/B帧的基准,会传播误码。压缩比大于I帧。B帧:双向预测编码图像,它既用过去的帧作基准,也用后来的帧作基准,即前向和后向预测都有,预测精度较高。B帧压缩最大,且不传播误码;

I,P,B三种图象的数据压缩比:

2~5:1,5~10:1,20~30:1双向预测B帧预测方式

I帧图像:只由帧内宏块组成

P帧图像:包含前向运动补偿I或PB帧图像:包含双向运动补偿I或P解码时间标签DTS(DecodingTimeStamp显示时间标签PTS(PresentationTimeStamp)MPEG-2码流的解码和显示顺序IBBPBBPIBBP传输流中的GOP结构传输帧序列与显示帧序列不同MPEG-2传输层码流分为:ES、PES、TS。ES(ElementaryStream):指只包含1个信源编码器的数据流。即ES是编码的视频数据流,或编码的音频数据流,或其它编码数据流的统称。打包:为便于传输,实现时分复用,基本流ES必须“打包”,就是将顺序、连续传输的数据流按一定的时间长度进行分割,分割的小段叫做“包”,因而打包也称为分组。PES

(PacketizedElementaryStream):将ES流分组打包后,在每一个包前加包头就构成了打包的基本流PES.(包头用于区别不同性质的ES的数据流识别码,PTS和DTS)视频PES一般一帧一个包,音频PES一般一个包的数据量不超过64KB。多个打包后的数码流再经过复用器成为传送流(TS流)。ES生成PESPES包头信息中加入PTS(PresentationTimeStamp)和DTS(DecodeTimeStamp)用于视频、音频同步;同时加入数据流识别码。打包器ESPESPES生成TS传输流是由一个或几个不同的PES包经传输复用器后组成传输流。TS流更适合在有干扰或误码的环境中传输。TS小包长度固定为188个字节。VPESTS复用

TS转输流APESDPES188B188B188B188BPES、PSI、SI调整字段包、PCRPID、计数器…视频PES1音频ES1数据流1打包器打包器视频ES1音频PES1节目复用器节目流播出视频PES2音频ES2数据流2打包器打包器视频ES2音频PES2传输复用器TS流数字电视码流之间的层次关系多媒体图象编码压缩国际标准多媒体图象编码压缩国际标准静态图象压缩标准JPEG视频图象压缩标准MPEG面向对象通信的视频图象压缩标准H.261(即P×64)P是参数,1~30。传输率为64~384kbps。用于可视电话和视频会议。为了适应各种为了在狭窄频带上实现高质量的视频图象和高保真的声音的传递。为了对复杂图象(自然的具有连续灰度或连续色调的复杂的)进行压缩。信道容量的数据传输,通过调整参数P来适应不同带宽的信道,并提供交互控制。视频图象序列的帧内图象的压缩编码也常用JPEG压缩标准面向通信的视频图象压缩标准

H.263为了在传输率低于64kbps的情况下(如,模拟电话网)传输视频。JPEG标准的2类算法JPEG标准的2类算法JPEG标准定义了两种相互独立的算法:1、可逆编码(无失真)。DPCM+熵编码(哈夫曼/算术编码)2、非可逆编码(有失真)。DCT+DPCM+Z型扫描+熵编码不常用 JPEG2000常用 JPEGJPEG标准之

基于DPCM的无失真编码原始图象数据DPCM预测熵编码器哈夫曼或算术编码无失真编码器压缩后的图象数据优点:无失真;容易用硬件实现缺点:压缩比太低,只有约2∶1编码表JPEG标准之

基本系统基于DCT的有失真编码正向离散余弦变换FDCT量化器熵编码器8×8块源图象数据压缩后的图象数据量化表编码表编码器MPEG-1的视频压缩编码MPEG-1中视频编码的关键压缩技术和H.261一样,是DCT、运动补偿和Huffman编码。编码器和解码器的原理框图也和H.261没有区别。

MPEG-1的信源输入格式是SIF(SourceInputFormat)。CCIR601格式的信源要转换成SIF后进入MPEG-1编码器,解码器输出也是SIF格式,显示时要经内插,扩充为CCIR601格式。PAL/NTSC都作如此处理。SIF格式如表所示。SIF(525/625)格式

信号分量行数/帧象素数/行亮度(Y)240/288352色度(U)120/144176色度(V)120/144176

352×240352×288或每帧的分辨率为:MPEG-2与MPEG-1比较MPEG-1,数字电视标准,带宽1.5Mbps,1993年发布。主要应用是VCD,它将图象数据压缩到1/25~1/200,声音数据压缩到1/65,并且图象质量还略优于录象带。分辨率为352×240,播放频率为30帧/秒MPEG-2,高清晰度数字电视标准。带宽为3~100Mbps。典型应用为DVD和HDTV广播。DVD采用可变速率1~10Mbps,速率大小根据图象复杂程度和声音多少而改变。分多个档次,分辨率和播放频率也随之不同。DCT变换不仅可在帧内进行,也可在场内进行(1)MPEG-2是MPEG-1的兼容和扩展。可广泛用于多种速率和各种分辨率的情况。(2)在MPEG-2中,视频序列可以是隔行扫描的,也可以是逐行扫描的,而在MPEG-1中视频序列只能是逐行的。(3)在MPEG-2中图像的色度格式还包括4:2:2和4:4:4格式,在MPEG-1中,图像的色度格式是4:2:0。MPEG-2广泛应用于DVD、SDTV和HDTV中。美国的ATSC欧洲的DVB日本的ISDB都已把MPEG-2作为信源编码标准。我国制定的数字卫星电视和数字有线电视的标准中,也已经采用了MPEG-2标准。MPEG-2视频部分MPEG-2标准规定了四种输入图像格式,称为级(Levels),低级、主级、高1440级、高级,提供了灵活的信源格式。

MPEG-2按压缩编码方法划分为:型(Profiles)共有五个型:简单型、主型、高型、信噪比可分级型、空间可分级型。“级”与“型”的若干组合构成MPEG-2视频编码标准的子集:对某一输入格式的图像,采用特定集合的压缩编码工具,产生规定速率范围内的编码码流。在20种可能的组合中,目前有11种是已获通过的,称为MPEG-2适用点。H.261标准(简称为P×64)

的传输率P是参数,1~30。传输率为64~384kbps。用于可视电话和视频会议。为了适应各种信道容量的数据传输,通过调整参数P来适应不同带宽的信道,并提供交互控制。当P=1或2时,码率为64~128kbps。由于码率太低,只能传输清晰度不太高的图象,所以只适用于面对面的可视电话。当P≥6时,码率384kbps,可传输清晰度良好的图象,故可用于会议电视。图像格式H.261标准的标准图象格式352288176×144176×144176×14488×7288×72CIFQCIFYUVH.263与极低码率视频编码技术为了在带宽低于64kbps的情况下(如,模拟电话网)传输视频,实现可视电话通信。极低码率视频编码技术:是编码后的数据率低于64kbps的各种编码技术的总称。H.263就是极低码率视频编码标准之一。H.263H.261和H.263

数据率比MPEG-1,-2更低的原因对H.261和H.263来说,每2帧之间,有3帧不传(B图);计算没有传输的B图时,H.261和H.263用简单的插值法;而在MPEG-1,-2中,同P图的编码一样,用基于运动补偿的预测方法。尽管有相同点:在计算P图时,都用基于运动补偿的预测方法。但是下面2条不同点导致H.261和H.263的数据率更低

:JPEG和MPEG的差别MPEG视频压缩技术是针对运动图像的数据压缩技术。为了提高压缩比,帧内图像数据和帧间图像数据压缩技术必须同时使用。MPEG通过帧运动补偿有效地压缩了数据的比特数,它采用了三种图像,帧内图、前向预测图和双向预测图,有效地减少了冗余信息。对于MPEG来说,帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT帧内图像数据压缩编码。MPEG-4标准的产生背景

-------引例足球比赛转播:球赛现场声音

和解说员的声音MPEG-4标准的产生背景

问题1未来的视听系统是以嵌入式个人计算机为核心的软件编码的开放式系统,电视也将由“纯线性”推进到“非线性”阶段。例如,迅速发展的计算机非线性编辑、交互式计算机游戏图象显示、交互式视频点播(VOD)、交互式控制视音频数据库中的素材等,都表明电视从“纯线性”到“非线性”的发展趋势。为了增强非线性电视的交互性、灵活性,提高编码效率,就需要制定一个对图象内容中的音视频对象(AVO)进行编码、组织和传输的准则。视听系统发展趋势--------非线性和交互性MPEG-4标准的产生背景

问题1MPEG-1、MPEG-2及MHEG都不能解决非线性和交互性的问题MPEG-1和MPEG-2都以音频帧、视频帧为编码对象,没有交互功能(如果说有,也只是在“帧”这一级有)。MPEG-1和MPEG-2的音频帧、视频帧以及MHEG中的大范围媒体对象,都不能再细分为更小的AV对象。故图象中的音视频对象(AVO)所组成的AV场景不能与人进行交互。MPEG-4标准的产生背景

问题2较窄带宽上的视频应用MPEG-1的数据率大约1.5Mbps,MPEG-2的数据率大约3~100Mbps随着网络的普及,基于网络的音视频多媒体应用越来越广。在较窄带宽上的音视频应用产生了一个很大的市场。传统编码器------

编码对象是帧(音频帧、视频帧)若干音频帧若干视频帧MPEG-4编码器------

编码对象是AO和VO将若干视频帧中的对象分开MPEG-4的特点MPEG4的重要特点:(1)基于内容的普遍性。MPEG4能够直接选取音频、视频内容进行编码,并对其灵活地进行控制和显示,用户可以自行选择场景中的物体的解码质量,进行家庭影视节目制作和编辑。(2)以AV为对象,增强了交互性和扩展性,从而提高了交互应用的灵活性。(3)将各种功能应用在自然的和合成的AV对象上,增强了节目编辑制作能力。(4)MPEG4在误码环境中,尤其是在恶劣误码条件下的低比特率应用中的抗误码性,有利于节目制作、分配和显示。MPEG-4----传统、内容编码的统一运动补偿纹理DCT比特流运动补偿纹理(DCT)比特流形状(反DCT)(传统编码,类似于MPEG-1、MPEG-2和H.261、H.263)基于内容的编码通用MPEG-4内核编码器MPEG-4VLBV内核编码器MPEG-4和MPEG-1、-2的区别MPEG-4的应用领域MPEG4在多媒体传输、多媒体存储等领域具有广泛应用:(1)低比特率下的多媒体通信,如视频电话、视频电子邮件、移动多媒体通信、电子新闻等。这些应用对传输速率要求较低,在4.8~64kbit/s之间,分辨率为176×144。MPEG4利用很窄的带宽,通过帧重建技术压缩和传输数据,以最少的数据量获得最佳的图像质量(2)互联网上的视频流与可视游戏,如网上电影。(3)数字电视、动态图像、万维网(WWW)。(4)实时多媒体监控。(5)基于内容存储和检索的多媒体系统。(6)基于面部表情模拟的虚拟会议。(7)DVD上的交互多媒体应用。MPEG-4的常见应用(软件)DIVX-MPEG-4影碟网上MPEG-4电影用MPEG-4技术来编码、压缩一部DVD,只需要两张CD-ROMMPEG-4出台后1年内,在计算机上播放DIVX-MPEG4文件的方法有两种:1、用DivxPlayer等专门的播放软件来播放;2、Windows自带的媒体播放机中安装一个MPEG4插件(Divx)。现在很多播放器都已经支持MPEG-4。MPEG-4格式的ASF流文件,或者AVI文件MPEG-4的常见应用(硬件)日本夏普公司推出的应用在互联网上的数字摄像机VN-EZ1。这台网络摄像机利用MPEG4算法,可把影像文件压缩为ASF(高级流格式),然后用户只要利用微软公司的MediaPlayer播放程序,就可以直接在电脑上进行播放。在移动多媒体通信领域,摩托罗拉公司,用手机看电影的技术。通过GPRS(通用数据包无线业务)移动数据网络传输MPEG4格式图像

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论