（信号与信息处理专业论文）mpeg2编码系统研究与设计.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-08 格式：PDF 页数：74 大小：2.60MB 积分：0 举报 版权申诉

已阅读5页，还剩69页未读，继续免费阅读

（信号与信息处理专业论文）mpeg2编码系统研究与设计.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

电子科技大学硕士论文 ab s t r a c t i t i s mp e g - 2 t h a t i s a v e ry i m p o rt a n t i n t e r n a t i o n a l s t a n d a r d f o r c o d i n g m o v i n g p i c t u r e c o m p r e s s . mp e g - 2 i s a p p l i e d i n d i g i t a l t v , d v d a n d h d t v . wit h d i g i t a l t v , d v d a n d h d t v d e v e l o p i n g , mp e g - 2 e n c o d e s y s t e m w a s c o m p r e h e n s i v e l y r e s e a r c h e d a n d a p p l i e d . t h i s d i s s e r t a t i o n b r i n g f o r w a r d a s o l u t i o n t o mp e g - 2 e n c o d e s y s t e m w i t h mp e g s 4 2 0 s p e c i a l m o v i n g p i c t u r e c o m p r e s s c h ip a n d a r e a l i z a t i o n i n h a r d w a r e o f v i d e o c o m p r e s s f o r t h e e n c o d e s y s t e m . t h e m a i n c o n t e n t s o f t h e d i s s e r t a t i o n i n c l u d e : 1 . t h e d e s c r i p t i o n o f v a r i o u s c l a s s i c a l t h e o r y o f p i c t u r e c o mp r e s s . 2 . t h e e x p l a n a t i o n f o r mp e g - 2 a l g o r i t h m , i n c l u d i n g s y s t e m , v i d e o a n d a u d i o 3 . g i v i n g a s o l u t i o n o f mp e g - 2 e n c o d e s y s t e m t h a t c o n s i s t s o f p c a n d t h r e e e x t e rna l c a r d s . 4 . g i v i n g a n i m p l e m e n t a t i o n i n h a r d w a r e o f v i d e o c o m p r e s s w i t h mp e g s 4 2 0 c h i p , c o m p a r i n g w i t h d s p s o l u t i o n o f mp e g - 2 v i d e o c o m p r e s s k e y w o r d smp e g - 2 d c t m o t i o n c o m p e n s a t i o n t s mp 3 p t s pcr 电子科技大学硕士论文第一章绪论近年来，随着半导体工业的进步，计算机、广播和通信技术的发展，人类进入了信息社会。信息在社会生产，人们的生活中起着重要的作用。社会机器的运转、人们的工作和生活都离不开信息。对信息的获取、交换、处理、再现已经形成了一种产业，这就是信息产业。二十世纪末，整个世界掀起了信息产业的热潮。各国政府开始花巨资建设信息网络的基础设施。自 1 9 9 3年美国克林顿政府提出 “ 国家信息基础设施 ( n n i )”计划后，西方七国又提出了 “ 全球信息基础设施 b a 2 - - b , ,., a m - * b , 。则p ( a , i b k ) = 1 ( 这-t . j = k ) ，i ( a , i 6 k ) 二。。得1 ( a , , b k ) 二 i ( a , ) , 也就是说b * 提供了 a , 全部的信息量。如果信源编码器没有以上的对应关系，p ( a , l b , ) 1 , i ( a , l b k ) # 0 , b 、不提供a ，全部的信息量，这产生了失真。如果用少量的编码符号对信源进行编码，即; b , , a 2 -b , 认为是对应关系，没有失真: 而a , - b 2 , a 2 - , b ，就是失真，分别由d , , d 2 来表示，代表它们对图像的质量的影响的一种度量。 -.j 叭0 向ild: 一- d 图2 - 2失真流图和矩阵有了失真的度量，就可以求概率平均或失真函数。以d ( ab k. ) 失真度量，p ( a , , b k ) 表联合概率分布，平均失真，即失真函数是: 第7 页电子科技大学硕士论文 d ( q ) 一艺d ( a , , b , ) p ( a , , b , )二艺d ( ab , ) p ( a , ) q ( b k a , ) ( 2 - 1 5 ) q ( b , i a ) 是条件概率。由式( 2 - 1 5 ) 可知， q ( b , i a , ) 是控制失真的一个量，故用d ( q ) 来表示其函数关系。现在可以与平均互信息量i ( x , y ) 联系起来讨论“ 一定失真条件” 的表示方法。设平均失真不超过d ，由式 ( 2 - 1 5 )可知，要求 d ( q ) d ( 2 - 1 6 ) 则必然存在这样一个条件概率值q ( b , i a , ) ，使d ( q ) 不超过d , 记 q ,，为保证失真在允许范围内的条件概率的集合，即: q d = q ( d ( q ) d ) ( 2 - 1 7 ) 率失真函数的基本含义就是在给定的失真的条件下找出m i n 7 ( x , y ) o 由于i ( x , y ) 也受q 的控制，因此，可以将率失真函数定义为: 在q ,; 范围内寻找最起码的平均互信息量，并以r ( d ) 记为率失真函数。 r ( d ) = m i n i ( x, y )( q q , ) 于是有定义: ( 2 - 1 8 ) 可见率失真函数是在允许失真d的条件下，信源编码给出的平均信息量的下界，也就是数据压缩的极限码率。率失真函数具有以下性质: 1 .在d5 0 时，r ( d ) 无定义。 2 .存在有一个d m a x ，使d ? d . - 时，r ( d ) = 0 3 . r ( 0 ) = h ( x ) 。因为r ( 0 ) 代表失真为0 的编码码率，这就是信息保持编码定理反映的结果。 4 .在0 -t d - 3 级( 2 5 6 级) ) : 对与n t s c广播电视，相邻两帧其亮度信号平均只有7 . 5 % 的像素变化 6 级( 2 5 6 级) ，而色度信号仅0 . 6 5 % 的像素大于此值。实验表明，与帧内预测相比，帧 ( 场)间预测一般可获得 i o d b左右的增益。可对不同的情况要分别对待，例如，活动缓慢区域，其帧间预测性能较好; 而在快速活动的区域，则帧间预测性能较差。通常，对活动较剧烈的部分，采用帧内编码方法。如何改善场景变化剧烈 ( 例如，场景的切换，物体高速运动) 的情况下的编码效率，是视频压缩有待于深入研究的问题之一。 2 帧 ( 场)重复对于静止或者是活动慢的视频信号，可以少传一些帧。例如，隔帧 ( 场) 传输。未传输的帧利用帧间存储器保存的前一帧作为该帧的数据，这对于视觉没有什么影响。因为，人眼对静止图像部分要求较高的空间分辨率。而对时间分辨率的要求可低一些。在电视电话中多采用帧 ( 场)重复的方法。 3 . 阀值法所谓的阀值法，就是只传送像素亮度的帧间差值超过某一门限阀值的像素。例如，阀值为5 ，凡是绝对值大于5的帧间差值像素就传送。通常，阀值大小由实验确定，但也可根据缓冲存储器的占有率来控制。 4 .运动补偿预侧运动补偿预测是十分有效的帧间预测方法，在 h . 2 6 1 , mp e g等标准中广泛使用，对此后面将详细讨论运动补偿。 5 . 自适应祯内 / 帧间编码当被摄对象活动剧烈或摄像机本身活动时，视频信号的帧间相关性明显下降，帧内相关性增强。因此，可根据景物的活动情况进行自适应帧内/ 帧间编码使帧间预测误差减小，提高编码效率。圣 2 . 2 . 2离散余弦变换 ( d c t )编码: , 1 互 2 . 2 . 2 . 1变换编码的主要特点预测编码的任务是要使预测值尽可能的接近实际样值，也就是要寻求一种尽可能接近原信号统计特性的预测方法，通过相差除去视频信号的相关性，从而达到数据压缩的目的。一种更有效的去除图像信号相关性的方法是对信号进第1 0 页电子科技大学倾 f 论文行变换。函数变换的数学工具是对同一事物的不同域内的描写方法。就所熟知的傅立叶变换来说，就是将一个函数时域描写变为频域描写。这种变换会使函数的某些特性变的明显，从而使问题处理简化。这是因为傅立叶变换的特性和信号的特性相吻合。正交变换也是线性变换，由代数知识可知，它是保持欧几里得长度不变的一个空间旋转。对图像信号采用正交变换，如果所选择的正交矢量空间与图像本身的主要特征很接近，则变换域内的图像信号的相关性明显下降，能量相对集中，就能使图像信号的数码率得到较大的压缩。一个信号若由n 个样点组成，即在一维空间内有月个样值，但也可以看作是n 维空间的一个点 ( 或者是一个n 维矢量)。这只是对同一信号的不同描述而己。一个图像信号，一般可以看作二维抽样来表示，并以各像素的亮度构成一个矩阵。在图像编码是通常以相邻的几个像素来构成子图像处理，一般取 n x n( 或者是mx n )的方块。同样也可以看作是n x n( 或者是mx n )维空间的一个点。为了形象表示，设每个子图像有1 x 2 个像素即相邻两个像素组成。于是每个子图像可由二维空间的一个点来表示。设每个像素有 8 个亮度级，如图2 - 4 ( a ) 分别用以x : 轴和x 2 轴来表示相邻两个像素的亮度等级。若图像结构的特点是相邻两个像素的亮度几乎差不多，则代表各子图像的二维坐标点将集中在4 5 斜线附近，如图2 - 4 ( a )的阴影区。为了对这些点的位置编码，就要对差不多大小的坐标值分别进行编码。现在若对图像进行正交变换，从几何上相当于作一个4 5 的旋转，变成y , , y ，坐标系，如图2 - 4 ( b )所示。 ( a ) ( b ) 图2 - 4 统计相关与坐标轴的关系经过坐标旋转变换以后，我们发现代表图像的子图像的点的坐标y . 与y , 之间的相关性比x . 与x , 之间的相关性统计上减弱。统计相关和统计独立的概念应该是: 如果一个随机变量值增加( 或减少) 另一个随机变量也统计地增加( 或第u页电子科技大学硕士论文减少)，则称这两个随机变量统计相关;否则是统计独立。还有，经线性变换后子图像的方差总和保持不变，即: 。 : . + c 7 h = 。或十叹 ( 2 - 1 9) 但在坐标轴上的分配却不同了变换前ct 呈 . 与。几几乎是相等的，但变换以后却有 6 尽。孟，这意味着子图像的能量向 y ，轴相对集中了。这就为数据压缩编码创造了条件。以上的例子虽然是一个特例，但例子告诉我们，采用与子图像结构特性相适配的正交变换，可以得到较好的数据压缩效果。通常在正交变换中， k - l变换被誉为最佳变换，其变换后的系数之间不相关。但就实际的成本与实时性来说， k - l变换常常是被认为是最难的一种变换。显然，它的理论价值高于实际价值。在视频压缩中，最常用的正交变换方法是离散余弦变换 ( d c t )，d c t 被认为是性能接近k - l变换的准最佳变换。变换编码的主要特点有: 1 .在变换域里描述视频图像比在空间域简单。 2 .视频图像的相关性明显下降，信号的能量显著的集中在少数几个变换系数上，采用量化和嫡编码可有效的压缩其数据。 3 .可充分利用人眼的视觉特性，例如，空间频率特性、视觉心理和视觉现象。 4 .具有较强的抗干扰能力，传输过程中的误码对图像质量的影响远小于预测编码。通常对高质量的图像，预测编码要求信道误码率小于或等于1 0 ,，而变换编码要求信道误码率小于或等于1 0 - 1 . s . d c t变换有快速算法，能实现实时视频压缩。芬 2 . 2 . 2 . 2 d c t编码的处理步异 : n 1 , d c t变换 d c t变换矩阵的大小可以从去相关程度和实现难易等方面来综合考虑 8 x 8 通常被认为是一种较好的选择。其二维 d c t变换为: 正变换: 一，= 告 c(u)c(v) i l 艺艺 f ( x , y ) c o s s = o y = o ( 2 x + 1) u ;r c o s 1 6 ( 2 - 2 0 ) 反变换: 第1 2 页电子科技人学硕士论文 f ( x , y ) = 艺艺c (u ) c ( v ) c o s ( 2 x + 1 ) u 7 c 1 6 ( 2 y + 1 ) u 7 c 1 6 ( 2 - 2 1 ) 其中 “(“ ，“ (，二 12 c ( u ) , c ( v ) 二1 2 、系数量化经 d c 丁量化得到的系数，其能量主要集中在沿对角线分布，且在左上角集中主要能量。这反映了能量主要以低频成分为主的客观事实，即图像大部分区域变化不大，亮度突变部分占少数。量化的目的是在确保一定图像质量情况下，舍弃一些对视觉效果影响不大的次要信息，从而达到进一步的压缩。由于不同频率的系数对人眼的视觉效果不同，因此，可充分利用人眼的视觉特性选择不同的量化方案。系数量化是 d c t编码的关键所在。常用的方法有区域编码、自适应比特分配、门限控制和综合方法等。所谓的区域编码就是将8 x 8 变换系数根据能量划分为若干区域，对每个区域分别量化和编码，每个区域的编码比特数由该区域中变换系数的能量大小决定。通常变换系数能量大的区域占有较多的比特数，反之亦然。值得注意的是，过多地删除高频系数会产生 “ 细节模糊”现象。自适应比特分配是指根据变换系数的能量大小自适应地分配变换系数所需的比特数。最佳分配方法是对被编码区域的能量分布情况进行概率统计，并根据失真要求来分配其比特数。通常采用直方图方法来取代复杂的概率密度函数估计，但也可用高斯密度函数来近似计算对均方失真d , 方差为 2c ,1 的系数，其最佳编码比特数为r , = ( 10 9 2 a 了一 10 9 2 d ) 2 0 门限控制法能避免舍弃能量较大的高频系数。例如，假设门限为t a ，凡小于几的系数均置为0 ，从而增加系数为0 的个数。门限的设置可根据人眼的视觉特性。因为人眼对不同的变换系数其敏感程度不同，低于一定能量可以略去。同时对非常敏感的变换系数，其门限控制可以取得小一些，而那些对视觉不太重要的系数可以取较大的门限，这样既能满足视觉的要求又降低的数码率。另一种门限的控制方法是自适应门限控制，即门限大小随图像细节的变化而自动的调整，以达到自适应的效果。为了达到最佳的效果。往往采用综合法，例如，结合使用自适应量化、预测编码、矢量量化等。综合方法往往比较有效，因此备受重视。 3 、系数排序经过量化的 d c t系数通常会出现较多的零值，使用游程编码能大大改善第1 3 页电子科技大学硕士论文编码效率。为了增加零系数的个数，如何对己量化的系数进行排序就显的尤为重要。通常可按 “ 之”字形排列。 4 ,摘编码 d c t 编码的最后是嫡编码。墒编码是一种基于量化系数统计特性所进行的无失真编码。常用的嫡编码方法有游程长度编码、哈夫曼编码和算术编码。在视频编码中，常用游程长度编码和哈夫曼编码。 2 . 2 . 3摘编码互 2 . 2 . 3 . 1 游程长度编码 ( r l c ) 游程长度编码最早用于二值图像的压缩编码。二值图像的每一个扫描行总是由若干段连着白像素和黑像素组成，即所谓的白长和黑长。对不同的黑长和白长，按其出现的概率分配以不同的码子，这种编码方法称之为游程长度编码。实际上，游程长度编码并不只限于二值图像上，目前广泛应用于视频编码中，例如前面讨论的 d c t编码中，通常变换系数经过量化后会出现很多零系数。在这种情况下，与其传送大量的零系数，不如告知接受端那些非零系数，并告知非零系数之间有多少个零，恢复时插入零系数即可。夸 2 . 2 . 3 . 2哈夫里编码、 : 哈夫曼编码是图像压缩中最重要的编码方法之一，是 1 9 5 2年由哈夫曼 c h u f f m a n )提出的一种非等长最佳编码方法。所谓最佳编码，即在具有相同输入概率集合的前提下，其平均码长比其他任何一种唯一可译码都短。图2 - 5 是哈夫曼编码的一个实例。其步骤如下: 1 、将输入符号按出现的概率由大到小的顺序排列 ( 相同概率的符号可以任意颠倒排列位置)。重排。将最小的两个概率相加，形成一个新的概率集合。再按第一步的方法如此重复到只有两个概率为止。 3 、分配码子。码子分配从最后一步反向进行，最后两个概率，一个赋予 0 ”码，一个赋予 “ 1 。该编码结构实际上是一棵二叉树，码子都是从根出发排列的。概率大的符第1 4 页电子科技大学硕士论文号 ( 或事件)分配较短的码子，概率较小的符号分配较长的码子，从而提高其编码效率。应当指出，由哈夫曼编码给出的最佳编码并不是唯一的，但其平均石马长相等。 0 . 61 码长码子信源符号出现概率 al叱a3如电匈衡 1 1 1 0 0 1 1 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 . 2 0 0 . 1 9 0 . 1 8 0 . 1 7 0 . 1 5 0 . 1 0 0 . 0 1 气j一介名勺j勺j勺j月勺j弓图2 - 5哈夫曼编码示意图图例中的编码参数分别为: 平均码长:2 . 7 2 信源墒:2 .6 1 编码效率:% 从上面的参数可以看出，哈夫曼编码的平均码长己经接近它的下限一一信源嫡，说明了哈夫曼编码的优越性。 2 .2 .4量化: ，经过抽样的图像，只是在空间上是离散的像素阵列，而每个像素的亮度值还是一个连续量，必须把它转化为有限个离散值，这就需要量化。从数学角度来看，量化过程就是把一个连续幅度值的无限数集合映射成一个离散幅度的有限数集 ( a ) 第1 5 页电子科技大学硕上论文 ; - - 一 x 一0 0 x , y * 一，夕 * x 一一闷 )一一x一一一o- - x k - 1 x k 2 丢一石乙 y上工 k + 1 x 一 _ _ _ x a 十 1十co 合。如图2 - 6 ( a ) , 入信号幅度x 落在表达为: ( b ) 图2 - 6 标量量化量化器的输出l 个量化电平y k , k = 1 , 2 , . . , l 。当量化器的输 x 、与x k + 、之间时，量化器输出电平为y k 。这个量化过程可以 y 二 q ( x ) = q-k -g x x k + l 卜y k , k = 1 ,2 ，二。 l 这里x * 成为分层电平。通常把 k = x k + l - x * 称为量化间隔。 ( 2 - 2 2 ) 如果 * 是一个常数，即 * 二 c , k = 1 , 2 ,.二， l 这样的的量化称为均匀量化，而将不等的量化间隔的量化方式称为非均匀量化。量化是以有限个离散近似表示无限多个连续值，所以一定存在量化误差。量化误差的定义为: q = x 一 y=x 一 q ( x ) ( 2 - 2 3 ) 对于确定输入的信号，q 是一个确定的函数。但对于图像等信源的随机信号，q 则是一个随机变量。通常把量化误差q 称为量化噪声，量化噪声一般用均方误差来度量。设输入信号x 的概率分布密度为f , ( x ) ，则量化噪声为: q y = e x 一 q (x )z 一 x 一 q (x )z p , ( x ) dx ( 2 - 2 4) 若把积分区域割成 l个量化间隔，则上式可写成: 1几 v2 =v y j ( x 一 y,) p ( x ) d x ( 2 - 2 5) k = i s , 量化器最好的是最佳量化。所谓的最佳量化，就是使量化误差最小的量化方法。最佳量化器的设计方法有两种。一种是根据客观准则设计法，采用量化均方误差最小为约束条件;另一种是主观准则设计方法，它根据人眼的视觉特性来设计量化器。一、客观准则的最佳盆化由量化误差公式可以得出，在给定信源的情况下，p ( x ) 己知的。因此，量化误差川与量化间隔的分割有关，即与lx k 集合的选择以及量化电乎伽 l i 第肠页电子科技人学硕士论文集合有关。最佳量化器就是在给定输入信号概率密度p ( x ) 和量化电平的条件 f ，求出一组分层电平值卜 * 与量化电平值枷 * ， k 一 1 ,2 ,., l ，使均方误差代最小。对式 ( 2 - 2 5 )求极值，即令 a ,y 2 - - - 乙 =0k=2 , 3 , . . . , l( 2 - 2 6 a ) k =1 , 2 , . . . , l ( 2 - 2 6 b) 因为客 !(一 y k)2 p (x)dx 一 (x 一，】) 2 p , (x )d x + 犷 (x 一 y 2 ) 2 p (x )d x + + 叮 (x 一， l )2 p (x )d x 所以有、1毛esweleseseseseseseeweest 0 a o- ;, _ a x , ( x 2 一 y , ) 2 p (x 2 ) 竺一 (x , 一， , ) 2 p (x i ) = 一 ( x , - y j 只( x , ) 二 0 a u y 二 a x e ( x 2 一 y , ) 2 只 ( x 2 ) 一 ( x ，一 y 2 ) 2 p ( x 2 ) = 0 ( 2 - 2 8 ) 二 ( x * 一 y k - , ) 2 p ( x k ) 一 ( x * 一 y k ) 2 p ( x k ) = a a 2 - - 二二=- 21 即、h ,a y k ， ( x 一 y k ) p ( x ) dx ( 2 - 2 9) 由式 ( 2 - 2 8 )和式 ( 2 - 2 9 )可得、一含 (y k + y k+i， ( 2 - 3 0 a ) x 只( x ) 公 1 k= ( 2 - 3 0 b ) 月 p ( x ) d x 户上一高厂戈二、主观准则的t化方法第1 7 页电子科技大学硕十论文主观准则实际方法主要是利用人眼的视觉特性的视觉掩盖效应。当图像边缘相邻两侧的亮度值相差很大时，即使存在较大的量化误差也不易察觉出来。也就是说，边缘高度越高，可见阀值越大。利用人眼的这种视觉特性能减少量化的分层数。只要干扰值低于可见阀值，人眼就察觉不出量化误差对图像质量的影响。根据上述原理所设计的主观准则的量化器能保证较好的图像质量。互 2 . 2 . 5运动补偿技术: ,-i 人眼对图像的静止部分要求高的空间分辨率和较低的时间分辨率，而对运动部分恰恰相反。为了很好的利用以上视觉特性，可把图像分割为静止部分和运动部分来分别处理。对静止的部分可重复前一帧的数据。对运动部分则设法测定其位移量，以位移量进行运动部分预测，并将此信息发送出去，可改善运动区的帧间预测效果，构成完整的图像。故称运动补偿预测。运动补偿预测技术由以下几个方面组成: i .图像分割。将视频图像分割成静止部分和运动部分。 2 .运动检测与估值。检测运动类型 ( 平移、旋转和缩放等)，估计运动物体的位移值。 3 . 运动补偿。用位移估值进行运动补偿预测。 4 予页测信息编码。对预测信息 ( 例如，运动矢量)进行编码，作为边信息发送给接收端。图2 - 7 给出了运动补偿编码器的原理框图。其中，i 为原始输入，i 为预测值，两者之差。经过量化后为e ，图像恢复数据为1 = i + e , i 与原始数据i 图 2 - 7 运动补偿编码器的原理相比，其量化误差为q = e - e , i 经过预测为i 。误差数据e 经过c进行预测第1 8 页电子科技大学硕士论文误差编码，运动位移矢量参数b 经由c 。编码。图像分割是运动补偿技术的基础，但实际上要把图像分割成不同运动的物体是比较困难的。通常采用两种比较简单的方法。一是把图像划分成矩阵形状的子块，适当的选择子块的大小，把子块分为静止和运动两类，估计运动子块的位移，进行预测编码。这种称之为块匹配法 ( b ma)。另一种方法是对每个像素的位移都进行递归估计，因此称为像素递归法 ( p r a)。这两种方法都有各自的特点，通常像素递归法比块匹配法的精度要高，对多运动画面的适应能力也强，但只能跟踪较小位移 ( 2 -3像素/ 帧)，且实现复杂。块匹配法虽然精度低于像素递归法，但由于其位移跟踪能力强 ( 6 一像素/ 帧)，且实现简单，因此在实际上中获得广泛的使用。块匹配法是目前视频压缩中最常见的运动估值算法。块匹配算法适合于运动物体作平移运动。其基本思想如图2 - 7 所示。 (m+ 2 h ) x ( n+ 2 v ) r * c- ( 第k - 1 帧) 五了 x 八块 ( 第a贞图2 - 8 块匹配运动估值首先，将当前帧 ( 第k帧) 划分为像素mx n的图像子块，并假定同一子块内的所有像素具有相同的位移。然后观察该子块与前一帧 ( 第k - 1 帧)的相关程度。为了减小计算量，总是指定一定范围进行相关度的计算。若给定一个搜索区域 s r作为匹配区: s r= ( m+ 2 h ) x ( n + 2 d ) ( 2 - 3 1 ) 在该搜索区域内寻求图像子块的最优匹配来得到其运动矢量的估值(ill) 常用的匹配准则有:归一化互相关函数 ( n c c f )，均方误差 ( ms e )和帧间绝对误差 ( ma d)等。第1 9 页一一一一一一一一一一一一 # 1 # x b y t ie .j c -_ 若采用最小均方误差 ( ms e )准则，则用下式: me s ( i , j ) 二二一 mn艺艺u , ( m , n ) 一 f , - , ( - + ，，。十 i ) z ( 2 - 3 2 ) 用_ ,八二 . 式中，人 ( m , n ) 第k 帧中待估计的子块像素的亮度值，人 _ , ( m , n ) 为k - l 帧的亮度值。i 为水平方向的偏移量，了为垂直方向的偏移量。若采用帧间绝对误差 ( ma d)准则，则用下式: m a d ( i , j ) m v蒸菩 !f , (m , n ，一几一 m 十，” 十 j )l ( 2 - 3 3 ) 因为m a d准则计算量小和硬件简单，所以用的较多。最优匹配的搜索方法有很多种，其中最简单可靠的是全搜索法，即对搜索区内每一点都计算 ma d 值，最小的 ma d对应的是最优匹配。它共需计算 ( m + 2 h ) x ( n + 2 v ) 个m a d值。全搜索方法的最大的优点是能保证全局最优，同时算法简单，易于实现。但缺点是计算量较大，特别是搜索区较大时，难于实时处理。为此，提出了很多快速算法。快速算法减小计算量，但实现比较困难，而且快速算法由于在搜索过程中存在大量的搜索空区，所以存在搜索到非最优点的情况，从而使帧间预测误差增大。第2 0 页电子科技大学硕士论文第三章视频压缩的mp e g - 2 算法 3 . 1 mp e g - 2 筒介 m p e g - 2是一种高质量的视频压缩标准，也是广泛用于广播电视的视频压缩标准。m p e g标准是由国际标准化组织 i s o和国际电工委员会 i e c共同制定的。m p e g 为m o v i n g p i c t u r e e x p e r t s g r o u p 的缩写。 m p e g 委员会初建于1 9 8 8 年，负责指定m p e g 标准，目前己经成功的指定了m p e g - 1 , m p e g - 2 , m p e g - 4 等标准。 m p e g - 2 标准于1 9 9 1 年开始指定。初期m p e g - 2 标准的基本要求有两条: 其一是视频格式采用7 2 0 x 4 8 0 像素，这和c c 工 r 6 0 1 标准规定的演播室用的数字电视像素要求相同，是 m p e g - 1标准所规定的 4倍;其二是传输码率为 4 - 1 o m b p s ，基本上也是m p e g - 1 传输码率的4 倍。当时对拟定中的m p e g - 3的基本要求也有这样相应的两条: 像素数为1 4 4 0 x 9 6 0 : 最高码率为4 0 m b p s ，其中考虑了高清晰度电视 h d t v的标准。后来 m p e g - 2 标准包括了原来规划的m p e g - 3 , 因此m p e g - 2 的图像数据流的数据率可高达4 0 m b p s 。它包括了c c i r 6 0 1 建议的常规电视和正在开发的h d t v 。而且兼容m p e g 一标准。m p e g - 2于 1 9 9 4 年正式推出，其标准的编号为 i s o / i e c 1 3 8 1 8 。标准包括三大部分，i s o / i e c 1 3 8 1 8 - 1 系统，规定几种伴音和图像数据的复用，以及加入同步信号后形成系统的技术要求;i s o / i e c 1 3 8 1 8 - 2 视频，规定了视频编码的技术要求;i s o / i e c 1 3 8 1 8 - 3 音频，规定了音频编码的技术要求。 m p e g意识到，如果将所有这些应用需要协调成单一的语法，其标准肯定将是非常复杂的。为此，m p e g - 2采纳了一种称为工具箱的折衷办法，将视频编码规范中规定的语法子集定义为类 ( p r o f i l e )其特点是可根据需要从工具箱中选出一个子集，以满足应用的需要。通常每一类包括几个等级 ( l e v e l ) ，一个等级为n的解码器能对最高为该等级 ( 包括该等级)的数据流进行解码。而一个类为n的解码器能对最高为该类 ( 包括该类)的数据流进行解码。依据m p e g - 2 标准，视频节目分为5级 ( p r o f i l e ) 5个层次 ( l e v e l )，具绍合有 2 0种，对应于不同的视频格式和压缩比，可采用其中的 1 1 种组合，其分辨率最高可以达到 1 9 2 0 x 1 1 5 2 。据专家估计，m p e g - 2协议将在未来三十年内满足人们对视频传输的要求。第2 1 页电子科技大学硕士论文 3 . 2 m p e g 一系统层算法及层次模型c s z c , z 3 . 2 . 1 mp e g - 2 系统层 m p e g - 2 是一种分层的图像数据传输算法，其码流由两层组成: 外层为系统层，内层为压缩层。系统层是对多个压缩层码流打包并复用而成，为在一个系统中使用一个或多个压缩的数据流提供必要的服务，主要支持下述的五项基本功能: 1 .将多个压缩层码流交织成单个数据流; 2 .解码时多压缩层码流的同步; 3 .提供解码开始时的缓冲区初始化参数; 4 .解码过程中对码流输入缓冲区( c h a n n e l b u f f e r ) 连续的管理; 5 .提供其所打包的压缩层数据在解码时所需的时钟信息。系统层编码可有两种方法:传输流( t r a n s p o r t s t r e a m ，简称 t s流) 和节目流( p r o g r a m s t r e a m ，简称 p s流) ，分别适用于不同的应用场合。这两种流都是由p e s 分组和一些包含其它必需信息的分组构成的，都支持一道节目的视频和音频压缩流在共同时间基点上的多路复用。因此， m p e g - 2 标准在其定义的t s 流和p s 流中提供了必要的和充分的编码句法，能保证同步译码和显示音频、视频信息，同时确保译码缓冲区既不上溢也不下溢。t s 流和 p s 流的面向分组的多路复用方法如图3 - 1 所示: 图 3 - 1 m p e g - 2 复用原理图 3 .2 . 1 . 1 转送流传送流是将多个独立时间基点的多道节目合成一个单独的数据流，其中第2 2 页电子科技大学硕士论文属于一道节目的各个原始数据流具有相同的时间基点。传送流是针对那些很容易发生错误的环境而设计的。相对而言，节目流是将一个或多个具有相同时间基点的数据流合成单个数据流，节目流是针对错误较少的环境而设计的。传送流的速率可以是变化的或固定不变的。其速率由节目的参考时钟 ( p c r )字段的位置和数值所决定，通常每一道节目都有自己的 p c r 字段。传送流中可以包括多道节目，所以传送流可以有很多方法产生有效数据流: 可以从传送流中抽取一道节目解码并显示; 也可以从传送流中抽取一道或多道节目形成新的传送流或者抽取当中一道节目形成一道节目流。传送流是由一系列的传送流分组形成的。传送流分组是一个包括头信息在内长度为 1 8 8 个字节的数据包。其包结构如图3 - 2 : 1e 一 1 8 8 b y te s - 3 h h e a d e r p a y lo a d h e a d e r p a y lo a d f- 1 - p a y lo a d t r a n s p o rt dm r i n d i c a t o r aa y 如 a d u n i t s t a r t i n d i c a t o r 乃 . 即a rt r 向c i t y p i d t r a n s p o rt s c r a n 山】五唱 ro n i mi 冉峋仍山n f 晚址 ro n t r a t c o n 血川勺 c o u n t e r d i s c o n t i n u i t y i n d 亏 r a i 叮 r a n d n m ac c e s s i n d ica t o r d a m e 川 m y s t r e a m功初出y i n d i c a t o r 5 日 a g s o p 山朋】 f i e u s t u f f in g b y t e s o p c r s p li c e c o u n t d o w n t r a n s p o rt p r i v a t e d a t a l e n g t l t r a n s p o rt p山门t o da 切 a 山即切 t i o n i i e ue x te n s i o n l e n g t h it w of f s e t口 p i e c e w i s e 双 a 加 sp ik e f 竹犯 1 5 2 2 2 4 3 3 图 3 - 2 传送流分组结构在转送流分组中，前4 个字节是分组头信息，其中第一个字节是同步字节位值 s y n c b y t e p 工 d 信息，其值固定为 0 x 4 7 。分组头还包括一个非常重要的字段它是指示存储于该分组有效负载中的数据类型。p 13p id 0 x 0 0 0 0 一一o x 0 0 0 f 是保留值，p i d 值为 0 x 0 0 0 0 指示该分组的数据是节目第2 3 贞电子科技大学硕士论文关联表( p a t ) ，而值为 0 x 0 0 0 1 指示是条件访问表( c a t ) o p i d 值为 o x f f f f 为空分组保留。尸 i d 通过节目特殊信息p s i ( p r o g r a m s p e c i f i c i n f o r m a t i o 门 ) 表来识别转送流分组中所带的数据，一个 p i d值的转送流只带一个原始流数据。 p s i 表也在传送流中，有以下四种 p s i 表: . 节目关联表p a t ( p r o g r a m a s s o c i a t i o n t a b l e ) . 节目映射表p m t ( p r o g r a m m a p t a b l e ) . 网络信息表 n i t ( n e t w o r k i n f o r m a t i o n t a b l e ) . 条件访问表 c a t ( c o n d i t i o n a c c e s s t a b l e ) t s n此ke t r 叮 b a d e 地 -mwy s t 砚合 m t s r 叮 k e t 巧哈i a m m即- p i d r 甲助油 m a p 下曲加 j 日朋.只口， r l u e l e m e n t a r y 少】 d t s p a c k e t e l e m e n t a r y _ p i d p a y

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）mpeg2编码系统研究与设计.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）mpeg2编码系统研究与设计.pdf

文档简介

温馨提示

最新文档

评论

相关文档