




已阅读5页,还剩69页未读, 继续免费阅读
(信号与信息处理专业论文)mpeg2编码系统研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电子科技大学硕士论文 ab s t r a c t i t i s mp e g - 2 t h a t i s a v e ry i m p o rt a n t i n t e r n a t i o n a l s t a n d a r d f o r c o d i n g m o v i n g p i c t u r e c o m p r e s s . mp e g - 2 i s a p p l i e d i n d i g i t a l t v , d v d a n d h d t v . wit h d i g i t a l t v , d v d a n d h d t v d e v e l o p i n g , mp e g - 2 e n c o d e s y s t e m w a s c o m p r e h e n s i v e l y r e s e a r c h e d a n d a p p l i e d . t h i s d i s s e r t a t i o n b r i n g f o r w a r d a s o l u t i o n t o mp e g - 2 e n c o d e s y s t e m w i t h mp e g s 4 2 0 s p e c i a l m o v i n g p i c t u r e c o m p r e s s c h ip a n d a r e a l i z a t i o n i n h a r d w a r e o f v i d e o c o m p r e s s f o r t h e e n c o d e s y s t e m . t h e m a i n c o n t e n t s o f t h e d i s s e r t a t i o n i n c l u d e : 1 . t h e d e s c r i p t i o n o f v a r i o u s c l a s s i c a l t h e o r y o f p i c t u r e c o mp r e s s . 2 . t h e e x p l a n a t i o n f o r mp e g - 2 a l g o r i t h m , i n c l u d i n g s y s t e m , v i d e o a n d a u d i o 3 . g i v i n g a s o l u t i o n o f mp e g - 2 e n c o d e s y s t e m t h a t c o n s i s t s o f p c a n d t h r e e e x t e rna l c a r d s . 4 . g i v i n g a n i m p l e m e n t a t i o n i n h a r d w a r e o f v i d e o c o m p r e s s w i t h mp e g s 4 2 0 c h i p , c o m p a r i n g w i t h d s p s o l u t i o n o f mp e g - 2 v i d e o c o m p r e s s k e y w o r d smp e g - 2 d c t m o t i o n c o m p e n s a t i o n t s mp 3 p t s pcr 电子科技大学硕士论文 第一章绪论 近年来,随着半导体工业的进步, 计算机、 广播和通信技术的发展, 人类进 入了信息社会。信息在社会生产,人们的生活中起着重要的作用。社会机器的运 转、人们的工作和生活都离不开信息。对信息的获取、交换、处理、再现已经形 成了一种产业, 这就是信息产业。 二十世纪末, 整个世界掀起了信息产业的热潮。 各国政府开始花巨资建设信息网络的基础设施。自 1 9 9 3年美国克林顿政府提出 “ 国家信息基础设施 ( n n i )”计划后,西方七国又提出了 “ 全球信息基础设施 b a 2 - - b , ,., a m - * b , 。 则p ( a , i b k ) = 1 ( 这-t . j = k ) ,i ( a , i 6 k ) 二 。 。 得1 ( a , , b k ) 二 i ( a , ) , 也 就是 说b * 提供了 a , 全 部的 信 息 量。 如果 信 源 编 码器 没有以 上的 对应关 系,p ( a , l b , ) 1 , i ( a , l b k ) # 0 , b 、 不提供a , 全部的 信 息量,这产生了失真。如果用少量的编码符号对信源进行编码,即; b , , a 2 -b , 认为是对应关系, 没有失真: 而a , - b 2 , a 2 - , b , 就是失真, 分别由d , , d 2 来表示, 代表它们对图 像的 质量 的影响的一种度量。 -.j 叭0 向ild: 一- d 图2 - 2失真流图和矩阵 有了 失真的 度量, 就可以 求概率平 均或失真函 数。以d ( ab k. ) 失真 度 量 ,p ( a , , b k ) 表 联 合概率 分 布, 平 均失 真, 即 失 真函 数是: 第7 页 电子科技大学硕士论文 d ( q ) 一 艺d ( a , , b , ) p ( a , , b , )二 艺d ( ab , ) p ( a , ) q ( b k a , ) ( 2 - 1 5 ) q ( b , i a ) 是条 件 概率。 由 式( 2 - 1 5 ) 可 知, q ( b , i a , ) 是 控 制失 真的 一 个量,故用d ( q ) 来表示其函数关系。 现在可以与平均互信息量i ( x , y ) 联系起来讨论“ 一定失真条件” 的表 示方法。设平均失真不超过d ,由式 ( 2 - 1 5 )可知,要求 d ( q ) d ( 2 - 1 6 ) 则 必 然 存 在 这 样一 个 条 件 概率 值q ( b , i a , ) , 使d ( q ) 不 超过d , 记 q ,, 为 保证失真在允许范围内的条件概率的集合,即: q d = q ( d ( q ) d ) ( 2 - 1 7 ) 率失真函数的基本含义就是在给定的失真的条件下找出m i n 7 ( x , y ) o 由 于i ( x , y ) 也受q 的控制, 因此, 可以 将率失真函数定义为: 在q ,; 范围内 寻找最起码的平均互信息量,并以r ( d ) 记为率失真函数。 r ( d ) = m i n i ( x, y )( q q , ) 于是有定义: ( 2 - 1 8 ) 可见率失真函数是在允许失真d的条件下, 信源编码给出的平均信息 量的下界,也就是数据压缩的极限码率。 率失真函数具有以下性质: 1 .在d5 0 时,r ( d ) 无定义。 2 .存在有一个d m a x , 使d ? d . - 时,r ( d ) = 0 3 . r ( 0 ) = h ( x ) 。 因为r ( 0 ) 代表失真为0 的编码码率, 这就是信息保 持编码定理反映的结果。 4 .在0 -t d - 3 级( 2 5 6 级) ) : 对与n t s c广播电视, 相邻两帧其亮度信号平均只有7 . 5 % 的像素变化 6 级( 2 5 6 级) ,而色度信号仅0 . 6 5 % 的像素大于此值。 实验表明,与帧内预测相比,帧 ( 场)间预测一般可获得 i o d b左右的增 益。 可对不同的情况要分别对待, 例如, 活动缓慢区域, 其帧间预测性能较好; 而在快速活动的区域,则帧间预测性能较差。 通常,对活动较剧烈的部分, 采 用帧内编码方法。 如何改善场景变化剧烈 ( 例如, 场景的切换, 物体高速运动) 的情况下的编码效率,是视频压缩有待于深入研究的问题之一。 2 帧 ( 场)重复 对于静止或者是活动慢的视频信号,可以少传一些帧。例如,隔帧 ( 场) 传输。 未传输的帧利用帧间存储器保存的前一帧作为该帧的数据, 这对于视觉 没有什么影响。因为, 人眼对静止图像部分要求较高的空间分辨率。而对时间 分辨率的要求可低一些。在电视电话中多采用帧 ( 场)重复的方法。 3 . 阀值法 所谓的阀值法,就是只传送像素亮度的帧间差值超过某一门限阀值的像 素。例如,阀值为5 ,凡是绝对值大于5的帧间差值像素就传送。通常,阀值 大小由实验确定,但也可根据缓冲存储器的占有率来控制。 4 .运动补偿预侧 运动补偿预测是十分有效的帧间预测方法,在 h . 2 6 1 , mp e g等标准中广 泛使用,对此后面将详细讨论运动补偿。 5 . 自 适应祯内 / 帧间编码 当被摄对象活动剧烈或摄像机本身活动时, 视频信号的帧间相关性明显下 降,帧内相关性增强。因此,可根据景物的活动情况进行自 适应帧内/ 帧间编 码使帧间预测误差减小,提高编码效率。 圣 2 . 2 . 2离散余弦变换 ( d c t )编码: , 1 互 2 . 2 . 2 . 1变换编码的主要特点 预测编码的任务是要使预测值尽可能的接近实际样值, 也就是要寻求一种 尽可能接近原信号统计特性的预测方法, 通过相差除去视频信号的相关性, 从 而达到数据压缩的目的。 一种更有效的去除图像信号相关性的方法是对信号进 第1 0 页 电子科技大学倾 f 论文 行变换。 函数变换的数学工具是对同一事物的不同域内的描写方法。 就所熟知的傅 立叶变换来说, 就是将一个函数时域描写变为频域描写。 这种变换会使函数的 某些特性变的明显, 从而使问题处理简化。 这是因为傅立叶变换的特性和信号 的特性相吻合。正交变换也是线性变换,由代数知识可知, 它是保持欧几里得 长度不变的一个空间旋转。 对图像信号采用正交变换, 如果所选择的正交矢量 空间与图像本身的主要特征很接近,则变换域内的图像信号的相关性明显下 降,能量相对集中,就能使图像信号的数码率得到较大的压缩。 一个信号若由n 个样点组成,即在一维空间内有月 个样值,但也可以看作 是n 维空间的一个点 ( 或者是一个n 维矢量)。这只是对同一信号的不同描述 而己。 一个图像信号, 一般可以看作二维抽样来表示, 并以各像素的亮度构成 一个矩阵。在图像编码是通常以相邻的几个像素来构成子图像处理,一般取 n x n( 或者是mx n )的方块。同样也可以看作是n x n( 或者是mx n )维空间 的一个点。为了形象表示,设每个子图像有1 x 2 个像素即相邻两个像素组成。 于是每个子图像可由二维空间的一个点来表示。 设每个像素有 8 个亮度级, 如 图2 - 4 ( a ) 分别用以x : 轴和x 2 轴来表示相邻两个像素的 亮度等级。 若图 像结构 的特点是相邻两个像素的亮度几乎差不多, 则代表各子图像的二维坐标点将集 中在4 5 斜线附近,如图2 - 4 ( a )的阴影区。为了对这些点的位置编码,就要 对差不多大小的坐标值分别进行编码。 现 在若对图 像进 行正交 变换, 从几何上相当于 作一 个4 5 的 旋转, 变 成y , , y , 坐标系,如图2 - 4 ( b )所示。 ( a ) ( b ) 图2 - 4 统计相关与坐标轴的关系 经过坐标旋转变换以后,我们发现代表图像的子图像的点的坐标y . 与y , 之间的相关性比x . 与x , 之间的相关性统计上减弱。 统计相关和统计独立的概念 应该是: 如果一个随机变量值增加( 或减少) 另一个随机变量也统计地增加( 或 第u页 电子科技大学硕士论文 减少),则称这两个随机变量统计相关;否则是统计独立。 还有,经线性变换后子图像的方差总和保持不变,即: 。 : . + c 7 h = 。 或 十 叹 ( 2 - 1 9) 但 在 坐 标 轴 上 的 分 配 却 不同 了 变 换 前ct 呈 . 与。 几 几 乎 是 相 等 的 , 但 变 换以 后 却 有 6 尽 。 孟 , 这 意 味 着 子 图 像的 能 量向 y , 轴 相 对 集 中 了 。 这 就 为 数 据 压 缩编码创造了条件。 以上的例子虽然是一个特例, 但例子告诉我们, 采用与子图像结构特性相 适配的正交变换,可以得到较好的数据压缩效果。 通常在正交变换中, k - l变换被誉为最佳变换, 其变换后的系数之间不相 关。 但就实际的成本与实时性来说, k - l变换常常是被认为是最难的一种变换。 显然,它的理论价值高于实际价值。 在视频压缩中,最常用的正交变换方法是离散余弦变换 ( d c t ),d c t 被认为是性能接近k - l变换的准最佳变换。变换编码的主要特点有: 1 .在变换域里描述视频图像比在空间域简单。 2 .视频图像的相关性明显下降,信号的能量显著的集中在少数几个变换 系数上,采用量化和嫡编码可有效的压缩其数据。 3 .可充分利用人眼的视觉特性,例如,空间频率特性、视觉心理和视觉 现象。 4 .具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于 预测编码。通常对高质量的图像,预测编码要求信道误码率小于或等 于1 0 ,,而变换编码要求信道误码率小于或等于1 0 - 1 . s . d c t变换有快速算法,能实现实时视频压缩。 芬 2 . 2 . 2 . 2 d c t编码的处理步异 : n 1 , d c t变换 d c t变换矩阵的大小可以从去相关程度和实现难易等方面来综合考虑 8 x 8 通常被认为是一种较好的选择。其二维 d c t变换为: 正变换: 一 ,= 告 c(u)c(v) i l 艺艺 f ( x , y ) c o s s = o y = o ( 2 x + 1) u ;r c o s 1 6 ( 2 - 2 0 ) 反变换: 第1 2 页 电子 科技人学硕士论文 f ( x , y ) = 艺 艺c (u ) c ( v ) c o s ( 2 x + 1 ) u 7 c 1 6 ( 2 y + 1 ) u 7 c 1 6 ( 2 - 2 1 ) 其中 “(“ ,“ (, 二 12 c ( u ) , c ( v ) 二1 2 、系数量化 经 d c 丁量化得到的系数,其能量主要集中在沿对角线分布,且在左上角 集中主要能量。 这反映了能量主要以低频成分为主的客观事实, 即图像大部分 区域变化不大, 亮度突变部分占少数。 量化的目的是在确保一定图像质量情况 下, 舍弃一些对视觉效果影响不大的次要信息,从而达到进一步的压缩。由于 不同频率的系数对人眼的视觉效果不同, 因此, 可充分利用人眼的视觉特性选 择不同的量化方案。系数量化是 d c t编码的关键所在。常用的方法有区域编 码、自 适应比特分配、门限控制和综合方法等。 所谓的区域编码就是将8 x 8 变换系数根据能量划分为若干区域, 对每个区 域分别量化和编码, 每个区域的编码比特数由该区域中变换系数的能量大小决 定。 通常变换系数能量大的区域占有较多的比特数, 反之亦然。 值得注意的是, 过多地删除高频系数会产生 “ 细节模糊”现象。 自 适应比特分配是指根据变换系数的能量大小自 适应地分配变换系数所 需的比特数。 最佳分配方法是对被编码区域的能量分布情况进行概率统计, 并 根据失真要求来分配其比特数。 通常采用直方图方法来取代复杂的概率密度函 数 估 计, 但也 可 用 高 斯 密 度函 数 来 近 似 计算 对均 方失 真d , 方差 为 2c ,1 的 系 数 , 其 最 佳 编 码比 特 数为r , = ( 10 9 2 a 了 一 10 9 2 d ) 2 0 门限控制法能避免舍弃能量较大的高频系数。 例如, 假设门限为t a , 凡小 于几的系数均置为0 , 从而增加系数为0 的个数。门限的设置可根据人眼的视 觉特性。 因为人眼对不同的变换系数其敏感程度不同, 低于一定能量可以略去。 同时对非常敏感的变换系数, 其门限控制可以取得小一些, 而那些对视觉不太 重要的系数可以取较大的门限,这样既能满足视觉的要求又降低的数码率。 另一种门限的控制方法是自适应门限控制, 即门限大小随图像细节的变化 而自动的调整,以达到自适应的效果。 为了达到最佳的效果。往往采用综合法, 例如,结合使用自适应量化、预 测编码、矢量量化等。综合方法往往比较有效,因此备受重视。 3 、系数排序 经过量化的 d c t系数通常会出现较多的零值,使用游程编码能大大改善 第1 3 页 电子科技大学硕士论文 编码效率。 为了增加零系数的个数,如何对己量化的系数进行排序就显的尤为 重要。通常可按 “ 之”字形排列。 4 ,摘编码 d c t 编码的最后是嫡编码。墒编码是一种基于量化系数统计特性所进行 的无失真编码。常用的嫡编码方法有游程长度编码、哈夫曼编码和算术编码。 在视频编码中,常用游程长度编码和哈夫曼编码。 2 . 2 . 3摘编码 互 2 . 2 . 3 . 1 游程长度编码 ( r l c ) 游程长度编码最早用于二值图像的压缩编码。 二值图像的每一个扫描行总 是由若干段连着白像素和黑像素组成, 即所谓的白长和黑长。 对不同的黑长和 白长, 按其出现的概率分配以不同的码子, 这种编码方法称之为游程长度编码。 实际上, 游程长度编码并不只限于二值图像上,目前广泛应用于视频编码 中,例如前面讨论的 d c t编码中,通常变换系数经过量化后会出现很多零系 数。在这种情况下,与其传送大量的零系数,不如告知接受端那些非零系数, 并告知非零系数之间有多少个零,恢复时插入零系数即可。 夸 2 . 2 . 3 . 2哈夫里编码 、 : 哈夫曼编码是图像压缩中最重要的编码方法之一,是 1 9 5 2年由哈夫曼 c h u f f m a n )提出的一种非等长最佳编码方法。所谓最佳编码,即在具有相同 输入概率集合的前提下,其平均码长比其他任何一种唯一可译码都短。图2 - 5 是哈夫曼编码的一个实例。其步骤如下: 1 、将输入符号按出现的概率由大到小的顺序排列 ( 相同概率的符号可以 任意颠倒排列位置)。 重排 。 将最小的两个概率相加,形成一个新的概率集合。再按第一步的方法 如此重复到只有两个概率为止。 3 、分配码子。码子分配从最后一步反向进行,最后两个概率,一个赋予 0 ”码,一个赋予 “ 1 。 该编码结构实际 上是一棵二叉树, 码子都是从根出发排列的。 概率大的符 第1 4 页 电子科技大学硕士论文 号 ( 或事件)分配较短的码子, 概率较小的符号分配较长的码子,从而提高其 编码效率。 应当指出,由哈夫曼编码给出的最佳编码并不是唯一的, 但其平均 石 马 长相等。 0 . 61 码长码子 信 源 符号 出现 概率 al叱a3如电匈衡 1 1 1 0 0 1 1 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 . 2 0 0 . 1 9 0 . 1 8 0 . 1 7 0 . 1 5 0 . 1 0 0 . 0 1 气j一介名勺j勺j勺j月勺j弓 图2 - 5哈夫曼编码示意图 图例中的编码参数分别为: 平均码长:2 . 7 2 信源墒:2 .6 1 编码效率:% 从上面的参数可以看出, 哈夫曼编码的平均码长己经接近它的下限一一信 源嫡,说明了哈夫曼编码的优越性。 2 .2 .4量化: , 经过抽样的图像, 只是在空间上是离散的像素阵列, 而每个像素的亮度值 还是一个 连续量, 必须把它转化为有限 个 离散值, 这就需要量化。 从数学角度 来看, 量化过程就是把一个连续幅度值的无限数集合映射成一个离散幅度的有 限数集 ( a ) 第1 5 页 电子科技大学硕上论文 ; - - 一 x 一0 0 x , y * 一 , 夕 * x 一 一 闷 )一 一x一 一一o- - x k - 1 x k 2 丢 一 石 乙 y上 工 k + 1 x 一 _ _ _ x a 十 1十co 合。如图2 - 6 ( a ) , 入信号幅度x 落在 表达为: ( b ) 图2 - 6 标量量化 量化器的输出l 个量化电 平y k , k = 1 , 2 , . . , l 。 当量化器的 输 x 、 与x k + 、 之间时, 量化器输出电 平为y k 。 这个量化过程可以 y 二 q ( x ) = q-k -g x x k + l 卜y k , k = 1 ,2 , 二 。 l 这里x * 成为分层电平。 通常把 k = x k + l - x * 称为量化间隔。 ( 2 - 2 2 ) 如果 * 是一个 常数, 即 * 二 c , k = 1 , 2 ,.二 , l 这 样的的 量 化称为 均 匀量 化, 而 将不等的 量化间 隔 的量化方式称为非均匀量化。 量化是以有限个离散近似表示无限多个连续值,所以一定存在量化误差。 量化误差的定义为: q = x 一 y=x 一 q ( x ) ( 2 - 2 3 ) 对于确定输入的信号,q 是一个确定的函 数。 但对于图像等信源的随机信 号,q 则是一个随机变量。通常把量化误差q 称为量化噪声,量化噪声一般用 均方误差来度量。设输入信号x 的概率分布密 度为f , ( x ) ,则量化噪声为: q y = e x 一 q (x )z 一 x 一 q (x )z p , ( x ) dx ( 2 - 2 4) 若把积分区域割成 l个量化间隔,则上式可写成: 1几 v2 =v y j ( x 一 y,) p ( x ) d x ( 2 - 2 5) k = i s , 量化器最好的是最佳量化。所谓的最佳量化, 就是使量化误差最小的量化 方法。 最佳量化器的设计方法有两种。 一种是根据客观准则设计法, 采用量化 均方误差最小为约束条件;另一种是主观准则设计方法, 它根据人眼的视觉特 性来设计量化器。 一、客观准则的最佳盆化 由量化误差公式可以得出,在给定信源的情况下,p ( x ) 己知的。因此, 量 化 误 差 川与 量 化 间 隔 的 分 割 有 关 , 即 与lx k 集 合 的 选 择 以 及 量 化 电 乎伽 l i 第肠页 电子 科技人 学硕士 论文 集合有关。最佳量化器就是在给定输入信号 概率密度p ( x ) 和量化电 平的条件 f , 求 出一组 分 层 电 平 值 卜 * 与 量 化 电 平 值枷 * , k 一 1 ,2 ,., l , 使 均 方 误 差 代 最小。 对式 ( 2 - 2 5 )求极值,即令 a ,y 2 - - - 乙 =0k=2 , 3 , . . . , l( 2 - 2 6 a ) k =1 , 2 , . . . , l ( 2 - 2 6 b) 因为 客 !(一 y k)2 p (x)dx 一 (x 一 , 】) 2 p , (x )d x + 犷 (x 一 y 2 ) 2 p (x )d x + + 叮 (x 一 , l )2 p (x )d x 所以有 、1毛esweleseseseseseseeweest 0 a o- ;, _ a x , ( x 2 一 y , ) 2 p (x 2 ) 竺一 (x , 一 , , ) 2 p (x i ) = 一 ( x , - y j 只( x , ) 二 0 a u y 二 a x e ( x 2 一 y , ) 2 只 ( x 2 ) 一 ( x , 一 y 2 ) 2 p ( x 2 ) = 0 ( 2 - 2 8 ) 二 ( x * 一 y k - , ) 2 p ( x k ) 一 ( x * 一 y k ) 2 p ( x k ) = a a 2 - - 二 二=- 21 即、h ,a y k , ( x 一 y k ) p ( x ) dx ( 2 - 2 9) 由式 ( 2 - 2 8 )和式 ( 2 - 2 9 )可得 、 一 含 (y k + y k+i, ( 2 - 3 0 a ) x 只( x ) 公 1 k= ( 2 - 3 0 b ) 月 p ( x ) d x 户上一高厂戈 二、主观准则的t化方法 第1 7 页 电子科技大学硕十论文 主观准则实际方法主要是利用人眼的视觉特性的视觉掩盖效应。 当图像边 缘相邻两侧的亮度值相差很大时,即使存在较大的量化误差也不易察觉出来。 也就是说, 边缘高度越高, 可见阀值越大。 利用人眼的这种视觉特性能减少量 化的分层数。 只要干扰值低于可见阀值, 人眼就察觉不出量化误差对图像质量 的影响。根据上述原理所设计的主观准则的量化器能保证较好的图像质量。 互 2 . 2 . 5运动补偿技术: ,-i 人眼对图像的静止部分要求高的空间分辨率和较低的时间分辨率, 而对运 动部分恰恰相反。 为了很好的利用以上视觉特性, 可把图像分割为静止部分和 运动部分来分别处理。 对静止的部分可重复前一帧的数据。 对运动部分则设法 测定其位移量,以位移量进行运动部分预测, 并将此信息发送出去,可改善运 动区的帧间预测效果,构成完整的图像。故称运动补偿预测。 运动补偿预测技 术由以下几个方面组成: i .图像分割。将视频图像分割成静止部分和运动部分。 2 .运动检测与估值。检测运动类型 ( 平移、旋转和缩放等),估计运动 物体的位移值。 3 . 运动补偿。用位移估值进行运动补偿预测。 4 予 页 测信息编码。对预测信息 ( 例如,运动矢量)进行编码,作为边信 息发送给接收端。 图2 - 7 给出了 运动补偿编码器的原理框图。 其中,i 为原始输入,i 为预 测值, 两者之差。 经过量化后为e , 图 像恢复数据为1 = i + e , i 与原始数据i 图 2 - 7 运动补偿编码器的原理 相比, 其 量化误 差为q = e - e , i 经过预 测为i 。 误 差数据e 经过c进行预 测 第1 8 页 电子科技大学硕士论文 误差编码,运动位移矢量参数b 经由c 。 编码。 图像分割是运动补偿技术的基础, 但实际上要把图像分割成不同运动的物 体是比较困难的。 通常采用两种比较简单的方法。 一是把图像划分成矩阵形状 的子块, 适当的选择子块的大小, 把子块分为静止和运动两类,估计运动子块 的位移,进行预测编码。这种称之为块匹配法 ( b ma)。另一种方法是对每 个像素的位移都进行递归估计,因此称为像素递归法 ( p r a)。这两种方法都 有各自的特点, 通常像素递归法比块匹配法的精度要高, 对多运动画面的适应 能力也强,但只能跟踪较小位移 ( 2 -3像素/ 帧),且实现复杂。块匹配法虽 然精度低于像素递归法,但由于其位移跟踪能力强 ( 6 一像素/ 帧),且实现简 单,因此在实际上中获得广泛的使用。 块匹配法是目前视频压缩中最常见的运动估值算法。 块匹配算法适合于运 动物体作平移运动。其基本思想如图2 - 7 所示。 (m+ 2 h ) x ( n+ 2 v ) r * c- ( 第k - 1 帧) 五 了 x 八 块 ( 第a贞 图2 - 8 块匹配运动估值 首先, 将当前帧 ( 第k帧) 划分为像素mx n的图像子块,并假定同一子 块内的所有像素具有相同的位移。 然后观察该子块与前一帧 ( 第k - 1 帧)的相 关程度。为了减小计算量,总是指定一定范围进行相关度的计算。若给定一个 搜索区域 s r作为匹配区: s r= ( m+ 2 h ) x ( n + 2 d ) ( 2 - 3 1 ) 在该搜索区域内寻求图像子块的最优匹配来得到其运动矢量的估值(ill) 常用的匹配准则有:归一化互相关函数 ( n c c f ),均方误差 ( ms e )和帧间 绝对误差 ( ma d)等。 第1 9 页 一一一 一一 一 一一 一 一 一 一 # 1 # x b y t ie .j c -_ 若采用最小均方误差 ( ms e )准则,则用下式: me s ( i , j ) 二二 一 mn艺 艺u , ( m , n ) 一 f , - , ( - + , , 。 十 i ) z ( 2 - 3 2 ) 用_ ,八 二 . 式中,人 ( m , n ) 第k 帧中 待估计的 子块像素的 亮度值,人 _ , ( m , n ) 为k - l 帧 的亮度值。i 为水平方向的偏移量,了 为垂直方向的偏移量。若采用帧间绝对 误差 ( ma d)准则,则用下式: m a d ( i , j ) m v蒸 菩 !f , (m , n , 一 几 一 m 十 ,” 十 j )l ( 2 - 3 3 ) 因为m a d准则计算量小和硬件简单,所以用的较多。 最优匹配的搜索方法有很多种, 其中最简单可靠的是全搜索法,即对搜索 区内每一点都计算 ma d 值,最小的 ma d对应的是最优匹配。它共需计算 ( m + 2 h ) x ( n + 2 v ) 个m a d值。全搜索方法的最大的优点是能保证全局最优, 同时算法简单,易于实现。 但缺点是计算量较大, 特别是搜索区较大时, 难于 实时处理。为此, 提出了很多快速算法。 快速算法减小计算量, 但实现比较困 难, 而且快速算法由于在搜索过程中存在大量的搜索空区, 所以存在搜索到非 最优点的情况,从而使帧间预测误差增大。 第2 0 页 电子科技大学硕士论文 第三章 视频压缩的mp e g - 2 算法 3 . 1 mp e g - 2 筒介 m p e g - 2是一种高质量的视频压缩标准,也是广泛用于广播电视的视频压 缩标准。m p e g标准是由国际标准化组织 i s o和国际电工委员会 i e c共同制定 的。m p e g 为m o v i n g p i c t u r e e x p e r t s g r o u p 的缩写。 m p e g 委员会初建于1 9 8 8 年, 负责指定m p e g 标准,目 前己经成功的指定了m p e g - 1 , m p e g - 2 , m p e g - 4 等 标准。 m p e g - 2 标准于1 9 9 1 年开始指定。初期m p e g - 2 标准的基本要求有两条: 其一是视频格式采用7 2 0 x 4 8 0 像素, 这和c c 工 r 6 0 1 标准规定的演播室用的数字 电视像素要求相同,是 m p e g - 1标准所规定的 4倍;其二是传输码率为 4 - 1 o m b p s , 基本上也是m p e g - 1 传输码率的4 倍。当时对拟定中的m p e g - 3的基本 要求也有这样相应的两条: 像素数为1 4 4 0 x 9 6 0 : 最高码率为4 0 m b p s , 其中考虑 了高清晰度电视 h d t v的标准。后来 m p e g - 2 标准包括了原来规划的m p e g - 3 , 因此m p e g - 2 的图像数据流的数据率可高达4 0 m b p s 。 它包括了c c i r 6 0 1 建议的 常规电视和正在开发的h d t v 。而且兼容m p e g 一 标准。m p e g - 2于 1 9 9 4 年正式 推出,其标准的编号为 i s o / i e c 1 3 8 1 8 。标准包括三大部分,i s o / i e c 1 3 8 1 8 - 1 系统, 规定几种伴音和图像数据的复用,以及加入同步信号后形成系统的技术 要求;i s o / i e c 1 3 8 1 8 - 2 视频,规定了视频编码的技术要求;i s o / i e c 1 3 8 1 8 - 3 音频,规定了音频编码的技术要求。 m p e g意识到,如果将所有这些应用需要协调成单一的语法,其标准肯定 将是非常复杂的。为此,m p e g - 2采纳了一种称为工具箱的折衷办法,将视频 编码规范中规定的语法子集定义为类 ( p r o f i l e )其特点是可根据需要从工具 箱中选出一个子集,以满足应用的需要。 通常每一类包括几个等级 ( l e v e l ) , 一个等级为n的解码器能对最高为该 等级 ( 包括该等级)的数据流进行解码。而一个类为n的解码器能对最高为该 类 ( 包括该类)的数据流进行解码。 依据m p e g - 2 标准,视频节目分为5级 ( p r o f i l e ) 5个层次 ( l e v e l ), 具绍合有 2 0种,对应于不同的视频格式和压缩比,可采用其中的 1 1 种组合, 其分辨率最高可以达到 1 9 2 0 x 1 1 5 2 。据专家估计,m p e g - 2协议将在未来三十 年内满足人们对视频传输的要求。 第2 1 页 电子科技大学硕士论文 3 . 2 m p e g 一系统层算法及层次模型c s z c , z 3 . 2 . 1 mp e g - 2 系统层 m p e g - 2 是一种分层的图像数据传输算法, 其码流由两层组成: 外层为系统 层,内层为压缩层。系统层是对多个压缩层码流打包并复用而成,为在一个系 统中使用一个或多个压缩的数据流提供必要的服务, 主要支持下述的五项基本 功能: 1 .将多个压缩层码流交织成单个数据流; 2 .解码时多压缩层码流的同步; 3 .提供解码开始时的缓冲区初始化参数; 4 .解码过程中对码流输入缓冲区( c h a n n e l b u f f e r ) 连续的管理; 5 .提供其所打包的压缩层数据在解码时所需的时钟信息。 系统层编码可有两种方法:传输流( t r a n s p o r t s t r e a m ,简称 t s流) 和节 目流( p r o g r a m s t r e a m ,简称 p s流) ,分别适用于不同的应用场合。这两种流 都是由p e s 分组和一些包含其它必需信息的分组构成的, 都支持一道节目的视 频和音频压缩流在共同时间基点上的多路复用。 因此, m p e g - 2 标准在其定义的t s 流和p s 流中提供了必要的和充分的编码 句法,能保证同步译码和显示音频、视频信息,同时确保译码缓冲区既不上溢 也不下溢。t s 流和 p s 流的面向分组的多路复用方法如图3 - 1 所示: 图 3 - 1 m p e g - 2 复用原理图 3 .2 . 1 . 1 转送流 传送流是将多个独立时间基点的多道节目合成一个单独的数据流, 其中 第2 2 页 电子科技大学硕士论文 属于 一 道节目的各个原始数据流具有相同的时间基点。 传送流是针对那些很容 易发生错误的环境而设计的。 相对而言, 节 目流是将一个或多个具有相同时间 基点的数据流合成单个数据流,节目 流是针对错误较少的环境而设计的。 传送流的速率可以是变化的或固定不变的。其速率由节目的参考时钟 ( p c r )字段的位置和数值所决定,通常每一道节目都有自己的 p c r 字段。 传送流中可以包括多道节目, 所以传送流可以有很多方法产生有效数据 流: 可以从传送流中抽取一道节目解码并显示; 也可以从传送流中抽取一道或 多道节目形成新的传送流或者抽取当中一道节目形成一道节目 流。 传送流是由一系列的传送流分组形成的。 传送流分组是一个包括头信息在 内长度为 1 8 8 个字节的数据包。其包结构如图3 - 2 : 1e 一 1 8 8 b y te s - 3 h h e a d e r p a y lo a d h e a d e r p a y lo a d f- 1 - p a y lo a d t r a n s p o rt dm r i n d i c a t o r aa y 如 a d u n i t s t a r t i n d i c a t o r 乃 . 即a rt r 向c i t y p i d t r a n s p o rt s c r a n 山 】五 唱 ro n i mi 冉 峋 仍 山n f 晚址 ro n t r a t c o n 血川 勺 c o u n t e r d i s c o n t i n u i t y i n d 亏 r a i 叮 r a n d n m ac c e s s i n d ica t o r d a m e 川 m y s t r e a m功 初 出y i n d i c a t o r 5 日 a g s o p 山朋】 f i e u s t u f f in g b y t e s o p c r s p li c e c o u n t d o w n t r a n s p o rt p r i v a t e d a t a l e n g t l t r a n s p o rt p山 门t o da 切 a 山 即 切 t i o n i i e ue x te n s i o n l e n g t h it w of f s e t口 p i e c e w i s e 双 a 加 sp ik e f 竹 犯 1 5 2 2 2 4 3 3 图 3 - 2 传送流分组结构 在转送流分组中,前4 个字节是分组头信息, 其中第一个字节是同步字节 位值 s y n c b y t e p 工 d 信 息 ,其值固定为 0 x 4 7 。分组头还包括一个非常重要的字段 它 是指 示存 储于 该分组有 效 负载 中的数据 类 型 。p 13p id 0 x 0 0 0 0 一 一o x 0 0 0 f 是保留值,p i d 值为 0 x 0 0 0 0 指示该分组的数据是节目 第2 3 贞 电子科技大学硕士论文 关联表( p a t ) , 而值为 0 x 0 0 0 1 指示是条件访问表( c a t ) o p i d 值为 o x f f f f 为空分组保留。尸 i d 通过节目 特殊信息p s i ( p r o g r a m s p e c i f i c i n f o r m a t i o 门 ) 表来识别转送流分组中所带的数据,一个 p i d值的转送流只带一个原始流数 据。 p s i 表也在传送流中,有以下四种 p s i 表: . 节目关联表p a t ( p r o g r a m a s s o c i a t i o n t a b l e ) . 节目 映射表p m t ( p r o g r a m m a p t a b l e ) . 网络信息表 n i t ( n e t w o r k i n f o r m a t i o n t a b l e ) . 条件访问表 c a t ( c o n d i t i o n a c c e s s t a b l e ) t s n此ke t r 叮 b a d e 地 -mwy s t 砚合 m t s r 叮 k e t 巧哈i a m m即- p i d r 甲 助油 m a p 下 曲加 j 日 朋.只 口, r l u e l e m e n t a r y 少】 d t s p a c k e t e l e m e n t a r y _ p i d p a y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大众机油知识培训
- 人教版九年级化学 2.2氧气的教学设计
- 六年级数学上册 六 百分数第1课时 百分数的意义和读写教学设计 苏教版
- 九年级物理下册 第十八章 能源与可持续发展 三 太阳能教学设计 (新版)苏科版
- 彩钢板设计培训
- 出国参展展前培训
- 餐饮成本管理培训课件
- 一年级下册10 端午粽教案
- 二年级数学下册 6 有余数的除法第4课时 有余数除法的竖式计算(2)教学设计 新人教版
- 主题三:红色之美 第16课《乡村振兴-战旗村的崛起》(教学设计)川教版四年级上册综合实践活动
- 河南省天一小高考2024-2025学年(下)高三第三次考试政治
- 自制结婚协议书范本
- 统编版二年级语文下册第四单元自测卷(含答案)
- 湘豫名校联考2024-2025学年高三春季学期第二次模拟考试化学答案
- 新课标《义务教育历史课程标准(2022年版)》解读课件
- 2025年陕西榆林能源集团横山煤电有限公司招聘笔试参考题库附带答案详解
- 2025年上半年江西省水务集团限责任公司招聘60人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年辽宁省能源控股集团所属辽能股份公司招聘笔试参考题库附带答案详解
- 第五课 我国的根本政治制度课件高考政治一轮复习统编版必修三政治与法治
- 2024年南通市公安局苏锡通园区分局招聘警务辅助人员考试真题
- 精神科护理不良事件分析讨论
评论
0/150
提交评论