(电路与系统专业论文)mpegⅡ压缩标准及其在dvddvb视频信号处理中的应用.pdf_第1页
(电路与系统专业论文)mpegⅡ压缩标准及其在dvddvb视频信号处理中的应用.pdf_第2页
(电路与系统专业论文)mpegⅡ压缩标准及其在dvddvb视频信号处理中的应用.pdf_第3页
(电路与系统专业论文)mpegⅡ压缩标准及其在dvddvb视频信号处理中的应用.pdf_第4页
(电路与系统专业论文)mpegⅡ压缩标准及其在dvddvb视频信号处理中的应用.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

污j 工业大学瘊士论文 摘爱 摘要 m p e g - 2 标准的应用越来越广泛,很多视频信号都是采用该标准进行处理 灼,特别是在运动图像质量需求高的场合,m p e g 一2 标准占有攀足轻重的位置。 w 以看到,d v d 作为一种消费产品,近年来的销量在躐线上升;随着我国数字 电视的开播,d v b 在我闼也将出现一个新的消赞亮点。论文结合d v d d v 8 的软 硬件齐笈,霹i p e g - 2 稼准及禳关算法送行7 系统深入豹磅究,霹其麓缩羹法 进行了改进,并将其成劝地用于多款产品开发。论文的主要研究内容脊: 1 ) 磺交了m p e g 一2 薮准采建豹梗关数据处瑾及绽粥算法。主要磅炎了离 散余弦变换对视频图像的处理,霍夫曼编码原则和运动补偿的原理。 ( 2 ) 研究了b l p e g 一2 标准内容,特别是对节鼹流、传送流的语法定义进行 了分析。还对m p e g 一2 标准编码方法提蹬了一稀基于伪裙移技术的改进揞旅, 并进行了试验。+ 并就m p e g 一2 标准在d v b 应用巾,相关码流的荚键参数含义及 设置送行7 研究。 ( 3 ) 澍m p e g 2 标准往d v d 应用中的具体解码软件实现进行了设计。重点 耀述了谈标准籀鹚鑫主簇过程豹程序设计。势结合d v d 撵放规靛设诗割 乍_ j 窭 程,对硬件电路从方案选择,主要模块设计,到系统调试做了分析。 ( 4 ) 对小波变换在m p e g 一2 中豹应用做了研究,算讨论了用小波变换替换 m p e g 一2 标准中的离散余弦交换的可畿髓,最籍提出了结合小波交换戎视频楚 理中应绡的一些设想。 关键字:o c t 交换运动 媸鬟夫曼编码毯摆穆技术小波变羧 嚣裴工业大学壤圭论文基最 a b s t r a c t m p e g 一2s t a n d a r db e c o m e sm o r ep o p u l a rt h a nb e f o r e a n da l m o s ta l lo ft h e v i d e os i g n a l sa r ep r o c e s s e d 证氆t h ep r o t o c 0 1 e s p e c i a l l y , i nt h ef i e l d so f h i g h q u a l i t yi m a g ep r o c e s s i n ga n dt r a n s m i s s i o n ,t h em p e g 一2i sw i d e l yu s e d i nt h i s d i s s e r t a t i o n ,m p e g 一2 s t a n d a r di s a n a l y z e dd e e p l ya n dc o m p l e t e l y , a n ds o m e i m p r o v e m e n ti s m a d ea b o u tm p e g 一2 an e wm o t i o nc o m p e n s a t i o na l g o r i t h m b a s e dp s e u d o p h a s e - s h i f ti s p r o p o s e d a tt h es a m et i m e t h e s ea l g o r i t h m sa n d t e c h n i q u e sa r es u c c e s s f u l l ya p p l i e d t ot h ed e v e l o p m e n t so fd v da n dd v b p l a y e r s t h em a i nc o n t e n t sa r es u m m a r i z e da sf e l l l o w s : 1 ) t h e e n c o d i n ga l g o r i t h m sa n dt e c h n i q u e su s e di nt h em p e g - 2a r es t u d i e d d e e p l ya n dc o m p l e t e l y t h ee m p h a s e so ft h er e s e a r c h e sa r ef o c u s e do nt h e d c tt r a n s f o r mi nt h ev i d e os i g n a l s p r o c e s s i n g ,t h et h e o r i e s o fh u f f m a n e n c o d ea n dm o t i o n c o m p e n s a t i o na l g o r i t h m s 2 ) o nt h eb a s i so ft l l e a n a l y g i so f t h es y n t a xo f 穗ep sa n dt sd a t as t r e a m 。a m o t i o nc o m p e n s a t i o na l g o r i t h mb a s e do np s e u d o - p h a s e - s h i f ti s p r o p o s e d c o m p a r e dw i t ho r i g i n a la l g o r i t h m ,t h i sa l g o r i t h mc a nr e d u c et h ec o m p u t i n g q u a n t i t yo f t h em o t i o nc o m p e n s a t i o ni nm p e g - 2 ,a n dt h er e s u l t sa r ea p p l i e d t ot h e d e v e l o p m e n t s o fd v da n dd v bp l a y e r b e s i d e s ,t h e o p t i m i z i n g m e t h o d so fp a r a m e t e r so ft h et sd a t as t r e a mu s e di nt h ed v b s y s t e ma r e g i y e n 3 ) t h e d e s i g no f t h ed e c o d es o f t w a r eo ft h ed v d p l a y e rw i t hm p e g - 2 i sg i v e n a n da l s o ,t h ed e b u gs c h e m eo ft h es y s t e mi s p r e s e n t e d f u r t h e r m o r e ,s o m e h a r d w a r ed e s i g n so ft h ed v d p l a y e ra r ef i n i s h e d 4 ) a tt h es a m et i m e t h i sd i s s e r t a t i o ns t u d i e st h e p r o b a b i l i t y t h a tw a v e l e t t r a n s f o r mi su s e dt os u b s t i t u t ef o rt h ed c tt r a n s f o i t ni nt h em p e g 2s t a n d a r d s o m ec o n s i d e r a t i o nt ou s et h ew a v e l e tt r a n s f o r mt op r o c e s st h ev i d e o s i g n a li n t h em p e g 一2h a sb e e ng i v e n k e y w o r d :d c tm o t i o nc o m p e n s a t i o n p s e u d o p h a s e - s h i f ta l g o r i t h m i i 。 h u f f m a n - e n c o d e w a v e l e tt r a n s f o r m e r 西北工业大学硕士论文第一章概论 第一章概论 1 1m p e g 标准简介 m p e g 是活动图像专家组( m o v i n gp i c t u r ee x p e r t sg r o u p ) 的英文缩 写,本来是标准化的工作班子,现在作为活动图像及与其相关的音频等信息 压缩的国际标准使用。它研究数字存储媒体上的活动图像及其伴音的编码表 示。 1 1 。1m p e g 一1 m p e g 组织于1 9 9 2 年颁布m p e g l ( i s o i e c1 1 1 7 2 ) 标准,主要是为数字媒 介( d s m ) 中的视频、音频信息压缩而提出的,被应用于c d r o l l 、数字录音带 ( d a t ) 、计算机硬盘和c d - r 、c d r w 等。m p e g 一1 实现了比特率不超过1 5 m b i t s 的运动图像及伴音的编码标准。m p e g 一1 传输信道可以是i s d n 和l a n 等。m p e g 一1 标准包括m p e g 视频、m p e g 音频和m p e g 系统三个部分。 m p e g l 系统编码层允许把1 个或多个基本流组合成单个流。来自每个基本 流的数据经过多路复用,并和一些附带信息一起编码,从而允许基本流能同 步重新播放。构成m p e g 一1 多路复合流的每个基本流由存取单元组成,存取单 元是表示单元的编码表示。视频基本流的表示单元为图像,对应的存取单元 包括图像的所有编码数据。音频基本流的表示单元是一组与来自音频帧的样 本对应的样本数据。 m p e g l 视频压缩采用d c t 变换、运动估计、运动补偿和v l c 可变长编码技 术,在l 。2 i t s 左右的码率下可以得到较高质量的娱乐型视频图像。m p e g l 视频压缩算法利用上述技术实现帧内编码和帧间编码相结合编码方法,既实 现了视频图像的高压缩比,又保证t m p e g - 1 视频具有与存储相适应的性质, 如能够随机访问、快进快退、检索、倒放等。 1 1 2m p e g 一2 为满足高比特率、高质量的视频应用的需要,与飞速发展的计算机和通 信技术相适应,m p e g 委员会1 9 9 2 年正式设立了运动图像专家组2 ( i s o i e c 1 3 8 1 8 ) ,于1 9 9 4 年1 1 月发布m p e g 一2 标准( 即i t u t r e c h 2 6 2 ) 。m p e g - 2 的传 输比特率在2 m b i t s l o m b i t s 之间,图像质量不低于n t s c p a l s e c a m 制式标 准。进一步发展了b p e g 家族,并被全世界公认为声音和图像信号数字化的基 础标准。m p e g 一2 标准也分为系统、图像和伴音三个部分。 落:| e 工盈丈掌鞭论文 箍一睾糍论 系统部分( i s o i e c l 3 8 1 8 3 ) 涉及如何将一个或多个图像、伴毒段其它 数据的基本码流组成单一码流,使之便于存储与传输。系统屡有两种方式: 稷序流( p r o g r a ms t r e a m ) 和传送流( t r a n s p o r ts t r e a m ) 。压缩后的基本 弼流与系统静稿惫一越缝合、字包,产生打识基本弱流p e s ( p a c k e t i s e d e e m e n t a r ys t r e a m s ) ,然后将这些p e s 又组合成程序流或传送码流。程序流 逶建子趣对无误避熬环境,攫予软佟楚理:传送濂适会专误玛鼹环境,适予 在各种媒质中存储和传遴,【l 】“5 】 m p e g - 2 视频部分规定了图像的通用编码方法,m p e g 2 在继承m p e g l 基于 o c t 的视频压缩编码的基穑上,对m p e g l 进行了避一多的扩震。其基本算法与 m p e g l 相间,可以作为m p e g l 的高级结构而建立,与m p e g 一1 兼容;但又增加 了霹分缀崔耋,魏:输入瓣窭蚕豫彩龟分繁磁( ¥:u :¥) 戆霹选铎性( 3 缓露 逸) ,可直接对隔行扫描信号j 行处理,码流结构、时空分辨率和信噪比的 可分缀性筹。菝照不同的“层瑟”( p r o f i l e ) 秘“等级” h ( - ) 乩( ) 心( ) 吼( ) 香农信息论已证明:信源熵是进行无失真编码的理论极限。低于此极限 的无失真编码方法是不存在的,这是熵编码的理论基础。而且可以证明,计 及像素间的相关性,使用高阶熵一定可以获得更高的压缩比。 平均码字长度 设a 为数字图像第k 个码字c 。的长度( 二进制代码的位数) 。其相应出 现的概率为该数字图像所赋于的码字平均长度r 为 r 2 展只( b i t ) ( 2 6 ) 编码效率 在一般情况下,编码效率往往用以下简单公式表示: ,7 = 等( ) ( 27 ) 式中h 为信源熵,r 为平均码字长度。 根据信息论中信源编码论,可以证明在r h 条件下,总可以设计出某种 无失真编码方法。当然如编码结果使r 远大于h 表明这种编码方法效率很低, 占用比特数太多,最好编码结果等于或接近于h 。这种状态的编码方法,称为 最佳编码。它既不丢失信息而引起图像失真,又占用最少的比特数。m p e g 一2 中用的霍夫曼编码即属于最佳编码方法,这就是在允许失真条件下的些失 真编码方法,若编码结果r ,与这掰个反度簿 级辩瘦瓣鹅字长黢努羽戈t 。移t 。如蘩不按定瑷筑翔赋予这两个磁字长度, 黔绽 t 。那么演雾下式; ( 致t p o 2 一( p , t 。+ ) 2 p ? t ,2 + 乳2 t 。2 + 2 p p tt p 。2 t 。2 一p 。2 t ? 一2 p 。p 。t 。h 一露t ? + 琢2 t 。2 一譬t ? 一r 2 t 。4 一( 野- - p ? ) 巳,t 。 t ,可皴上式夫予0 。游羹:始式燕拜哥激褥爨: o 出予上式左边第一顼是辫这嚣个灰发缓不按定理援剃编鼹获搿始鹅字妖 震绞诗平均毽,聪第二璎是按照定理娥粼绽褥获褥鲶秘字妖震黢诗乎戆僮, 两项之茬潞然就怒前面定义的卅r 了,可以直观熊证明变长编码定理。 2 。2 2 。2 爨夫爨( 1 f u f f m a n ) 编磁骞浚 霍夫爨编粥楚校据霹瓷长发豢佳编礴定臻,液用鬟夫受算法髓产生的一种 缡筠方法。在燕蠢穗黼埝入糕露褰舍瓣蘸挺下,它魏零穆薅字长度貔其它程 露穆礁霹译爨都夸,嚣熬瞧露穆蔟烫紧凑薅。下嚣戳一令蒸傣铡予来喜蹙 明嚣编码方法; l 一l 一 国圈圈圈囤圈圉圈 r 吣嘲刚哪嘲蝴删删嘣 娥敝敝散敝魏辨辑 西北工业大学硕士论文第二章m p e g 2 压缩算法及改琏 编码步骤: 将输入灰度级按出现的概率由大到小顺序排列( 对概率相同的灰度级 可以任意颠倒排列位置) 。 最小两个概率相加,形成一个新的概率集合,再按第步方法重排( 此 时概率集合中概率个数已减少一个) 。如此重复进行直到只有两个概率为止。 分配码字。码字分配从最后一步开始反向进行,对最后两个概率一个 赋于“0 ”码,一个赋于“l ”码。如例中概率0 6 0 赋于“0 ”码,0 4 0 赋于 “l ”码( 也可以将0 6 0 赋于“1 ”码,0 4 0 赋于0 码) 。如此反向进行直 到开始的排列。在此过程中,若概率不变仍用原码字,如第六步中概率0 4 到第五步中仍用“1 ”码。若概率分裂为两个,其码字前几位码元仍用原来的, 码字的最后一位码元一个赋于“0 ”码元,另一个赋于“l ”码元。如例中第 六步概率0 6 0 到第五步分裂为0 3 7 和0 2 3 ,则它们码字分别为“0 0 ”和“0 1 ”。 例中霍夫曼编码的编码效率计算: 根据式( 2 5 ) 求出前例信源熵为 三 h 。一p 】0 9 2p 。一( o 4 l o g z 0 4 + 0 1 8 l o g = 0 1 8 + 2 x 0 1 l o g :0 i + o 0 7 l 0 9 2 0 0 7 + 0 6 1 0 9 2 0 0 6 + 0 0 5 l 0 9 2 0 0 5 + 0 0 4 l 0 9 2 0 0 4 ) = 2 2 5 根据式( 2 :6 ) 求出平均码字长度为 r = 鼠只= o 4 0 n 1 + 0 1 8 n 3 + 0 1 0 x3 + 0 1 0 4 + 0 0 7 x 4 + o 0 6 x 4 + 0 0 5 x 5 + o 0 4 x5 = 2 6 l 根据式( 2 7 ) 求出编码效率玎为 行:旦:一2 2 5 :9 7 8 。 足2 6 1 2 2 3 预测编码 预测编码有线性预测和非线性预测两类,可以在一幅图像内进行,即所 谓的帧内预测,也可以在多幅图像之间进行,即所谓的帧间预测。线性预测 通常称为差值脉冲编码调制法( d i f f e r e n t i a lp u l s ec o d em o d u l a r i o n ) ,简 写为d p c m 。 2 2 3 1 d p c m 的基本原理 d c p m 的基本原理是基于图像中相邻像素之间具有较强的相关性。每个像 素可以根据以前已经知道的几个像素值来做预测。因此在预测编码中,编码 和传输的并不是像素取样值本身,而是这个取样值的预测值( 也称估计值) 与其实际值之间的差值。 设瓜为待编码像素,其前面n 1 个像素为 z | i = l ,2 ,n - l 。一般地, 在图像信号的线性预测编码中,如用前面n 一1 个像素来预测第x 。个像素,有 一x n = a 。肛a 2 肛+ a 辱, ( 2 8 ) 西北工业火学硕士论文 第二章m p e g 2 雕缩算法及改进 式中,x 。为正的预测值,在线性预测中,其预测系数a 。是常数。得到的预 测值与真正待发送的五相减,得到预测误差凸 e v = 乓一 ( 2 9 ) 显然,预测精度越高,预测误差e 。越小。重要的是,发送端编码传输的正 是这个差值( 实际上还需将民实旌量化编码等措施后才传输) 。毫无疑问,通 过预测,使传输的实际数据量大大减小。数字信号的优势之一是可以纠正信 道传输中产生的错码,如果接收端和发送端采用类似的预测形式,则接收端 - - _ _ 一 第n 个预测值亦为x 。,即 x s = a l 石r + a 2 尼。+ + a 尿。 式中,m 为接收端的第i 个预测值。 ( 2 1 0 ) 圈2 4 一个磐型的预测编解码系统的结构框图 据此。接收端恢复的应是预测值与经接收解码的量化值之和,即 x n 。= 以+ e 。( 2 1 1 ) 由式( 2 7 2 1 0 ) 可见,信号恢复时产生的误差仉: q v = x n x 。2 只v 卧。 此误差实质上为量化误差所致,其大小由量化分层数或量化比特数决定。 2 2 3 2 运动补偿编码 运动补偿实际上是对活动图像( 或一系列静止图像的连续排列) 进行压 缩时所采用的一种帧间编码技术。客观上相邻帧问有较大的时域相关性,因 此运动补偿的目的就是尽可能地将这种时域相关性去除,其核心技术是运动 估值( m e ) 。运动补偿的原理可简要的理解为:当视频编码器对图像序列中的 第n 帧f 。进行处理时,利用运动估值得到f 。的预测值f 。,如果预测系统性能 卓越,其f 与f 。两者差值极小,即差值基本上分布在0 附近。编码传输的是 n 帧的预测值与其实际值之间的差值,因而所需的比特数少得多。此即运动补 偿去除信源中时间冗余度的本质所在,也是一种较为先进的帧间编码技术。 运动估值算法归纳为两大类,一是像素递归算法p r a ,另一类是块匹配算 法b m a 。p r a 基于单个像素在整个图像范围内进行运动估值,由某个像素周围 的若干像素递归的预测该像素的位移;b m a 则是基于当前帧中一定大小的块, 溪她工监文学螟士论文笨二誊m p e g - 2 压缩爨法致教避 在当前帧的前帧或后帧的一定区域内搜索该像块的最健匹配块,作为它的预 测块。b m a 是基予平移运渤的辊瑗来送行估值的。在平移运动串,物体上豹每 个点均有相同的速度大小和方向,在物体运动轨迹上,当前时刻所处俄置是 囊麓一时裁经位援穰移孬缮爨懿,繇第n 菠孛憨疼容愚豳第n l 蔟孛稳应黎 分经不同方向的平移而形成的,于是可以将一幅图像分成许多n x m 大小的像 素块,在其稳邻帧中樱对应豹几薅位墨周围豹定范围内,道过某些题配准 则寻找这些n l 蒙素块的最佳聪配块。旦我捌,便将最佳既配块与滔前的 相对位移( x ,捌y ) ,即运动矢量m v 遴出,并传输到接收端。实际应用中, 炙将运动矢量( 刀x ,y ) 及最往匹配浚与当前之闻斡熬值块一起编碣传辕。 在接收端通过运动矢量在已经恢复的相邻帧中找到当前块的最佳匹配块,并 与接收型瓣差藿块攘燕,茨复茏瓷蔻块。 人眼的空间分辨率与物体运动速度成反比。因此对传送静止图像戏运动 及其缓慢的图像帧( 场) ,可以剃用接收端约帧( 场) 存储器提供兹一竣( 场) 的亮度和色度数据重复鼹示;对于图像中的运动部分,有较大的帧闻麓,而 人眼的空间分辨率低,皮保持相间的传送帧,但可降低取样率,如2 :1 隔像 素( 聿亍) 传送。辩于未耱送的像索,采薅内摇臻雳裾舔像素平麓筐代餐,来 传送的行用存储器中前后帧传送的行的数据内捅。为此在进行帧间帧内自适 盛瑗测黠,善先要设置一定魏判决蠡难,驭便决定编强嚣选撂建释工穆炊态, 以提高活潮图像予贞测编粥的精度。判决准则即计算帧间差值,帧间差慎通常 采取某一固定像豢位置( m ,n ) 上,当前蜮的图像亮度俊x 。( m n ) 与上帧的 亮度值x 。( n l ,n ) 之差,朝 d 。( m ,n ) = x 。( m ,n ) - - x ( i l l ,n )( 2 1 2 ) 裁上式瑟富,设瓮令蘩疆,懿g 。 若 d 。( m ,n ) l g ,表明当前帧的像素位于活动序列图像的静此或背 景送域,藏对不煲送这类像素,接收蒜瘸兹峻撼淼位置主豹像素填於。 若id 。( m ,n ) l s ,则认为当前帧的像素位于运动物体区,需要传送。 消除和降低时间冗余的帧间落动补偿压缩编码大致分为三个步骤: 在福邻顿中估计运动物体的位移值即使移矢豢,称为逶动倍毽( 预 测) 或位移估值等。 簿l 霉鬓缮鬻豹运动信壤送行蕻游预嚣编鸫,黪运动替德。运动静偿 是把参考帧中的像索( 或像素块) 位移后作为当前帧像素( 或块) 的预测。 将预测偿患如趱动矢量壤预测误差进舒( 量化) 编码。显然姥豺豹 预测误差丽样是一个较小的值,即得到较大的压缩。 在接收端,同样采用有预测补偿的预测方法,还原出原图像的像素( 或 块) 酶蓓怒。运动嵛偿斡鹜的是蠢除葙邻闰像之间的位移差异,使两幡图像 的内容尽可能接近,更好地利用活动图像的时间相关性。实现上述编粥过程 羲关键是邀凌售缓,运动钤嫠编避黪效攀取决予运费嵇蘧震量戆好环。运动 补偿编码算法的桉心问题是如何根据当前帧和以前帧的图像去估算遮动矢 量。为了怒到运动矢量,通常熬方法是把图臻划分为大小适当瓣矩形予块, 针对子块的运动部分,假定块做平移运动,估计出运动子块的逐动矢爨,进 西北工业大学坝上论义 第二章m p e g 2 压缩算法及改进 行预测编码块匹配法( b m a ) 。【1 9 】 为了进行运动估值,一个视频帧被分解为多个小的像素块,将每个像素 块与参考帧上的每列或每行像素块进行比较。找到匹配块后,再通过估值补 偿得到更精确的甚至相等的“匹配块”,用一个差值( 其实质就是运动矢量) 来代替传输( 编码) 的块信息,以达到压缩之目的。根据m p e g 标准,运动检 测是分块进行的,基准块和搜索窗是分块的,且扫描方式不同。而且基准块 不重叠,搜索窗互相重叠。如何输入基准块,搜索窗数据和处理这些数据, 使电路简单、规则,又能连续不间断地作实时运动检测,是设计实时运动检 测器的关键。 ( 3 ) 运动补偿预测编码举例 运动补偿法的起源就是在一帧图像中的一个部分搜索与邻近帧相同尺寸 的部分,即尽量达到“匹配”。因此所谓的块匹配,简单理解为把当前帧上的 某图像子块“贴”到上一帧的哪个位置合适。对于当前帧的每一个子块,在 上帧的某一搜索范围内寻求最佳匹配,并认为本子块就是从上一帧的最佳 匹配块平移过来的,计算出位移矢量作为当前帧的匹配块的补偿。块匹配算 法主要有全搜索、二维对数搜索、三步搜索、共轭方向搜索、正交搜索和交 叉搜索等。下面先介绍全搜索法。 将图像分为n n 像素的子块,以子块作为运动估值和补偿的基本单元。 设a 为当前帧中的一个待处理的子块,在其前一帧以a 为中心,上下左右各 距d 。个像素的区域b ( 又称搜索窗) 内寻找一个与a 最相似的子块c ,它与a 的坐标偏移量即为估计的运动矢量( v ) ,a 搜索c 的过程即为匹配过程,如图 2 5 所示。在块匹配中,块的位移与块的中心或块中任何一点的位移是等价的。 因此块的位移可以理解为中心点的位移。采用匹配技术时,选择合适的子块 非常重要,图像分割是运动补偿的基础,显然子块尺寸小,准确度高,运算 量为在( n + 2 d 。) ( n 4 - 2 d ) 的匹配区进行匹配计算;若子块尺寸大,自然是准 确度下降,复杂度也下降。通常子块n 取为8 或1 6 。 在运动补偿算法中,全搜索精度最高,但因运算量庞大而应用有限。三 步搜索法是近年来引人瞩目的一种运算补偿算法。三步法是一种由粗到精的 搜索过程,其三步搜索法如图2 6 所示。 n 卜叫 111 22 i 1 1,l12 _、3r ,、:2 3 3 3 11 图25 全搜索匹配过程示意图图2 6 三步搜索法图解 西北工业大学硕士论文 第二章m p e g 2 压缩算法及改进 在图2 6 中, 以搜索窗原点为中心,以l ,= e n t ( d + o 5 ) 为步长构造个9 点点 z 阵,d 为垂直和水平方向的最大位移,e n t 表示取整。 计算各点误差值,找出误差最小的点,并以此点为中心,以l := e n t ( 二l + 0 5 ) 为新的步长构造新的9 点点阵。 2 以l 。= e n t ( 导+ o 5 ) 为步长重复递步。直到搜索步长减至l 。此 z 时的9 点中误差值最小的点即为匹配点,对应的坐标即为运动矢量。 此外,在实际的块匹配算法的应用中,必须兼顾运算量和匹配精度,譬 如对于图2 ,6 所示的三步搜索法,应注意以下几点: 第一搜索区域为7 个像素,经过三次搜索( 步长依次为4 ,2 ,1 ) , 最后得到运动矢量( 5 ,3 ) 。实际上,在三步搜索法中。由于搜索范围是7 , 即在上一帧中以当前子块为原点,将当前子块在其上下左右距离为7 的范围 内按一定规则移动,每移动到一个位置,取出同样大小的子块与当前子块进 行匹配计算,则当d _ = 7 时,三步法最多仅需3 9 - - 2 = 2 5 次匹配。比全搜索 法少的多。 第二,任何( 块) 匹配法的搜索匹配过程,其实质就是搜索位移矢量, 此乃运动估值的核心。 第三,匹配算法遵循匹配准则,其中平均绝对误差m a d ( i ,j ) 为: 眦d ( i ,j ) 3 斋善善阶,珂) - s t ( 卅咖+ j ) l ( 21 3 ) 或绝对误差和 s a o ( i ,j ) = f s ( m ,n ) - s , ( m + f ,n h - j ) ( 2 1 4 ) n ,1 = i 当m a d ( i ,j ) 或s a d ( i ,j ) 最小时,即为匹配最佳的准则。其中s 。( 盯l ,1 3 ) , s ,( m + i ,n + j ) 分别为当前帧像素值和参考帧位移的像素值。 2 3 i p e g 编码的一个改进方法 当前流行的运动估计算法都是在空间域中进行的,而不是直接在d c t 域 中进行的,因此传统的混合编码结构的编码过程必须经过反量化和i d c t 变换。 改进的新编码结构中采用了变换域运动估计算法,这样可以省掉反量化和 i d c t 变换过程。而且传统的混合编码结构中对于预测帧( p v o p 和b v o p ) 进行编码的时候,反馈环中的d c t 变换是用来计算运动补偿后的预测误差的 d c t 系数。但是对于基于d c t 变换的运动补偿。运动补偿是直接在变换域中进 行的,因此可以不需要计算这些系数。从以上分析可以看出,新的编码方法 不仅降低了编码器的复杂程度,而且解决了实时编码的瓶颈问题。并且不需 西北工业大学顺士论丈 第二章m p e g 2 压缩算法及改进 耍大量的帧缓存空间,有利于硬件实现。 2 3 1 伪相位技术 u t k o c 和r a yl i u 【l i 】提出了一种利用傅立叶变换的相位信息在傅立 叶变换域中进行运动估计的方法d c t 伪相位技术。 设信号( x 。( n ) n = 0 ,n - 1 ) 为一维离散信号。对它右移m 位( m o ) 得 到信号( x :( n ) n = o ,o 6o n - 1 ) 。假设信号x t ( n ) 在定义域d 以外的值都为零, 因此有:恐伪= p 7 ( n - 嘲m ) e d d 将它的d c t 变换和d s t ( 离散正弦变换) 展开成以下式子: x f ( k ) :吾c x - i 州”c o s - ( n + 0 5 ) 1 如 o ,_ l j , 吲”= 三c 弘n - i n咿血 等”) 吲王“。) 车州咿“叶等“+ 0 j 删= 2 c 缱n - 1 0 州砂c 斟等,”z 2 c ( ) x - ( 一) 伽l 等叫 引炉知,w n - i 心洫降刁 女 l ,n i , k o ,n t , k l ,一,n l k 其中,c ( ) : 击,“= o 或1 ,z i 和彳分别表示信号x ( n ) 的d s t 变 1 l ,k 为其它值 换( d s t 1 ) 和d c t 变换( d c t 一1 ) ,x ;和x ;分别表示信号x z ( n ) 的d s t 变换 ( d s t - 2 ) 和d c t 变换( d c t 一2 ) 。定义 硝幽n 等c m + 冲涧s 瞥( m 刊为伪相位。 2 3 2 基于d c t 变换的运动估计算法 我们可以将文献 1 1 介绍的通过伪相位技术求一维信号的位移信息的方 法推广到二维空间,由此得到在d c t 域中求物体的二维平移运动的方法。图 2 7 是这种在d c t 变换域中进行运动估计的算法的流程图,图2 8 是算法实现 的结构图。 堕垄三些盔兰堡主堡茎! ! 三兰竺型翌兰至塑堡望! ! ! ! 堂 图2 7 d c t 变换域运动估计流程图 运动向量( m 。肺。) 图2 ,8 d c t 变换域运动估计实现结构图 2 3 2 1 二维d c t 变换和伪相位的计算 首先将前一帧图像x 。和当前帧x 。分别进行二维d c t 一2 ( 2 d d c t 一2 ) 和二 维d c t 一1 ( 2 d d c t - 1 ) 变换。二维d c t 一2 变换计算4 个系数,每个系数都是由 d c t 一2 d s t 2 变换核定义的一个二维可分离的函数,它们的定义如下所示: x f o ( k = 熹c c 罾n - i 舢灿侈c , c 啦 , 珊肛砉唧莹舶细sr n + 0 5 , s i r i 降帖) f c 划,= 砉,“。莹航咖i n 等似+ o t s , c 。s 肾。+ o s ) f c 州,= 砉c c 啪羔f 加朋s i n 降c m + o s , s i l l 曙c n + o s ) 同样,二维d c t - i 是由d c t 一1 d s t 一1 的变换核定义的四个函数。 i c i ( k , l z z i ( k ) = 鲁c ( k ) c q ) 1。孙刚) c o s ( 等m ) c o s ( 和 ) = 啬“刚) c o s ( 等m ) c o s ( 等n ) v 月,月= o o 烈咖砉职,蔗确( m c o s ( 等州n ( 和 z 驯) = 砉) c ( 嗟i 舢) s - n ( 等咖s ( 和 z 聃忙砉c c ( f ) 羔。“m ) s i n ( 等m ) s l n ( 和 与一维情况相似,假定运动只有平移运动,设m 。为沿x 轴正方向平移的值, m ,为沿y 轴正方向的平移值。在二维空间中,一个物体可能向四个方向运动, 东北( m u o ,m , 0 ) ,西北( m 。 0 ) ,东南( m u 0 ) 和在二维空i a q 中, 一个物体可能向四个方向运动,东北( m u o ,仉 o ) ,西北( m 。 0 ) ,东南 f m 0 ) 和西南f m o m o i 一( f c 十1 ) = 一( f 。( 5 + 1 ) ,矿d s c ( i ,歹:) 2 0 4 7 - 2 0 4 8 f ” v l u 】s2 0 4 7 f ” v 】【u - 2 0 4 8 4 、解调控制 解调控制将由下面等价的任何过程实现。首先,块中所有的这些重构的、 饱和化的系数f 【v 】 “】被求和。然后检测这个值为奇还是偶。如果和为偶,则 要对系数h 7 】 7 】进行调整修改。于是有: 77 s u m = z f 川“】 v i o t = o , v “卜:f v 】 “所有除u = v = 7 外的“,v f 【7 】【7 f , 7 】 7 】- l i f ,【7 】【7 】+ - s 姗为奇数 如果f 7 1 1 7 为奇s “m 为偶数 如果f 7 1 1 7 为偶s u m 为偶数 下面是饱和化与解调控制的程序,及在进行量化处理时的默认量化矩阵。 西北工业大学颅上论文第四章m p e g 一2 解码在d v d 应用中的软件实现 4 2 2 4 反d c t 一旦d c t 系数f v u 被重构,通过反d c t 算法很容易得到反变化值 fl y i x 。这些值将被饱和为一2 5 6 = f y 儿x = 2 5 5 ( 对于所有x ,y ) 。 在一个未跳过的宏块中,如果对于宏块中一个给定块,p a t t e r nc o d e i 为l ,则那个块的系数数据包含在比特流中。这将使用前面所叙述的方法解码。 如果p a t t e r n c o d e i 为零,或者如果宏块被跳过,那么那个块不包含系 数数据。这样的块的样本域系数f l y x 都取零值。 4 2 2 5 运动补偿 运动补偿过程即由以前的解码图像形成预测,与系数数据( 从i d c t 输出 的) 组合起来恢复最终的解码样本。下图给出了这过程的简化图鳃。 来自 解码像素 图4 3简化的运动补偿过程 通常,对于每个块最多形成4 个独立的预测,组合起来构成最后的预测 块p y x 对于内部编码宏块不形成预测,所以p y x 为0 。内部编码的宏块可以 带有被称为“隐藏运动向量”的运动向量,除此之外均不产生预测。 从上图可以看到,运动补偿是m p e g 一2 标准的特点所在,同时也是在解码 软件中最难完成的部分,因为运动补偿模块涉及到预测方式、预测场帧的选 择、运动向量的算法、分级解码和预测的最终形成问题。下面只是简单解释 西北工业人学硕士论文 第四章m p e g2 解码在d v d 应用中的软件宴= 吼 各部分的意义,在软件中其实是一些变量或信号位的拾取问题。 l 、 预测方式 预测方式主要有场预测和帧预测。场预测和帧预测其实就是使用一个或 几个以前的本身可以解码的场( 场预测) 或帧( 帧预测) 中的数据独立的产 生预测场或帧。 在一个场图内的所有预测都是场预测而在帧图内可能用到场预测也可以 用帧预测( 在宏块的基础上选择) 。 另外还有仅用于场图的1 6 8 运动补偿方式,和用于参考场( 帧) 与被 预测场( 帧) 问没有b 图的p 图的预测方式。 2 、场和帧的选择 场预测 在p 图中,预测由最近的两个解码帧作出( 可能有插入的未解码的b 图) , 用于编码帧的第一幅图的预测或帧图的场预测。这种情况下,两个参考场是 同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论