(模式识别与智能系统专业论文)复杂背景下的运动目标分割算法研究.pdf_第1页
(模式识别与智能系统专业论文)复杂背景下的运动目标分割算法研究.pdf_第2页
(模式识别与智能系统专业论文)复杂背景下的运动目标分割算法研究.pdf_第3页
(模式识别与智能系统专业论文)复杂背景下的运动目标分割算法研究.pdf_第4页
(模式识别与智能系统专业论文)复杂背景下的运动目标分割算法研究.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨工程大学硕士学位论文 摘要 在图像处理领域,视频图像序列中运动目标的分割与跟踪是一个被广泛 研究的热点。在众多的分割和跟踪方法中,本文将研究对象定位在具有一定 复杂背景下的运动物体,采用马尔可夫随机场模型( m r f ) 作为本文分割的主 要算法,但是基于m r f 的图像分割算法存在算法时间复杂度高,处理速度慢 以及参数估计不准确等缺点,这些缺点一直是该方法应用于工程实践的最大 障碍。 此外,传统的m r f 图像分割方法大多适用于背景简单的场合,而对于复 杂的背景,像背景光线的突然变化,背景中物体变化( 包含随风摆动的树枝, 喷泉等) ,无法获得令人满意的效果,因此本文针对这些缺点进行了改进。 大多数视频图像处理的问题可以归结为一个标记获取的问题,也就是说, 一个视频处理图像问题的解决方案就是给图像中所有的像素点分配一系列的 标记。采用马尔可夫随机场,运动目标分割可以归结为事先观察场和其它一 系列约束条件下对图像初始标记场进行优化,从而得到优化标记场的问题。 而初始标记场的选取对马尔可夫随机场分割算法有着重要的影响。如果 初始标记场选取和实际偏差较大,不能获得理想的分割结果,而且,在全局 优化时,也不利于算法的收敛。 为了得到较为准确的初始标记场,本文对g i b b s 能量函数做了改进。将 彩色图像的r 、g 、b 三个分量分别标记获得原始初始标记场,再利用改进后 的能量函数对r 、g 、b 获得的原始标记场重新标记,获得最终的初始标记场, 即对原始标记场的一次优化处理。 为了提高基于m r f 的图像分割速度,本文从去除冗余的计算量出发,先用 对称差分算法检测到包含运动目标的小区域,再在该区域内运用马尔可夫随 机场分割算法确定运动物体的精确边界这样可以把参加计算的像素点的数 量减少到原来的一半以下,提高了该算法的运算速度,同时也可以排除运动 区域外的噪声干扰。 实验证明,改进后的算法在复杂背景下能够获得较好的分割结果,并且 实时性较好。 哈尔滨工程大学硕士学位论文 关键词:马尔可夫随机场;对称差分;图像分割;复杂背景;运动目标 a b s t r a c t i nt h ef i e l do fi m a g ep r o c e s s i n g ,t h es e g m e n t a t i o na n dt r a c k i n go fm o v i n g o b j e c ti nv i d e os e q u e n c e si sah o tr e s e a r c h t o p i ci nr e c e n ty e a r s ,v a r i o u so f s e g m e n t a t i o nm e t h o d sc a nb eu s e da c c o r d i n gt od i f f e r e n ts i t u a t i o n so fm o v i n g o b j e c t sa n di t sb a c k g r o u n d i nt h i sp a p e r , t h ea u t h o ru s em a r k o vr a n d o mf i e l dm o d e la sm a i n a l g o r i t h m o fs e g m e n t a t i o na n d t r a c k i n g o f m o v i n go b j e c ti n a s t a t i o n a r yc o m p l e x b a c k g r o u n d ,b u ti th a si t sw e a k n e s s e si nh i g ht i m ec o m p l e x i t y ,s l o wp r o c e s s i n g s p e e da n di n a c c u r a t ee s t i m a t i o nf o rp a r a m e t e r s ,t h e s ew e a k n e s s e sh a v ea l w a y s b e e nt h eb i g g e s to b s t a c l e sw h i c hh i n d e rt h em e t h o df o r ma p p l y i n gi np r o j e c t p r a c t i c e i na d d i t i o n ,t r a d i t i o n a lm r fw o r kw e l li ns i m p l i f i e db a c k g r o u n d b u ti t c a l l ta c h i e v et h ei d e a le f f e c ti nc o m p l e xb a c k g r o u n d ,s u c ha ss u d d e nc h a n g eo f b a c k g r o u n dr a y ,c h a n g eo fb a c k g r o u n do b j e c t s ( c o n t a i n i n gt r e e sb l o w i n gi nt h e w i n da n df o u n t a i n s ) t h e r e f o r e ,i nt h i sp a p e ri m p r o v e m e n tw a sm a d ef o c u s e do n t h o s ew e a k n e s s e s m o s tv i d e oi m a g ep r o c e s s i n g q u e s t i o n sc o m ed o w nt ot h eq u e s t i o n so f o b t a i n i n gl a b e l s i na n o t h e rw o r d ,t h es o l u t i o no fv i d e oi m a g ep r o c e s s i n gq u e s t i o n i st od i s t r i b u t el a b e l st oe v e r yp i x e li ni m a g e m o v i n go b j e c t ss e g m e n t a t i o nc o m e d o w nt o o p t i m i z a t i o no fi n i t i a ll a b e l s i nt h eo b s e r v a t i o n sa n das e r i e so f c o n s t r a i n e dc o n d i t i o n s i ti si n t e n d e dt oa c h i e v eo p t i m i z e di n i t i a ll a b e l s t h e r e f o r e ,t h er e s u l t so fi n i t i a ll a b e l sh a v ei m p o r t a n ti n f l u e n c eo nm r f s e g m e n t a t i o na l g o r i t h m i fi tw a sd i f f e r e n t o b v i o u s l yb e t w e e ni n i t i a l l a b e l s a c h i e v e da n da c t u a lr e s u l t s ,t h ep e r f e c tr e s u l tc a n to b t a i n e d ,a n di t g o e sa g a i n s t a l g o r i t h mc o n v e r g e si ng l o b a lo p t i m u m i no r d e rt og e tb e t t e ra c c u r a t ei n i t i a ll a b e l s t h ep a p e rm a k ei m p r o v e m e n to n g i b b se n e r g yf u n c t i o n i to b t a i n e dt h e o r i g i n a li n i t i a ll a b e l sb yr ,g ,bc o l o r v e c t o r s ,t h e nr e a s s i g n e dl a b e l sf o rt h eo r i g i n a li n i t i a ll a b e l sb yi m p r o v e de n e r g y f u n c t i o na n do b t a i n e dt h ef i n a li n i t i a ll a b e l s n a m e l y ,i tw a so n et i m eo p t i m i z a t i o n 哈尔滨工程大学硕十学位论文 t r e a t m e n tf o rt h eo r i g i n a li n i t i a ll a b e l s i no r d e rt oi m p r o v et h ee f f i c i e n c yo fi m a g es e g m e n t a t i o nb a s e do nm r f ,t h e p a p e rs t a r t i n gf r o mr e m o v i n gt h er e d u n d a n tc o m p u t a t i o n a lc o m p l e x i t y f i r s t l y ,t h e s y m m e t r i cd i f f e r e n c ea l g o r i t h mw a su s e df o rd e t e r m i n i n ga s m a l lr e g i o ni n c l u d i n g m o v i n go b j e c t ,a n dt h e n ,m r fs e g m e n t a t i o na l g o r i t h mw a su s e df o rd e t e r m i n i n g t h ee x a c tb o u n d a r yo fm o v i n go b j e c t si nt h es m a l lr e g i o n i nt h i sw a y ,i tc a n d e c r e a s e dt h en u m b e ro fp i x e l st a k e dp a r ti nc o m p u t i n gt ou n d e rt h eh a l fo ft h e f o r m e r ,i tn o to n l yi n c r e a s e dc o m p u t i n gs p e e d ,b u ta l s or e m o v e dn o i s ei n t e r f e r e n c e b e y o n dt h es m a l lr e g i o n n ee x p e r i m e n ts h o w e dt h a tt h i s i m p r o v e da l g o r i t h mc a ng e t i d e a l s e g m e n t a t i o nr e s u l ta n dg o o dr e a l t i m ep e r f o r m a n c e k e yw o r d s :m r f ;s y m m e t r i cd i f f e r e n c e a l g o r i t h m ;i m a g es g e m e n t a t i o n ; c o m p l e xb a c k g r o u n d ;m o v i n go b j e c t 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导下,由 作者本人独立完成的。有关观点、方法、数据和文献的引用已在 文中指出,并与参考文献相对应。除文中已注明引用的内容外, 本论文不包含任何其他个人或集体已经公歼发表的作,胃一成果。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 作者( 签字) :冈蛹 日期: 训 年岁j f j 。 j 哈尔滨工程大学 学位论文授权使用声明 本人完全了解学校保护知识产权的有关规定,即研究生在校 攻读学位期间论文工作的知识产权属于哈尔滨上程大学。哈尔滨 工程大学有权保留并向国家有关部门或机构送交论文的复印件。 本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据 库进行检索,可采用影印、缩印或 :j i 捕等复制手段保存和汇编本 学位论文,可以公布论文的全部内容。同时本人保证毕业后结合 学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈 尔滨工程大学。涉密学位论文待解密后适用本声明。 本论文蛔在授予学位后即可口在授予学位1 2 个月后口 解密后) 由哈尔滨工程大学送交有关部门进行保存、汇编等。 作者( 签字) :闲锄幻 日期: 例7 年;月日 剔签字) 聊叼 矸年;月日 哈尔滨f + 利人学硕十学伊论文 第1 章绪论 1 1 课题研究的背景及意义 人类接受的外界信息有8 0 以上是来自于视觉,视觉是人类最霞要的信 息交流方式。人类是通过眼睛与大脑来获取、处理与理解视觉信息的。周围 环境中的物体在可见光的照射下,在人眼的视网膜上形成图像,由感光细胞 转换成神经脉冲信号,经神经纤维传入大脑皮层进行处理与理解。视觉不仅 指对光信号的感受,还包括了对视觉信息的获取、传输、处理、存储与理解 的全过程。信号处理理论与计算机出现后,人们试图用摄像机获墩环境图像 并将其转换成数字信号,用汁算机实现对视觉信息处理的令过程。 运动对象的分割和跟踪技术一直是图像处理和计算机视觉领域的重要研 究课题。近年来,随着多媒体技术的迅猛发展及计算机性能的不断提高,各 种视频图像的应用越来越广泛。视频图像序列中运动对象的分割技术也1 益 受到人们的青睐,得到了广泛的应用。例如,在人:1 :智能系统中,要对运动 对象进行判断与跟踪:在圉防安全系统中,需要对军事目标进行芷艮踪与识别; 以及在生物医学领域的应用等等。为了实现基于内容的存储、传输和检索等 操作,如何快速有效的分割出运动对象有着非常重要的作用和意义。 在目前使用的数字视频监控系统中引入视频运动目标分割技术,可实现 对图像序列中运动目标的自动分割,从而人人提升峪控系统的性能,使得监 控系统能够自动监视重要区域,并能住有少数人或擎辆活动时j ,:刻自动报警, 保障被监控区域的安全。并且,在实现了视频运动目标分割的基础上,加入 运动目标识别或跟踪算法,能解决运动目标自动识别和f 艮踪等问题,可以进 一步增进监控系统的智能化,最终实现无人值守的智能场景监控系统。同时, 在交通检测中应用视频运动 j 标分割技术,使得f 动测蹙车速、统计流量、 自动记录肇事车辆等功能的实现成为了可能。 综上所述,对基于图像序列分析的视频运动分割算法进行研究,具有很 重要的应用前景和研究价值。 哈尔滨1 。人。誓顺一t - :。伊论文 1 m f l ;i i i i ;i i i i i i i i i i i i i ;i i i i i i ;i i i i i i ;i ;i i i i ;i i i ;i i i i i 1 2 国内外研究现状 近年来,国内外对于运动目标分割技术的研究取得了许多成果,人们提 出了许多新的分割技术及方法。通过参阅近年来各研究人员提出的运动目标 的分割方法,并进行归类可以看出,对运动目标的分割方法大致可分为:检测 变化区域的分割方法、基于非参数模型的运动分割方法、基于参数模型的运 动分割方法、基于分类的分割方法、基丁形态学的方法以及其他一些分割方 法等【1 i 。 l 、检测变化区域的分割方法 经过全局运动估计和补偿后,相邻视频帧的背景是静i :的,经过帧问的 差分图像可以枪测到运动区域1 2 刮。背景亮度的变化存室内主要是水源于噪声 和灯光的亮度的变化,在室外主要是由于纹理的叟化。山于噪声是随机的, 因此假设噪声为高斯分布,而运动对象的筹分为非高斯分靠,通过高阶统计 量如四阶可以预分割出运动对象区域和背景区域;然后通过块匹配估计差分 图像的运动场进一步区分出运动对象区域和背景区域| 2j 。文献 3 提出相邻的 两个差分图像的方差之比服从f 统计分仃,而且不需要知道实际的方差。文 献【4 1 认为帧间差分符合两个零均值的拽普拉斯分佃的混合,并应用最大似然 法估计分布参数,然后分割出背景和运动对象。 文献 5 中首先利用棚邻帧筹并采用全局阈值获得变化检测模板,然后采 用局部阈值的迭代松弛技术来完成边沿的光滑滤波。为了分割不连续运动的 对象,使用了一个深度为l 的可调节存储器,如果存储器中的某个像素在日仃 几帧中的变化检测模板至少有一次属于运动对象,则该像素属于运动对象。 通过消除未覆盖的背景区域并使模板边沿刈齐图像边沿来改进对缘模板的定 位。文献f 6 1 使用变化检测、颜色分割、局部运动估算和局部运动补偿等多个 信息来判决运动区域,该方法可以有效地分离同定的和运动的区域。 由于直接通过两帧差检测变化区域的方法对噪声比较敏感,因此,文献 【4 ,7 1 采用形态运动关联算子来间接利用帧差检测运动区域,同时根据序列 图像的运动程度,采用多帧处理来获取运动对象,该算法具有一定的抗噪能 力。文献 8 采用多帧信息构建兰维张旨的办法榆测变化i 叉域,彳i 仅能叮靠地 估计运动信息,还对噪声有一定的鲁棒性。 2 哈尔滨t 烈人号:硕十子:伊论文 总的来 兑,这类方法计算简- 尊,但是对于噪声仍比较敏感,且刈象_ 运动 不能太快。由于室外场景背景变化复杂,冈此该方法比较适用于审内场景运 动视频对象的分割。例如,对于可视电话、电视会议等视频,摹于变化区域 的检测方法比基于运动的分割方法效果好。 2 、基于非参数模型的运动分割方法 二维运动( 也称为投影运动) 指的是三维运动在图像平面上的透视或币交 投影。对物体的运动是通过估计光流场柬得剑的,光流场足罔像亮度随时问 变化的函数。通常假设相邻帧问外界照明条件不变,因此光流场反映了运动 场。但是由于孔径和遮挡问题,用光流法估计二维运动场的解足不稳定的, 需要使用附加的假设模型来模拟二维运动场1 9 j 。 典型的用于运动分割的方法是基丁| 块运动估计的分割方法。块运动模型 主要应用在低码率视频编码应用中,基于平移的块运动模趔的运动估计不能 处理旋转和缩放的情况,块运动模型的分割精度山块的大小决定。由于运动 估计运算量大,基于运动的对象分割和跟踪要求有准确的运动估计,冈此常 采用一种金字塔式的由料到细的快速估计方法| 8 1 1 。 另一种典型的用于运动分割的方法是皋于贝叶斯法l l 叭1 3 - 1 6 1 。贝叶斯法是 在给定光流数据的条件下,搜索分割标记的最大后验概率,使得当日订分割与 期望分割符合的程度最大。贝叶斯法利用随机平滑度约束条件,采用g i b b s 分前i 估计位移场。其中文献 1 3 】采用形态学分水岭算法进行仞始分割,然后 根据运动信息用己知的标汜数进行标记,并根据初始分割将标记场模型化为 m r f 随机场( m a r k o vr a n d o mf i e l d ) 。由于贝叶斯的估计需要一个损耗函数的 全局优化,因此经常采用一些优化算法,例如模拟退火法、迭代条件模型法、 平均场致退火法和最高置信度优先法。由于贝叶斯法同时进行分割和运动估 计,分割效果较好,f 日运算最大。为了提高处理速度,文献【1 6 通过引入对 象的形状信息,采用“混合直方图”模型,把颜色和纹理弓形状模型化为独 立的联合高斯分布,使得采用贝, - t 。斯法能较好地分割出对象。 使用空间变换的网格( m e s h ) 模型成为目自仃一个积极的研究领域,网格模 型分为三类:规则网格、自适应网格和荩于内容的网格。文献 1 5 】采用规则网 格得到对象的褂边界。文献【1 7 改进了夕边形匹配的运动估计算法,降低了 算法的复杂度。通常假设运动场是连续的,但足市实并非如此,因此为了提 哈尔滨f :样人学7 ,页l “字:伊论艾 高运动估计准确度,义献ll8 l 提出了基于网格的自遁心内捅技术水实现运动 补偿;而为了提高运动估计的速度,文献【1 9 】提出一种自仃向插值方法代替迭代 的网格运动估计,采用块运动矢量和最优内插核来得到网格运动矢晕。文献 2 0 1 采用s u s a n ( s m a l l e s tu n i v a l u es e g m e n ta s s i m i l a t i n gn u c l e u sm e t h o d ) 方法 生成2 d 自适应的三角形网格模型,根据多帧运动分析把网格节点分为运动 节点和静止节点,通过把估计的运动矢量分为可靠运动矢量和不可靠运动矢 量,保留具有可靠运动矢量并满足时| 、日j 一卜和空间上的约束条件的节点作为运 动对象粗网格。提取边沿对比度,按照最大对比度约束条件查找准确的对象 边界,并采取一些控制策略。该网格模型可以很好地应用在旋转和缩放的情 况下,并能检测和跟踪多个运动对象,并叮以处理对象问遮挡或新对象的出 现。但是,该方法的分割结果易受网格生成算法中关键点数选择的影响。 在检测出变化区域的基础上,文献 2 1 1 4 吏用s n a k e 算法以及松弛法以得到 精确的对象边沿。文献 2 2 通过改变s n a k e 能量项使其具有仿射不变性的特 点,并结合对象的参数原型可以很好的解决多个对象分割时的对应问题。文 献4 ,8 ,2 3 1 采用一种改进的自适应轮廓算法,即“l e v e ls e t ”的分割方法, 可以自适应地分裂或合并区域,从而分割出多个对象。其中文献 4 】采用两条 曲线沿着各自收敛的反方向演化,两曲线的交界就是分割出的边界;文献 8 , 2 3 1 附加运动信,i , 至i i i 最项进行分割。这类方法根掘图像的梯度信息和时空光 滑约束条件使曲线按能量最小原则收敛,且可能收敛到局部最小。 3 、基于参数模型的运动分割方法 采用基于参数模型的运动分割法的基本思想是:假设有k 个相互独立的 运动物体,每一个光流矢量对应于单个不透明体的二维刚体运动的投影,那 么,每一个不同的运动可以通过系列映射参数来i r 确描述。参数模型需要 对视频图像进行分割,每个区域的运动用一一个参数集末描述。运动矢量可以 从这些模型参数来合成。 一个由平面的三维刚体运动产生的二维运动场,在i f 交投影下叮用6 个 参数的仿射模型描述【2 4 粕j ,而在透射投影下,则得到8 个参数的透视模型【2 7 2 8 1 。文献 2 6 】采用对象的3 d 模型和深度信息分割对象。文献 2 9 】采用二次空 间变换,不仅可以补偿诸如平移、尺度变化、旋转等变化,还能补偿形变和 非均匀伸展等非线性变化。文献 3 0 】采用基于运动的分级分割方法,首先采 4 哈尔滨i :柑人。页十号:伊论文 用自底向上的方法估计局部的运动场并进行区域的例步合并,然后用全局运 动分析指导各区域的进一步合并。 相对于非参数模型,参数模型受噪声的影n 向较小,因为参数足由多个像 素结合在一起估算出来的。参数模型可以有效地处s 甲- x , t 象i h j 的遮挡问题,缺 点是只适用于刚体运动。 4 、基于分类的分割方法 基于多个特征聚类的分割算法是普遍应用的一种分割方法p 卜”j 。般首先 从图像中抽取出一些特征,如华标、线条、拐,_ 、轮廓、纹理、形状、颜色、 运动、直方图、空问连通性、时f n 卜一致性等,对象通常被认为足根抓特定的 条件具有一致性的一组区域,且根据多个特征能够区分这些不刷的区域。文 献【3 1 1 采用的聚类算法在进行运动估计之后,集合了分级和分割聚类两者的 优势,并结合模糊理论和多个高斯分布的混合模型,同时考虑了各个待分割 区域的空间大小。文献 3 2 1 以多个特征矢量作为输入,通过采用空f h j 约束的 模糊c 均值聚类算法能够分割出各个区域。对于不连续运动的对象,进步 采用时间上的一致性作为聚类输入,根据每类特征重要程度不同而采用不同 的加权系数。文献 3 3 1 推广了k 均值算法,不仪考虑颜色、亮度、运动等, 还考虑了区域在时空上的一致性。文献 3 4 1 采用迭代的分类技术同时估计分 割和类参数,使分割算法鲁棒性更好。文献 3 5 1 也足对不同特征采用不同的 加权,并采用白组织神经网络进行特征聚类,然后合并神经j 删络的输出得到 希望的分割结果。 分类算法可以简单地同时分割出具有类似性质的多个对象,但是,由于 对象或对象间的遮挡会影响某些特征的出现或隐藏,这使得分割算法变得更 复杂;而且由于算法的迭代性质,使得计算晕较大,不利于实时处理。另外, 由于某些特征的提取受到噪声影响较大,因此该类方法也对噪声比较敏感, 但是没有光流方法那样敏感。这种方法仅适用于比较简嗨的图像背景。 5 、基于形态学的分割方法 采用形态学分水岭算法分割对象的算法被广泛使用【3 6 4 0 j 其中分水岭算法 由图像简化、标记提取、决策和后处理四步构成。图像简化就是去除螳小 的细节和噪声而保留一些较强的图像轮廓,使得分割容易进行。标记提取就 是从简化后的图像巾提取出些相连像素作为种了点,作为决策分割的初始 哈,j ; 宾i f ¥人7 17 ,员。卜+ 予! f 矗论艾 区域。决策就是根据图像的灰度彩色梯度信息进jj :区域生长的过程,最终分 割出对象的边界。文献 3 6 】提出了一种时空形态学分割方法,通过移去对人 眼不敏感的细节并保留对人眼敏感的细节,使得图像得到简化,然后采用基 于区域合并和分割的算法得到各个区域,而儿f i 产牛人:i = 边沿。由于会分割 出多个区域,因此可采用空问运动连通性束消除小的运动区域。文献 3 9 1 提 出采用多尺寸形态学梯度算法对图像进行初始分割,然后根据运动一致性进 行区域合并。由于采用彩色信息进行区域合并时,容易消除弱的边沿,而对 象的提取需要边沿信息,因此文献【4 0 1 提出基于边沿+ 噪声模型的统计方法, 认为对于弱边沿,标记的最优位置对称位于边沿两边,且尽可能靠近边沿。 该方法同时采用了边沿信息和彩色信息,以提高边沿的准确定f 妒。 该方法运算简单,能较好地提取运动对象的轮廓,但由于要依靠梯度信 息,因此对噪声比较敏感。 6 、其他一些分割方法 文献【2 4 1 采用局部方差对比度和帧问差分刈。比度构成:二维熵分析j 图,用 以分割运动对象。文献 4 1 】采用g a b o r 和m a l l a t 小波变换进行运动分割,其 中g a b o r 小波变换可在低的空间分辨率下准确估计运动信息,m a l l a t 小波变 换用于进行高分辨率下的对象分割。基于彩色快速递归最短扫描树( r e c u r s i v e s h o r t e s ts p a n n i n gt r e e ) 算法【4 2 j 是一种由细到粗的分割方法,分割速度快,但 是需要预先指定最终分割的区域数,而且对噪声也比较敏感。文献 4 3 】通过 交互方式预先在整个视频中选择一些代表对象不同特征的关键帧,对关键帧 进行对象分割后作为分割其他帧时的参考,这种方式通过利用对象的多视点 信息可以达到鲁棒分割跟踪对象的目的。对于某螳应用,可以采用多个单日 视频1 3 2 】或立体视频【2 l t3 3 1 束准确估计各个埘象的运动信息、深度信息,通过融 合同一场景的多视点信息柬有效地分割运动对琢。 尽管视频运动对象分割方法很多,但总的来说有两种方式:即自动方式和 半自动方式。自动分割难度大,分割效果随图像和视步贞的内容复杂程度变化 很大。主要特点是面向特定应用,预先调整好参数,可完成实时处理任务, 如车辆检测系统、大厅监测系统、叮视电话和电视会议等;半自动分割方式则 适用于复杂场景下对象的分割,虽然分割质量较好,但不具有实时性。其主 要特点是依赖于人工的交互确定语义级对象并干预分割和跟踪结果,可用于 6 哈尔滨l 平! f ! 人予:硕十学1 秒论丈 任意对象的分割。 以上简要归纳了人们近年来提出的视频图像中运动目标的分割与跟踪技 术。对于内容较简单的一些视频,如视频会议、可视电话、新闻广播等的自 动分割技术己比较成熟,但是有关参数鲁棒性不好,仍需进一步研究参数的 自动调整方法。对于较复杂的视频运动对象的自动分割技术仍处于初步研究 阶段,主要是由于语义级对象的确定、复杂背景的影响、多个不同类型运动 对象的存在、多个对象i b j 的遮挡、对象的突然变化、非刚体对象的任意形变, 以及算法的实用化等难题需要解决。 1 3 本文主要研究内容 近几年来,国内外对于利用g i b b s 分布定义的马尔可夫随机场模型 ( m r f :m a r k o vr a n d o mf i e l d ) 已经广泛应用于图像分割中。例如,p a p p a s 4 4 j 利用马尔可夫随机场模型对静止图像进行分割,l i u l 45 j 利用马尔可夫随机场模 型和模糊聚类的方法对彩色图像进行分割,a n d r e y l 46 j 也利用该方法对纹理图 像进行分割,文献 4 7 则利用马尔可夫随机场模型实现对视频图像分割。 该算法充分利用了帧差图像中像素i b j 的马尔町夫性,并建立了马尔町夫 随机场模型以实现图像分割。采用此算法,对视频图像进彳分割,可以获得 连续的边界;并且,由于马尔可大随机场的作用对象是币个的像素,故而可以 获得较高的分割精度,达到像素级别的分割:同时,该算法摒弃了运动恢复结 构算法以及基于运动信息的参数模型对运动目标足刚体的限制,可以提取在 运动过程中发生形变的运动目标;也不似基于光流估计算法那般需要人工的 参与,可以实现视频运动目标的自动提取。因此,我们采用基于m r f 的运 动目标分割算法作为最后的分割算法。 初始标记场的选取是m r f 模型中的关键技术之一。如果初始标记场选 取和实际偏差较大,就不能获得理想的分割结果,而且,在全局优化时,也 不利于算法的收敛。 为了得到较为准确的初始标记场,本文对传统求取初始标记场的方法进 行了改进,将彩色图像的r 、g 、b 三个分量分别标记获得原始初始标记场, 再根据r 、g 、b 获得的原始标记结果获得最终的初始标记场,即对原始标记 哈尔滨i j l 阵人7 7 :硕十学伊论文 场的一次优化处理。 另外,虽然基于马尔可大随机场的运动目标分割算法分割结果精确,但 由于马尔可夫随机场的作用刈象是单个的像素,并日要刈标记场进行优化, 经常采用一些优化算法,例如模拟退火法、迭代条件模型法、平均场致退火 法和最高置信度优先法,因此该算法复杂程度高,计算量大,实时性较差。 本文针对这一缺点进行了改进:先用差分法检测出包含运动目标的小区域, 之后在该小区域内利用马尔可夫随机场算法确定运动物体的精确边界,大大 减少了需要标记优化的象素点的数量,在很大程度上减小了算法的计算量, 也可以去除运动区域外的干扰噪声。 1 4 本文的结构安排 本文总共分为六章对所研究的内容进行了详细l 剞述,本文的结构为: 第l 章绪论。介绍了课题背景和研究意义:对幽内外研究现状及应用方 法做了详细说明;阐述了本文的辛要研究内容。 第2 章彩色图像初始标记场的获耿方法。本章首先介绍了几种常用的颜 色模型,其次详细阐述了灰度图象及彩色图像初始标记场的获耿原理,最后 对几种常用的阈值设定方法作了比较况明,把增强大津法作为本文的阈值设 定方法。 第3 章基于马尔可夫随机场的分割算法研究。本章详细介绍了m r f 理 论以及基于m r f 的图像分割实施方法,叙述了基于m r f 模型的图像分割数 学模型的建立以及求解方法。 第4 章基于改进的马尔可夫随机场分割算法研究。本章对传统的马尔可 夫随机场算法的不足进行了改进:为了改善马尔町夫随机场在复杂背景下的 分割结果,本章重新定义了系统的能最函数,利用改进后的能最函数能够得 到一个更合理得初始标记场;为了提高基于m r f 的图像分割速度,本文从去除 冗余的计算量出发,先检测到包含运动日标的小区域,把参d h i , i 一算的像素点 的数量减少为原来的一半以下,提高了该算法的运算速度,同时也可以排除 运动区域外的噪卢干扰。 哈尔滨i _ f l | 人学硕十伊论文 第2 章彩色图像初始标记场的获取方法 基于马尔可夫随机场的运动目标分割算法也是一个求取标记的问题。马 尔可夫随机场模型中,标记场的取值有两种情况,= 6 = o ,o = 1 1 :分别表示 像素的运动属性与静止属性。本文将主要介绍彩色图像初始标记场的获取方 法。 2 1 颜色模型 颜色是图像的一种重要视觉性质。颜色特征定义比较明确,抽取也相对 容易。在图像的自动分析中,颜色是一种能简化目标提取和分类的霞要描述 符,所以选择合适的对颜色的表达方j 足很重要的。另一方面也需要注意, 对颜色的特征表达依赖于所用的颜色模型,并不足所有的颜色空f u j 都与人的 感觉是一致的。从物理学的观点,颜色的感知源于刺激视网膜的电磁辐射的 谱能量。这些谱能量分布可记为e ( 五) ,其中人分布在波长为可见的 3 5 0 7 8 0 n m 之间。e ( 五) 与光源的分锥s ( a ) 和被光所照射物体的反射特性 r ( 2 ) 是密切联系着的,这个关系可以表示 e ( a ) = s ( 2 ) r ( 2 )( 2 1 ) 但人类对颜色的感觉与许多物理现象、神经心理学效果和生理行为都有 关,且关系是比较复杂的。 常用的颜色模型可以分成两类。一类面向诸如彩色显示器或打印机之类 的硬设备( 但可以弓具体设备相关,也可孑具体设备无关) 。另一类嘶向视觉 感知或者说以颜色处理分析为目的应用,女i l 动岫中的彩色图形,各种削像处 理的算法等。在第二类中有些是感知上非均匀的模型,有些则是在非均匀模 型的基础上进行变 换以使其相对均匀。要分割一幅彩色图像,颜色空问的选取是非常重要 的,因为它对分割结果起着决定性作用。目前表达颜色的彩色模型有许多种, 它们是根据不同的应用目的而提出的。在众多的颜色空川中选择哪种颜色空 间能得到好的分割效果一直是研究的热点。下面简单介绍几种常用的颜色模 型。 9 哈尔滨i :样人学硕+ 伊论文 2 1 1 r g b 模型 面向硬设备的最常用的颜色空f b j 是r g b 颜色空间,它是一种与人的视觉 系统结构密切相关的模型。根掘人眼结构,所有颜色都町以看作是坌a i ( r e d ) , 绿( g r e e n ) 年 :l 蓝( b l u e ) 3 个基本颜色的不同组合。绝人部分的显示器都采用这种 彩色模型。r g b 对应到显示器的三个刺激值,组成i 维诈变坐标系统,该系 统中任何颜色都落入r g b 彩色立方体内,r g b 模型如下图2 1 所示: b g 图2 1r g b 模,弘 在该模型中,黑色在原点处,白色位于离原点最远的角上,灰度等级沿 着这两点的连线分布。每一个分量图像都是其原色图像,用以表示每一像素 的比特数叫做像素深度。考虑r g b 图像,其中每一幅8 比特图像,在这种条 件下,每一个r g b 彩色像素有2 4 比特深度。在2 4 比特r g b 图像中颜色总 数为( 2 8 ) 3 = 1 6 7 7 7 2 1 6 。 色觉的产生需要发光光源的光通过反荆或透射的方式传递到人眼睛,刺 激视网膜细胞引起神经信号传输到人脑,然后人腑对此加以解释产生色觉。 设为组成某种颜色c o l o r :所需要的三个刺激黄分别用x 、y 、z 表示,这二三个 刺激值与r 、g 、b 存在如下的关系: x = 0 4 0 9 r + 0 310 g + 0 2 0 0 b ( 2 2 ( a ) ) 1 0 哈尔滨1 杵人。孑:硕十。7 :何论文 y = 0 17 7 r + 0 813 g + 0 010 b ( 2 2 ( b ) ) z = 0 0 0 0 r + 0 010 g + 0 9 9 0 b ( 2 2 ( c ) ) 当x = i ,y = i ,z = i 时,对应于白光。设每种刺激量的比例系数为x ,y , z ,则有c = x x + y y + z z 。比例系数x ,y ,z ,为色系数,其定义为: x = i 二丐 ( 2 3 ( a ) ) = 一 i z - j l ” x + y + z 、。 y y = i = _ i ( 2 - 3 ( b ) ) x + y + z 、 z = i 二 ( 2 3 ( c ) ) x + y + z 、? 此时,x + y + z = l 。 r g b 模型是最基础最常用的模型,它很好的诠释了颜色属性。可以说 r g b 对图像彩色的产生是理想的,但是对彩色描述 二的应用还有以下一些不 足: ( 1 ) r g b 空间用红、绿、蓝三原色的混合比例定义不同的色彩,从而, 不同的色彩难以用准确的数值来表示,定量分析比较困难。 ( 2 ) r g b 系统中,彩色通道之i b j 的相关性很高,从而合成图像的饱和度 偏低,色调变化较小,图像的视觉效果较差。对相关性高的图像作 对比度扩展,通常也只是扩大了图像的明亮程度,对增强色渊差异 作用较小。 ( 3 ) 人眼只能够通过感知颜色的亮度、色调和饱和度末区分物体,不能 够直接感觉红、绿、蓝三色的比例,此外,色调和饱和度与红、绿、 蓝的关系是非线性的,冈此,在r g b 窄f h j 中刈图像进行分析与处理 难以控制其结果。 2 1 2 c i e 颜色空间 1 9 3 1 年,c i e ( 困际标准照明委员会) 建立了一系列表示可见光谱的颜色空 间标准。基本的c i e 颜色空问是c i ex y z ,它建立在标准观察者的视觉能力 的基础上。基于c i e x y z 又有c i ex y y ,c i el a b ,c i el c h ,c i el u v 等颜 哈尔滨i :稗大学硕十学何论文 色空间,都是由r g b 颜色空间经过非线性变换得到的。 ( 1 ) x y z 颜色空间 f 因为r g b 颜色空问有如此多的缺点,因此很少被直接使用在图像处理 的领域。x y z 颜色空| 、日j 就是为了克服r g b 颜色空i n j 的缺点而在r g b 颜色空 间的基础上,用假想的三个原色x 、y 、z 建立的4 个新的颜色空i n j 。这种颜 色空f b j 本身与设备无关,相刈r g b 颜色空f b j 来说具有更高的门j 。移植性。具体 转换公式为: x = 0 4 9xr + o 31xg + 0 2xb ; ( 2 - 4 ( a ) ) y = 0 1 7 7xr + 0 8 1 2xg + 0 0 11xb ; ( 2 - 4 ( b ) ) z = 0 0 1xg + 0 9 9xb ; ( 2 4 ( c ) ) 虽然x y z 颜色空白j 是由r g b 颜色空f h j 做了改进而得到的,并且这种颜 色空问几乎能够包含人类能够感觉到的所有颜色,f 日足x y z 颜色空l 日j 最大的 缺点是不具备颜色的均匀性。 ( 2 ) l a b 颜色空问 l a b 颜色空i n j 是国际照明委员会在1 9 7 6 制定的一种色彩模式。自然界中 任何一种颜色都可以在l a b 颜色空f h j 中表达出来,它的色彩窄i h j 比r g b 空 问还要大。另外,这种模式是以数7 化方来拙述人的视觉感觉,陔模型勺 显示器的色移、输出设备以及其他设备无关。l a b 系统是一个优秀的亮度和 彩色分离器,它在图像压缩方面很有用。l a b 颜色空问取坐标l a b ,其中l 代表亮度:a 的诈数代表红色,负端代表绿色;b 的i f 数代表黄色,负端代表蓝 色。l a b 颜色空间由x y z 转换而得的,具体转换公式为: l = l1 6 厂( n 一1 6 : ( 2 - 5 ) a2 b = 其中f ( x ) = 7 7 。 厂( 志) 一 ; 。i f ( y ) - ( 志) x + 0 1 3 8 x 0 0 0 8 8 5 ( 2 - 6 ) ( 2 - 7 ) l f ( x ) = x 3 ,x 0 0 0 8 8 5 6 ( 2 - 8 ) 1 2 :窒当鎏:堡奋茎堡圭茎堡丝圣 2 1 3 h i s 颜色模型 h i s 色彩空州是执人的视觉系统出发,用色调( h u e ) 、色饱和度( s a t u r a t i o n 或c h r o m a ) 和亮度( i n t e n s i t y 或b r ig i i t n e s s ) 束描述色彩。h i s 色彩空自j 可以用 一个圆锥空间模型来描述。用这种描述h i s 色彩空问的圆锥模型相当复杂, 但确能把色调、亮度和色饱和度的变化情形表现得很清楚。通常把色调和饱 和度通称为色度,用来表示颜色的类别与深浅程度。由于人的视觉对亮度的 敏感程度远强于对颜色浓淡的敏感程度,为了便于色彩处理和识别,人的视 觉系统经常采用h i s 色彩空问,它比r g b 色彩空间更符合人的视觉特性。 在图像处理和计算机视觉中大量算法都可在h i s 色彩空问中方便地使用,它 们可以分丌处理而且是相互独立的。因此,在h i s 色彩空问可以大大简化图 像分析和处理的工作量。h i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论