(完整版)视频目标检测与跟踪算法综述_第1页
(完整版)视频目标检测与跟踪算法综述_第2页
(完整版)视频目标检测与跟踪算法综述_第3页
(完整版)视频目标检测与跟踪算法综述_第4页
(完整版)视频目标检测与跟踪算法综述_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、视频目标检测与跟踪算法综述1、引言运动目标的检测与跟踪是机器视觉领域的核心课题之一,目前被广泛应用在视频编码、智能交通、监控、图像检测等众多领域中。本文针对视频监控图像的 运动目标检测与跟踪方法,分析了近些年来国内外的研究工作及最新进展。2、视频监控图像的运动目标检测方法运动目标检测的目的是把运动目标从背景图像中分割出来。运动目标的有效分割对于目标分类、跟踪和行为理解等后期处理非常重要。目前运动目标检测算法的难点主要体现在背景的复杂性和目标的复杂性两方面。背景的复杂性主要体现在背景中一些噪声对目标的干扰,目标的复杂性主要体现在目标的运动性、突变性以及所提取目标的非单一性等等。所有这些特点使得运

2、动目标的检测成为一 项相当困难的事情。目前常用的运动目标检测算法主要有光流法、帧差法、背景相减法,其中背景减除法是目前最常用的方法。2.1帧差法帧差法主要是利用视频序列中连续两帧间的变化来检测静态场景下的运动 目标,假设fk(x, y)和f(k i)(x, y)分别为图像序列中的第k帧和第k+1帧中象素点 (x,y)的象素值,则这两帧图像的差值图像就如公式 2-1所示:Diffkifk(x, y) f(k 1)(x, y)(2-1)2-1式中差值不为0的图像区域代表了由运动目标的运动所经过的区域(背景象 素值不变),又因为相邻视频帧间时间间隔很小,目标位置变化也很小,所以运 动目标的运动所经过

3、的区域也就代表了当前帧中运动目标所在的区域。利用此原理便可以提取出目标。下图给出了帧差法的基本流程:1、首先利用2-1式得到第k帧和第k+1帧的差值图像Diff k 1 ; 2、对所得到的差值图像Diff k 1二值化(如 式子2-2示)得到Qk+1 ; 3、为消除微小噪声的干扰,使得到的运动目标更准 确,对Qk 1进行必要的滤波和去噪处理,后处理结果为 Mk 1。(T为阈值)(2-2)255,if ,Diffk 1(x,y) T0,if ,Diffk1(x,y) T1帧差流程图从结果看在简单背景下帧差法基本可检测到运动目标所在的位置,而且计算简单,复杂度低。当图像采样间隔较小时, 帧差法对图

4、像场景变化不敏感,这是 帧差法的优点,但同时目标部分漏检的可能性增大了, 容易使检测到的目标出现 空洞。在实际应用中,由于帧差法的简易性,帧差法经常作为某些改进算法的基 础。2.2光流法光流的概念30,31是由Gibson在1950年首先提出的,光流理论在计算机 视觉,三维运动分析中有着非常广泛的作用。外界物体由于运动在人的视网膜上 产生一系列连续变化的信息,这些信息就如同是光的流一样不断从眼中流过,故此称之为光流。1981年Horn和Schunek创造性的将二维速度场和我们通常所 说的图像的灰度联系在一起,提出了光流约束方程,从而使得光流的计算有了最 基本的方法。随后光流法不断发展,按照理论

5、基础分为:微分法,快匹配法,基 于能量的方法,基于相位的方法,其中尤以微分法最为常用,该方法主要是基于 下面两种假设:1、 强度不变假设,即在一组连续的二维图像序列中,某个目标的运动轨迹 在各帧中对应的像素点具有相同的灰度值。2、全局平滑假设,即物体的运动矢量是局部平滑的或只有缓慢变化。特别 是刚体运动,各相邻像素点具有相同的运动速度,即速度平滑。这时,光流矢量 梯度的模值的平方应该最小,用 x和y分量的拉普拉斯算子的平方和来表征光 流场的平滑程度。假如给定一个图像上m点坐标为(x,y),且它在t时刻的象素值为I (x, y,t)在 t dt时刻该点运动到(x dx,y dy),象素值为:I(

6、x dx,y dy,t d则在强度(2-3)不变的假设下:I (x dx, y dy,t dt)I (x, y,t)公式2-3即为光流约束方程,将式2-3泰勒展开,并令dt趋于0,我们可以得到:(2-4)IxUIyV It 0其中 Ix I. x,|y I; y, It p t,u dxjdt,v dy. dt,(u,v)即为像素点在图像平面运动产生的瞬时速度场也即光流场。光流法的主要任务就是通过求解光流约束方程求出U、V,但是由于只有一个方程,并不能唯一确定U和V, 这就用到了第二个假设,在该假设下就是要使得:E(IxU IyV It)2 a2()2 (亠)2 ()2 ()2)dxdy mi

7、n ( 2-5)xyxy其中a是个权重系数,一般取0.5,这样联合(2-4)式和(2-5)式即可得到:n 1nnnt 222.uuIxIxUIyVI;aIxIy n 1nnn t 222( 3-6)VVIyIxUIyVI,aIxI y 从推导的过程看,光流法的计算非常复杂,难于满足实时性的要求,且在目标提取时对噪声很敏感,所以此算法还难以直接在实际中推广使用。2.3背景减除法背景减除法是将视频帧与背景模型进行比较,通过判定灰度等特征的变化, 或用直方图等统计信息的变化来判断异常情况的发生和分割出运动目标。基于背景差的方法,概念非常清晰。该方法与帧差法相比,可以检测出短时 间静止的目标,如短时间

8、静止的车辆(长时间静止的车辆可以归为背景),且不受 车速快慢的限制;与光流法相比,背景差法可以通过简化算法,降低计算量,满 足视频检测的实时性要求。但随着研究的不断深人,算法的复杂性也在不断提高, 特别是对较复杂场景下的前景(运动目标)检测,如针对光照变化场景下的目标 检测(室外的环境光、室内的灯光等),针对含有高噪声场景区域的目标检测(场景 中含有树木、水面、旗帜等物体的反复运动),针对场景频繁发生改变(车辆停止、 背景中物体搬动等)情况下的目标检测等问题,使得算法的复杂性大大提高。用背景减除法进行运动目标检测的主要过程 包括预处理、背景建模、前景检 测和运动区域后处理 等。背景建模是背景减

9、除法的核心环节,目前主要方法有: 基于背景的时间差分法、中值滤波法、W4方法、线性预测法、非参数模型法(又称内核密度估计法)、混合Gauss法、隐马尔科夫模型法(HMM)、本征法、基于 均值替换的背景估计法、码本方法等。目前用无参的核密度估计方法对复杂场景的背景建模正成为背景差方法研究的热点,该方法特别针对具有微小重复运动的场合,如含有摇动的树叶、晃动的灌木丛、旋转的风扇、海面波涛、雨雪天气、光线反射等运动的场合。由于基 于无参的核密度估计的背景建模是对一段视频的统计分析,在对视频图像中的背景进行建模时,计算量很大,这势必会影响算法的实时性,因此需要在提高背景 建模的速度与准确率上做大量的研究

10、工作,同时改进模型的适应性。另外,背景 更新策略方面,如何判断是否需要更新背景模型,如何及时的更新背景模型都是 现阶段困扰研究人员的问题。基于无参方法的背景差法主要分为四个步骤:1、利用无参法对背景进行建模,2、核函数带宽选择,3.对背景模型进行更新,4、 运动目标的提取。对于以上三种运动目标的检测方法, 帧差法实现最为简单,但目标提取效果 较差,该方法通常可以作为某种改进算法的基础。 光流法相对准确,但计算复杂, 实时性很差,且对多目标提取困难。背景差法可以较好的提取目标轮廓, 但该方 法涉及对背景的建模,建模过程比较复杂。这些早期提出的移动目标检测方法大都单独地处理各个像素的灰度值或颜 色

11、而没有考虑较大尺度上的特征, 故可称它们为基于像素的方法。典型的方法包 括均值-阈限方法、高斯混合模型、非参数模型等。由于这些方法没有充分利用 局部像素之间的关系信息,很多有效的图像特征无法得到表示,从而导致移动目 标检测精度及效度都受到影响。后期大量的检测方法都不同程度地利用了局部区 域层次的信息,称为基于区域的方法。典型的基于区域的方法包括纹理方法直方 图方法等。针对移动目标检测的各种像素级、区域级特征不断被提出,它们各有各的优 缺点。如何能够设计一种特征将这些特征统一地结合在一起,从而充分利用各自的优势显得非常有意义。 一种简单的思路是用几种特征组成特征向量,并利用 该向量作为各个像素的

12、特征:fk x, y, LBP(x,y),|lx(x,y) , Iy(x, y),3、视频目标跟踪算法运动目标跟踪是在目标检测的基础上,对检测到的目标进行有效跟踪。目前, 在视频监控、 人机交互及某些高级的视频系统中, 对感兴趣目标的跟踪是其中必 不可少的重要环节,它为后面更高级的视觉应用提供有价值的信息。通常影响跟踪的因素主要有四个: 目标模板的表示, 候选目标的表示, 相似 度的衡量和搜索的策略。衡量跟踪算法优劣的条件有两个, 即实时性和鲁棒性, 所以一个好的跟踪算 法应满足:1. 实时性好:算法要费时少,至少要比视频采集系统的采集速率快,否则 将无法实现对目标的正常跟踪。 如果跟踪系统还

13、涉及到其他的图像处理环节, 那 么就要预留较多的时间给图像处理部分,所以实时性至关重要。2. 鲁棒性强:实际的观测环境,图像的背景可能很复杂。光照、图像噪音 及随时可能出现的目标遮挡, 均使目标的跟踪变得非常困难。 因此算法的鲁棒性 对跟踪效果的好坏起着重要的作用。以上提到的两条很难在系统中同时得以满足, 往往需要某种折中, 以期得到 较好的综合性能。 通常运动目标的跟踪可以分为运动目标检测、 运动目标的特征 选取和目标的后续跟踪三个阶段。 由此可见跟踪算法远比单纯的目标检测算法复 杂的多。根据被跟踪目标信息使用情况的不同, 可将视觉跟踪算法分为: 基于对比度 分析的目标跟踪、 基于匹配的目标

14、跟踪和基于运动检测的目标跟踪。 基于对比度 分析的跟踪算法主要利用目标和背景的对比度差异, 实现目标的检测和跟踪。 基 于匹配的跟踪主要通过前后帧之间的特征匹配实现目标的定位。 基于运动检测的 跟踪主要根据目标运动和背景运动之间的差异实现目标的检测和跟踪。 前两类方 法都是对单帧图像进行处理。 基于匹配的跟踪方法需要在帧与帧之间传递目标信 息。对比度跟踪不需要在帧与帧之间传递目标信息。 基于运动检测的跟踪需要对 多帧图像进行处理。 除此之外,还有一些算法不易归类到以上 3 类,如多目标跟 踪算法或其他一些综合算法。3.1 基于对比度分析的目标跟踪算法 基于对比度分析的目标跟踪算法利用目标与背景

15、在对比度上的差异来提取、 识别和跟踪目标。 这类算法按照跟踪参考点的不同可以分为边缘跟踪、 形心跟踪 和质心跟踪等。 这类算法不适合复杂背景中的目标跟踪, 但在空中背景下的目标跟踪中非常有效。边缘跟踪的优点是脱靶量计算简单、响应快,在某些场合(如要求跟踪目标的左上角或右下角等 )有其独到之处。缺点是跟踪点易受干扰,跟 踪随机误差大。 重心跟踪算法计算简便, 精度较高, 但容易受到目标的剧烈运动 或目标被遮挡的影响。 重心的计算不需要清楚的轮廓 在均匀背景下可以对整个 跟踪窗口进行计算, 不影响测量精度。 重心跟踪特别适合背景均匀、 对比度小的 弱小目标跟踪等一些特殊场合。 图像二值化后, 按重

16、心公式计算出的是目标图像 的形心。一般来说形心与重心略有差别。3.2 基于匹配的目标跟踪算法3.2.1 特征匹配特征是目标可区别与其他事物的属性, 具有可区分性、 可靠性、 独立性和稀 疏性。基于匹配的目标跟踪算法需要提取目标的特征, 并在每一帧中寻找该特征。 寻找的过程就是特征匹配过程。特征提取是一种变换或者编码, 将数据从高维的原始特征空间通过映射, 变 换到低维空间的表示 根据 Marr 的特征分析理论,有 4 种典型的特征计算理论: 神经还原论、 结构分解理论、 特征空间论和特征空间的近似。 神经还原论直接源 于神经学和解剖学的特征计算理论, 它与生物视觉的特征提取过程最接近, 其主

17、要技术是Gabor滤波器、小波滤波器等。结构分解理论是到目前为止唯一能够为 新样本进行增量学习提供原则的计算理论,目前从事该理论研究的有麻省理 T 学院实验组的视觉机器项目组等。特征空间论主要采用主分量分析 (PCA) 、独立 分量分析(ICA)、稀疏分量分析(SCA)和非负矩阵分解(NMF)等技术抽取目标的子 空间特征。 特征空间的近似属于非线性方法, 适合于解决高维空间上复杂的分类 问题,主要采用流形、李代数、微分几何等技术。目标跟踪中用到的特征主要有几何形状、 子空间特征、外形轮廓和特征点等。 其中,特征点是匹配算法中常用的特征。 特征点的提取算法 很多,如 Kanade LucasTo

18、masi(KLT)算法、Harris算法、SIFT算法以及SURF算法等。特征点一般 是稀疏的, 携带的信息较少, 可以通过集成前几帧的信息进行补偿。 目标在运动 过程中,其特征 (如姿态、几何形状、灰度或颜色分布等 )也随之变化。目标特征 的变化具有随机性, 这种随机变化可以采用统计数学的方法来描述。 直方图是图 像处理中天然的统计量,因此彩色和边缘方向直方图在跟踪算法中被广泛采用。322贝叶斯跟踪目标的运动往往是随机的。这样的运动过程可以采用随机过程来描述。 很多 跟踪算法往往建立在随机过程的基础之上, 如随机游走过程、马尔科夫过程、自 回归(AR)过程等。随机过程的处理在信号分析领域较成

19、熟,其理论和技术 (如贝 叶斯滤波)可以借鉴到目标跟踪中。贝叶斯滤波中,最有名的是 Kalman滤波(KF)。KF可以比较准确地预测平 稳运动目标在下一时刻的位置,在弹道目标跟踪中具有非常成功的应用。 一般而 言,KF可以用作跟踪方法的框架,用于估计目标的位置,减少特征匹配中的区 域搜索范围,提高跟踪算法的运行速度 KF只能处理线性高斯模型,KF算法的 两种变形EKF和UKF可以处理非线性高斯模型。两种变形扩展了 KF的应用范 围,但是不能处理非高斯非线性模型,这个时候就需要用粒子滤波(PF)。由于运动变化,目标的形变、非刚体、缩放等问题,定义一个可靠的分布函数是非常困 难的,所以在PF中存在

20、例子退化问题,于是引进了重采样技术。事实上,贝叶 斯框架下视觉跟踪的很多工作都是在 PF框架下寻找更为有效的采样方法和建议 概率分布。这些工作得到了许多不同的算法。如马尔可夫链蒙特卡洛(MCMC)方法、Un see nted粒子滤波器(UPF)、Rao Blackwellised粒子滤波器(RBPF)等等 文献【5】引入了一种新的自适应采样方法一一序贯粒子生成方法在该方法中粒子通过重要性建议概率密度分布的动态调整顺序产生。文献【6】根据率失真理论推导了确定粒子分配最优数目的方法, 该方法可以最小化视觉跟踪中粒子 滤波的整体失真。文献【7】计算最优重要性采样密度分布和一些重要密度分布 之间的KL

21、距离,分析了这些重要密度分布的性能。文献【8】在粒子滤波框架 下,采用概率分类器对目标观测量进行分类,确定观测量的可靠性,通过加强相关观测量和抑制不相关观测量的方法提咼跟踪性能。除了 KF和PF之外,隐马尔科夫模型(HMMs)和动态贝叶斯模型(DBNs)也 是贝叶斯框架下重要的视觉跟踪方法。HMMs和DBNs将运动目标的内部状态和观测量用状态变量(向量)表示,DBNs使用状态随机变量(向量)集,并在它们之 间建立概率关联。HMMs将系统建模为马尔科夫过程。这些算法的主要区别如 表1所示。表1贝叶斯跟踪算法算法描述能力状态表示方法拓扑结构KF线性、咼斯一个随机变量(向量)固定PF非线性、任意分布

22、一个随机变量(向量)固定HMMs非线性、任意分布一个随机变量(向量)固定DBNs非线性、任意分布随机变量(向量)集可变表1中每个简单的算法都可以看成是下一行复杂算法的特例。反之,每个复 杂算法都可以看成是简单算法的扩展。其中.DBNs具有最佳的灵活性,可以处理不同的运动模型和不同的状态变量组合。DBNs又可以看作概率图模型(PGMs)的一个例子。PGMs的基本思想是用图 形的方式将多变量概率分布分解.统计变量用图的节点表示,变量间的条件关系 用图的连接或边表示。PGMs可以分为有向图(DAGs)和无向图(Ugs)。前者能够 处理时间模式,适合目标跟踪和场景理解等任务。后者能很好地描述图像像素之

23、 间的空间依赖性适合图像分割和图像分析等任务。通过组合图理论和概率理论,PGMs可以用来处理问题描述中的不确定性。 不确定性恰好符合人类视觉系统中天然的概率性和视觉模糊性(如遮挡从3D到 2D投影的信息损失)。通过规定概率模型元素之间的关系,PGMs可以有效地表示、学习和计算复杂的概率模型。PGMs能够有效地组合目标的动态信息和外观 信息,有效解决目标的运动估计问题,为目标跟踪提供了很好的理论框架。表1中算法都可以看成是PGMs的特殊形式。323核方法核方法的基本思想是对相似度概率密度函数或者后验概率密度函数采用直 接的连续估计。这样处理一方面可以简化采样,另一方面可以采用估计的函数梯 度有效

24、定位采样粒子。采用连续概率密度函数可以减少高维状态空间引起的计算 量问题,还可以保证例子接近分布模式, 避免粒子退化问题。核方法一般都采用 彩色直方图作为匹配特征。Mean Shiftl是核方法中最有代表性的算法,其含义正如其名。是“偏移的 均值向量”。直观上看,如果样本点从一个概率密度函数中采样得到,由于非零 的概率密度梯度指向概率密度增加最大的方向, 从平均上来说,采样区域内的样 本点更多的落在沿着概率密度梯度增加的方向。因此,对应的Mean Shift向量应该指向概率密度梯度的负方向。Mea n Shift跟踪算法反复不断地把数据点朝向 Mea nShift矢量方向进行移动, 最终收敛到

25、某个概率密度函数的极值点。 在Mean Shift跟踪算法中。相似度函数 用于刻画目标模板和候选区域所对应的两个核函数直方图的相似性,采用的是 Bhattacharyya系数。因此。这种方法将跟踪问题转化为 Mean Shift模式匹配问题。 核函数是 Mean Shift 算法的核心,可以通过尺度空间差的局部最大化来选择核 尺度,若采用高斯差分计算尺度空间差,则得到高斯差分 Mean Shift 算法。Mean Shift算法假设特征直方图足够确定目标的位置,并且足够稳健,对其 他运动不敏感。 该方法可以避免目标形状、 外观或运动的复杂建模, 建立相似度 的统计测量和连续优化之间的联系。但是

26、, Mean Shift算法不能用于旋转和尺度 运动的估计。为克服以上问题,人们提出了许多改进算法,如多核跟踪算法、多 核协作跟踪算法和有效的最优核平移算法等。文献 11则针对可以获得目标多视 角信息的情况,提出了一种从目标不同视角获得多个参考直方图, 增强Mean Shift 跟踪性能的算法。3.3 基于运动检测的目标跟踪算法基于运动检测的目标跟踪算法通过检测序列图像中目标和背景的不同运动 来发现目标存在的区域。 实现跟踪。 这类算法不需要帧之间的模式匹配, 不需要 在帧间传递目标的运动参数, 只需要突出目标和非目标在时域或者空域的区别即 可。这类算法具有检测多个目标的能力, 可用于多目标检

27、测和跟踪。 这类运动目 标检测方法主要有帧间图像差分法、 背景估计法、能量积累法、运动场估计法等。光流算法是基于运动检测的目标跟踪的代表性算法。 光流是空间运动物体在 成像面上的像素运动的瞬时速度, 光流矢量是图像平面坐标点上的灰度瞬时变化 率。光流的计算利用图像序列中的像素灰度分布的时域变化和相关性来确定各自 像素位置的运动, 研究图像灰度在时间上的变化与景象中物体结构及其运动的关 系。将二维速度场与灰度相联系, 引入光流约束方程, 得到光流计算的基本算法。 根据计算方法的不同,可以将光流算法分为基于梯度的方法、基于匹配的方法、 基于能量的方法、基于相位的方法和基于神经动力学的方法。文献【 12】提出了 一种基于摄像机光流反向相关的无标记跟踪算法, 该算法利用反向摄像机消除光 流中的相同成分,得到有效的跟踪效果。文献【 13】将光流算法的亮度约束转化 为上下文约束 把上下文信息集成到目标跟踪的运动估计里, 仿照光流算法, 提 出了上下文流算法。文献【 14】引入了几何流的概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论