已阅读5页,还剩49页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙 江 理 工 大 学信 息 电 子 学 院毕业论文(设计)诚信声明我谨在此保证:本人所写的毕业论文(设计),凡引用他人的研究成果均已在参考文献或注释中列出。论文(设计)主体均由本人独立完成,没有抄袭、剽窃他人已经发表或未发表的研究成果行为。如出现以上违反知识产权的情况,本人愿意承担相应的责任。声明人(签名): 年 月 日 毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日指导教师评阅书指导教师评价:一、撰写(设计)过程1、学生在论文(设计)过程中的治学态度、工作精神 优 良 中 及格 不及格2、学生掌握专业知识、技能的扎实程度 优 良 中 及格 不及格3、学生综合运用所学知识和专业技能分析和解决问题的能力 优 良 中 及格 不及格4、研究方法的科学性;技术线路的可行性;设计方案的合理性 优 良 中 及格 不及格5、完成毕业论文(设计)期间的出勤情况 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)指导教师: (签名) 单位: (盖章)年 月 日评阅教师评阅书评阅教师评价:一、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格二、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)评阅教师: (签名) 单位: (盖章)年 月 日浙江理工大学本科毕业设计教研室(或答辩小组)及教学系意见教研室(或答辩小组)评价:一、答辩过程1、毕业论文(设计)的基本要点和见解的叙述情况 优 良 中 及格 不及格2、对答辩问题的反应、理解、表达情况 优 良 中 及格 不及格3、学生答辩过程中的精神状态 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格评定成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)教研室主任(或答辩小组组长): (签名)年 月 日教学系意见:系主任: (签名)年 月 日摘 要近年来,随着通信和计算机技术的日益进步,以及全球安全防范工作的迫切需要,智能视频监控系统获得了日益广泛的研究与应用。智能视频监控是指通过对视频内容的分析,分割出人、动物和车辆等目标,并给出各个目标的行为和动作的描述,来判断突发事件的发生,并产生后续的告警等决策行为。这一技术包括了运动目标的检测分割、提取、跟踪、目标分类和行为分析等方面,涉及到计算机视觉、模式识别和人工智能等领域的许多核心课题。运动目标跟踪是智能视频监控系统的一个基本环节。运动目标分割的目的是从序列图像中将运动目标的变化区域从背景中提取出来。运动目标的有效分割对于目标识行为理解等后期的处理是非常重要的。基于变化区域检测是众多分割方法中的一类,此类方法是通过检测序列图像帧上的变化区域与不变区域,以将运动物体与静止背景进行分割的基于变化区域检测的方法是在基于时空图像亮度和梯度信息的独立运动区域中考虑图像分割的为了降低噪声的干扰,通常都利用相邻两帧检测变化区域分割过程有使用参数模型和不使用参数模型的方法而本文就是要研究基于参数模型下的运动目标分割方法。主要研究基于高斯混合模型的运动目标分割方法。关键词:运动目标分割;高斯混合模型;EM算法;背景分割AbstractThe abstract recent years, along with the correspondence and the computer technology daily progress, as well as the global safe guard work urgent need, the intelligent video frequency supervisory system has obtained day by day the extensive research and the application.The intelligent video frequency monitoring is refers through to the video frequency content analysis, divides goals and so on human, animal and vehicles, and gives each goal the behavior and the movement description, judges the thunderbolt the occurrence, and has policy-making behaviors and so on following the warning.This technology has included movement aspects and so on goal examination division, extraction, track, target category and behavioral analysis, involves to domain and so on computer vision, pattern recognition and artificial intelligence many core topics. The movement target tracking is an intelligent video frequency supervisory system basic link.The movement goal division goal is withdraws from the sequence image the movement goal change region from the background.The movement goal effective division regarding later period and so on item marking behavior understanding processing is extremely important.Based on changes the region examination is in a multitudinous division method kind, this kind of method is through the examination sequence chart picture frame on change region and the invariable region, by carries on the mobile and the static background the division. Based on changes the region examination the method is in considers the image division based on the space and time image brightness and in the gradient information independence movement region. For the noise reduction disturbance, usually all uses the neighboring two examinations to change the region. The division process has the operating parameter model and the operating parameter model method. But this article is needs to study based on the parameter model under the movement goal division method.The main research mixes the model based on Gauss the movement goal division method. Key word: Movement goal division; Gauss mixes the model; EM algorithm; Background division目 录摘 要Abstract第一章 绪论61.1研究背景及意义61.2国内外研究现状61.3高斯混合模型71.4本文的研究内容8第二章 运动目标的分割技术92.1差分法92.2分流法102.3基于主动轮廓线模型的方法112.4基于统计模型的方法112.5其他方法12第三章 基于高斯混合模型的运动目标分割133.1混合高斯模型的贝叶斯框架133.1.1框架概述133.1.2背景模型143.2混合高斯模型的算法实现153.2.1估计P(x)中的各个参数153.2.2估计当前状态173.2.3ffe-Grimson方法193.2.4背景分割193.3 EM方法20第四章 分割后处理224.1去噪方法简介224.1.1中值滤波及其特点224.1.2近似中值滤波234.1.3实验结果234.2连通区域标定234.2.1具体方法244.2.2实验结果264.3连通区域合并26第五章 实验结果与讨论285.1流程图285.1.1总流程图285.1.2分割具体流程图285.2实验程序285.2.1分割函数程序285.2.2运行程序335.3运行结果344.4结果讨论35第六章 总结与展望36参考文献37致 谢39附 录39第一章 绪论1.1研究背景及意义人体目标的视觉分析是把计算机视觉方法应用到传统的视觉监控领域中,用计算机实现人体目标的视觉分析,来提高监控系统的智能化,在实际应用方面非常有意义。它的主要目的是从一组包含人的图像序列中检测、识别、跟踪人体,并对其行为进行理解和描述。大体上可分为底层视觉模块、中间层数据融合模块和高层视觉模块。底层视觉模块主要研究背景的创建和更新以及前景人体目标的分割和提取,分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。但是视频分割技术一直是计算机视觉及多媒体应用中最困难的问题之一。本课题的任务是要求学习运动目标分割方法的基本原理及视频图像中图像处理的基本方法,从拍摄的视频图象中用基于参数模型的方法对运动目标进行分割,并研究其分割性能。1.2国内外研究现状图像分割是图像工程中一项十分重要的技术。在对图像的研究和应用中,人们往往仅对图像中的某些区域感兴趣。这些区域常称为目标、目标或前景(相对前景来说其他部分称为背景),它们一般对应图像中特定的、具有独特性质或意义的区域。图像分割是把图像分成各具特征的区域并提取出感兴趣区域的技术和过程,是图像分析与目标辨别的基础。分割是一个很大而且比较难的话题,针对分割的目标数据集的不同,可以把分割分为对静态图像的分割、对视频流的分割和对样本(感兴趣模式的标识符,如圆点、直线等)的分割。根据分割方法学的不同可以分为基于模型拟合的分割和基于聚类的分割。要想为分割建立起一个系统的理论架构比较难,其中的一个原因就是,很难从比举例更实用的层次去评价一个分割方法。然而,不管各种分割方法在表面上看起来有多不一样,它们的确有着很大的相似之处:每种方法都试图用某些形式的相似去获得数据集的精简表示3,这某些形式的相似需要靠提取的特征进行比较,这些特征可能是颜色、纹理、形状、运动等或者它们的组合向量。尽管图像分割的研究已有几十年的历史,得到了广泛重视、研究和应用,但至今尚无通用的分割理论,现已提出的分割算法大都是针对具体问题的,并没有适合于所有图像的通用的分割算法。国际上许多图像技术学术会议都有图像分割主题和分会,有关图像分割研究的文章早己万计,有关图像分割的技术和算法种类繁多且层出不穷,但是至今还没有建立起统一的理论体系。就拿以运动为特征对视频流进行的运动目标分割来说,从帧差法2、5再到光流法以及混合的方法,其中,以StauLuffe-Grimson的混合高斯模型方法效果最为出众,以它为基础进行改进的运动目标分割算法应用也最为广泛1、2、4、7。然而,这个方法也有它自身的局限性。当遇到运动目标与背景颜色相近、背景中的物体突然移动、产生阴影或是背景扰动1等情况时,混合高斯模型的效果就会受到影响。同时,StauLuffe-Grimson在将混合高斯模型应用到实际中而进行简化时,将后验概率的计算用比较匹配进行替代,这可以极大的降低算法的计算量和复杂度,但同时牺牲了效果。而运动目标分割涉及对视频内容的分析和理解,这与人工智能、图像理解、模式识别、神经网络和计算机视觉等学科有密切联系。目前人工智能的发展还不够完善,计算机还不具有观察、识别、理解图像的能力;同时关于计算机视觉的研究也表明要实现正确的图像分割需要在更高层次上对视频内容进行理解。因此,尽管现今已经出现了MPEG-4等框架但至今仍没有通用的有效方法去根本解决视频目标分割的问题,视频目标分割被认为是一个具有挑战性的难题,基于语义的分割则更加困难。目前进行视频目标分割的一般步骤是:先对视频图像数据进行预处理以利于分割,这可通过低通滤波、中值滤波、形态滤波来完成;然后对视频图像数据进行特征提取,可以是颜色、纹理、运动、帧差、位移帧差乃至语义等特征;再基于某种均匀性标准来确定分割决策,根据所提取特征将视频数据归类;最后是进行相关后处理,以实现滤除噪声及准确提取界。1.3高斯混合模型本文主要研究基于参数模型的运动目标分割方法,而参数模型是指采用某特定形式的概率密度函数来描述语音特征矢量在特征空间的分布情况以该概率密度函数的一组参数作为模型的特征6。如传递函数、微分方程等称为参数模型。瞬态响应曲线和频率响应曲线称为非参数模型。后者由于不显含物理参数,意义不大。参数模型是一个很笼统的概念,实际中有着各种各样的参数模型,而本文主要以其中的高斯混合模型为基础,来实际进行操作。高斯混合模型在最基本的情况下,视频序列的背景分割可以被视为一个二值化分类问题,即判断某一时刻某一点的状态是前景还是背景。从贝叶斯的观点来看,这种判断应该是基于后验概率的。用P(B|x)来表示这个后验概率,P(x)是此点在某时刻的观测值,B表示背景事件(即观测到的物理表面为背景)。现在我们不知道背景和前景的准确定义,因为什么是背景什么是前景是和具体应用环境密切相关的,背景和前景的区分是高层的语义,属于图像理解的层面。我们暂时把前景和背景看成是两种互斥的类型(即全集的一个划分,他们互相不包含,而且只有前景和背景)。1.4本文的研究内容在运动目标分割方面:运动目标的有效分割对于目标分类、特征提取、特征表达与最后的识别等处理非常重要,因为后期处理的过程仅仅考虑图像中对应于运动目标的像素。本文针对混合高斯模型算法,采集了大量原始实验数据,在PC平台上用C语言搭建环境,在不同参数下对算法进行了大量实验,通过对实验结果数据进行曲线模拟,对不同参数下的算法表现进行了分析。同时,从最基本的理论框架开始,对混合高斯模型算法进行了详细的分析,并基于混合高斯模型算法对视频图像中的运动目标分割进行研究。第二章 运动目标的分割技术运动目标分割,旨在分割出视频序列中的运动目标,并沿时间轴跟踪目标的演进。在实际应用过程中,有很多影响因素都对分割算法造成了困难口。运动目标分割是图像分割技术在时间域上的一个分支,主要利用的是目标的运动特征达到分割的目的。然而,众所周知,图像分割本身就是一个病态问题,因为底层数据所提供的信息总是少于分割本身所需的信息,所以分割没有唯一的结果,没有最优的结果,没有正确的结果,没有错误的结果,分割应视具体应用的不同而有不同的策略、准则,没有一个通用的方法。目前为止,业界也没有一个统一的标准来衡量各种分割方法。目前利用各种手段的分割方法层出不穷,它们的各种组合也在各种环境下发挥着各自的作用。给运动目标分割方法分类也有很多种方法,比如,有基于检测变化的和构建背景的,有时域的和时空域的方法,有像素级的、区域级的和帧级的方法,按用途分有用于编码的、基于内容可操作的,有基于模型参数的、非模型参数的,有基于形态学、非形态学的等等。其实很多方法都是复合的方法,最常见的是将运动的特征应用到传统的图像分割中去达到目的,或是将传统的图像分割技术(如形态学方法)与运动检测相结合,要想完全清晰的对各种方法进行分类是一件很困难的事情,业内也没有一个很好的方法。倒不如通过对一些最基本的方法的原形进行了解来对运动目标分割方法有一个整体概念上的了解。下面将对一些基本的分割方法或思想进行简略分析和介绍。2.1差分法图像序列又成为动态图像,它由一系列图像组成,它们具有给定的活着假设的相对次序,并给出相邻图像获取的时间间隔关系。它们一般可以表示为; (2.1)i=0,1,M-1,j=0,1N-1所谓相对次序一般是指时刻tk在tk-1之后的(k=1,2,n-1)。相邻两图像获取的时间间隔可以相等,也可以不等,一般取所有图像的获取时间间隔相等。从公式(2.1)能看出,图像序列可以看成具有两个空域坐标和一个时域坐标的三维物体,既图像体,像素被扩展成体素,表示小体积单元的灰度。由于运动目标所形成的图像序列可分为两种情况:一种是静止背景,一种是变化背景。从处理方法上看,一般是采用突出目标或消除背景的思想。对前一种情况可采用消除背景的方法,处理起来比较简单。对后一种情况,处理起来比较复杂,则通常需要进行帧间稳像及配准;若采用突出目标的方法,则需要在配准的基础上进行多帧能量积累和噪声抑制。将不同时刻的两幅图像进行不交,可以反映出一个运动物体在此背景下的运动结果。比较简单的方法就是将两幅图像做“差分”或“相减”运算,从相减的图像中,很容易发现运动物体信息。在相减后的图像中,灰度不发生变化的部分被减掉,这里包括大部分背景和一小部分目标。 (2.2)其中,T为二值化的阈值,可有人工选取,也可由专门的算法自动求出。实际上,由公式(2.2)得到的将是两个较为明显的变化区域,而在某些实际情况中只需要一处,故一般把绝对值号去掉,变为 (2.3)2.2分流法光流计算技术是Gibson于1950年提出。所谓光流是指图像中模式运动的速度,它是一种二维(2D)瞬时速度场,其中2D速度矢量是可见的三维速度矢量在成像平面上的投影。光流法分割运动目标的基本原理是:给图像中的每一个像素点赋予一个速度矢量,这就形成了一个图像运动场,在运动的一个特定时刻,图像上的点与三维物体上的点一一对应,这种对应关系可由投影关系得到,根据各个像素点的速度矢量特征,可以对图像进行动态分析。如果图像中没有运动目标,则光流失量在整个图像区域是连续变化的,当物体和图像背景存在相对运动时,运动物体所形成的速度矢量必然和邻域背景速度矢量不同,从而检测出运动物体的位置。2.3基于主动轮廓线模型的方法在传统的计算机视觉领域,严格的各自独立的分层理论有着广泛的影响。这种理论认为底层的视觉认为的完成只能依赖于从图像本身获得的信息。Kass等人对这种模型提出了挑战,于1987年提出了称为Snake的主动轮廓线模型。Snake算法的主要思想是:一条参数曲线在内力和外力的作用下移动到某个能量函数极小的位置,以此来确定物体的轮廓。设参数曲线:w(s)=x(s),y(s),并定义能量函数为 (2.4)式中:和分别为调整曲线张性的加权参数和刚性的加权参数;和分别为曲线对s的一阶和二阶导数;是由图像决定的外部能量。Snake是能量极小化的样条,内力约束它的形状,外力引导它的行为,图像力将其拖向显著的图像特征。对于灰度图像I(x,y)来说,外部能量通常可表示为 (2.5)式中:是方差为的二维高斯函数;是梯度算子。2.4基于统计模型的方法基于贝叶斯概率统计的运动估计建立统计模型 10。它利用随机平滑度约束条件,采用Gibbe分布,估计位移场。在给定光流数据的条件下,搜索分割标记的最大后验概率,使当前分割与期望分割的符合程度最大。它是检测当前的分割符合被观察的光流数据的程度和当前分割与我们的期望值一致程度的方法。这种算法可以同时完成运动场估计和目标分割,但计算量比较大,而且需要选择合适的特征并建立良好的目标特征概率分布模型。使用空间变换的网格模型成为目前一个积极的研究领域。网格模型可以很好地应用在旋转和缩放的情况下,并能检测和跟踪多个运动目标,并可以处理目标间遮挡或新目标的出现,但是该方法的分割结果容易受到网格生成算法中关键点数目选择的影响,运算估计的复杂度也大大增加。2.5其他方法除以上介绍的四个主流方法以外,现今所有的分割方法还有基于高阶统计的方法;基于小波的方法;基于人工神经网络的方法,基于形态学的分割方法;遗传算法以及使用空间变换的网络模型的分割方法等等,由于篇章问题,也就不一一列举。接下来的这种方法是混合高斯模型方法,我将在随后章节作详细分析。这种方法运用了数学建模的思想,对图像所反映的客观事物进行像素级的建模。通过参数估计得到实际的模型,在再一个贝叶斯准则的框架下对模型进行分析并得到最终的结论。第三章 基于高斯混合模型的运动目标分割3.1混合高斯模型的贝叶斯框架3.1.1框架概述把某个点随时间的变化作为一个随机过程,这个随机过程可能是由几个不同的随机过程合成的,其中每个随机过程都表示一个具体的物理过程(可以理解为某一个物理表面的观测随时间的变化过程),真实世界中的很多物理过程都可以用高斯过程来模拟,因此混合高斯模型由此得名。简单来说就是用混合高斯过程来模拟某个点随时间的变化过程。用公式表示某点在某时刻的随机分布率14就是 (3.1)q表示第k个高斯分布,及表示正态分布概率密度函数。在这个分布模型的基础上,开始的后验概率等价于 (3.2)从上面的公式分析可知前景背景分割实际上需要解决两个问题:首先通过所有得到的样本来估计某点的随机过程一维分布函数(因为是要得到某时刻的分布率),这包括合成混合高斯过程的各高斯过程的一维分布函数(以下简称高斯过程的分布)以及他们的系数P(q)(即某个高斯过程的权重,表示观测到这个高斯过程的概率);然后估计每个高斯过程是背景过程(即它所代表的物理表面被作为背景,以下同)的概率。可以这样来直观的理解这个贝叶斯框架:把某点观测到的样本看成是那些不同高斯过程产生的(看到的颜色是那些不同的物理表面产生的),我们首先判断某个样本(某点某时刻的观测)是哪个高斯过程产生的,然后再来判断各个高斯过程哪些是背景过程,哪些是前景过程。因此,当某时刻某点的观测是来自前景过程的概率(这个概率是用混合分布率以后验概率的形式表示的)大于50%时,这个观测就被判定为前景(这个点被认为是前景点)。解决第一个问题就要估计P(q)和P(qk)(第k个高斯过程的分布率),这与判断观测属于哪个过程相似,从理论上讲是与具体应用无关的。解决第二个问题就要估计B,即判断每个高斯过程是属于前景还是背景,这就不可避免的与具体的应用环境有关,而且是启发式的(需要高层语义的指导,即需要理解)。因此在解决第二个问题时可以引入一些与应用环境相关的因子和高层的语义来达到更好的效果。显而易见,在像素级的处理(以像素为处理单位,不考虑各像素间的空间相关性)中不可能做到完全正确的分割。举个例子,一个正在走路的人和一个正在旋转的电风扇有着相似的信号特征,如果没有对事件的理解,它们就很难区分。可以使用区域级帧级分割、动态模板或是祸合目标模型等方法来引进高层语义。3.1.2背景模型要使用混合高斯模型进行背景分割,只要估计出上述两个问题中相应的分布率。然而,事先必须定义好什么才是背景模型,在这个贝叶斯框架下可以做出一个理论上比较合理的定义。如果我们能正确地把所有的样本进行分类,把每个样本都归为属于某个高斯过程的一类,那么,背景模型就应该由被认为是背景的样本组成的,也就是说背景的随机过程一维分布函数需要由所有被认为是背景的观测来估计。其中,某个样本点被认为是背景的概率为P(x,B)。假设P(x|Gk,B)=P(x|Gk)某点(r,c)的背景过程在t时刻的分布(直观点说就是是背景的概率)15可以表示为:(3.3)等号最右边的表达式表明背景的分布是由原始的混合模型中的高斯部分经P(x|r)加权得到的。因此,各P(x|q)对实际的模型有很大的影响。举例来说,即使背景分布是从混合模型衍生来的,如果只把最有可能的高斯作背景, P(x|r)为l,其余的高斯都不是背景,P(x|q)为0,所得到的背景模型就只是一个简单的高斯分布。很多早期的论文就使用了这种方法,即把最有可能的几个高斯作背景,其余的都不是背景。这相当于一种两分法,但作为背景的高斯的数目并不是固定的。然而,当某个高斯在背景和前景间变化时会产生突变。从上面的公式还可以看出,背景模型包含了p(B),利用这一点,我们可以引入相应的几只把具体应用相关的因素引入到背景的分割中来。3.2混合高斯模型的算法实现经过上一节的理论分析,可以归纳出应用混合高斯模型的实际步骤:首先,我们要使用参数估计的某种方法通过观察到的样本估计混合高斯模型的各个参数,包括其中的各个高斯模型P(r|q)的均值、方差,以及各高斯模型的加权系数,用高斯模型出现的先验概率P(q)来表示;然后我们要对P(x|q)进行估计。下面的分析很多都要和参数打交道,在参数估计的过程中为了突出参数,我把公式用了另一种表示方法,但实际上是等价的。比如前面的P(r|q)或g(x,rk)可以用fx(x)来表示,先验概率P(q)可以用叭来表示,后验概率P(r|x)可以用P(k)来表示,以后他们是通用的,不再叙述14、8。3.2.1估计P(x)中的各个参数这是当观测数据为不完全数据时求解最大似然估计的问题。有很多早期的工作对这个求解进行了研究。其中,期望最大化 (ExPeetationMax如ization,EM)是一种使用最广泛的方法,它用迭代的方法求解最大似然估计。Stau月七卜Grimson将一种EM的近似算法应用到了运动目标提取领域。具体的EM算法将在下一节进行阐述。当前所有观测样本的最大似然函数可以表示为表示某点某时刻的观测值,当前总共有N个观测值,。表示待估计的参数集合,氏表示第k个高斯分布的参数集合。通过EM算法,迭代的求上式的期望的最大值,得到 (3.4) (3.5) (3.6)上述9、15理论结果是无法应用到实际的,因为它假定了k,X是静态过程,且把N作为了一个定值,实际上每一帧k,X都在变化,每一帧都要根据当前帧的观测样本对参数重新进行估计。因此,Stauffe.Grimson引入了一种在线的算法,就是定义一个时间轴上的学习速率,使得某一时刻的参数不仅能根据当前的观测进行更新,同时能够利用前一时刻的参数进行时间上的积累平均。首先,由于是在线算法,而且实际过程中每一时刻的参数都可能变化,同时最近的观测所包含的实际过程的信息量较大,所以要使得参数能根据当前的观测进行更新。其次,EM算法先是求期望,再进行最大化,不断地迭代计算,得到的结果如 (3.4)也是样本在时间上的平均,即使简化为在线算法也要保证样本在时间上有一个积累平均。由此可见,新的在线算法尽可能的保证了EM进行参数估计的准确性,同时又大大简化了EM算法,使其能够应用到实际中来。下面主要分析一下这种参数估计的EM在线算法。定义一个时变的增益二一厂(就是前面说的时间轴上的学习速率,把(3.4)简化为如下的形式: (3.7)上述模型虽然体现了X的不平稳性,但是有一点不足,当t很大的时候,模型对新的观测就会越来越不敏感,然而,相对于旧的观测来说新的观测应该更加重要,这样才能适应实际模型的变化。为了克服这个缺陷,在实际应用时可以给增益设置一个最小值代。,当t很大的时候,增益就变成了一个定值。把(3.7)代入(3.5)和(3.6)得到: (3.8) (3.9) (3.10)(3.8)(3.9)与(3.5)(3.6)并不是完全一致的,因为(3.10)的定义少了一个因子,这样做的好处是简化了计算,下文中会具体进行分析。3.2.2估计当前状态由(3.7)(3.10)可知,通过在线的EM方法估计混合高斯模型的参数归根到底是要求P(k|Xt,),这是一个后验概率,直观上的意义可以理解为已知某个观测戈,判断这个观测是由第k个高斯过程产生的概率。这个后验概率的重要性也可从(3.3)式看出,其中,第一个等号右边的P(k)就是我们所要求的P(k|Xt,)。理论上来讲,P(k|)是一个后验概率,可以由它的贝叶斯公式求得,即: (3.11)当前状态可以由使得后验概率 (3.10)最大的k进行估计,如下: (3.12)(3.10)式的分母与k是相互独立的,所以(3.12)式中省略了分母。如果X是由K个物理表面中的一个产生的,那么(3.12)式可以很好的模拟现实情况。然而实际中,X往往很有可能不是由这K个高斯过程产生的,比如一个从未出现的表面进入了像素的视野。这时,实际的模型应该增加一个第K+l个高斯模型,这个高斯模型可以有一个先验概率叭,它的均值没有定义,方差无穷大。1.由(3.7)(3.10)可知,我们实际上要求P(k|Xt,),k对于直观理解有些作用,但对参数估计是没用的2.不能用贝叶斯公式求解P(k|),因为贝叶斯公式 (3.11)右边的参数正是EM要估计的参数,我们是要通过P(k|Xt,)来估计混合模型的参数,不能本末倒置3.考虑到实际计算的需要,混合高斯中不能随便加入新的高斯模型StaufferGrimson最大的贡献莫过于提出了一种P(k|Xt,)的简化算法。他们用简单的匹配代替了P(k|xt,)的计算。当观测落在某个高斯分布的2.5倍标准偏离(如果是一维的高斯过程,标准偏离由(3.12)定义;若是多维的情况,由(3.13)和(3.14)定义)内时,认为此观测是由这个高斯产生的。 (3.13) (3.14) (3.15)从而P(k|Xt,)简化为如下形式 (3.16)如果有两个或两个以上的高斯都匹配,则取混合模型中峰值G最大的高斯作为匹配。这是一种大大的简化,同时,从客观上来看这种简化也不无道理。在通常情况下,P(k|xt,)的取值为1或0,当仅有一个高斯与观测匹配时,P(k|xt,)的取值非常接近于l,对于以前从未进入视野的表面来说,这个简化同样适用,因为它定义了不匹配的情况。当不匹配出现时,认为有一个从未进入视野的表面进入了视野,选择混合模型中峰值最小的高斯模型,把这个模型替换掉,用新观测作为它的均值,并给它初始化一个较大的方差。如果这个表面是短暂的,它的峰值会随着学习过程减小,并最终被新的表面所替换掉。如果这个表面是长期出现的,它的峰值会随着学习过程逐渐增大,并最终成为背景。因此,要求混合模型中高斯模型的数目至少能够保证随时有一个高斯处于闲置状态可以用来模拟新出现的表面。然而,事物都是有着两面性的。由于用匹配取代了后验概率的计算,背景概率的精确度大大降低,因此,在分割后的前景部分出现了很多的镂空,。但只要针对具体应用对参数进行适当合理的选取,就可以控制镂空的出现,而且,后处理时的中值滤波也会减小镂空的影响。经过权衡,后验概率的简化还是相当有益和值得的。3.2.3ffe-Grimson方法3.2.1节中分析了Stauffer-Grimson如何将EM算法通过定义一个时间增益进行简化,然而,真正的Stauffer-Grimson算法定义的时间增益是一个定值代,由式(3.6)可以看到,当t趋近于无穷时与时变增益的效果是一样的,但这种定义在初始化的时候会遇到问题。Stauffer-Grimson定义的p见(3.17)和3.2.1节定义的数据,见(3.18)也不完全相同 (3.17) (3.18) (3.19)首先来看一下(3.18),定义的好处,由于少了一个因子, 因此计算量大大降低,只需要根据(2.15)判断是否匹配就能得到结果,而Stauffer-Grimson还要再计算一次,这个概率的计算有指数有乘方,相对于比较运算(判断是否匹配)开销要大很多;再来看一下这样定义的问题,导致前一时刻的估计为0或非实数,这样在具体计算之前要进行判断,而Stauffer-Grimson的方法就不存在这样的问题。3.2.4背景分割这里的背景分割实际上指的就是判断当前的观测是前景还是背景。由(3.2)可知,混合高斯模型模拟的是客观的过程,不分主观上的前景或背景,也就是说,混合模型中的各高斯过程既有可能是前景过程,又有可能是背景过程。因此,如果背景是双表面的,混合模型中最少要有三个高斯模型,其中两个模拟背景,另外一个模拟前景。如果混合模型少于两个,混合高斯模型就相当于在时间上求平均得到背景,并用当前帧减去背景得到前景。然而,K并不是越大越好,从(3.8)实验表明,五个模型以上效果就没有多少改善的余地了。由(3.3)第一个等号右边的表达式可以看到,一个观测为背景的概率是由两个后验概率的积相加得到的。(3.15)把后验概率P(k|Xt,)的计算用判断匹配来代替,实际上除了匹配的高斯模型P(k|x)等于1外,其余的高斯模型P(q|x)都等于因此,P(x|Xt,B)也不得不用类似的两分法进行简化。从而,实际的背景分割过程首先判断当前观测与哪一个高斯模型匹配,然后再判断这个高斯模型是属于背景还是前景。判断当前观测与哪一个高斯模型匹配就是前面3.2.2节所阐述的估计当前状态。剩下一个问题就是判断各个模型是属于前景还是背景。Stauffer-Grimson采用了一种排序的机制,即按照成为背景的可能性由大到小把各高斯模型排序,选择Gk作成背景可能的参数,这个值越大,相应的高斯模型就越有可能是背影从公式上看,加权高斯分布、的峰值成正比直观来看,一个表面如果经常出现在视野中(大的),观测值不怎么变化,比较稳定(小的),就很有可能是背景。Stauflr-Grimson定义了一个参数T表示视野中看到背景的概率,根据刚才的排序,满足下式的前面B个模型为背景模型,剩下的模型默认为是前景模型。 (3.20)至此,整个算法的理论框架及衍变来的实际算法的各个问题都已解决。3.3 EM方法参数估计是数学建模应用到实际中的关键步骤,是许多新技术的研究前提和应用保证。传统的参数估计有很多种,经常用到的有最大似然估计,最大似然估计算法有较强的优势,它能实现联合参量数值大小和正负性的双重估计,而且趋于真值的收敛速度快,但计算复杂度的问题使得它的实现比较困难。期望最大化 (ExpectationMaximiyjion,EM)算法是参数估计的一种很重要的算法,最初是由DemPster,Laird和Rubin提出的,它是一种当观测数据为不完全数据时求解最大似然估计的迭代算法,他大大降低了最大似然估计的计算复杂度,但性能却与最大似然估计相近,具有很好的实际应用价值。假设某随机向量由两部分组成:可见部分Z和隐含部分c,满足分布P=(C=i,Z|)。当函数是凸函数(convex,fun
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 让小学生热爱英语学习的策略
- 设备维修保养合作
- 语文要素教学的方法探讨
- 货源稳定质量保证
- 质量保证书在购房过程中的作用
- 购买虚拟现实服务合同
- 购销合同与采购合同的合同范本
- 购销合同签订中的合同风险控制问题
- 购销奶粉合同范本
- 资产评估服务合同价值
- 核心素养导向下高校体育课程教学改革创新策略研究
- 金融工程学(第五版)第8章外汇风险管理
- 家禽集中屠宰建设项目可行性报告
- 安全学原理第2版-ppt课件(完整版)
- 材料库温湿度点检记录表模板
- led电子灯箱制作方法
- 《机电设备维修技术》课程标准
- 蓝紫色渐变插画风职业生涯规划PPT模板
- 《图形创意设计》PPT课件(完整版)
- 企业、事业专职消防队训练内容及操作规程
- 天津市武清区城乡总体规划
评论
0/150
提交评论