




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2016届计算机科学与技术专业毕业设计(论文) 毕业设计(论文)题 目 基于背景差分法的 行人检测研究 专 业 计算机科学与技术 班 级 学 生 指导教师 2016 年摘 要现阶段许许多多的监控类系统的运作进行方式依然需要很多相关工作人员不断地监视和分析视频内的场景,不仅没有休息时间,而且工作量特别大,实时性信息和监控实时性两者矛盾越来越明显。这便是研究本课题的意义,本论文阐述了本课题的研究现状、实现它所涉及到的背景建模方法、特征提取方法和背景更新等。此课题研究的内容是基于背景差分法行人的视频监控系统:在不需要人为进行干预的前提下,利用视频分析和机器学习等的一些方法,通过针对于截取到的图像进行
2、实时的场景以及目标物做出有可行性的分析,将摄像机截取到的视频图像的帧通过自动化的检测分析处理,进而达到对动态的场景中目标的行以及其和位置进行确定的目的,然后进行跟踪检测,并且对于检测到的目标的行为进行分析、语义的描述以及理解,实现模仿与人类相似的生物视觉和分析的功能。但由于很多的方法还是不够成熟和稳健,因此有必要做大量的研究以提高在较为复杂的环境中检测运动目标的成熟度和准确率,进而提高实用化的效果。此程序是以MATLAB进行实现,开始利用了混合高斯模型从当前复杂的背景图像序列中构建背景模型,此时首先需要使用方差、均值以及权值来进行计算建模所需要的数据,如马兹距离等,在此过程中,方差尽量大一些,
3、权值尽量小一些,这样有利于获得高斯模型;然后据此模型采用联通区域轮廓特征进行提取行人特征。在以上过程中以加权更新的方法构建实时的模型更新机制,从而规避了背景被污染。关键字:混合高斯,联通区域,特征提取,加权更新ABSTRACTTo present many monitoring of such systems works still need a lot of related staff continually monitoring and analysis in the video scene, not only no time to rest, and particularly large
4、 workload, real-time information and real-time monitoring is the contradiction is more and more obvious. This is we attentively studies the significance of this topic, this paper expounds this topic research present situation, implement it involved background modeling method, the feature extraction
5、method and background, etc.My study is the content of the video monitoring system based on background difference method pedestrians: on the premise of without the need for human intervention, using some methods of video analysis and machine learning and so on, through to the image on the real-time s
6、cene make a feasibility analysis, and target of the camera to capture the video image frame through the analysis of the test automation processing, thus achieve the goal of the dynamic scene line as well as its purpose, and location to determine and track detection, and to analysis the behavior of t
7、he detected target, the semantic description and understanding, imitation is similar to human biological vision and the analysis of the function. But as a result of a lot of methods are not enough mature and steady, so it is necessary for us to do a lot of research in order to improve the moving tar
8、get detection in complex environment of maturity and accuracy, and improve the effect of practical application. This program based on matlab implementation, began using the gaussian mixture model from the current complex background image sequences to construct background model, first you need to use
9、 at this time, the mean and variance weights to calculate needed for modeling data, such as horse, distance etc., in the process, the variance as far as possible a few bigger, weights of less as far as possible, that is conducive to gain gaussian model; Then according to this model USES the unicom a
10、rea contour features extracted to pedestrians. In the process of the above with weighted update method to build model of real-time update mechanism, so as to avoid the contamination in the background.Key words:mixed gaussian,connected regions,feature extraction,weighted update目 录第一章 绪论11.1选题背景及研究意义1
11、1.1.1 选题背景11.1.2 研究意义21.1.3在智能视频监控领域的应用31.2 国内外研究现状及发展趋势41.2.1 国外研究现状41.2.2 国内研究现状51.3论文主要工作51.3.1 主要工作5第二章 开发平台与背景差分法62.1 MATLAB平台62.1.1 MATLAB62.2 背景差分法7第三章 常用特征提取与更新方法简介113.1特征提取113.2更新方法14第四章 程序实现之背景建模164.1概述164.2高斯建模方法164.2.1单高斯建模方法174.2.2混合高斯建模方法18第五章 实验结果与结果分析235.1环境配置235.2程序运行截图245.2.1程序界面24
12、5.2.2加载视频图245.2.4设置检测区域255.3结果实验分析27第六章 总结与展望276.1总结与展望27毕设总结29致 谢30参考文献31第1章 绪论1.1选题背景及研究意义1.1.1 选题背景取得外部信息的方法百分之八十以上都是基于视觉图像信息,由于视频图像信息拥有特别的空间以及结构特性,经常使得它在人类进行各种活动的过程中需要的信息中拥有着不可被替代的重要地位。 1,比如计算机和电子显微镜以及超声波等。总而言之,数字图像处理技术涉及于各个领域。在二十世纪二十年代从英国的首府伦敦到纽约利用海底电缆使用数字压缩的技术传输了第一幅数字照片,产生了数字图像处理技术。在之后很久的一段时间,
13、在遥控感应等方面的管饭应用,图像处理技术渐渐的受到广大的关注以及逐渐开始发展。第三代计算机生长起来后,数字图像处理技术得到了快速的成长并且广泛应用与很多的领域。数字图像处理技术大放异彩是在CT发明以及在医疗上的应用和获得了“科技世界王冠级”的诺贝尔奖。现今数字图像处理技术己然成为计算机科学、医学、工程学、信息科学、物理、化学、生物学乃至统计学等的领域中研究的工具。数字图像处理技术在紧接着信息高速公路、数字地球等观点的提出以及Internet的广泛应用中它的需求量出现线性增长状态,数字图像处理技术带给人们巨大的社会与经济收益以及无限的便捷,它无时无刻不在影响着每个人,数字图像处理技术拥有着不可限
14、量的潜力,值得为它付出精力来挖掘它的光芒。计算机视觉是一门从数字图像处理技术和模式识别捆绑发展起来的的科学,它是用来研究机器怎么样去“看”世界的科学,通俗的说便是通过种种成象的系统来模拟人们的视觉器官作为图像信息输入的手段,计算机程序代替人们大脑完成分析,处理以及解释的功能,让计算机可以像人一样用视觉观察世界,用大脑思考世界,从而渐渐自动地生成适应环境的能力。现阶段计算机视觉已然广泛的应用于医疗治愈诊断、军事、监控检验、智能化生产、文档分析等领域。在社会的不停的发展与进步的过程中科技也是飞速的发展,伴随着的便是交通运输、金融银行、仓储管理、电力供应以及军事安全等方面的安全隐患日益增大,需要不停
15、的改进对安全的防范技术,也是由于这些,加速了视频监控系统的飞速发展,但是他也是把双刃剑,视觉信息文件出现膨胀的现象。1.1.2 研究意义现阶段绝大多数的视频监控系统的工作模式仍然是工作职员不间断地监视分析场景内的活动、日夜值守、工作量杂冗,导致了视觉信息文件出现膨胀的现象和监控实时性两者矛盾日渐突出。拥有智能的视频监控系统,不需要人为干预情况,直接利用机器视觉和视频分析的方法,通过截取到的图像信息,对实际存在的目标物体以及场景做出需要的特功能定的判断,对摄像机截取到的视频图像序列自动化的分析,进而达到对动态的场景中目标物体活动的定位、跟踪以及识别和对它的行为活动进行分析 ,理解以及语义的描述等
16、的功能,最后达到模拟类似人类等生物器官如眼睛 大脑等所具备的功能。综上所述,在复杂环境下智能监控已然成计算机视觉领域值得深入研究的走在科技前端的研究方向之一。此课题的研究意义就是为了深入研究基于背景差分法的行人检测。本论文将通过对比各种特征提取方式的优势和不足以及对处理的结果进行各方面的综合的分析,最后探索研究更好的方法以及提出自己的意见。1.1.3在智能视频监控领域的应用当代的社会处在一个日新月异,状况千奇百怪的突发的状态,科技更加是走在处理问题的前沿,社会安全问题变得日益尖锐,从而显得视频监控的重要性愈发明显,与此同时,安全监控的难度也是愈发高,对视频监控的挑战也是越来越强。随着社会大众对
17、安全监控的要求提高以及硬件和网络设备性价比愈来愈高,随处可见的安全监控设备已经越来越普遍,规模也是越来越强大,耗费大量的人力来进行实时监控以及监控视频文件膨胀导致了根本就没有成为研发期望的事前监控警报的作用,最后竟沦为了在事情发生后的提取证据视频的设备 “亡羊补牢为时已晚”,因此智能化已然成为研究必然的发展方向。现阶段智能视频监控是各国政府以及学术研究人员均在密切地关注着监控系统技术的发展。它就像一簇火苗,以迅雷不及掩耳之势成为了计算机领域中近几年新兴起的一个应用方向。安全视频智能监控就是利用图像处理技术与计算机视觉结合的一门新型技术,通过对截取到的视频信息进行自动化以及实时的分析来对动态场景
18、中的目标物体进行定位、识别以及跟踪技术,然后在此基础上进行分析和判断截取到的视频中运动目标的行为,一旦出现异常的问题,就提前进行报警处理。之后再通过处理视频监控系统的方法使得提高视频监控系统的智能化水平,换一种说法就是说,在电子完全智能化的作用下,不需要进行人为的干预,将计算机进行模拟人体器官如眼睛以及大脑的功能,用分析,追踪对预先设计好的目标物体的方法,对它的行为动作进行解释以及做出相应的设计好的处理与反映。使用另一种描述方法将计算机程序对目标物体的行为用另一种可以便于理解的语句描述出来,使得人类不用浪费精力便可以轻松掌握控制人类所担心的安全问题采用这种技术,也就是说它可以模拟人来做人类做不
19、了或者是浪费精力的事情,降低人们的工作量。而本课题涉及的背景差分法就是可以达到智能的安全视频监控的方法之一。1.2 国内外研究现状及发展趋势一切的发展都是基于人们的需求而发展来的,而视频监控这一技术随着社会的发展渐渐的融入了人们的生活,但是随这科技的发展,智能的视频监控应景而生,它拥有宽广的使用前景,由此人们对它的研究也是渐渐深入。1.2.1 国外研究现状近年来国外出现了大量的卓著的相关于视频监控的研究文献如:一科技出名的美国便有一个系统:它可以进行多人的追踪以及对人体进行分割和定位,分割之后将人与物体分割一进行检测人有无带着物品,与此同时,检测人与物体的互动也可以进行简单的检测,在室外的环境
20、下检测人的行为更是不再话下,这个系统便是源自于美国马里兰大学(University of Maryland)所研究的实时监控系统;佛罗里达中央大学(University of Central Florida)研发的可以识别特别事件以及描述动态物体的行为的KNIGHT智能监控系统就是使用了机器视觉技术来检测监视区域目标的变化来实现的;而在一九九七年由美国国防高级研究项目署(DARPA, Defense Advanced Research Projects Agency)主管成立的主要有卡内基梅隆大学(CMU, Carnegie Mellon University)以及麻省理工学院(MIT, Ma
21、ssachusetts Institute ofTechnology)等的美国的十几家高等研究院校进行研究的大型视频监控项目,此项目的成果已然实现了在道路上对行人和车辆等的目标物进行分析、研究与追踪,实现的方法便是对视频监控技术的深入研究;在之后英国的雷丁大学(University of Reading)开发了VIEWS车辆交通监控原型系统,此系统就开始进行交互识别的琢磨以及基于行人与车辆的定位和追踪研究。随后,许多的大型企业也逐步将视觉检测识别技术投入使用中,如IBM等。1.2.2 国内研究现状我国的绝大多数科技类院校也投入了极大的精力在相关的研究上,首当其冲的就是自动化识别模式国家重点实验
22、室视觉监控小组所属的中国科技研究院研究设计的可以实现实时的追踪检测行人车辆并且外部变化干扰如光照、树干阴影等的情况下已然健壮的交通监控原型系统(Vstar, Visual Surveillance Star) ;较为出名的对本课题有相关研究的还有西安电子科技大学电子工程学院模式识别与智能控制研究所、上海交通大学航空航天信息与控制研究所、桂林电子科技大学图像所等研究机构、华中科技大学图像识别与人工智能研究所等。1.3论文主要工作本课题主要是从特征提取以及构建背景模型两方面进行实现。在实现基于背景差分法的行人检测的特征提取方面,程序是选用了联通区域轮廓特征提取的技术来实现的。在实现基于背景差分法的
23、行人检测的构建背景模型方面,在本课题的实现和论文中则是选用了混合高斯方式,本方法使用的是利用正态分布曲线精确地量化事物,它把各个完整的事物分解程几个或几十个甚至更多的正态分布曲线形成的模型 。通过将目标的背景图像建立高斯模型来实现的。而在此过程中出现的灰度直方图则代表的是目标图像灰度的值出现的频率。智能的监控作用检测的是中心的位置,然而背景目标对于运动目标物体的检测过程中对目标的操作非常紧要,这也是为何需要建模灰度直方图一般是双峰和多峰的,一般情况下,多峰是像医学类图像一样比较复杂的图像,就是将多峰理解为许多个正态分布曲线叠加而成的,那么这样就比较容易处理图像的分割问题了;双峰是指目标图像的背
24、景和目标区域在灰度方面有一些差异,而在其它方面也差异颇大。那么它的一个峰对应背景的灰度,另一个峰则对应于目标的灰度。 第2章 开发平台与背景差分法2.1 MATLAB平台 MATLAB出自于美国MathWork公司研发的数学软件,它的基本数据单元是矩阵,它被用于它的指令表达式与数学、工程中常用的形式极其相似,因此相比较于C/C+等的编程类语言来说要简单很多,而且由于它吸收了很多软件的优点,如Maple等使得它拥有强大的数学处理能力,类似于难度较大的数值与符号计算的功能让操作者可以从计算的痛苦中解脱出来。此外,简单的界面设计方法和直接拖动控件的方式是初学者更快掌握的点,而且它的控件非常丰富而且简
25、单实用;由于它拥有非常完善的处理图形的作用让MATLAB的变成变得可视化;下面简单的介绍一下MATLAB的特性强处理能力与图形处理。1、强处理能力MATLAB拥有丰富的数学方面运算的函数,既包含快速傅立叶变换、微分方程及偏微分方程的组的求解、稀疏矩阵运算、多维数组操作、工程中的优化问题、数据的统计分析复数的各种运算、建模动态仿真、符号运算、三角函数和其他初等数学运算、矩阵运算和线性方程组的求解等的复杂函数,也包括特征向量、矩阵等的初级函数这些函数都能非常容易的达到使用者需要的功能。它被运用于600多个工程中,每一个函数内置所用到的算法基本上属于科研界的最新、最成熟的研究成果,这些算法是解决了容
26、错处理以及功能的处理优化的,它是一个包含大量计算算法的集合。如果在同等的情形下,MATLAB相较于C、FORTRAIN,对于使用者而言,它的编程量与计算量会少很多。2、图形处理MATLAB可用于科学计算和工程绘图。基于在旧版本的基础上讨论,他制图功能就非常强大,此功能的制图可以是表达式作图、图象处理、二维、动画、可视化的。它可以将矩阵以及向量通能够打印和标记注释的图形表示出来,这一点就归功于它的对于数据的可视化功能。相较于旧版本,新的版本就显得强大的多,它在数据的可视化方面对于制图它不再只是拘泥于二维三维,在四维方面也有了此方面的功能,在其他方面它也有了提高,例如对于光照以及色度,MATLAB
27、同样表现了出色的处理能力。与此同时,它也增加了很多功能型函数以及在显示界面的设计上也有了极大的提高。2.2 背景差分法背景差分法就是基于运动的目标物体的检测方法之一,它就是通过对实时得到的背景图像对应像素值与当前帧图像像素值做减法处理,此时会有两种情况,第一种是得到的结果会小于某一确定的数值,此时确定这一个像素点属于场景背景;第二种是得到的结果会大于某一确定的数值,此时确定这一个像素点属于目标背景,然后将该确定值分割后进行二值化处理获得所需要的目标物体的具体信息,如它的形态、位置等。视频图像预处理的作用即是将开始输入的视频图像的信息翻译成在后处理的阶段用到的格式。此时第一步基本都是进行去噪处理
28、,减少干扰信息,就像在天气晴好的情况下光照、树荫等。之后就需要关注所要处理的数据的格式转换,此时降低视频图像的尺寸就迫在眉睫了。相比较于以前灰度图像处理的频率,彩色图像处理渐渐的出现在社会大众生活中,此时场景背景就会变得难以处理,但是目标背景就会更加容易提取。然而在后处理的时间就是在处理预处理翻译好的场景背景。背景差分法的基本的处理的过程如图2-1:输入视频预处理背景建模前景检测滤波处理运动前景反馈图2-1视频图像的处理过程背景差分法在建模的基础上,通过对实时得到的背景图像对应像素值与当前帧图像像素值做比较处理来检测运动的目标物体的方法之一。由此可见,背景的建模是至关重要的步骤之一,系统对它的
29、精确度要求很高,那么面临的挑战就是场景背景它是变化多端的并且属于不可预测事件,它会有很多干扰,就像道路旁的树荫、天气变化导致的变化雨雪,阳光,嘈杂的叫卖声,施工的声音以及硬件障碍,就需要要不断的改进来处理诸如此类的问题,因为所有的检测算法的基本准则是要适用于越多的场景背景越好。背景差分法的缺点就是对于外界变化的抗干扰能力差。而它的优点就是在背景图像提取过程中,面对难以获得静态不动的背景,在这里选择利用动态背景的动态的变化,进行背景的实时更新,利用输入的视频图像的图片帧信息以及背景的恢复以达到背景图像的提取,非常容易实现且准确率高。 2.2.1 混合高斯模型混合高斯模型利用正态分布曲线精确地量化
30、事物,它把各个完整的事物分解程几个或几十个甚至更多的正态分布曲线形成的模型 。它是使用方差以及均值来确定的,一旦使用不同的学习模式,那么模型的收敛性、稳定性以及精确性就会不同。通过将目标的背景图像建立高斯模型来实现的。而在此过程中出现的灰度直方图则代表的是目标图像灰度的值出现的频率。它是利用三到五个高斯模型来表示视频图像的每一个像素点的特征,就需要在最新帧的视频图像信息之后继续更新模型,使用当前图像里面的各个像素点和混合高斯模型进行比较,如果匹配成功,那么这一像素点即为背景点,反之如果不成功,即为前景点。2.2.1.1单高斯分布模型单高斯分布模型它就是将视频图像里面的每个像素点的灰度值假设为一
31、个个的随机的过程,与此同时,将该点的像素灰度值出现的频率看作呈现高斯分布,用数学形式表示为式(2.1):式(2.1)2.2.1.2多高斯分布模型多高斯分布模型就是进行混合运用来模拟复杂场景的多模态,它是利用任意一个高斯分布就可以模拟一个背景的场景的原理,用几个叠加的高斯分布来模拟一个视频背景图像的像素点来建模。2.2.2中值法背景建模中值法背景建模:首先,确定一个时间段,在此期间,提取一段连续的视频图像序列,然后将选取的这一段图形序列所对的像素灰度值的大小进行排列(从小到大),最后就需要提取排列后的序列的中值当作是背景图像的像素灰度值。2.2.3均值法背景建模均值法背景建模算法与中值法背景建模
32、很相似,首先,确定一个时间段,在此期间,提取一段连续的视频图像序列,然后将选取的这一段图形序列所对的像素灰度值的累加后求均值,最后需要提取该均值当作是背景图像的像素灰度值。它的优点是运算速度很快,缺点是它对外部的变化大的视频是不适用的。2.2.4卡尔曼滤波器模型卡尔曼滤波器模型的基本思想是在Kalman滤波理论的基础上利用时域递归低通滤波的原理检测变化迟缓的背景场景,将远景图像默认为噪声,在持续更新背景场景以及保持稳定的背景的基础上,消除来自于外部的干扰声音。2.2.5高级背景模型高级背景建模获取到的是每个像素或一组像素的时间序列模型。第3章 常用特征提取与更新方法简介3.1特征提取特征提取即
33、是把视频图像上的每一个像素点划分成各自属于的集合,每一个集合可以是连续的区域,也可以是连续的线,更可以是独立的点集。换一种说法就是将模式的检测值变化来提取该模式的特征,简单的来说就是使用影像的分析以及变换来提取特征。它是结合图像处理技术和计算机视觉的观点。行人特征描述基本可以分为以下的三个方向: 底层特征、基于学习特征和混合特征。底层特征就是基于纹理、颜色等的图形特征;基于学习的特征就是在众多的行人样本里面提取到的行人特征;混合特征就是众多的底层特征的混合;3.1.1 基于Haar小波特征的方法Poggio和Papageorgiou最早提出Harr小波的概念;随后真正加快特征获取速率以及把这个
34、方法使用在行人检测方法的是Viola等提出的积分图的观点,它同时利用外观模式与人体运动来创建行人检测系统,并且取得了很好的结果。3.1.2基于Hog特征的方法HOG随着Zhu等人提出积分直方图,使得HOG特征的计算速度得到了极大的提高,与此同时,在Adaboost算法构建级联分类器结合多尺度的方法基础上,建立了行人检测系统,它不同于以前,它是一个快速的系统。也使得HOG成为了现阶段应用的最多的行人特征方法。在二零零五年随着梯度直方图的提出与将之利于与行人的检测,不仅在包括背景、视角以及光照等的法国国家信息与自动化研究所的行人数据库上的检验成功率高达百分之九十,更是在在麻省理工学院的行人数据库上
35、得到接近于百分之百的成功率;之后Qu等人又在无背景情况下提出了HOG特征,此观点不仅加速了HOG特征提取的速度,而且消除了通常情况下的背景因素对目标HOG特征的影响,与此同时实验表明了该方法相较于传统HOG特征提取的方法在处理视频中的行人检测时结果会比较好;Wang等人将HOG特征与局部二值模式相结合,用于存在部分遮挡情况下的行人检测,使用线性支持向量机作为分类器,在法国国家信息与自动化研究所行人库上获得了百分之九十七的检测率。其缺点是拥有运算的复杂度比较高,导致了不适用于实时的使用3.1.3 基于edgelet特征的方法BWu等人将短的直线或曲线使用到单幅图像的复杂场景的行人检测中即是所理解
36、的“小边”,它使用Edgelet特征将已经知道类别的物体来分割以及检测,并且取得了较好的结果。它因为每一个Edgelet特征都需要手动标定,使得比较耗时而且费力,甚至本身比较复杂的一些曲线,用手工来标定符合人体曲线的“小边”特征会显得非常难。 Edgelet特征的优点是:1)受光照影响较小;2)对于处理的过程中行人出现干扰遮挡或者视角姿势的变换不是特别敏感; 3)目的是剔除背景中与Edgelet在形状上相似的边缘,原理是方向信息与边缘的强度; 4)由于需要存储的只有方向信息以及片段的位置,所以使得存储的空间比较小以及匹配计算也较简单;3.1.4 基于轮廓模板的方法基于轮廓模版的方法用过图像中目
37、标物体的灰度信息、边缘轮廓以及纹理构建模板,使用构建的模版通过匹配的方法来进行检测。基于人体边缘轮廓的模板识别方法用以检测行人是Gavrila等较早提出的;这种方法能够更好地表示人体外观,他是在此方法基础上将人体的形状特征与边缘信息相结合来的。这种方法的优点是非常简单便于操作,其原因是因为它没有必要对特征提取处理以及图像进行分割,只需要在最初始的数据上运算,使得全部的图像信息得以保留;它的缺点可能出现分类错误以及需要构建很多的形状模板才可以得到较好的匹配效果,出现这种状况的原因是出自于行人形态均不一致。3.1.5 基于运动特征的方法现今的一段时间很多的研究人员都投身于把目标的运动信息深入到行人
38、检测系统里面,以此同时并结合别的静态特征。其中比较具有代表性的算法包括:(1)Dalal等提出将基于外观的梯度描述子和基于运动的差分光流描述子相结合来构建行人检测器,它是针对于针对摄像机运动的情况,缺点是这个方法仅仅检测单个窗口是有作用,而检测整幅的图像的效果则并不是特别的理想。(2)Viola等人针对摄像机禁止的情况提出在不同图像上计算Haar like特征,然后将运动信息与图像的灰度信息相结合构建行人检测系统。它的优点对于干扰条件多的情况,当然如果目标被遮挡的话效果也不会好;还有就是检测速度为很快,仅仅是4f/s(帧/秒),而且误检率很低较差。 3.2更新方法基于像素级和帧级的多层次动态自
39、适应背景更新方法是在背景随着着时间的变化而不可避免的产生变化的问题出现而提出的。它可以解决背景的更新不能匹配实时的背景变化、外部的干扰因素比较多如噪声。它提高了背景图像更新的抗干扰的能力以及对背景更新变化的相应速度。它是用来控制一些有可能像素点,防止它们从背景像素点转换为前景像素点,它的作用还有解决移入移除物体、处理变化较大且全局的问题如光照变化、在帧级时更新整个背景。像素级更新具体实现如下:(1)通过对当前帧图像与前一帧图像做差分求得图像中的不变区域Rfs,;使用相同的方法,前帧图像与背景图像做差分的处理,利用形态学运算与二值化得到不变的图像区域Rbs;Rb为不变区域的公共部分, Rs=Rb
40、sRfs。(2)将背景中没有出现变化的区域Rs使用公式确认的背景像素值替代。(3)由于新旧背景或许会有部分不一样的地方,在进行像素的更新时,需要利用中值滤波技术对替换区域的边缘附近以达到除噪声的目的,最后重新确定边缘的像素值。像素级更新方法的优点不仅可以准确地判断在监视的场景中,是不是可以处理像素背景更新以及监视的场景中是不是有运动的物体,而且继承了时间间隔图像差分方法对于场景微小变化,尤为明显的是光线变化,基本上有固定背景差分方法检测运动物体准确的优势且又消除了积累性误差。帧级更新具体实现如下:(1)首先有多少相邻的帧间灰度像素发生了突变,然后把它和图像总像素数相除,如果结果大于0.6(0.
41、6为一般的经验阈值Tf),说明发生突变的像素灰度值的数目是图像总像素数的很大一部分,那么就是说明图像发生帧级变化。(2)当然为了防止判断出现失误,就有必要确定连续的几帧都发生了全局变化,那么进行背景更新。帧级更新主要是适用于处理背景全局变化以及场景光线大范围突变的问题。背景更新基本过程首先是利用摄像机收集实时的图像,此时最开始的背景可以随意的选取,但是默认是用第一帧的图像来当作为初始背景图像,然后对收集的图像做背景差分、帧间差分以及综合分析,采用合适的处理方法统计静态像素,最后对背景更新进行多层次的自适应,进行帧级更新或者是像素级别更新。第4章 程序实现之背景建模4.1概述在此课题的研究过程中
42、,前景检测是机器重要的一环,它不仅仅是进行目标分析的基础步骤,更加是整个工程的基本要求。它的基本方法有背景相减法、帧间差分法以及光流法等,但背景详见饭即背景差分法是现今阶段在运动目标检测过程中最常使用的方法之一。它的基础性能是由选取的背景建模技术来决定的。因此对于运动目标检测的关键技术便是如何从实时的视频序列中建立高效并且实用的背景模型。对于运动目标检测的背景建模技术经常使用的方法非递归背景建模方法、线性预测模型、卡尔曼模型、高斯模型以及相对比较简单的均值、中值模型。上一章对于各种主流的背景建模方法进行了阐述以及比较它们的适用性以及相对性。在基于背景模型的基础上在视频信息中获取目标的运动的前景
43、的基本流程如下:首先在训练的阶段:对获取到的视频进行背景建模处理;其次在检测阶段:用检测的图像与背景模型进行减法处理即背景差分法;最后需要更新阶段:更新背景模型的参数如方差,权值以及均值等。4.2高斯建模方法如果在背景的运动变化相对比较缓慢并且它的干扰条件都是类似于风、雨雪或者光照,就像摄像机时固定在一个地方的这种情况下时,一般情况下,基本可以使用高斯建模技术来实现背景建模。将确定的图像序列的背景和前景进行分离开来。通俗的来说,就是将运动的目标物体与静止的背景分离开,前景就是运动的目标类似于行人、汽车等。就这样达到背景建模的目的。 4.2.1单高斯建模方法单高斯分布模型的基础是在所有的像素点都
44、在起所在的视频图像信息中呈现高斯分布状态。由于单高斯分布模型它对于光照的变化及其敏感,因此此模型适用于在较长时间段光照没有发生相对没有特别明显的变化;还有就是因为它在视频图像场景中存在运动的目标物体即前景时只有一个模型(单模态),所以只能检测的范围局限于在背景中前景的阴影相对而言的阴影相对而言小。不可以将前景和静止的背景分离开,否则会使得虚景率过大。单高斯建模技术其实就是计算在n帧训练视频图像序列里面所有固定的像素点(x,y)的像素值尽可能多的样本的方差、均值。也就是说,均值和方差就是单高斯背景模型需要的所有参数,得到它们就可以得到需要的模型。然后通过用背景差分法得到值与预设的阈值做比较,即依
45、据|I1-I|=3(I为均值,为方差)来判定在像素点是属于背景还是前景。在视频图像信息里面的所有像素点的数值在图像中的变化均能够看成不停生成像素值的一个个随机过程,用4.1.1表示:式(4.1.1)在上式中,为像素值,为图像序列,像素点的横坐标和纵坐标分别用和分别表示,表示序列图像的帧号。单高斯分布背景模型一般来说适用于单模态背景情况下的建模,在分布密度函数中,表示的是t时刻高斯分布的均值,而下标t表示的是时间,则表示为高斯分布的协方差。单高斯分布用单个高斯分布来表示每个像素点的颜色数值的分布。假定某一个像素点此时的颜色值为,如果若计算所得的值小于预先知道的阈值,则此像素点便属于背景,它匹配于
46、高斯分布;否则,此像素点就是属于前景。单高斯分布模型的背景更新就是描述视频图像信息场景背景的高斯函数所对应的参数更新,学习率就是指参数更新的速度,此时像素点的高斯分布参数的更新便使用式(4.1)进行:式(4.1)其中,是当前背景图像中像素点的灰度值,同时又是高斯分布的均值,则为当前帧像素点的灰度值,参数更新后背景图像的灰度值则用表示。学习率用表示,当目标被检测为运动前景时,就可以取值为0,背景模型参数可以取经验值,若该值取太小,会使背景模型跟不上实际场景背景的更新速度,若取值如果太大则可能将速度较慢的运动目标更新成为背景模型的一部分,使运动的目标检测可能会出现空洞与拖尾的现象,丢失运动前景目标
47、甚至也是有可能的。单高斯背景模型适合处理有变化很小的与变化特别慢的比较简单场景,如果是较复杂场景而且背景变化很大甚至发生突变,或者当背景像素值是多峰分布(如细小动作的重复运动)时,那么背景像素值的变化将会比较快,此时单高斯背景模型就不能处理这种情景了,不能够精确地描述背景了。 4.2.2混合高斯建模方法 混合高斯建模的方法是把每个图像按照许多个高斯分布混合进行建模的,同时应对多种背景的变化。这是为了解决在单高斯建模无法处理背景中有运动目标的一系列问题,就可以引入混合高斯模型,对背景的每个状态分别进行建模,依据数据是属于哪个状态来进行更新这种状态的模型参数,这样也就克服了在运动背景下的背景建模问
48、题.但是如果当背景中的状态比较多时,这种模型在对背景建模时还会遇到许许多多的问题.在很多应用场景,如湖面的涟漪、摇曳的树叶、飘扬的国旗等,像素点值都将会显现出多模态的特性,无法使用单高斯模型进行估计背景。例如,当叶子在晃动时,它会反反复复地挡住某一个像素点然后又离开,此时这个像素点的值会发生一个周期性的变化,任何一个单峰分布都将无法描述此时这个像素点的背景。为了能够有效地提取感兴趣的运动目标,把晃动的叶子看作背景,这里可以采用混合高斯背景的模型为这些像素点来建立多峰分布模型,定义了合适的像素级稳态准则,只要满足此准则的像素值就可以认为是背景,那么在运动目标真正检测时可以考虑予以忽略。对于特定的
49、应用情景,如果想对特定某种算法的缺点与优点进行比较评价,那么一定要明确这种像素级稳态准则。基于混合高斯建模的基本方法,就是根据读取N帧训练图像,然后可以每次对每个像素点进行迭代建模。下面假设K为每个图像所允许的最大的模型个数,初始时设个初始值的标准差。每当输入一幅训练的图像时,此时将它用的像素值来更新原来的背景模型。对于一个特定的某个像素,如果当它的像素值与某个高斯模型的均值的差小于2.5倍的标准差,那么就可以认为这个像素和该模型相适应,然后再用它的像素值来更新这个模型的均值与方差,如果当前像素值模型的个数小于K,那么为这个像素点建立一个新的模型。如果已经判断了K个模型,并且它们全部都不符合条
50、件,那么就可以把权重最小的模型更替为新的这种模型,新模型的均值即使该像素点的数值,此时再设定一个的初始标准差,如此反复的进行处理,直到所有帧训练图都能够训练通过。处理波动能力与K值密切相关,K值越大,则处理波动能力越强,相应所需要的处理时间也就越长。K个状态中每个状态用一个高斯函数表示,这些状态一部分表示背景的像素值,其余部分则表示运动前景的像素值。若每个像素点颜色取值用变量表示,其概率密度函数可用如下K个三维高斯函数式(4.2)表示:式(4.2)上式中是t时刻的第i个高斯分布,其均值为,协方差矩阵为,为第i个高斯分布在t时刻的权重,且有,其中 式(4.3)式(4.3)中d表示的维数。当对灰度
51、图像用混合高斯模型进行背景建模时,取d=1,处理起来比较容易。当对彩色图像建立高斯模型时,为了减少计算量,提高算法的实时性,一般假定每帧视频图像中各像素点的R,G,B三颜色通道相互独立,并具有相同的方差,则协方差矩阵取值为式(4.4):式(4.4)在高斯建模过程中,比较当前像素值与该像素K个高斯模型,如果满足公式4.5:公式(4.5)则认为该像素与第i个高斯模型相匹配,更新混合高斯模型;若找不到与当前像素值相匹配的高斯模型,则创建一个新的高斯模型添加到背景模型中。创建高斯模型和更新混合高斯模型的具体方法如下:创建新的高斯模型将当前像素值作为高斯模型的均值,选取较大的方差和较小的权重,以式式(4
52、.2)创建一个新的高斯模型。更新混合高斯模型假设t时刻的像素值与第m个高斯模型相匹配,更新第m个高斯模型的各参数:式(4.6)式(4.7)式(4.8)对于其它高斯模型,均值和方差不变,只对权重做如式(4.8)的调整:式(4.9)其中,模型学习率由用户指定,;参数学习率。混合高斯模型在构建过程中,将各高斯模型按照优先级顺序排列,优先级定义式(4.9)。式(4.10)高斯建模的流程如图4-1所示这就相当于为每个颜色通道各建立了一个一维混合高斯模型。在YUV颜色空间进行混合高斯背景建模,也可以作类似处理,认为Y,U,V相互独立,在每个颜色通道各建立一个一维混合高斯模型。这就是混合高斯背景建模的基本原
53、理。在将上述的叙述综合起来便可以得到混合高斯背景建模相对于单高斯模型来说,尽管处理复杂的场景的时候并不是特别的适用,但是对于比较简单的场景还是拥有很好的效果的。而在实际的应用里面混合高斯背景建模算法的不适用性主要表现于(1)由于混合高斯背景建模算法需要预先对视频图像中的所有像素点的灰度信息都进行包含K个高斯函数的混合高斯模型的建立,而且所有的高斯函数中都包含这w、z、c这三个参数,在得到每一个新视频图像帧后必须要将所有像素点的以上三个参数进行更新,加之如果再考虑到灰度信息的问题以及所有的像素点的颜色通道即三原色,那么就需要对视频图像信息中包含的所有像素点的三原色均建立一个包括K个高斯函数的高斯
54、模型,由此便导致了该混合高斯模型的计算量特别大,那么就难以实现用户对实用性的需求;是否是横行初始化横行按W/S排序是否有匹配是否为背景引出新模型代替排序最低模型当前点为前景当前点为背景更新模型的参数与权重更新模型的参数和权重当前点为背景当前点为前景更新模型的参数和权重图4-1混合高斯建模流程(2)对一个复杂的场景而言,每个像素点只有3一5个状态是不太准确的,因为动态的场景中会发生很多变化,一旦多于这个状态个数,则会出现错检,使检测的效果很不理想,这就是算法实时性和准确性之间的矛盾所在。(3)对每个像素点定义了K个状态,这就要求对场景有一定的先验知识,影响了算法的普遍应用。其次,K的取值与算法实
55、时性和准确性有很大的关系,K越大,算法虽然越精确,但实时性会降低,其计算量将更加难以负荷,因此很难满足应用系统对算法实时性的要求,这严重限制了混合高斯背景模型在智能监控系统中的应用,为了保证实时性,K的取值范围一般在3一5之间。因此,需要一种应用更为普遍的算法,即使在背景很复杂的情况下,仍能对背景进行准确建模,从而很好地分割出前景目标。第5章 实验结果与结果分析5.1环境配置在这里,基于背景差分法的行人检测研究程序实现是在32位WINDOWS7下,使用MATLAB 2012a的版本实现的。MATLAB的配置教程多且简单,在这里就不再作介绍了。5.2程序运行截图5.2.1程序界面图5-1图5-1
56、程序界面图5.2.2加载视频图5-3图5-2加载视频后的图像5.2.4设置检测区域图5-3、图5-4图5-3 设置检测区域图5-4设置检测区域5.2.4检测效果图5-5程序效果图5-6程序效果5.3结果实验分析综上所述和实验结果截图展示,可以发现:背景差分法在运用了以混合高斯模型,结合联通区域轮廓特征提取的方法,可以有效的提取出视频中运动前景的行为和动作,以及其位置,且效果较好。第6章 总结与展望本文对智能视频监控系统中的运动目标检测技术进行了基本层面的研究。首先对智能视频监控系统的发展历史以及现状进行了一系列的论述,简要的阐述了智能监控系统应用远景。在之后针对运动目标检测,说明了视频图像预处
57、理的必要性,图像的预处理可以有效地利用中值滤波的方法进行消除噪声,中值滤波作为非线性滤波方法,它既能够保护视频图像信息的完整性且针对消除噪声非常有效,改善图像质量与格式,使图像清晰以及方便后处理阶段的操作。在分析比较了几种常用的运动目标检测的方法之后,选用了背景差分法,因为这个方法可以直接得到运动对象的位置、大小、形状等信息,并且能够完整准确地提取运动目标的信息,简单实用,易于实现,因此本文采用背景差分法来实现运动目标的识别,并取得了比较理想的效果。由于智能视频监控系统有很广泛的应用前景和经济价值,所以智能视频监控技术是一个很热门的研究课题。如何使得智能视频监控系统具有更好的准确性和实时性,是一个需要研究的方向。该领域所涉及的研究内容十分广泛,本文尚存在一些不足之处有待改进:(1)在一个较为复杂的环境里进行运动目标物体智能的检测与识别依然是需要研究的一个方向。(2) 如何排除背景环境变化的影响也是一个需要深入研究的问题。(3)当运动物体的颜色和背景相近时,经过差分处理运动物体就有可能被忽略。(4)利用双摄像头对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财务审计中数据分析方法试题及答案
- 产品市场占有率下降原因分析法律分析重点基础知识点
- 模具设计中的市场调研试题及答案
- 刷题神器农业植保员试题及答案
- 2024农业植保员考场表现试题及答案
- 农作物种子繁育与环境保护的关系试题及答案
- 应用知识农业植保员试题及答案
- 了解体育经纪人考试的2024年试题及答案
- 尿管拔除后的护理
- 项目执行难点分析的试题及答案
- 粗饲料粉碎机的设计(全套cad图纸)
- 责任商业联盟RBA(CSR)知识培训
- 钡安全技术说明书MSDS
- 承插型盘扣式脚手架作业指导书
- LY/T 2588-2016林业有害生物风险分析准则
- 2023年广州市黄埔区中医院康复医学与技术岗位招聘考试历年高频考点试题含答案解析
- 江苏省民用建筑施工图绿色设计专篇参考样式2021年版
- GB/T 34720-2017山羊接触传染性胸膜肺炎诊断技术
- GB/T 24368-2009玻璃表面疏水污染物检测接触角测量法
- GB/T 18901.1-2002光纤传感器第1部分:总规范
- GB/T 1282-1996化学试剂磷酸
评论
0/150
提交评论