图像视频制导_第1页
图像视频制导_第2页
图像视频制导_第3页
图像视频制导_第4页
图像视频制导_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电视成像制导电视成像制导技术就是指利用位于导弹前部的电视成像系统获得目标的信息,经过一系列算法的处理,从而制定出相应的控制命令,导引武器的运行,达到精确命中目标的制导技术。指令制导指令制导这种制导方式是利用武器外部的电视成像探测设备捕获目标信息,经过测算形成控制指令之后,发送给武器导引系统,从而命中目标。遥控制导遥控制导这种制导方式是利用武器本体携带的电视成像探测系统,探测到目标信息之后,发回到地面控制中心,由控制中心测算形成控制指令之后发送给武器,从而准确命中目标。寻的制导寻的制导这是由武器本体携带的电视成像系统完成目标识别与跟踪,结合控制导引系统,形成控制指令,最后导引武器命中目标的等一系列过程的制导方式。这种方式脱离了人工的参与,大大节省了资源,制导效果良好。红外制导红外成像制导是利用目标和背景的热辐射温差,形成图像来实现白动导引,具有分辨率高、抗干扰能力强,隐蔽性好、白主捕获目标,昼夜工作能力强等特点。目标的热辐射和周围环目标的热辐射和周围环境的差别越大,红外制导的精度越高,所以它对目标的热辐射能力有非常高的依赖性。光纤制导光纤制导是指导弹距离目标较近时,光纤导引头将目标及背景的图像信号采集下来,经过光纤双向传输系统传回地面的导弹轨迹监视系统,通过操作员对图像进行搜索、识别和捕获目标,生成的控制指令经过上行线传到导弹,控制导弹精确命中目标的制导技术。基于图像的目标识别与跟踪被认为是电视成像制导的核心技术,是捕获目标信息的关键手段,被大量应用于武器装备的末制导中。基于图像的目标识别与跟踪技术分为以下几类:基于模板的跟踪与识别基于模板的识别与跟踪方法是比较典型的图像处理方法,它利用预定义的一系列模板或者模型,在得到的电视成像即图像序列中寻找目标,即在一幅大图像中搜寻与模板有相同的尺寸、方向的图像,通过一定的算法可以在图中找到目标,确定其坐标位置,更先进的一些算法可以融合其他高效的预测算法,根据目标在相邻图像间的位置不同,预测出一张图片中可能出现的位置,缩小模板匹配的范围,从而缩小匹配时问,提高实时性和精确度。基于统计学的跟踪与识别基于统计学的方法是通过对大量的样本和非样本进行学习和统计,得到一系列的统计特征,根据得出的这些统计特征来判断图像中是否有和样本中很接近的目标,从而达到检测目标的目的。因为它的统计特征都是从样本当中获取的,不会依赖先验的模型,避免了先验模型不完整不精确等错误,同时具有一定的在线学习,实施扩展的能力,在算法的鲁棒性上有明显的优势,所以成为了当前比较热门的识别方法,常见的有神经网络、支持向量机和BOOSC等方法,但是它的缺点就是必须在检测和识别目标之前,进行样本学习的训练,形成有效的样本统计特征,这种样本的训练往往是比较费时的。基于运动的跟踪与识别基于运动的识别与跟踪方法也是常见的图像处理方法,它根据检测相邻图像当中像素值的发生变化的部分以及变化的方向,来确定运动的物体或者目标的位置和速度等信息,在检测目标的同时还给出了时间维度上的信息,因此应用也相当广泛,算法非常多,其中比较常见和成熟的算法有差分法、光流法和meanshift算法。差分法因为其简单快速的特点得到很好的应用,但是它的缺点也很明显:得到的目标信息的准确度不能保证,而且对光照很敏感;光流法原理是通过赋予图像中每个像素点一个速度矢量,根据相邻图像之间的变化,确定这些速度矢量,如果它们在图像中不是连续变化的,那么就可以通过这些像素点确定运动的物体,但是光流法最大的瓶颈在于它的计算复杂度,很难在实时的环境中运用;meanshift算法近年得到很多的关注,它的实时性和鲁棒性都趋于平衡,能够较好检测目标的位置信息,在将它扩展到连续图像中时,就形成了camshaft算法,和meanshift算法一样,它利用图像中的颜色信息来捕捉目标,将上一时刻得到的结果传递到下一时刻中,所以继承了meanshift算法的一些优点,但是主要适用于与背景存在色彩差异的彩色目标,识别跟踪效果良好。基于区域的识别与跟踪基于区域的识别与跟踪方法是根据图像全局信息之间的联系,来确定相邻图像相应部分的确定关系,从而确定目标的一类方法,这样的算法相对消耗时间要长,所以在实时处理中很难运用,需要结合其他多种信息。近年出现了一种新的基于区域的识别方法:显著性区域检测,这是根据人类视觉习惯和特点发展起来的一种方法。基于特征的识别与跟踪基于特征的识别与跟踪算法建立在多种多样的图像特征点上,通过检测这些特征点,来确定具有某种特征的目标是否出现在图像上。常用的特征检测算法有SIFT/SUFT,Haar和FAST等等,其中Haar是相对比较成熟的一种特征检测算法,它应用非常广泛,可以充分描述目标的特征,计算方便,常常与AdaBoost算法结合起来,形成以Haar特征为基础的学习过程,输出学习大量样本之后的结果,作为目标检测的有效训练集。基于图像的目标识别与跟踪技术的难点:图像质量的下降对目标识别跟踪的影响。在图像采集和传输等过程中,不可避免地要受到各种噪声的污染,这些噪声会导致图像质量下降,目标特征的模糊,影响识别跟踪的精度,因此图像去噪一直是基于图像的识别跟踪领域研究的重点。天气等不可抗因素对目标识别跟踪的影响。在真实的战场环境中,天气环境等因素瞬息万变,加上各国对天气武器的研制力度持续加大,未来战争中,天气因素的影响将进一步加强,如何在恶劣的天气环境下保证精确打击武器的精确度,将成为图像制导技术或者其他受环境影响的制导技术研究的新的热点和难点。基于图像的目标识别跟踪算法的实时性。实际试验中,图像数据、大量传感器数据以及频繁的控制指令数据都是在并发进行的,对飞行器机载的处理系统要求很高,在硬件条件一定的情况下,如何选择一个快速的并且不影响传感器和控制指令数据传输的识别算法显得很重要。图像预处理噪声的产生大部分出现在成像,数字化和传输的过程当中,这时的图像往往表现为模糊不清,特征不明显,而在恶劣天气条件下(雾,烟,雨等)进行的拍摄,由于天气的影响,无法拍摄出对比度高的图像,同时由于空气中颗粒的增加,大气散射增加,会使图像整体效果偏向灰白色,在这种情况下对后续的操作处理会产生不利的影响,甚至会无法进行下去,所以图像增强在图像预处理中显得十分重要。图像去噪与锐化针对图像质量退化的情况,可以从几个方面入手:一是让色彩分布更均衡白然;二是增加图像的对比度,使图像具有丰富的细节;三是使图像内物体的边缘更加清晰。图像去噪噪声可以理解为“妨碍人们感受器官对所接受的信息理解的因素”,在理论上可以定义为“不可预测,只能用概率统计的方法来处理的随机误差”。噪声对图像的输入、采集和处理的各个环节以及最终的输出结果都会产生一定的影响,特别是在前期产生的噪声,那么一定会对其后的处理以及最终的结果产生较大影响,有的图像处理方法对噪声很敏感,必须在执行之前做去噪处理,所以图像去噪一直以来都是图像预处理领域的研究重点。常见的噪声有高斯噪声、椒盐噪声(脉冲噪声)和伽马噪声等,常见的噪声处理算法有均值滤波和中值滤波。均值滤波均值滤波也称为线性滤波,对图像中的高斯噪声有很好的去除效果,算法的主要思想就是求取像素点的邻域平均值,然后用这个平均值来代替原图像中的像素点值,例如原图像中的一个像素点(X,Y),选择一个以其为中心的模板,这个模板由(X,Y)相邻的若干像素点组成,求得模板中所有像素点值的均值之后,用这个均值替换(X,Y)的值,公式表示为:式中,avg(x,y)为均值滤波后的结果,N为模板当中像素总数,v为模板中的像素点值,M(x,y)为以(x,y)为中心的模板。均值滤波对高斯噪声确实存在很好的去噪效果,但是随着滤波窗口的增加,虽然高斯噪声越来越少,图像的边缘也变得越来越模糊了。中值滤波中值滤波是一种非线性的滤波算法,它是基于排序统计理论的一种图像去噪算法,对图像中的脉冲噪声或者椒盐噪声有很好的去除效果,其原理是将原图像中,以某个像素点为中心的模板内的所有像素值以大小排序,然后选取序列的中间值作为输出的像素值,代替原来的中心像素,这样做就可以让与周围像素值差距比较大的像素修改成与周围像素差不多的值,消除图像中的“椒盐”。即一组数N1,N2…Nn,把n个数按照值的大小排列成一个序列,选取中值为:例如:有一个序列为{1,2,5,13,6,4,7},按照大小重新排序后为{1,2,4,5,6,7,13),则Med{1,2,5,13,6,4,7)=5即为中值输出以此中值5代替原序列的中问值13,则滤波后的序列为{1,2,5,5,6,4,7}。中值滤波对椒盐噪声(脉冲噪声)确实存在很好的去噪效果,但是随着滤波窗口的增加,虽然椒盐噪声越来越少,图像的边缘也变得越来越模糊了。图像锐化图像平滑往往使图像中的边界、轮廓变的模糊,为了减少这类不利效果的影响,这就需要利用图像锐化技术,使图像的边缘变的清晰。在图像处理中进行图像锐化的目的主要有两个:一是通过图像锐化增强图像的边缘,使模糊的图像变得清晰,这种模糊可能是采集图像的时候就产生了,也有可能是在锐化之前所做的图像处理操作产生的;二是提取目标的边界,方便对图像进行分割,方便对目标物体的识别。执行图像锐化操作之后,使图像的质量有所改变,变得更加适合人眼的观察或者机器的识别。恶劣天气条件下的图像增强直方图双向均匀化直方图均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化的基本思想是把原始图的直方图变换为均匀分布的形式,这样就增加了象素灰度值的动态范围从而可达到增强图像整体对比度的效果。直方图均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化的基本思想是把原始图的直方图变换为均匀分布的形式,这样就增加了象素灰度值的动态范围从而可达到增强图像整体对比度的效果。图像的直方图是表示图像当中像素点灰度值的一种分布概率,作为直观表现图像信息的一种方式。假定一幅图像像素点的灰度值从0到255随机分布,那么这幅图像最多具有255个灰度级,直方图就是将图像中每个灰度级的像素点的和统计出来,以横坐标为灰度级,纵坐标为像素个数和表示出来的二维图表。通过直方图的统计,会发现很多图片的绝大部分灰度级都集中在0到255之间的某个区间内,这样的图像灰度级不够丰富,使得对比度较低,直方图均衡化就是通过将图像中的像素点尽量分布到整个灰度级来增强图像的对比度。算法流程如下:1.首先统计各个灰度值上的像素点之和,并计算各个灰度值的概率。2.然后计算各个灰度值得的累计概率分布函数。3.通过累计概率分布函数,求得当前灰度值应该映射到的新的灰度值, 从而使灰度值均衡分布双向直方图均衡算法的主要原理是首先对输入图像进行直方图均衡化的处理,然后对经过一次均衡化之后的图像进行统计,找出在整个灰度空间(0-255)中像素个数不为零的灰度值有哪些,这些实际的灰度值之问的间距往往是不相同的,将这些灰度值等间距排列就完成了第二次均衡化,这样因为第一次直方图均衡化所导致的相邻灰度级之问的问距不等的现象就可以很好的解决,避免了第一次均衡化之后部分图像会出现失真的情况。其算法原理:首先用直方图均衡化对图像灰度值进行处理,再统计所有灰度值中像素点不为0的实际灰度值。把统计出来的实际灰度值进行重新排序,在整个灰度值区间内做等间距排列。原图像受到天气的影响,整体图像偏暗,显得模糊不清,直方图分布集中在中问区域,经过直方图均衡化之后,图像亮度明显增强,图像边缘更加清晰,直方图分布也覆盖了整个灰度空问,但是有的地方出现了过增强,有失真现象,经过直方图双向均衡化之后,图像的失真现象得到改善,图像灰度过渡更加白然,具有明显的优势。基于暗通道的图像增强何恺明博士等人提出,相关论文也曾于2009年荣获何恺明博士等人提出,相关论文也曾于2009年荣获CVPR最佳论文奖,同时也是该奖设立以来,首次由亚洲学者获颁此殊荣CVPR是IEEEConferenceonComputerVisionandPatternRecognition的缩写,即IEEE国际计算机视觉与模式识别会议。在雾天天气条件下,不同的悬浮颗粒对光线的散射作用和效果是不同的,结合散射函数,有人提出了大气散射模型。式中I(x)是人眼或者目标探测装置获取到的有雾图像在X位置处的值,J(x)是没有雾的情况下,清晰图像在X处的值,这也是我们需要的结果,t(x)为大气传递系数,它反映了光线穿透大气的能力,值越大说明有越多的光线穿过大气到达人眼或者探测装置,取值范围是[0,1],A是一个常量,称为大气光强,表示在无穷远处的光线强度。通过对大量自然图像的实验研究发现,自然图像在绝大部分区域当中,某些点的RGB三个通道中,至少有一个通道的值很低,也就是说,这些区域中的所有点的三个通道值的最小值往往非常小,甚至接近于0,这就是被称为暗通道的先验理论,用数学方程式表示如下:式中,是区域中三通道值的最小值,就是指这个区域,它以x为中心。产生暗通道的原因很多,主要由三点:图像中物体的阴影,比如建筑物的阴影,植物的阴影,岩石的阴影等等。自然图像中往往有比较鲜艳的颜色,比如红色的花,黄色的叶了,绿色的草地等等,这些像素点往往某个通道的值很高,而有的通道的值非常小。本身颜色就比较暗的物体,比如泥土,岩石,树干等等。算法流程如下:首先对雾天成像模型方程的两边同时取RGB三个通道的最小值,演变成方程如下式中,假设透射率t(x)在一个区域中保持不变,因此t(x)为方程中为常数,假设Ac为已知,且是正常数。在等式两边同时处以常数Ac,有:然后对图像的三个通道取最小值,有:观察上式可以看到,图像的三通道的最小值就是暗通道,由式(2-4)可知的值接近于0,就是说等式右边第一项的值近似为0,于是上式简化推导之后有:通过上面的推导可以计算出清晰无雾的图像,但是应该适当地保留一些空气散射的效果,即保留一点雾更符合实际情况和人眼感觉,对上式加入一个系数来控制,有:根据经验值,系数一般设置为0.95。对于第一步假定已知的透射率t(x)和大气光强值,可以运用下式来优化,来消除因为分区域计算而产生的“块效应”,有:式中,L是拉普拉斯抠图矩阵,为归化因了,U是单位矩阵,经过这一过 程之后,透射率将变得更加平滑和接近实际状态。假定已知的大气光强值可以从暗通道图像中求取,在暗通道图像中选取亮度值最大的0.1%像素,在这些像素中选择对应的有雾图像中亮度最大的像素,把该像素值作为A值,这样的计算方法比直接提出图像中天空的灰度值的方法具有更好的鲁棒性。最后,把计算好的t(x)和加入公式中,经过推导之后,得到清晰无雾的图像,有:通过对直方图双向均衡化和基于暗通道的去雾算法相比较,可以发现,后者具有较好的图像增强效果,且在雾天情况下更甚,但是相比直方图双向均衡化算法,算法消耗时问较长,做到实时处理有一定的难度。图像分割图像分割是计算机图像处理与目标识别技术中最为基础和重要的研究领域之一。图像分割实现了前景物体和背景物体的分离,这样可以让提取目标特征或者直接识别出目标更加方便高效,所以图像分割一直都是图像识别与跟踪研究的重点之一,受到人们的重视。基于视觉显著性的图像分割人类观察一幅图像时,总是首先会先注意到图像当中比较显著的部分,或者是比较重要的部分。图像中显著性区域的存在,来源于视觉系统的独特性,不可预测性,稀疏性以及奇异性,并且受到图像颜色、梯度和边缘等属性影响,这和人类如何处理视觉上刺激有关,目前是认知心理学、神经生物学和计算机视觉等领域研究的热点问题。人类的视觉注意理论假设人类的视觉系统只会详细地处理图像的某个局部,而不是整幅图像。这个理论的提出者们提议将视觉注意机制分为两个阶段:快速的、下意识的、自底向上的,数据驱动的显著性提取和慢速的、任务依赖的、自顶向下的、目标驱动的显著性提取。生物视觉研究人员通过对视觉显著性的观察认为,视觉系统对视觉信息的对比度是很敏感的,所以关注一种自底向上,利用全局对比度显著性检测算法,主要流程如下:首先将一幅RGB图像转换到CIEL*a*b*空间。CIEL*a*b*空问是国际照明委员会国际照明委员会(英语:InternationalCommissiononillumination,法语:CommissionInternationaledel´Eclairage,采用法语简称为CIE[1])是由国际照明工程领域中光源制造、照明设计和光辐射计量测试机构组成的非政府间多学科的世界性学术组织,是技术、科学、文化方面的非营利组织。国际照明委员会(英语:InternationalCommissiononillumination,法语:CommissionInternationaledel´Eclairage,采用法语简称为CIE[1])是由国际照明工程领域中光源制造、照明设计和光辐射计量测试机构组成的非政府间多学科的世界性学术组织,是技术、科学、文化方面的非营利组织。对图像中一种具体的像素来考虑,定义为,它的显著性值的定义式为:式中,D(,)为像素和像素在L*a*b*空问的颜色距离度量。为了减少计算时问,提高效率,将对每一个像素进行显著值计算简化为对每一种颜色进行显著值计算,这样上式就可以简化为:式中,是像素的颜色值,n是图像中出现的颜色总数,是在图像中出现的概率。在得到显著图之后,就可以对显著图进行图像分割了,利用一个固定的阀值将显著图二值化,到达图像分割的目的。基于自适应滤波器的分割优化算法在图像处理和机器视觉领域,往往需要应用多种图像滤波器来达到降噪、变换和识别目标等功能。一些常用的滤波器,如高斯滤波器、拉普拉斯滤波器以及Sobel滤波器等已经被广泛应用于图像平滑和锐化、边缘检测和特征提取以及图像抠图等方面。本文将采用一种新型的自适应滤波器对基于显著性检测图像分割的结果进行优化,以求达到更精细的图像分割效果。基于目标图像的自适应滤波算法是一种使输入图像尽可能跟踪到目标图像当中的细节的自适应滤波器,它的结构见图如下所示:基于目标图像的滤波算法结构图首先,从整体的角度来看,假设目标图像为I,输入图像为p,输出图像为q,设定一个以k为中心,r为半径的滤波窗口,在它们之问建立一个线性变换:式中,和是关联滤波窗口的两个系数,假定它们在滤波窗口中是不变的。由上式可知,,所以这个线性模型可以确保当且仅当目标图像I有突变,即表示出现边缘的时候,输出图像q也会出现边缘,这就是基于目标图像滤波器最基本的思路。其次,可以通过使输入图像和输出图像之问的差异达到最小来求解上述两个系数,也就是使式中达到最小:式中,常数的作用是防止过大,调节输出图像偏向于“平滑”还是偏向于“尖锐”。利用线性回归方法,经过推导计算,得到式的解,经整理如下所示:式中,、和分别是目标图像I在滤波窗口中的平均值和方差,是在滤波窗口中像素点的个数,是输入图像p在滤波窗口中的平均值。接着,就可以把这个模型运用到滤波器中:移动滤波窗口使其覆盖整个图像。此时,以其中某个像素点i为例,它会出现在每一个包括它的窗口中,也就是说当滤波窗口的半径不同时,计算出来的q;也不尽相同·于是将上式以一种“均衡”的角度改写为:进一步得到公式:上式中的两个参数:滤波窗口半径r和滤波平滑系数。滤波窗口半径影响算法执行的速度以及块效应的程度,滤波平滑系数影响输出图像更接近平均值还是目标图像。为了提高算法的智能性,利用图像的平均梯度来白适应调节半径r和平滑系数。图像的平均梯度定义如下:把目标图像以一个变化的半径值划分成一个个矩形即窗口,然后在各个窗口中求取当前窗口中的平均梯度值,这样做的好处在于可以较好地把握图像局部的某些细节,然后依据木桶效应的原理,将所有窗口中的最大值与设定的经验值比较,从而确定半径。主要步骤如下:读入目标图像,以初始半径值将目标图像划分为一个个窗口。从左上角第一个窗口开始,通过式求取当前窗口中的平均梯度,遍历整个目标图像。比较每个窗口中的平均梯度的值,找出最大值,并与设定的阀值作比较。如果大于阀值,则半径确定;如果小于阀值,则将半径增大固定值,重复以上步骤,直至所有窗口的平均梯度的最大值大于设定的阀值为止。自适应化方法流程图:经过基于目标图像的自适应滤波器的优化之后,显著图分割效果的细节更加丰富,更加接近原图的内容,弥补了基于显著性分割中二值化带来的边缘生硬的缺点,且试验中无需人工参与,优化的效果明显。基于Haar特征的目标识别算法1998年,研究人员经过运用Haar小波变换算法对人脸提取特征这一过程的启发,引入了一种新的特征表示方法,这种方法被称为局部Haar特征。它首先是基于灰度值的一种特征表示方法,在图像中的某个局部矩形,被划分为黑色区域和白色区域两部分,然后分别计算黑色区域和白色区域的灰度级和,两个区域灰度值的差值就是所需的特征值,显然这种特征可以反映出图像中某个局部区域内的灰度分布情况。典型的局部Haar特征由4个矩形组成,分别对应于边界、细线和对角线特征,如图所示:局部Haar特征的定义是如下:式中是矩形所包围的区域内的灰度积分,是矩形的权重,N是Haar特征计算范围内的矩形的个数。Intel公司的研究人员对Haar特征进行了拓展,加入了旋转特性这一选项,部分解决了目标运动时产生旋转的识别问题,成为Haar特征的扩展集,如图所示,每一行的后半部分就是加入45“旋转特性的Haar特征扩展集。相对于经典的Haar特征,加入这一旋转特性的扩展集可以在水平或者垂直方向上,产生一个丰富的且范围可仲缩的特征集,这对于提高的识别算法的效率以及正确率有很大的帮助。Haar特征的计算Haar特征的计算是通过积分图来实现的,对于一个垂直的矩形,里面一个像素点的积分图是这样定义的:从(0,0)坐标到这个像素点的坐标所围成的矩形里的像素值之和。公式如下:式中的是矩形内的像素点,上式可以通过迭代迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的初始值的方法计算出来,有:迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的初始值式中,II(-1,y)=II(x,-1)=0。通过上式,任何矩形的积分图都可以计算出来,如下图所示:图垂直矩形积分图计算上图中,矩形D的积分图计算方法就是D矩形的右下角坐标围成的矩形(A+B+C+D)的积分图加上D矩形的左上角坐标围成的矩形(A)的积分图之和,减去D矩形右上角坐标围成的矩形(A+B)的积分图加上D矩形左下角坐标围成的矩形(A+C)的积分图之和。用公式表示如下:式中,(x,y)和(w,h)分别是矩形的左上角坐标以及宽和高。扩展的Haar特征集加入了45°旋转特征,对于45°旋转的矩形,定义它的积分图为左上角45°区域和左下角45°区域的像素和,有:上述旋转矩形的积分图公式可以通过两次扫描所有像素得到。从左至右,从顶至底进行第一次扫描得:式中,II(一1,y)=II(-2,y)=II(x,-1)=0。再从低向上,从右至左扫描一次得:这样任意的45°旋转矩形((x,y,w,h,45°)的像素和可以通过下式确定:旋转矩形积分图计算与垂直矩形的计算方法相同的是,矩形D的积分图仍然等于4点坐标围成的矩形(A+B+C+D)的积分图加上1点坐标围成的矩形(A)的积分图之和,减去2点坐标围成的矩形(A+B)的积分图加上3点坐标围成的矩形(A+C)的积分图之和。AdaBoost算法AdaBoost算法原理AdaBoost学习算法,最初是用来提高系统性能的一个简单的分类算法,它通过对一些弱分类器的加权叠加,形成了强分类器。当选中的样本被运用到AdaBoost算法中,它的权值就等于这个样本被其中某个弱分类器选中的概率,显然初始权值就是分了为1分母为样本数的一个分数,接着经过第一次的学习后,如果这个样本被某个弱分类器正确地辨别了,那么在下一轮的学习中,它的权值要相应降低一点,同样,如果这个样本没有被正确地分类,在下一轮学习中,权值就会增加,这样“谨慎”的做法就为了提高分类器的识别精度,如果最后这个样本还是被认为不是有效的样本,那么从机器的角度,就真的是不包含目标的样本。在每一轮的学习中,选择一个对所有训练样本的分类误差最低的最优的弱分类器,最后由这些最优的弱分类器组成一个强分类器。对于一个样本的分类,分类误差最高的情况就是随机猜测,为了使训练过程足够充分,弱分类器只需要分类误差小于随机猜测,所以采用的弱分类器只是仅仅包含一个特征和一个带有方向的阈值的分类器。一个简单的弱分类器可以表示为如下形式:式中,为弱分类器,是比例系数,用来决定不等号的方向,为具体的特征,为阈值,x为图像了窗口。样本图像为(X1,Y1),...(Xn,Yn),其中当等于0时,表明这是包含了目标物体的正样本图像,当等于1时,表明这是不包含目标物体的负样本,开始计算前,权重初始化公式为:式中,m为正样本的数量,1为负样本的数量。下一步从t=1到t=T进行循环计算,有:归一化权重:对每个特征f,训练一个弱分器h();计算所有特征的弱分类器的加权错误率,有:按最小错误率选取最佳弱分类器。按照这个最佳弱分类器,调整权重:式中,=0表示被正确分类,=1表示被错误分类。最后得到强分类器,有:其中,。单独一个AdaBoost分类器即使很强,在误检率和检测时问上根本满足不了真正的实时人脸检测系统的需要,采用级联检测策略能很好地解决这个问题,因此级联分类器被引入到Adaboost算法中。在级联分类器中,每一个待检测窗口只有通过了当前层的强分类器(AdaBoost分类器)才能进入下一层。这样大量的待检测窗口只需要最初几层简单的判断就可以被迅速淘汰,使得平均检测成本大大降低。多层级联结构中,每一层的强分类器都是由AdaBoost算法训练来的。基于Adaboost分类器的训练流程如下:采集一定数量的正样本和负样本,并且在这两类样本中对所有了窗口提取特征。计算训练样本的特征值,并通过计算分类误差选择一个合适的特征值,这个特征值就是最优的弱分类器的分类阈值。把所有最优的弱分类器通过加权叠加,形成强分类器。将若干强分类器串联起来,形成一个级联分类器,到此训练结束。训练程序的流程图如下:训练程序流程图Intel公司即OpenCV软件提供了对Haar特征和AdaBoost算法的支持,其中createsamples.exe程序用来创建样本,Haartraining.exe程序用来进行样本训练。这个过程的基本步骤是首先采集样本,用createsamples.exe程序建立样本描述文件,即生成一个类型为.vec的文件,利用生成的.vec文件,通过Haartraining.exe程序来完成包括负样本的训练。训练完成后,会生成一个目录来存放训练好的模式识别.xml文件。以坦克小车为例,具体训练过程如下:1.样本的创建采集坦克小车不同角度的照片150张左右,将这些图片全部裁剪成只包含坦克小车的20*20大小的样本图片;再选取不包含小车的300张左右随机图片作为负样本。负样本可以通过背景描述文件来描述,背景描述文件是一个文本文件,每一行包含了一个负样本图片的文件名(基于描述文件的相对路径),该文件必须手工创建。打开Windows运行程序,输入cmd打开DOS命令窗口,进入图片路径,再次输入dir/b>negdata.dat,则会图片路径下生成一个negdata.dat文件,打开该文件将最后一行的negdata.dat删除,这样就生成了负样本描述文件。制作一个正样本描述文件,用于描述正样本的名称,数量以及目标在正样本图片中的位置,典型的形式为:posdata/car1.bmp1002020,其中carl.bmp是正样本图片名称,1表示包含一个目标,(0,0)和(20,20)分别是包含目标的矩形的左上角坐标以及宽和高,方法跟创建负样本的描述文件相同。运用createsamples.exe程序创建正样本的.vec文件,典型的命令行参数为:-infoD:\car\posdata\posdata.dat一vecD:\car\pos.vec-num150-w20-h20其中一num<numberof_samples>表示要产生的正样本的数量,必须和正样本图片数目相同。-w<sample_width>表示输出样本的宽度(以像素为单位),-h<sample_height>表示输出样本的高度,以像素为单位。2.训练分类器样本创建完成之后,接下来要由Haartraining.exe程序来实现训练分类器。一个典型的命令行参数为:"D:\ProgramFiles\OpenCV\bin\Haartraining.exe”-datadata\cascade一vecdata\pos.vec-bgnegdata\negdata.dat-npos150-nneg300-mem512-modeALL-w20-h20其中-data<dir_name>表示训练好的级联分类器识别文件的存放路径名,-vec<vec_file_name>表示正样本描述文件名,-bg<background_file_name>表示背景图片描述文件,-npos<number_ofpositive_samples>和-nneg<number_ofnegative_samples>表示用来训练每一个分类器的正、负样本数量,-mem<memory_in_MB>表示向计算机申请的以MB为单位的可用内存,内存越大则训练的速度越快,更多的参数资料此处没有使用到,参数越多,训练的时问往往越长。这样训练器就创建成功了,训练过程的程序运行情况如下所示训练结束之后的得到XML文件包含了正样本中目标物体的Haar扩展特征集,利用这个XML就可以快速识别目标。Haar特征算法实验结果及分析基于Haar特征的目标识别方法基本思想就是:首先将样本采集工作做好,并训练好分类器,然后将包含物体特征的xml文件加入到程序中,对设备采集到的图像进行识别。如果识别成功,则以一个矩形框的形式返回目标在图像中的位置等信息,然后进入跟踪模式或者结束;如果识别失败,则重新开始识别操作。算法流程如下图所示:利用训练结果识别目标流程图CAMSHIFT跟踪算法的研究均值迁移方法即Meanshift算法是图像识别跟踪的热门方法,于1975年被人提出,1995年运用到视觉领域,核心思想就是对窗口中的像素加权求平均,得到新的窗口值,然后迭代加权求平均直至收敛。在此基础上,有人把它运用到连续图像序列中,形成了Camshaft算法,主要用于彩色目标的检测跟踪。Meanshift跟踪算法在机器视觉中我们可以用一个物体的灰度或颜色分布来描述这个物体,假设物体中心位于,则该物体的概率分布可以表示为:其中,归一化系数C通过条件导出:的表达式:则任意的中心位于y的物体可以表示为:因此物体跟踪可以简化为寻找最优的y,使得户最相似。获取户与。的相似性用系数来度量,表达式为:对上式在处进行泰勒展开可以得到:4-6经整理得:4-7其中:4-8这样就可以对式(4-7)右边的第二项利用Meanshift算法进行优化。基于MeanShift的跟踪算法运行过程就是系数的最大化过程·给定目标模型的分布以及目标的预测位置,计算步骤如下:计算分布,计算根据式4-8,计算出权重根据Meanshift向量计算出目标的新位置,有:更新,计算。如果,令,回到步骤4。如果,则停止迭代,否则令,回到步骤1。对于图像来说,它是一个二维离散矩阵,目标当前所在位置,在这里可以称为窗口的形心,可以通过计算如下的矩来得到,有:4-104-114-12上儿式中,是零阶矩,I(x,y)是点(x,y)处的像素值,和是x,y的一阶矩,和分别为窗口的形心横纵坐标。Camshift跟踪算法颜色空间和颜色直方图HSL颜色空间这种颜色空问跟常见的RGB格式不同,它由色调、饱和度和亮度三个参数构成,也叫HSV或者HSI模型。色调H是指人眼感受到的颜色的信息,如蓝色绿色等,取值范围为0°-360°;饱和度S是指这种的“浓淡”程度,如深蓝色淡绿色等,取值范围为0~1,饱和度等于1时表示最纯的颜色;亮度L是指反射到人眼的光的强度大小,取值范围也是0~1,当等于0时代表黑色。HSL颜色空问同人对颜色的感知相一致,是适合人的视觉特性的颜色空问,能较好反映人对颜色的感知和鉴别。线性颜色表示系统如RGB颜色空问,其三个颜色分量没有很好地和人对颜色判断的因素相联系,冗余信息多,对三个分量分别处理将会带来颜色信息的丢失和错乱,将RGB空问转换为HSL空问后,它将亮度(L)与反映颜色本质特性的两个参数—色调(H)和饱和度(S)分开。RGB空问到HSI空问的H分量的转换公式如下:颜色直方图在目标识别中,可以用颜色直方图来表示一幅彩色图像。其实就是统计不同值的像素个数,扩展到彩色图像中,描述的就是不同的颜色在图像中所占的比例,颜色直方图对于图像的以观察轴为轴心的旋转以及幅度不大的平移和缩放等几何变换是不敏感的,颜色直方图的这种特性使得它比较适合于检索图像

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论