基于数字图像处理的障碍物识别_第1页
基于数字图像处理的障碍物识别_第2页
基于数字图像处理的障碍物识别_第3页
基于数字图像处理的障碍物识别_第4页
基于数字图像处理的障碍物识别_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要数字图像处理就是利用计算机对图像信息进行加工,以满足人的视觉心理或者应用需求。图像识别所讨论的问题,是研究用计算机代替人自动地处理大量的物理信息,解决人类所不能识别的问题。对于计算机来说,在实际工作环境里,图像场景已有较大的变化。因此要区分图像属于哪一类,往往要通过一系列关键技术来实现。由此产生的图像识别方法也有很多。本文在较广泛地调研文献的根底上,对图像识别系统进行了较为全面的综述,并以较为大量文字和具体的实例,通过使用常用的仿真语言和软件对基于数字图像处理的障碍物的识别进行了研究。第一局部通过中值滤波、梯度法锐化和边缘检测进行处理后,将目标图像与背景图像差分;第二局部再进行形态学膨胀、最小外接矩形特征计算后,在分割的根底上选择需要提取的特征,对某些参数进行测量后,根据测量结果做分类和识别,通过对标记区域计算质心进行定位识别,最后通过MATLAB软件对其进行了仿真,获得了较理想的识别结果。关键词:数字图像处理;图像识别;背景差分;膨胀处理;最小外接矩形ABSTRACTThedigitalimageprocessingistousethecomputertocarryontheprocessingimageinformation,tomeettheperson'svisualpsychologyorapplicationrequirements.Theproblemsdiscussedimagerecognition,isthestudyusedcomputerinsteadofpeopleautomaticallywiththeamountofphysicalinformation,solvetheproblemofhumanbeingscan'tidentify.Forcomputerspeaking,theactualworkenvironment,imagesceneforgreaterchange.Sotodistinguishbetweenimagewhatkind,oftentothroughaseriesofkeytechnology.Theresultingimagerecognitionmethodalsohasalotof.Thispaperinawidelyresearchliterature,andonthebasisofimagerecognitionsystemforacomprehensivereview,andtobealotofwrittenandaspecificexample,throughtheuseofcommonlanguageandsoftwaresimulationbasedondigitalimageprocessingofobstaclesrecognition.Thefirstpartthroughthemedianfiltering,gradientmethodsharpenandedgedetectionafterprocessing,willtargetimageandthebackgroundimagedifference;Thesecondpartofmorphologicalinflationagain,minimumcircumscribedrectangularfeaturecalculation,inthedivisionofthebasisofthechoiceneedtoextractcharacteristicofsomeparametersformeasurement,themeasurementresultsdoclassificationandidentification,throughtothemarkerareascalculationcentroidlocalizationrecognition,thelastthroughthesoftwareMATLABsimulation,obtainedaidealrecognitionresults.Keywords:Digitalimageprocessing;Imagerecognition;Backgrounddifference;Expansionprocess;Minimumboundingrectangle 目录摘要 1关键词 1ABSTRACT 2Keywords 21绪论 11.1数字图像处理简介 11.2数字图像处理的特点 21.3课题目的和意义 31.4论文结构安排 42图像识别系统简介 52.1图像预处理 5灰度化和二值化 5光照补偿 6图像差分 9图像平滑 11图像锐化 12边缘检测 152.2形态处理 172.3图像的识别 182.4小结 183基于数字图像处理的障碍物识别 193.1仿真环境简介 193.2预处理 21灰度化 213.2.2背景差分 22二值化 24中值滤波 25Robert梯度算子锐化和边缘检测 253.3膨胀处理和目标识别 283.3.1膨胀处理 28目标识别 283.4小结 304总结与展望 32致谢 34参考文献 35附录一〔程序代码〕 36附录二〔程序运行结果〕 381绪论1.1数字图像处理简介数字图像处理一般是利用计算机或其它含有微处理器的嵌入式数字设备对图像进行处理。由于计算机等数字设备只能处理离散数字信号,因此它所处理的对象也只能是数字图像。而在我们日常生活中出现的图像信号绝大局部都是模拟信号,所以必须通过某种方式将模拟图像信号转化为数字图像信号。这个过程称之为模数转换,需要用到采样、量化理论。图像处理技术是20世纪60年代随着计算机技术和VLSI的开展而产生、开展和不断成熟起来的一个新兴技术领域,它在理论上和实际应用中都取得了巨大的成就。视觉是人类最重要的感知手段,图像又是视觉的根底。早期图像处理的目的是改善图像质量,它以人为对象,以改善人的视觉效果为目的。图像处理中输入的是质量低的图像,输出的是改善质量后的图像。常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得成功应用的是美国喷气推进实验室。他们对空间探测器“徘徊者〞7号在1964年发回的几千张月球照片进行图像处理,如几何校正、灰度变换、去除噪声等,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球外表地图,获得了巨大的成功。在以后的宇航空间技术探测研究中,数字图像处理技术都发挥了巨大的作用。图像处理技术取得的另一个巨大成就是在医学上。1972年英国EMI公司工程师Hounsfield创造了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT。CT的根本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术被授予诺贝尔奖,以表彰它对人类做出的划时代奉献。从20世纪70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速开展,数字图像处理技术向更高、更深层次开展。人们已开始研究如何用计算机系统解释图像,类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。20世纪80年代末期,人们开始将其应用于地理信息系统,研究海图的自动读入、自动生成方法。数字图像处理技术的应用领域不断拓展。图像处理技术的大开展是从20世纪90年代初开始的。自1986年以来,小波理论与变换方法迅速开展,它克服了傅里叶分析不能用于局局部析等方面的缺乏之处,被认为是调和分析半个世纪以来工作之结晶。1988年,小波分析被有效地应用于图像分解和重构。小波分析被认为是信号与图像分析在数学方法上的重大突破。随后数字图像处理技术迅猛开展,到目前为止,图像处理在图像通讯、办公自动化系统、地理信息系统、医疗设备、卫星照片传输及分析和工业自动化领域的应用越来越多。进入21世纪,随着计算机技术的迅猛开展和相关理论的不断完善,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就。属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等。该技术成为一门引人注目、前景远大的新型学科。1.2数字图像处理的特点根据数字图像处理所涉及到的数字设备、技术本身以及技术的具体实现形式——软件,数字图像处理的特点可以分为以下几点:(1)再现性好:计算机图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿,那么数字图像处理过程始终能保持图像的真实再现;(2)处理精度高:按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以满足任一应用需求。从原理上讲不管图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了;(3)适用面宽:图像可以来自多种信息源。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理;(4)灵活性高:由于图像的光学处理从原理上讲只能进行线性运算,极大地限制了光学图像处理能实现的目标;而数字图像处理不仅能完成线性运算,且能实现非线性处理,即但凡可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现;(5)信息压缩的潜力大:计算机图像中各个像素不是独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间相关性比帧内相关性一般说还要大些。因此,图像处理中信息压缩的潜力很大。图像处理就是对图像信息加工以满足人的视觉心理或应用需求的方法。图像处理方法有光学方法和电子学方法。而数字图像处理就是利用数字计算机或其它的硬件设备对图像信息转换而得到的电信号进行某些数学处理以提高图像的实用性。计算机进行图像处理一般有两个目的:(1)产生更适合人观察和识别的图像。(2)希望能由计算机自动识别和理解图像。总的来说,数字图像处理包括点运算、几何处理、图像增强、图像复原、图像形态学处理、图像编码、图像重建、图像识别等。本文的主要内容那么是其中的图像识别。图像识别所讨论的问题,是研究用计算机代替人自动地处理大量的物理信息,解决人类生理器官所不能识别的问题,从而局部代替人的脑力劳动。人类识别图像的过程总是先找到它们外形或颜色的某些特征进行比拟分析和判断,然后加以分门别类,即识别它们。研究计算机识别图像时也借鉴人的思维活动,采取同样的方法。然而图像的灰度与彩色是由光强和波长不同的光波引起的,与景物外表的特性、方向、光线条件以及干扰等多种因素有关。因此要区分图像属于哪一类,往往要经过预处理、分割、特征提取、分析、分类、识别等一系列过程。现在这些技术完全可以用计算机模拟、对图像信息进行处理来到达对它的识别。1.3课题目的和意义“识别〞这两个字分开来解释有“认识〞和“区别〞的含义。说“识别某物体〞包含有认识它而且能从一堆物件中把它与别的物件区别开来的意思。通常我们说认识某事物,这一定是经历过中曾经见过或者接触过它,因而了解它的特性。一旦你认识了它,自然也能把它与其他事物区别开来。根据存储在大脑中的模式,就能对物体进行识别,这种识别就是“模式识别〞。图像识别,可以认为是图像的模式识别,它是在模式识别技术在图像领域中的具体运用。模式识别的研究对象根本上可以概括为两大类:一类是有直觉形象的图像,如图像、相片、文字等;一类是没有直觉形象而只有数据或信息波形,如语音、心电脉冲、地震波等。模式识别研究的目的是研制能够自动处理某些信息的机器系统,以便代替人完成分类和辨识的任务。所以,狭义地讲,图像识别所研究的模式就是图像。本文的目的是通过对图像识别原理的研究,对障碍物识别技术的原理进行分析研究,通过中值滤波、背景差分、梯度法锐化与边缘检测进行预处理后,利用形态学的膨胀处理和最小外接矩形的计算与定位,对障碍物目标进行识别,并通过MATLAB软件仿真对其进行了仿真实现。图像识别是立体视觉、运动分析、数据融合等实用技术的根底,在导航、地图与地形配准、自然资源分析、天气预报、环境监测、生理病变研究等许多领域重要的应用价值。1.4论文结构安排在本章中,我们首先总结归纳了图像的概念,数字图像处理开展的历程及其特点,以便对数字图像处理有一个感性的认识和把握,并对我们所研究的课题有一个较为客观的定位。接下来就引入了本文所研究的课题的本质——图像识别,按本文的思路对图像识别系统进行了较为完整的表达。接下来的章节中,将作如下安排:第2章对图像识别系统的关键技术进行介绍;第3章介绍基于数字图像处理的障碍物识别的原理和算法。这样的安排,是因为本文的定位是基于数字图像处理的图像识别,另外还要对目前图像识别领域的关键技术做一个比拟全面的综述。2图像识别系统简介图像识别所讨论的问题,是研究用计算机代替人自动地处理大量的物理信息,解决人类所不能识别的问题。对于计算机来说,在各种恶劣的工作环境里,图像与景物已有较大的差异。因此要区分图像属于哪一类,往往要通过预处理、形态学处理或特征提取、分析分类与识别等一系列关键技术来实现。由此产生的图像识别方法也有很多。本文所研究的图像识别系统的思路是预处理、形态学处理、提取特征量来对目标障碍物进行识别。2.1图像预处理图像预处理是相对于图像识别而言的一种前期处理。不管采用何种装置,输入的图像往往不能令人满意。例如图像中物体的轮廓过于鲜明而显得不协调;按检测对象大小和形状的要求看,图像的边缘过于模糊;在相当满意的一幅图像上会发现多了一些不知来源的黑点或白点;以及图像的失真、变形等等。总之,输入的图像在视觉效果和识别方便性等方面可能存在诸多问题,这类问题不妨统称为“质量〞问题。尽管由于目的、观点、爱好等的不同,图像质量很难有统一的定义和标准,但是,根据应用要求改善图像质量却是一个共同的愿望。改善图像质量的处理称之为图像预处理,主要是指按需要对图像进行适当的变换突出某些有用的信息,去除或削弱无用的信息,如改变图像的比照度,去除噪声或强调边缘的处理等等。2.1.1灰度化和二值化在图像预处理阶段,都要把采集的图像进行灰度化处理,这样既可以提高后续算法速度,而且可以提高系统综合应用实效,到达更为理想的要求。图像灰度化技术的研究具有重要意义。颜色可分为黑白色和彩色。黑白色指颜色中不包含任何的色彩成分,仅由黑色和白色组成。在RGB颜色模型中,如果R=G=B,那么颜色〔R,G,B〕表示一种黑白颜色;其中R=G=B的值叫做灰度值,所以黑白色又叫做灰度颜色。彩色和灰度之间可以互相转化,由彩色转化为灰度的过程叫做灰度化处理;由灰度化转为彩色的过程称为伪彩色处理。相应地,数字图像可分为灰度图像和彩色图像。通过灰度化处理和伪彩色处理,可以使伪彩色图像与灰度图像相互转化。图像灰度化就是使彩色的R,G,B分量值相等的过程。二值图像就是指只有两个灰度级的图像。在数字图像处理中,二值图像占有非常重要的地位,特别是在实用的图像处理中,以二值图像处理实现而构成的系统是很多的,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像,这就不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。二值图像具有存储空间小,处理速度快。更重要的是,在二值图像的根底上,还可以进一步对图像处理,获得该图像的一些几何特征或者其他更多特征。二值化分为全局二值化和局部自适应二值化。一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个全局的阈值T,用T将图像的数据分成两局部:大于T的像素群和小于T的像素群。将大于T的像素群的像素值设定为白色〔或者黑色〕,小于T的像素群的像素值设定为黑色〔或者白色〕。这样就做到了全局二值化。全局二值化在表现图像细节方面存在很大缺陷。为了弥补这个缺陷,出现了局部二值化方法。局部二值化的方法就是按照一定的规那么将整幅图像划分为N个窗口,对这N个窗口中的每一个窗口再按照一个统一的阈值T将该窗口内的像素划分为两局部,进行二值化处理。局部二值化也有一个缺陷。这个缺陷存在于那个统一阈值的选定。这个阈值是没有经过合理的运算得来,一般是取该窗口的平均值。这就导致在每一个窗口内仍然出现的是全局二值化的缺陷。为了解决这个问题,就出现了局部自适应二值化方法。局部自适应二值化,该方法就是在局部二值化的根底之上,将阈值的设定更加合理化。该方法的阈值是通过对该窗口像素的平均值E、像素之间的差平方P、像素之间的均方根值Q等各种局部特征,设定一个参数方程进行阈值的计算。二值化是图像处理的根本操作,任何图像处理根本离不开二值化的操作。其应用非常广泛。2.1.2光照补偿在图像的获取过程中,由于拍摄环境的复杂性,当光照条件〔包括强度和光谱组成〕变化时,采集的图像差异较大,影响图像的定性和定量分析,因而必须对图像进行光照补偿。光照强度补偿主要是消除由于实际光照条件不均匀,偏光、侧光、高光等导致的过亮、过暗、阴影的影响。在光照强度补偿算法中,对于均匀的光照变化,常使用直方图均衡法、Gamma校正和对数变换等方法;对于非均匀的光照变化,代表性的方法有基于频域的同态滤波方法和双立方插值法等。同态滤波能减少光照并锐化边缘和细节,广泛应用于不均匀光照以下图像的补偿,且只能直接对灰度图像进行处理。所以,这里介绍同态滤波法。图像f(x,y)可以用它的入射分量i(x,y)与反射分量r(x,y)的乘积来表示,即:f(x,y)=i(x,y)·r(x,y)式(2.1)不均匀光照表达在入射分量i(x,y)中,属于变化缓慢的低频成分;而图像的细节等特性那么主要反映在图像的反射分量r(x,y)中,属于高频成分。对于照明不均匀的图像的处理,就是要尽量削减入射分量的影响,即压制图像的低频分量,同时增强物体的反射分量,即放大图像的高频分量[4]。同态滤波是增强图像比照度和压缩图像亮度范围的滤波方法,减少低频成分并增加高频成分,从而减少光照变化并锐化边缘或细节,但不影响图像像素变化,所以在灰度化之后进行同态滤波,然后才进行中值滤波。同态滤波的主要过程描述如下:(1)首先对图像函数f(x,y)取对数,lnfx,y=lnf(2)对上式进行傅里叶变换,得到:Flnu,v=FT(3)将上式乘以同态滤波函数H(u,v),作滤波处理:Glnu,v=Fln(4)求傅里叶反变换:FT-1Gln(u,v)=(5)最后求指数变换,得到同态滤波处理的图像,即:gx,y=explngi同态滤波增强图像的效果与滤波曲线的分布形状有关,实际应用中,需要根据不同图像的特性和增强的需要,选用不同的滤波曲线,可以到达满意的效果。同态滤波过程如图2.1所示,图中H(u,v)成为同态滤波函数。ff(x,y)对数运算(log)

离散傅里叶变换(DFT)傅里叶逆变换(IDFT)指数运算(exp)

g(x,y)H(u,v)图2.1同态滤波过程根据图像特性和需要,选用不同的滤波器传递函数H(u,v),它能以不同的方法影响傅立叶变换的高、低频成分,同态滤波函数关系如图2.2所示。图中:Rh代表高频增益,R1代表低频增益,D(u,v)表示频率(u,v)到滤波器中心(uHH(u,v)D(u,v)RR图2.2同态滤波函数同态滤波器是通过高通滤波器进行修改得到与其对应的同态滤波器,常用的巴特沃斯同态滤波器滤波函数为:Hu,v=Rh式中,D0为〔u0,v0〕=〔0,0〕时D(u,v)的值,表示截止频率。常熟c被引入用来控制滤波器函数斜面的锐化,它在Rh和R1之间过渡,当Rh>1、R1<1时,减小低频和增强高频,使得动态范围压缩和比照2.1.3图像差分图像差分运算又称为图像相减运算,常用于检测变化及运动物体。差分方法可以分为控制环境下的简单差分方法和基于背景模型的差分方法。在可控制环境下,或者在很短的时间内,可以认为背景是固定不变的,可以直接使用差分运算检测变化或运动的物体。背景图像差分是最直接、最简单的一种方法。差分运算的方法是,首先将选定的背景图片储存,再计算目标图像和设定的场景背景模型的差,然后通过比拟计算的差和根据实际情况设定的阈值的不同来检测目标,所得结果直接反映了目标的位置、大小、形状等信息。对于背景静止的目标,图像的背景差分能很好的实现目标的检测。使用背景差分的前提是预先知道背景,除了直接获取背景之外,获取背景还可以使用统计平均法,它是通过对连续的图像序列进行统计平均来获得背景的。在摄像机固定的情况下,背景的变化是缓慢的。比方,当背景中固定对象的移动和外界光照条件变化、背景物体出现扰动〔如树枝、树叶的摇动等〕,或者固定的摄像机出现抖动等,概括起来,可分为两类变化:场景的光照变化和场景构成的改变。背景图像出现变化后,待识别图像的背景与背景图像就不是完全相同的了,而是局部相同。背景图像发生缓慢变化情况时,需要对背景图像进行更新,以消除上述干扰,使得背景图像也能适应后来的图像的差分运算。利用背景估计算法或高斯模型可以很好地解决背景出现变化的问题。简单的背景更新算法就是将背景图像与当前帧图像取均值,将结果作为新的背景估计,实际应用中往往是给背景图像和当前图像赋予不同的权值,求它们的加权平均。进行差分运算时,假设差值小于某个阈值,那么用该点当前像素值更新背景图像,否那么该点的背景图像值不变。实际应用中这种方法运算量少,对背景渐变跟踪较快,但无法应对背景的突变情况,造成误检和漏检[6]。高斯模型就是用高斯概率密度函数〔正态分布曲线〕精确地量化事物,将一个事物分解为假设干的基于高斯概率密度函数形成的模型。图像灰度直方图可以认为是图像灰度概率密度的估计。如果图像所包含的目标区域和背景区域相比比拟大,且背景区域和目标区域在灰度上有一定的差异,那么该图像的灰度直方图呈现双峰-谷形状,其中一个峰对应于目标灰度,另一个峰对应于背景中心灰度。对于复杂的图像,一般是多峰的,通过将直方图的多峰特性看作是多个高斯分布的叠加,可以解决图像的分割问题。图像的某点像素值符合前景高斯分布时,就认为该点属于前景目标;符合背景高斯分布时,就认为该点属于背景,并进行背景更新[6]。高斯模型属于概率统计模型。背景一般可以分为单模态和多模态两种,前者在每个背景点上的像素值分布比拟集中,可以用单个概率分布模型来描述,后者的分布那么比拟分散,需要多个分布模型来共同描述。自然界中的很多景物和人造物体,如水面的波纹、摇摆的树枝、飘扬的旗帜等,都呈现出多模态的特性,在多云天气条件下的交通场景也表现为多模态特点,即背景忽明忽暗。在背景估计过程中,假设背景模型中每个图像点是独立的,并且像素值的分布是位置无关的,对它们的处理也是独立的[6]。因此高斯模型分为单高斯模型和高斯混合模型两种。在背景差分的前提下,二者的优劣比拟有以下四点:(1)单高斯模型需要进行初始化,比方在进行视频背景分割时,这意味着如果人体在前几帧就出现在摄像头前,人体将会被初始化为背景,而使模型无法使用;(2)单高斯模型只能进行微小性渐变,而不可突变。如户外亮度随时间的渐变是可以适应的,如果在明亮的室内突然关灯,单高斯模型就会将整个室内全部判断为前景。又如,假设在监控范围内开了一辆车,并在摄像头下开始停留。由于与模型无法匹配,车会一直被视为前景。当车过很长时间离去时,由于车停留点的亮度发生了很大的变化,因此已经无法与先前的背景模型相匹配;(3)单高斯模型无法适应背景有多个状态,如风吹的树叶。单高斯模型无法表示这种情况,而使得前景检测混乱,而高斯混合模型能够很好地描述不同状态;(4)相对于单高斯模型的自适应变化,混合高斯模型的自适应变化要强大的多。它能解决单高斯模型很多不能解决的问题。如无法解决同一样本点的多种状态,无法进行模型状态转化等。很明显,高斯混合模型的应用范围较单高斯模型更广,由于具有多个模型,划分更为精细,适用于多类别的划分。2.1.4图像平滑在图像的获取和传输过程中原始图像会受到各种噪声的干扰,使图像质量下降。为了抑制噪声、改善图像质量,要对图像进行平滑处理。抑制或消除这些噪声而改善图像质量的过程称为图像的平滑。图像平滑的目的是为了消除噪声。在图像处理中的滤波属于空间滤波,它是一种着眼于灰度的空间分布。常用的方法是运用一个K×K的模板对全图像做卷积运算。滤波的目的有两个,一个是将随机空间噪声平滑掉;二是保持、突出目标的某种空间结构。空域滤波可增强图像目标的信噪比,大局部噪声,如由红外成像器件、传输通道、A/D转换器等引起的噪声,通常表现为孤立像素的离散化变化,不是空间相关的,与它们的相邻像素显著不同,这种现象是许多噪声去除算法的根底。一般情况下,减少噪声的方法主要有邻域平均法、中值滤波法、低通滤波法等。(1)邻域平均法邻域平均法是一种局部空间域处理的方法,就是对含有噪声的原始图像f(x,y)的每个像素点取一个邻域S,计算S中所有像素灰度级的平均值,作为空间域平均处理后图像g(x,y)的像素值,即g(x,y)=1M(m,n∈S)f(m,n)式(式中f(x,y)为N×N的阵列;x,y=0,1,2,…,N-1;S是以(x,y)点为中心的邻域的集合,M为邻域S中的像素点数,S邻域可取四点邻域或八点邻域(如图2.3)。图2.3四点领域和八点领域(2)中值滤波法中值滤波法是一种非线性平滑技术,是基于排序统计理论的一种能有效噪声的非线性信号处理技术,根本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近真实值,从而消除孤立的噪声点。中值滤波是一种非线性滤波,由于它在实际运算过程中并不需要图像的统计特性,所以比拟方便。中值滤波首先是被应用在一维信号处理技术中,后来被二维图像信号处理技术所应用。在一定的条件下,可以克服线性滤波器所带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效,但对于线、尖顶等细节多的图像不宜采用中值滤波。使用二维中值滤波最值得注意的是保持图像中有效的细线状物体。与平均滤波器相比,中值滤波器从总体上来说,能够较好地保存原图像中的跃变局部。(3)低通滤波法图像经过傅里叶变换以后,噪声频谱一般位于空间频率较高的区域,而图像本身的频率分量那么处于空间频率较低的区域内,因此可以通过低通滤波的方法,使高频成分受到抑制,而使低频成分顺利通过,从而实现图像的平滑。低通滤波可以在空间域和频域中进行。eq\o\ac(○,1)空间域低通滤波。在空间域中实现低通滤波是采用离散卷积,与高通滤波所用卷积表达式相同,即为式(2.9)式中输出图像g(m1,m2)是M×M方阵,输入图像f(n1,n2eq\o\ac(○,2)频域低通滤波。这是一种频域处理法。对于一幅图像,它的边缘、细节、跳跃局部以及噪声都代表图像的高频分量,而大面积的背景区和缓慢变化局部那么代表图像的低频分量,用频域低通滤波法除去其高频分量就能去掉噪声,从而得到平滑。2.1.5图像锐化在图像增强过程中,通常利用各类图像平滑算法消除噪声,图像的常见噪声主要有加性噪声、乘性噪声和量化噪声等。一般来说,图像的能量主要集中在其低频局部,噪声所在的频段主要在高频段,同时图像边缘信息也主要集中在其高频局部。这将导致原始图像在平滑处理之后,图像边缘和图像轮廓模糊的情况出现。为了减少这类不利效果的影响,就需要利用图像锐化技术,使图像的边缘变得清晰。图像锐化处理的目的是为了使图像的边缘、轮廓线以及图像的细节变得清晰,经过平滑的图像变得模糊的根本原因是因为图像受到了平均或积分运算,因此可以对其进行逆运算(如微分运算)就可以使图像变得清晰。从频率域来考虑,图像模糊的实质是因为其高频分量被衰减,因此可以用高通滤波器来使图像清晰。但要注意能够进行锐化处理的图像必须有较高的性噪比,否那么锐化后图像性噪比反而更低,从而使得噪声增加的比信号还要多,因此一般是先去除或减轻噪声后再进行锐化处理。图像锐化算子有一阶微分算子和二阶微分算子。其中一阶微分算子主要有Robert梯度算子、Prewitt梯度算子、Sobel算子;二阶导数算子为Laplacian算子。(1)一阶微分算子一阶微分主要指梯度模运算,利用一阶导数检测边缘点的方法就称为梯度算子法。图像的梯度值包含了边界及细节信息,梯度值正比于像素之差。对于一幅图像中突出的边缘区,其梯度值较大;在平滑区域梯度值小;对于灰度级为常数的区域,梯度为零。eq\o\ac(○,1)Robert梯度算子Robert梯度就是采用对角方向相邻两像素之差,故也称为四点差分法,即用4点进行差分,以求得梯度。其缺点是对噪声较敏感,常用于不含噪声的图像边缘点检测。梯度算子类边缘检测方法的效果类似于高通滤波,有增强高频分量,抑制低频分量的作用。eq\o\ac(○,2)Prewitt梯度算子〔平均差分法〕因为平均能减少或消除噪声,Prewitt梯度算子法就是先求平均,再求差分来求梯度。利用检测模板可求得水平和垂直方向的梯度,再通过梯度合成和边缘点判定,就可得到平均差分法的检测结果。eq\o\ac(○,3)Sobel算子〔加权平均差分法〕Sobel算子就是对当前行或列对应的值加权后,再进行平均和差分,也称为加权平均差分。Sobel算子和Prewitt算子一样,都在检测边缘点的同时具有抑制噪声的能力,检测出的边缘宽度至少为二像素。由于它们都是先平均后差分,平均时会丧失一些细节信息,使边缘有一定的模糊。但由于Sobel算子的加权作用,其使边缘的模糊程度要稍低于程度要稍低于Prewitt算子。(2)二阶导数算子对于阶跃状边缘,其二阶导数在边缘点处出现过零交叉,即边缘点两旁的二阶导数取异号,据此可以通过二阶导数来检测边缘点。这里主要介绍Laplacian算子。对数字图像f(m,n),用差分代替二阶偏导,那么Laplacian算子为:Gi,j=4fLaplacian算子是最简单的各向同性微分算子,具有旋转不变性,比拟适用于改善因为光线的漫反射造成的图像模糊。经过推导可以发现当图像的模糊是由光的漫反射造成时,不模糊图像等于模糊图像减去它的拉普拉斯变换的常数倍。另外,人们还发现,即使模糊不是由于光的漫反射造成的,对图像进行拉普拉斯变换也可以使图像更清晰。Laplacian锐化的一维处理表达式是:式(2.11)在二维情况下,Laplacian算子使走向不同的轮廓能够在垂直的方向上具有类似于一维那样的锐化效应。综上所述,首先,图像过渡的边缘(也就是沿整个斜坡),一阶微分都不为零,经过二阶微分后,非零值只出现在抖坡的起始处和终点处。可以得出结论:一阶微分产生较粗的边缘,二阶微分那么细。其次,孤立的噪声点。在孤立点及其周围点,二阶微分比一阶微分响应要强。第三,细线,也是一种细节。对线的响应要比对阶梯强,且点比线强。所以,可以总结出一阶微分和二阶微分的区别:(1)一阶微分处理通常会产生较宽的边缘,二阶微分处理得到的边缘那么细;(2)二阶微分处理对细节有较强的响应,如细线和孤立点;(3)一阶微分处理一般对灰度阶梯有较强的响应;(4)二阶微分处理对灰度级阶梯变化产生双响应;(5)二阶微分在图像中灰度值变化相似时,对线的响应要比对阶梯强,且点比线强。大多数应用中,对图像增强来说,二阶微分处理比一阶微分好,因为形成细节的能力强,而一阶微分处理主要用于提取边缘。2.1.6边缘检测图像的边缘是图像的重要特征之一,数字图像的边缘检测是图像分割、目标区域识别、区域形状提取等图像分析领域十分重要的根底,其目的是精确定位边缘,同时较好地抑制噪声,因此边缘检测是机器视觉系统中必不可少的重要环节。所谓边缘是指图像局部特性的不连续性,是图像局部强度变化最显著的局部。灰度或结构等信息的突变处称为边缘,例如:灰度级的突变,颜色的突变,纹理结构的突变等。边缘是一个区域的结束,也是另一个区域的开始,利用该特征可以分割图像。边缘主要存在于目标与目标、目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征和形状特征等图像分析的重要根底。图像分析和理解的第一步常常是边缘检测。边缘检测的实质是采用某种算法来提取出图像中对象与背景间的交界线。图像灰度的变化情况可以用图像灰度分布的梯度来反映,因此可以用局部图像微分技术来获取边缘检测算子。经典的边缘检测方法是对原始图像中的像素的某个邻域来构造边缘检测算子。目前,提取边缘常用边缘算子法、曲面拟合法、模板匹配法等。这里只介绍边缘检测算子法。在图像锐化局部曾经讨论过,梯度算子,特别是Robert算子等,可以对边缘进行提取,这里再介绍一下Canny算子和LoG算子。Canny边缘检测算子在灰度图像中得到广泛应用。根据边缘检测的有效性和定位的可靠性,Canny研究了最优边缘检测器所需的特性,推导出最优边缘检测器的数学表达式。对于各种类型的边缘,Canny边缘检测算子的最优形式是不同的。Canny给出了评价边缘检测性能优劣的三个指标:好的信噪比;好的定位性能;对单一边缘仅有唯一响应。Canny首次将上述判据用数学的形式表示出来,然后采用最优化数值方法,得到了对应给定边缘类型的最正确边缘检测模板。对于二维图像,需要使用假设干方向的模板分别对图像进行卷积处理,再取最可能的边缘方向。Canny所提出的边缘检测方法属于先平滑然后求导数的方法。主要由以下步骤实现:eq\o\ac(○,1)图像平滑。Canny建议用高斯函数进行图像平滑:高斯函数:Gx,y=exp-x图像卷积:IGx,y=Gx,y其中:是一个尺度参数,越小,那么函数越“集中〞,即仅在一个很小的局部范围内平滑,越大,那么表示图像在一个较大的范围内进行平滑;I(x,y)为原始图像。eq\o\ac(○,2)边缘点定位。Canny指出用梯度方向的二阶导数的零交叉作为判别边缘点的准那么。假设该点满足以下条件,那么该点为边缘点:∂2G∂α其中:为平滑的梯度方向:α=tan-1∂Ieq\o\ac(○,3)边缘强度假设某像素满足边缘定位条件,那么该像素的边缘强度为:式(2.16)利用图像强度二阶导数的零交叉点来求边缘点的算法很容易受到噪声干扰,所以在边缘检测前滤除噪声是十分必要的。为此产生了LoG(LaplacianofGaussian)算法,也称之为拉普拉斯高斯算法。它的根本特征有:eq\o\ac(○,1)平滑滤波器是高斯滤波器;eq\o\ac(○,2)增强步骤采用二阶导数(二维拉普拉斯函数);eq\o\ac(○,3)边缘检测判据是二阶导数零交叉点并对应一阶导数的较大峰值;eq\o\ac(○,4)使用线性内插方法在子象素分辨率水平上估计边缘的位置。常用的LoG算子是5×5的模板,如以下图2.4所示:图2.4拉普拉斯算子卷积模板模板中各点到中心点的距离与位置加权系数的关系如图2.5所示。图2.5LOG到中心点的距离与位置加权系数的关系曲线由于图像的平滑会引起边缘的模糊。LoG算法中的高斯平滑运算会导致图像中边缘和其他锋利不连续局部的模糊。值越大,噪声滤波效果越好,但同时会丧失一些重要的边缘信息;值小时又会平滑不完全而留有太多噪声。只有当两者结合的很好时才能较好地检测出图像的最正确边缘。2.2形态处理数学形态学是由一组形态学的代数运算子组成的,它的根本运算有4个:膨胀〔或扩张〕、腐蚀〔或侵蚀〕、开运算和闭运算,它们在二值图像和灰度图像中各有特点。基于这些根本运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析及处理。形态学图像处理表现为一种邻域运算形式;一种特殊定义的邻域称之为“结构元素〞〔结构元素是指具有某种确定形状的根本结构元素,例如一定大小的矩形等〕,在每个像素位置上它与二值图像对应的区域进行特定的逻辑运算,逻辑运算的结果为输出图像的相应像素。膨胀是将与目标区域接触的背景点合并到该目标物中,是目标边界向外部扩张的处理。膨胀可以用来填补目标区域中存在的某些空洞,以及消除包含在目标区域中的小颗粒噪声。通常是用以连接间断的线或将因二值化处理,使原本应该在一起的区域被间断开的区域重新连接时采用。简单说,就是将间断的轮廓线连在一起,并将其中的空点填充。腐蚀处理是膨胀处理的对偶,是消除边界点,使边界向内部收缩的过程。可以用来消除小而且无意义的目标物。如果两目标物之间有细小的连通,可以选取足够大的结构元素,将细小连通腐蚀掉。腐蚀处理通常在去除小颗粒噪声以及消除目标物之间的粘连是非常有效的。腐蚀处理可以表示成用结构元素对图像进行探测,找出图像中可以放下该结构元素的区域,而膨胀处理可以理解成是对图像的补集进行腐蚀处理。开运算即使用同一个结构元素对图像进行先腐蚀再膨胀的运算,在结构元素S下的开运算定义为:F∘S=F⊝S⨁S式(2.1开运算通常用来消除小对象物、在纤细点处别离物体、平滑较大物体的边界的同时并不明显改变其面积。开运算可以去除小颗粒噪声,以及断开目标物之间的粘连,主要作用与腐蚀处理相似,但与腐蚀处理相比,优点是可以根本保持目标原有大小不变。闭运算是使用同一个结构元素对图像先膨胀再腐蚀的运算,在结构元素S下的闭运算定义为:F∙S=F⨁S⊖S式(2.1闭运算通常用来填充目标内细小空洞、连接断开的临近目标、平滑其边界的同时不明显改变其面积。闭运算与膨胀处理的作用相似,与膨胀处理相比,可以根本保持目标原有大小不变。2.3图像的识别图像识别多用统计方法,以数学的决策理论为根底,建立统计学识别模型。根本方法是在对研究的图像进行大量的统计分析,找出规律性认识,抽取出反响图像本质特点的特征进行识别。这其中的主要工作在于如何抽取图像的特征或决定统计参数,必须把图像的大量信息缩减为少数的特征。为了抽取特征,有时要对原始图像信息进行各种变换,把多维的图像点简化为较低的维数。在图像识别领域,文字识别的研究最为深入,取得的成果也较大。除了统计方法识别外,近年来模糊数学和神经网络在图像识别方面也有了广泛应用。2.4小结本章主要介绍了图像识别的一些关键技术的原理,为下一章论述基于数字图像处理的障碍物识别打好理论根底。下一章将着重介绍基于数字图像处理的障碍物识别的原理和相关算法,并在MATLAB中进行仿真。3基于数字图像处理的障碍物识别障碍物的检测识别作为图像识别的重要内容,利用计算机对获得的图像进行分析和提取其中的目标信息,到达识别障碍物的目的。由于受距离、复杂环境及技术条件的限制,拍摄的图像一般都较复杂,这为置于背景下目标的提取及识别带来了较大的困难。通过对图像识别系统的学习和分析,本章利用图像识别的技术到达对障碍物的识别的主要目的,以路面及路面车辆的图像为例,在正常光照条件下进行识别。3.1仿真环境简介MATLAB是由美国Mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言〔如C、Fortran〕的编辑模式,代表了当今国际科学计算软件的先进水平。用MATLAB进行科技编程相对于传统的科技编程语言有诸多的优点。主要包括:(1)友好的工作平台编程环境。MATLAB由一系列工具组成。这些工具方便用户使用MATLAB的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交互性更强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境提供了比拟完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。(2)简单易用的程序语言。MATLAB是一个高级的矩阵/阵列语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句与执行命令同步,也可以先编写好一个较大的复杂的应用程序〔M文件〕后再一起运行。新版本的MATLAB语言是基于最为流行的C++语言根底上的,因此语法特征与C++语言极为相似,而且更加简单,更加符合科技人员对数学表达式的书写格式。使之更利于非计算机专业的科技人员使用。而且这种语言可移植性好、可拓展性极强,这也是MATLAB能够深入到科学研究及工程计算各个领域的重要原因。(3)强大的科学计算机数据处理能力。MATLAB是一个包含大量计算算法的集合。其拥有600多个工程中要用到的数学运算函数,可以方便的实现用户所需的各种计算功能。函数中所使用的算法都是科研和工程计算中的最新研究成果,而前经过了各种优化和容错处理。在通常情况下,可以用它来代替底层编程语言,如C和C++。在计算要求相同的情况下,使用MATLAB的编程工作量会大大减少。MATLAB的这些函数集包括从最简单最根本的函数到诸如矩阵,特征向量、快速傅立叶变换的复杂函数。函数所能解决的问题其大致包括矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、傅立叶变换和数据的统计分析、工程中的优化问题、稀疏矩阵运算、复数的各种运算、三角函数和其他初等数学运算、多维数组操作以及建模动态仿真等。(4)出色的图形处理功能。MATLAB自产生之日起就具有方便的数据可视化功能,以将向量和矩阵用图形表现出来,并且可以对图形进行标注和打印。高层次的作图包括二维和三维的可视化、图象处理、动画和表达式作图。可用于科学计算和工程绘图。新版本的MATLAB对整个图形处理功能作了很大的改良和完善,使它不仅在一般数据可视化软件都具有的功能方面更加完善,而且对于一些其他软件所没有的功能〔例如图形的光照处理、色度处理以及四维数据的表现等〕,MATLAB同样表现了出色的处理能力。同时对一些特殊的可视化要求,例如图形对话等,MATLAB也有相应的功能函数,保证了用户不同层次的要求。另外新版本的MATLAB还着重在图形用户界面〔GUI〕的制作上作了很大的改善,对这方面有特殊要求的用户也可以得到满足。(5)应用广泛的模块集合工具箱。MATLAB对许多专门的领域都开发了功能强大的模块集和工具箱。一般来说,它们都是由特定领域的专家开发的,用户可以直接使用工具箱学习、应用和评估不同的方法而不需要自己编写代码。目前,MATLAB已经把工具箱延伸到了科学研究和工程应用的诸多领域,诸如数据采集、数据库接口、概率统计、样条拟合、优化算法、偏微分方程求解、神经网络、小波分析、信号处理、图像处理、系统辨识、控制系统设计、LMI控制、鲁棒控制、模型预测、模糊逻辑、金融分析、地图工具、非线性控制设计、实时快速原型及半物理仿真、嵌入式系统开发、定点仿真、DSP与通讯、电力系统仿真等,都在工具箱〔Toolbox〕家族中有了自己的一席之地。(6)实用的程序接口和发布平台。新版本的MATLAB可以利用MATLAB编译器和C/C++数学库和图形库,将自己的MATLAB程序自动转换为独立于MATLAB运行的C和C++代码。允许用户编写可以和MATLAB进行交互的C或C++语言程序。另外,MATLAB网页效劳程序还容许在Web应用中使用自己的MATLAB数学和图形程序。MATLAB的一个重要特色就是具有一套程序扩展系统和一组称之为工具箱的特殊应用子程序。工具箱是MATLAB函数的子程序库,每一个工具箱都是为某一类学科专业和应用而定制的,主要包括信号处理、控制系统、神经网络、模糊逻辑、小波分析和系统仿真等方面的应用。(7)应用软件开发〔包括用户界面〕。在开发环境中,使用户更方便地控制多个文件和图形窗口;在编程方面支持了函数嵌套,有条件中断等;在图形化方面,有了更强大的图形标注和处理功能,包括对性对起连接注释等;在输入输出方面,可以直接向Excel和HDF5进行连接。MATLAB的根本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C、FORTRAN等语言完成相同的事情简捷得多,并且MATLAB也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也参加了对C、FORTRAN、C++、JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。3.2预处理图像预处理环节,主要采用了灰度化、中值滤波、Robert梯度算子锐化及边缘检测。为下一环节的图像差分和膨胀处理做准备。灰度化图像灰度化就是使彩色的R,G,B分量值相等的过程。由于R,G,B的取值范围是[0,255],所以灰度的级别只有256级,即灰度图像仅能表现256种颜色〔灰度〕。灰度化的处理方法主要有如下3种:(1)最大值法:使R,G,B的值等于3值中最大的一个,即R=G=B=max(R,G,,B)式(3.1)显然,最大值法会形成亮度很高的灰度图像。(2)平均值法:使R,G,B的值求出平均值,即R=G=B=R+G+B3式(3.2平均值法会形成比拟柔和的灰度图像。(3)加权平均值法:根据重要性或其他指标给R,G,B赋予不同的权值,并使R,G,B的值加权平均,即R=G=B=WrR+W其中Wr,Wg,Wb分别为R,G,B的权值。Wr,Wg,Wb取不同的值,加权平均值法就形成不同的灰度图像。由于人眼对绿色的敏感度最高,红色次之,对蓝色最低,因此使Wr>Wg>WVgray=0.30R+0.59G+0.11B式时,能得到最合理的灰度图像。MATLAB中,RGB模式的图像进行灰度化处理时,调用函数语句为:I=imread('*.bmp');J=rgb2gray(I);即可实现对彩色图像的灰度化处理,为后续工作做好准备。3.2.2背景差分目标分割要对图像进行差分处理,以获得目标区域,克服噪声影响。背景差分即是将当前图像与背景图像的对应像素值相减,再对差值取绝对值后输出,得到包含有目标信息的图像。背景差分需要设定一个阈值,将亮度大于阈值的点作为目标点,反之作为背景点,从而得到目标区域,这种方法适合用来在背景图像较为稳定的情况下检测目标。阈值选取方法分为固定阈值和自适应阈值。固定阈值是一个常数,当图像使用固定阈值得不到有效分割时,就使用自适应阈值进行处理。自适应阈值是图像灰度值的函数,随图像灰度值分布的不同而调整,适用于亮度不均的图像。对于静态场景,使用固定阈值即可得到有效分割。通过分析背景图像的灰度值,阈值的选取公式为:T=μ+K×σ式(3.5)其中,μ为背景均值,σ为背景标准差,K一般取3~5,。阈值处理的公式如下:gx,y=1f(x,y)>T其中,g(x,y)表示阈值处理后的二值图像,T表示阈值,f(x,y)为待处理图像的灰度值。本文选取的图像是静态的,背景图像是直接获取的,所以选用固定阈值。经过分析背景图像的灰度值,阈值T=0.2。在背景差分时,为了应对非道路局部的变化〔如光照缓慢变化、路旁树枝的摇动、草地上出现行人等〕,由于实际场景中这些变化不一定会单独出现,所以单高斯模型无法应对这样的背景变化,所以选用高斯混合模型对背景图像进行更新,以应对背景场景出现的干扰,保证差分后图像只出现待识别的目标图像。高斯混合模型使用K〔一般为3~5〕个高斯模型来表征图像中各个像素点的特征,统计图像中相同像素点的最近t帧值Xt,式(3.7)式中,μi表示该像素点颜色值的R、G、B分量;权值ωi≥0;i=1,2,…,k。k个高斯分布总是按照优先级λi,t=ωi,tσi,t2(对某像素点的每个样本更新点Xt+1,判断其与已存在的K个高斯分布进行匹配,假设满足条件Xt+1-μt<2.5σi,那么Xt+1高斯分布的权重、均值和方差分别按照式(3.8)、式(3.9)和式(3.10)更新。对于匹配的分布Mi,t+1=1;否那么ωi,t+1=μi,t+1=1-ρμi,t其中,ρ=αωi,t+1。高斯模型更新完毕之后,重新排列优先级λi,t式(3.11)式(3.12)该模型中有两个重要参数α和H,其中1/α表示训练P(Xt)的最大样本空间中的样本点个数;H用来确定作为背景模型的分布算法总体的流程如下:(1)计算当前像素值是否归属于存在的正态分布中的某一个;(2)假设找到一个匹配,那么更新每个分布的权值ω,引入一个学习参数α,其大小由噪声水平决定,更新公式为:ωt(3)假设没有找到任何匹配,那么认为当前像素值属于前景,并用一个新的正态分布取代排序在最后面的正态分布。新的正态分布ωtωt=在具体实验中,通常把n个分布中ωσ在进行背景差分后二值化,再对目标区域进行膨胀处理,对目标区域进行标记,求取最小外接矩形。3.2.3二值化图像的二值化处理就是将图像上的点的灰度置为0或255,也就是使整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。二值化的原理即设定某一阈值,将灰度图像的像素分成大于阈值的像素群和小于阈值的像素群两局部。设输人灰度图像函数为,输出二值图像函数为,那么gx,y=0f(x,y)<T阈值T是把目标和背景区分开的标尺,选取适当的阈值就是既要尽可能保存图像信息,又要尽可能减少背景和噪声的干扰,这是选择阈值的原那么。MATLAB中二值化图像函数主要有dither和im2bw函数。dither函数通过颜色抖动来到达转换图像的目的。语法如下:BW=dither(I)Image是图像矩阵资料,BW是二值化图像矩阵;而im2bw函数通过对灰度值进行阈值判断的方法到达目的。语法如下:BinaryImage=im2bw(Image,[Level])Image是输入图像矩阵资料,Level是二值化程度值,介于0到1之间,BW是二值化图像矩阵。本文采用im2bw函数。3.2.4中值滤波中值滤波是一种非线性滤波,一般采用含有奇数个点的滑动窗口,用窗口中个点灰度值的中值来代替指定点的灰度值。对于奇数个元素,中值是按照大小排序后中间的数值;对于偶数个元素,中值是指排序后中间两个元素灰度值的平均值。这里,中心点像素减去近邻8个值的中值来置换该点像素。输入像素f(x,y)的8个临近像素值从小到大排列并标记为:x0、x1、x3,…g(x,y)=f(x,y)-m(x,y)式(3.15)式中m(x,y)定义为:mx,y=x3+对于二维序列进行中值滤波时,滤波窗口也是二维的,但这种二维窗口可以有各种不同的形状,如线状、方形、圆形、十字形、圆环形等。二维数据的中值滤波可以表示为:式(3.16)在实际使用窗口时,窗口的尺寸一般先用3×3,再取5×5逐渐增大,直到其滤波效果满意为止。对于有缓变的较长轮廓线物体的图像,采用方形或圆形窗口为宜,对于包含尖顶角物体的图像,适宜用十字形窗口。本文选取的图像噪声水平较小,所以中值滤波处理选用3×3模板。相关的MATLAB语句为:Image_BW_medfilt=medfilt2(image_bw,[33]);figure;imshow(Image_BW_medfilt)中值滤波器是典型的低通滤波器,由于它在实际运算过程中并不需要图像的统计特性,所以比拟方便。在一定的条件下,对滤除脉冲干扰及图像扫描噪声最为有效,但对于线、尖顶等细节多的图像不宜采用中值滤波。中值滤波对图像的平滑有显著效果,很好地去除了椒盐噪声,并有效保存了图像边缘细节。3.2.5Robert梯度算子锐化和边缘检测梯度算子用于计算梯度值,通常认为它也是边界提取算子,具有极值性、位移不变性和旋转不变性。图像在点处的梯度定义为一个二维列矢量:式(3.17)梯度的幅值即模值,为:式(3.18)梯度的方向在最大变化率方向上,方向角可表示为:式(3.19)在不引起歧义时,为了方便,一般将梯度矢量的模值简称为梯度。实用中,梯度模还有很多近似式,此处不加列举。对图像f施用梯度模算子,便可产生所谓的梯度图像g,g与f像素之间的关系是式(3.20)式中G为梯度模算子。由于梯度图像g反映了图像f的灰度变化分布信息,因此对其进行某种适当的处理和变换,或将变换后的梯度图像和原图像组合作为f锐化后的图像。Robert梯度算子用4点进行差分,以求得梯度,即采用对角方向相邻两像素之差,故也称为四点差分法。对应的水平和垂直方向的模板为:式(3.21)标注·的是当前像素的位置(i,j)为当前像素的位置,其计算公式如下:Gi,j=fi,j-f(i+1,j+1)当梯度计算完后,如何确定锐化输出的图像是一个需要考虑的问题,根据需要,可以生成不同的梯度增强图像。具体有五种方法:(1)直接以梯度值作为锐化输出,即:f'i,j=G(i,j)式(这种方法直截了当,简单易行,缺点是增强的图像仅显示灰度变化剧烈的边缘,对灰度变化平缓的区域那么呈现黑色,整体表现暗的特性。(2)辅以门限判决:f'i,j=Gi,j式中,T是一个非负的门限值。只有梯度超过一定值时才用梯度值替代原灰度值。适中选取T值,既可以增强明显的边缘,又不会破坏灰度变化平缓的区域。(3)给边缘规定一个特定的灰度级,即:f'x,y=LG式中,T是一个非负的门限值,LG(4)给背景规定特定的灰度级,即:f'i,j=Gi,j这种方法将背景用一个特定的灰度级来实现LB(5)将背景与边缘用二值图像来表示,即:f'i,j=LGG(i,j)≥T这种方法主要突出了边界的位置,其中LG,LRobert梯度算子对噪声较敏感,常用于不含噪声的图像边缘点检测。梯度算子类边缘检测方法的效果类似于高通滤波,有增强高频分量,抑制低频分量的作用。图像边缘得到锐化加强,图像的细节得到加强。灰度平缓变化的局部由于梯度较小而显得很黑。第2章中说过,梯度算子也可以用来进行边缘检测。Robert算子适用于边缘明显且噪声较少的图像分割,常用来提取道路图像。本文中,道路图像并不复杂,而且在边缘检测之前已经用中值滤波对图像进行了处理,消除了噪声,所以这里仍然采用Robert算子进行边缘检测。Robert算子的定义为:Gf(x,y)=f(x+1,y+1)-f(x,y)2+由于上述算法的处理工作量很大,因此在实用上常采用绝对差算法对上式化简如下:Gf(x,y)≈fx+1,y-fGf(x,y)≈fx+1,y+1Robert算子采用对角线方向的相邻两像素之差进行梯度幅度检测,其检测水平、垂直方向边缘的性能要好于斜线方向边缘,且检测定位精度比拟高,但对噪声较敏感。3.3膨胀处理和目标识别3.3.1膨胀处理对于灰度图像,膨胀就是在结构元素的范围内,求取结构元素与图像中对应元素的和,看哪个和最大,然后这个和就作为图像中心点的值,当然这个中心点是指和结构元素中心位置对应的那个图像位置上的,然后继续滑动结构元素。而对于二值图像,膨胀就是用结构元素在图像上移动,只要结构元素中有一个点与图像中的点重叠即可,膨胀的结果是结构元素中心点划过的区域的内部,所以图像的边缘就被扩大了。设二值图像为F,结构元素为S,当一个结构元素S的原点移动到图像的点(x,y)处时,将其记作Sxy。此时图像X被结构元素SD=F⨁S=其含义为,当结构元素S的原点移动到(x,y)位置,假设S中包含至少一个像素值为1的点,那么在膨胀后的图像上该点为1,否那么为0。具体步骤如下:(1)将预先设定好形状以及原点位置的结构元素的原点移动到图像中可包容的所有像素点;(2)判断该结构元素所覆盖范围内的像素值是否存在至少一个为1的点,假设存在,那么膨胀后的图像中与结构元素原点相同位置上的像素值置为1,假设该覆盖范围内的所有像素的值为0,那么膨胀后的图像中与结构元素原点相同位置上的像素值置为0.(3)对原图中所有像素值为1的点重复前两步。MATLAB中实现膨胀处理的函数如下:BW2=dilate(BW1,SE)BW2=dilate(BW1,SE,…,n)其中,BW2=dilate(BW1,SE)表示使用二值结构要素矩阵SE对图像数据矩阵BW1执行膨胀操作。输入图像BW1的类型为double或unit8,输出图像BW2的类型为unit8。而BW2=dilate(BW1,SE,…,n)表示执行膨胀操作n次。3.3.2目标识别膨胀处理后对膨胀后的图像进行标记,标记区域的方法是利用每一个区域的连通域来定的。MATLAB中的bwlabel函数可以在二值图像中标记连通区域,主要对二维二值图像中各个别离局部进行标注〔多维用bwlabeln,用法类似,这里不作介绍〕。用法介绍如下:L=bwlabel(BW,n)[L,num]=bwlabel(BW,n)返回一个和BW大小相同的L矩阵,包含了标记了BW中每个连通区域的类别标签,这些标签的值为1、2、num〔连通区域的个数〕。n的值为4或8,表示是按4连通寻找区域或按8连通寻找,默认为8。这里num返回的就是BW中连通区域的个数。接下来对标记图像进行最小外接矩形的计算。图像的外接矩形是指完全包含了图形上所有的点、线,且各边均与图形相接触的矩形。一个图形的外接矩形有无穷多个,其中面积最小者称为最小外接矩形。由定义可知几何图形的最小外接矩形是唯一的,它在一定程度上描述了该图形的某些几何特征即长和宽。计算最小外接矩形的一种方法是旋转法,即将图像在90(1)将图像边缘点绕该图像形心点x0,(2)计算出每旋转θ后的最大横坐标xmax、最小横坐标xmin和最大纵坐标ymax、最小纵坐标yS=xmax-(3)在旋转θ,重复执行前两步,直到旋转角度到达90(4)在所有的图像边缘外接矩形面积中,找出面积S最小时的xmax、xmin、ymax为保证精度,每次旋转的角度θ=输入目标图像输入目标图像计算形心设置每次旋转角度θ旋转9计算最小和最大横的坐标与纵坐标求出外接矩形面积找出面积最小的外接矩形求出面积最小时的坐标值NY图3.1旋转法对最小外接矩形计算后,对目标进行特征参数提取,提取出表征目标信息的特征参量,即可到达定位和识别目标障碍物的目的。特征参数提取是要获得表征目标的特征参量,作为检测结果输出,对于二值图像,常使用质心作为特征参量来表征目标位置信息。具体方法是对标记区域进行质心运算,然后找到该标记区域在x轴和y轴上区域的最正确边缘点。质心的计算公式如下:式(3.33)式中,xm和ym分别为质心的横纵坐标,n为图像中目标区域的像素个数,xk和yk分别为确定目标的质心后,就可以通过质心位置确定目标位置,加上最小外接矩形的标示,从而到达定位和识别目标障碍物的目的。3.4小结基于数字图像处理的障碍物的识别需要在图像处理环节对待识别的图像进行较好的处理,首先进行对图像灰度化和去噪处理,然后锐化了图像中目标的边缘之后进行图像的背景差分,将图像中的感兴趣区域和非感兴趣区域区别开,之后对目标图像进行膨胀处理、最小外接矩形计算,最后定位识别。对静态图像的处理和识别较视频图像简单,特别是最小外接矩形的计算是定位和识别的关键。4总结与展望作为一种比拟有潜力的识别技术,障碍物的识别受到了广泛关注,开发出可靠高效的障碍物识别方法不但具有重要的理论意义,而且有很高的实用价值。本文针对图像的特性,分析和研究了障碍物识别的相关技术,主要从数字图像处理的角度出发,将中值滤波法、梯度法锐化与边缘检测、形态学膨胀处理和最小外接矩形应用于障碍物的识别。总结前面的研究,本文完成了以下工作:(1)综合分析了障碍物识别技术的开展现状和几种趋势,选择了通过数字图像处理技术,以路面图像为例,主要是用中值滤波对图像进行去噪处理,然后用Robert算子对图像进行分割。(2)对分割后的图像进行了膨胀处理,将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论