基于智能视频分析的特定车辆识别研究-检重通过稿_第1页
基于智能视频分析的特定车辆识别研究-检重通过稿_第2页
基于智能视频分析的特定车辆识别研究-检重通过稿_第3页
基于智能视频分析的特定车辆识别研究-检重通过稿_第4页
基于智能视频分析的特定车辆识别研究-检重通过稿_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于智能视频分析的特定车辆识别研究摘要本课题的出发点是基于现有的、已经覆盖全市几乎所有交通路口、停车场等各类现有视频监控系统,利用路口等处的大量监控探头所提供的视频,运用视频和图像处理分析技术,实现对某些特定车辆的自动识别方法的研究探讨,再通过监控视频的联网,实现对某些特定车辆的位置和行车轨迹等信息进行记录和查询,为某些特定的业务工作快速确定和定位某些特定车辆提供技术手段。在本文中对系统中涉及到的图像预处理、HOG特征提取、特征库建立、SVM分类器的训练,以及对算法的改良都做了详细的论述,同时针对有代表性的算法做了认真的分析学习,主要从以下几个方面开展论文的书写。第一章,主要介绍了国内外在运用视频监控系统对车辆识别检测的研究现状,认识到该课题的研究价值及实际意义;第二章,对图片特征的提取方法做了比拟分析,最后选取HOG特征作为车辆的特征;第三章,就目前通用的分类器训练方法做了简要分析,通过比拟各自的优缺点,再结合本课题目标对象的特征,选取SVM作为分类器;第四章,对现有HOG特征在灰度域中提取的方法进行改良,将其在颜色域里提取,在HOG特征中含有颜色信息,同时对算法进一步的改良,结合视频的多角度识别处理方法,得到改善后的算法,并实验验证算法有效;第五章,对本课题取得的成果做一总结,并确定之后的研究方向。关键词:特定车辆,车辆识别,HOG特征提取,颜色域HOG特征提取,SVM,多角度识别SPEACIFICVEHICLEIDENTIFICATIONBASEDONINTELLIGENTVIDEOANALYSISABSTRACTThepointofthisprojectisbasedonvariousexistingvideosurveillancesystems,hascoveredalmostallthecity'strafficjunctionsandparkinglotsandsoon.Theuseofalargenumberofvideoswhichareprovidedbyvideosurveillancecameras,andtheuseofvideoandimageprocessingandanalysistechniques,toachievecertainspecificvehicleautomaticidentificationmethodofstudywastoinvestigate.Alsothroughsurveillancevideonetworking,toachievecertainspecificvehicleinformationsuchasthelocationanddrivingtrackrecordandqueryforspecificoperationalworkquicklyidentifyandlocatecertainvehiclestechnicalmeans.Inthispaper,thesysteminvolvesimagepreprocessing,HOGfeatureextraction,featuredatabasecreation,SVMclassifiertraining.Alsoontheimprovementofthealgorithmhasdiscussedindetail,andhaslearnedandanalyzedrepresentativealgorithmscarefully,mainlyfromthefollowingaspectstowritepapers.Thefirstchapter,theresearchstatusofuseofvideomonitoringsystemondetectionofvehicleidentificationathomeandabroadwasintroduced,andknowingthevaluesandpracticalmeaningsofthesubject;thesecondchapter,analyzevariouspicturefeaturesextractionmethods,finallyselectHOGfeaturesasvehiclesfeatures;thethirdchapter,analyzethecurrentgeneralclassificationforthetrainingmethod,bycomparisontheirrespectiveadvantagesanddisadvantages,againcombinationofthesubjecttargetobjectfeatures,selectSVMasclassification;thefourthchapter,improveexistinghogfeaturesextractioningraygamuttocolorgamut,andthenewHOGfeaturescontainscolorinformation,atthesametimecombineidentificationofmulti-angletoimprovethealgorithmandexperimentalverificationtheeffectiveofalgorithms;thefifthchapter,sumtheresultsachievedonthissubject,anddetermineresearchdirections.KEYWORDS:specificvehicle,vehicleidentification,HOGfeatureextraction,colorgamutHOGfeatureextraction,SVM,identificationofmulti-angle目录摘要IABSTRACTII第一章绪论11.1研究背景及研究意义11.2车辆检测识别技术2对已有的车辆检测技术进行介绍2车辆识别技术进行介绍3国内外车辆检测识别的研究现状介绍31.3本文的主要研究工作51.4论文的组织结构5第二章基于HOG特征的特定车辆检测62.1车辆检测的主要方法62.2面包车的主要特点及检测方案8轮廓特征明显8检测方案:HOG92.3基于HOG特征的面包车HOG特征提取实现102.4本章小结12第三章基于SVM的面包车分类识别133.1车辆识别常用的分类器介绍133.2基于SVM的面包车分类器183.2.1SVM分类器原理18最优分类超平面19内积函数21车辆库的建立223.2.5SVM分类器的训练243.3基于SVM的面包车分类识别实验243.4本章小结25第四章基于颜色+HOG的面包车检测识别274.1颜色特征27彩色图像27面包车的颜色特征284.2基于颜色特征的检测识别预处理28常用的颜色特征提取方法有:28彩色空间29针对颜色对HOG算法的改良32实验结果及分析344.3多角度识别354.4本章小结35第五章总结与展望375.1主要研究成果375.2进一步工作37致谢39参考文献40绪论研究背景及研究意义今年来随着电子技术、计算机视觉理论及智能理论的开展,视频监控技术应用变得越来越普及,无论是在城市街道两侧、银行营业厅、机场车站还是在学校校园都可看到监控摄像头的身影。视频监控已逐渐融入人们的日常生活过程中,特别为人们生命财产平安提供了一种有效的平安保障。通常视频监控技术常用于平安指数较高场所,能够实现无人值班情况利用监视监控系统获得重要地点平安信息,这对于降低犯罪率及犯罪证据获得有十分重要意义,实践说明视频监控技术逐渐普以及为公安司法系统快速侦破各种形式案件起到重大作用;常见于监控系统常用于公路等场合实现车速以及车流量的检查,通过建立城市道路检测网络实现交通的智能疏导和意外事故检查等功能,为城市交通的平安运行保驾护航。视频监控技术先后开展先后经过模拟视频监控、数字视频监控、智能视频监控三个重要阶段。第一代视频监控系统设备采用模拟摄像头收集图像信息,利用同轴电缆传输,由处于不同地方摄像机采集图像后,分别通过多路电缆输送到监控室内,根据先后顺序通过在显示器上交替显示,监控人员必须时刻观看监视器,按照人工判断是否会出现异常事件的方法,因此消耗了较大的人力,因为长时间人工监视容易产生视觉疲劳,很难保证判断的准备率。受到电缆制造技术限制,传输距离很短,又因为模拟信号传输通常要求带宽较大,所以导致在带宽分配灵活性上变得较差。同时还存在采集到的视频图像难以保存等缺点。有关数据统计,英国目前摄像机总数到达了500多万个,按照有关数据计算显示:在伦敦居住的居民平均每个人每天将要被摄像机拍摄300次。然而目前视频监控大局部都是由人来完成,摄像机增加后,既没有足够的屏幕供显示观看,也不可能安排足够的人员24小时盯着屏幕看,这为居民人身财产带来很大的平安隐患,于是公安系统2004年在全国范围内确定了22城市作为首示范城市,2005年先后确定中了西部地区多个城市以及江苏、浙江、山东、广东四省等23个城市作为第二批示范城市,至到2023年全国范围内示范城市到达180个,示范建设为视频监控技术开展及快速普及提供有力条件。现在大约400万个监控摄系统用于城市道路监控与报警系统,国内已建有130多万不同级别安防系统,每年增加各类安防系统超过了30万个,其中银行金融方面所就有5万多个,车辆及车道检测系统超过2万多个;2023北京奥运会期间,我国己完整开发出一套"随着视频监控规模逐渐扩大,通过安保人员进行人工实时监控所暴露出来的局限性越发突出,经过30多年开展,视频监控系统尽管在功能及性能上得到很大程度增强,但是很多地方还具有一定局限性:(l)人类本性的缺点大多数情况下,人类并不是值得一位完全信用的观察者,不仅在视频观看还是视频回放的情况下,因为人类本身固有缺点,常常使我们发觉不到威胁存在,从而时常会导致漏报现象出现。(2)监控器上视频停留时间过短大多情况下,除了一些特殊要求的的监控系统外,视频监控系统会绝大多数不会按照1:1的比例进行摄像机配置监视器配置,即很多视频监控系的各个监控点不能时刻处在监控者的监视范围内。(3)误报及漏报问题存在误报和漏报为视频监视系统中最常出现的两大问题,误报指主要是将监控点中平安动作误认为具有威胁的活动,进而产生错误报警,漏报那么反之。(4)对视频数据处理困难较大随着现在车辆增减,交通事故发生次数也与日剧增,经常被要求交通找出与肇事者有关录像视频资料,从而进一步确定事故责任及评估该事件存在的平安威胁,传统视频监控系统缺乏智能分析技术,大量录像视频数据不能按照一定分别标准进行有效的分类存储,面对海量视频数据进行分析时,使交通工作人员的工作量变得极其很大且耗时,很多情况下还不能获得有效相关信息,而且还会出现误判误报等情况,使数据分析困难进一步加大,从而给交通或警察人员处理交通时间带很大的困难。(5)响应周期长视频监控系统时常由监控人员对存在平安威胁作出响应和处理,对响应时间要求低的情况来说根本能够满足。但绝大情况下由于平安系统的需要多个功能局部,联合配合处理时,这就要求监控系统的响应速度较快,这和用户的身或财产的损失情况密切相关。现在的视频监控系统向着数字化、智能化和网络化的方向开展。利用图像压缩手段等数字化技术,能够进一步改善信息量及带宽问题,借助于计算机视觉技术实现视频的智能监控,进而实现目标识别、报警等根本功能。数字化技术增强了抗干扰能力,传输段的问题且带宽较小,采用视频智能技术,实现视频自动监控,很大限度的节约人力物力。数字化后的视频图像易于保存,可将视频图像数据建立数据库对以后检索、查阅提供方便。计算机网络和便携式网络终端广泛应用,使远程监控逐渐成为现实。智能视频监重要作用之一为视频图像处理和分析程序,其中计算机视觉技术在其担任着重要角色。车辆检测识别技术对已有的车辆检测技术进行介绍半个世界以来视频车辆检测技术的研究,无论在理论及实践方面都取得丰硕成果,目前在视频车辆检测技术中核心技术为,图像处理。即为得到图像分析准确结果,检测算法为关键环节。所以,如何设计交通流检测算法是需要解决视屏车辆检测中主要问题方式之一。通常分为:知识型、运动型、立体视觉型和像素强度型4类。(1)知识型。目的为检测车辆的形状、颜色、对称性等常识信息。(2)运动型。主要借助于序列图像之间大量信息,主流方法为:光流法和运动能量法。(3)立体视觉。借助于两个或多个摄像机对同一景物从不同位置成像获得立体像对,通过各种算法匹配出相应像点,从而恢复深度(距离)信息。(4)基于像素强度的方法直接检测帧间变化,有时间差分法和背景差分法。通常视频车辆检测技术分为两大类:基于虚拟传感器(虚拟点、虚拟线、虚拟线圈)的非模型交通信息检测技术及基于目标提取和模型跟踪交通信息检测技术。(1)非模型交通信息检测技术1982年,Takaba等提出以虚拟点为处理单元的交通参数提取方法,为交通参数的视频检测奠定重要根底。非模型交通信息检测技术能够检测指定区内移动像素群,优点之处不需要理解像素群具体含义。主要工作原理为车道上设置一些虚拟传感器,当车辆经过传感器时,引起图像中局部区域内容的变化,处理该变化信号,可以提取所需信息。(2)基于跟踪交通信息检测技术该类技术有如下优势不仅能够实现非模型检测系统功能,还可以提取诸如车辆形状、属性等信息。该技术目前的研究主要针对于多运动目标的检测方面,BenjaminCoifmana等提出一种基于特征跟踪的交通参数提取方法,该方法以相机校正为根底,通过特征跟踪提取出车流量、车速及车流密度等参数。Young-KeeJung等提出利用背景差分的视频分割方法提取出运动车辆,然后通过基于Kalman滤波跟踪运动车辆,获取车流量和车速等参数。Daniel等对交通参数提取问题进行了研究,并于2000年提出一种先利用边缘提取,获取差分图像中运动车辆的约束框,进而跟踪车辆,获取车长和平均车速的方法。SurendraGupte等长期致力于交通图像处理的研究。车辆识别技术进行介绍目前车辆识别方法很多,主要图像识别及雷达检测两种主要方法,由于现在图像识别车辆精度较低,还不能准确地识别出大卡车和小轿车。Tan等[1]提出一种无须进行显式特征符号提取与匹配的车辆识别方法,直接根据图像梯度数据来确定目标车辆寻找图像中准备位置,缺点之处为提前获取交通场景中的先验知识,且基于灰度的相关匹配算法对场景类型的适应能力不强,这直接限制了该算法的广泛适用性。vanLeuven等[2]利用图像序列跟踪车辆,将图像中的模型与每个观测到的车辆进行匹配,通过Kalman滤波器控制模型的位和比例,依据多假设策略来过滤跟模型具有相似局部特征的对象,而现实中车辆图像模式有多样性,有时会出现图像畸变,增加了图像匹配的复杂性。车辆识别本身就存在一定难度,要对车型再行细分必然使车辆识别更加困难、复杂。而车辆前方盲区及ROI[3]区域〔驾驶员感兴趣区域〕内不同类型车辆对驾驶员驾驶行为影响不同,因此,识别出前前方车辆且对被识别车辆进行大小检测,准确确定前前方车辆的位置及大小最为重要。国内外车辆检测识别的研究现状介绍计算机视觉及图像处理技术不断改良,使视频在智能交通系统应用成为可能。国外对视频检测技术从上世纪70年代视频车辆检测技术的开始研究,并在理论和实践方面取得很大研究成果,经过几十年的开展逐渐商业化。1978年美国JPT(加州帕萨迪纳市的喷气推进实验室)首先提出运用机器视觉来进行车辆的检测[4],它是传统检测方法的一种可行的替代方案。后来ISS公司(ImageSensingSystem,INC)在1987年研制为第一代,验证了交通领域中应用视频检测技的可行性。NEWCAST大学的RourkeA,BellMGH和运输工作研究组(TORG)提出基于图像中的车辆的多窗口技术研究。后来对滤波器到沿图形的边界线扩展得到图形检测器,之后车辆检测相当于检测平行四边形,在车辆停车场的图像检测中结果ChoiandYang[5]使用基于均值偏移的聚类算法提取具有对称特性的车辆候选块,用块的几何和辐射度特征对每个候选块进行分类,Zheng[6]用多形态预处理得到候选车辆,这个过程用神经网络进行分类,这样的两步法系统的分割阶段会产生误差,ZhaoandNevatia[7]将车辆检测视为一个三维目标识别问题,他们利用人类知识构建典型车辆的的几何模型。然而,效率来说,由于需要大量的人为建模,这个算法不容易检测其他目标。Hinz[8]andSchlosseretal[9]应用三维模型构建车辆几何模型进行车辆检测和计数。AniruddhaKembhavi[10]等提出基于偏最小二乘法在车辆检测应用研究。东南大学的肖旺新[11]等基于小波变换的多尺度自适应闭值图像边缘检测的新方法应用于交通图像边缘检测。车辆检测及识别是基于各种图像处理算法,目前的车辆检测方法主要有地感线圈车辆检测法、波频检测法、智能视频检测法等。地感线圈检测法是比拟传统的车辆检测方法[12]。其原理是电磁感应的原理,而利用此种方法制成的车辆检测器为线圈检测器,它通常在同一车道的道路路基下埋设环形线圈,并让线圈通过一定的工作电流,使其作为传感器使用,当车辆通过此线圈或停在上面时,车辆自身的铁质就会使线圈里面的磁通改变,从而导致线圈回路的电感量的改变,检测器将检测得到的电感量的变化作为判断正在通行的车辆状态的依据。而不同车型本身的铁质分布不同,导致提取的车辆特征不同,所以采用模式识别的方法对特征[13]进行识别,从而判决出通过线圈的车辆类型。这种方法的优点是灵敏度和识别准确率都很高,且投入少,易于掌握。是其剖路施工量较大、后期维护难度也大。且由于地埋,易受路面环境等因素影响,而且入线圈的路面容易受损,尤其是在十字路口的路面。波频检测方法用微波[14]、红外线[15]或超声波[16]装置对车辆发出电磁波,并将感应信息返回给装置进行识别分析的一种检测方法。这种方法可以用在城市道路的交通监控中。其优点是受气候温度影响较小,已在我国东北地区成为主流应用,在深圳等大型城市也因为架构较为简便有占有率上升的趋势。灵敏度和捕获率不及地感线圈检测法,且因为基于微波技术,故可能存在一定错误率。智能视频检测[17]方法是直接集成在摄像机内部或者构建在前端工控机内的一个功能强大的综合事件检测“软件〞,对道路视频信息进行实时识别检测[18],一旦在分析过程中发现“车辆〞,便进行视频跟踪,当视频检测到相应的车辆进入到最正确的拍照范围时,便触发相应抓拍及后续的车型识别行为,其优点是硬件易于安装,维护方便,不会破坏路面,比拟灵活,能够做到实检测及更新。目前视频中的车辆检测方法[19]已经在交通监控管理系统中得到了广泛的应用,而且随着物联网技术的应用及图像处理、特征提取、模式识别等技术的不断完善,智能视频交通监控的应用前景将更加广阔。目前,车辆检测的根本方法是通过检测视频中明显运动的目标检测车辆。其中包括:背景相减法[20],帧差法[21],光流场法[22],高斯混合模型法[23]等等。但是这些方法中,背景的消除是一大难点,而且受到摄像机的抖动、光照变化、阴等的影响很大。后来,L.Anan[24]、L.Li[25]、NafiUrRashid[26,27]等人提出了基于虚拟检测线[28,29](VirtualDetectionLine,VDL)的方法。这种方法的优点是不用考虑背景的影响,在每帧图的固定位置设置一条虚拟线,而提取每一帧在这条虚拟线上的信息,然后按照时间顺序排列来就形成了一幅关于整个视频的时空图〔Time-SpatialImage,TSI〕。时空图中每一个图像块表示一辆车的缩减信息。通过计算图形块在时空图中的位置可得出要进行特征提取的关键帧。本文的主要研究工作本课题致力于研究在海量的标清和高清视频资料中,运用动目标检测跟踪算法,在低清晰度的情况下,较为准确的对特定车辆〔面包车、渣土车〕进行检测,面包车轮廓HOG特征提取,同时利用基于SVM等分类识别模型根底上,进行单一颜色面包车识别。目的是开发出一套低清晰度情况下特定车辆〔面包车、渣土车〕的实时检测识别算法,为公安监控实战中对这类车俩的排查监控和标准管理,提供智能化自动化的解决方案。本文主要研究内容如下:1.对基于视频的车辆识别算法的研究学习。通过对HAAR-LINK、边缘检测法和基于梯度方向直方图〔HOG〕等基于视频的车辆算法的学习,比拟不同算法优点和适用领域。2.通过对基于梯度方向直方图〔HOG〕算法的深入研究,阐述本课题利用该算法并结合颜色根底上,实现对车辆轮廓进行HOG特征提取,实现对某类特定车辆、单一颜色识别及管理。3.利用基于梯度方向直方图〔HOG〕算法,实现对视频中的面包车进行识别,经过实验验证,由实验仿真结果说明该基于智能视频的车辆识别系统在实际管理中有效性。论文的组织结构本论文主要内容分为五个章:第1章论述本课题的研究背景及意义,介绍智能视频车辆检测和识别算法在国内外的开展及研究现状,以及本文所要研究的主要内容。第2章,重点介绍基于HOG特征的特定车辆检测,包括车辆检测的主要方法:除对常用方法进行一般性介绍外,重点分析面包车的主要特点及检测方案,其中包含轮廓特征明显检测方案,基于HOG特征的面包车检测等。第3章着重分SVM的面包车分类识别进行分析,介绍了车辆识别常用的分类器,重点分析基于SVM的面包车分类器应用,主要包括:SVM分类器原理、车辆库的建立以及SVM分类器的训练,最后利用基于SVM的面包车分类识别进行实验分析,给出比拟结果。第4章建立颜色和HOG的面包车检测识别系统,首先分析了面包车的颜色特征,即为白色单一性,然后利用基于颜色区分轮廓类似的车辆〔SUV等〕、颜色特征的检测识别预处理等根底上,最后通过提取其主颜色或颜色分布,并判断是否符合面包车的主颜色或颜色分别,从而通过实验进一步验证该算法的有效性。第5章最后对论文进行总结,说明对本文算法缺乏之处,以及本文你研究工作展望趋势。基于HOG特征的特定车辆检测车辆检测的主要方法利用检测算法检测出运动车辆的运动范围、轮廓等数据信息。车辆识别主要是通过对轮廓等信息进一步提取特征分析,识别出运动车辆的具体位置以及车辆本身相关信息。目前对运动车辆检测和识别常用方法介绍如下:(1)背景差分法背景差分法是指采用当前与背景图像进行相减方式来确定运动物体的检测方法,为视频检测常用检测方法。其中主要特点:图像像素差,假设差值大于阈值那么说明该点是运动物体上的像素点,并标识出来;假设差值阈值那么说明是背景像素无需标识。关键之处如何有效性提取背景图像。目前无运动物体的情况下拍摄一幅只含有背景下进行有效提取,该方法只适用于背景不变化或者变化甚微且无外界干扰很小情况下,应用范围小。该检测算法的实时性差,且对急剧变化的外界干扰因素非常敏感。(2)光流法光流是指运动物体在观测成像面上像素运动的瞬时速度。这种运动模式是指一个物体的外表和边缘在一个视角条件下由摄像机和背景形成明显的移动。假设没有运动物体经过,整个视场中的光流变化是均匀流动的,假设视场中存在运动物体,对速度光流场与及周围的光流产生影响变化,可检测出运动物体大量信息。(3)帧差法帧差法是指将待测图像与前一幅图像相减,当灰度值大于设定的阈值时那么认为该点运动体,假设小于阈值那么认为是背景。帧差法检测关键之处是如何选帧间数量。假设选取的值较大、车速过快,帧差后的结果将大于运动区域,会带来很多问题。假设选取的值较小、车速较慢,那么两帧之间几乎没有位移,相减之后可能无法检测出运动物体,这就是不能检测出静止物体或者接近于静止物体原因所在。以上方法都存在缺乏之处,对图像进行分类时,如何选择适宜的方法对颜色、纹理、形状等特征进行训练,直接提取这些特征将会产生大量的高维数据,从这些高维的特征中如何选取出最重要的特征具有十分重要意义。常见的基于视频的车辆识别技术,主要有以下几种:1.梯度方向直方图HOG最早由Dalal于2005年提出,最初被用于行人检测中,取得了较好的效果。根据图像的形状、外观等特征信息,能够很好描述梯度或边缘的方向密度分布原理,能够快速随外界光照变化和目标旋转而变化。主要特征为:HOG主要先将图像划分为小细胞单元〔称为cell〕,再计算所有细胞单元中各像素点的梯度或边缘的方向直方图。将假设干个细胞单元组成一个区间〔称为block〕,然后在这些区间内对各细胞单元的梯度进行归一化,最后取得梯度方向向量。图像的梯度方向向量数由图像大小、cell大小、每个cell所取梯度维数等因素所决定。其计算方法为:〔2.1〕其中,——表示维数;——表示block大小;——表示cell大小;——表示block移动步长;W、h——分别表示图像宽与高。因此可以在应用中根据实际情况调整片尺寸、cell维数等参数,以降低特征向量维数。HOG特征为基于梯度方向的分布直方图具有优势,既可描述运动车辆中轮廓特征,又会减弱光照及小量的偏移不敏感现象。2.边缘检测法边缘检测方法是在不同的光线条件下利用车体的不同部件、颜色等提供的边缘信息有效的提取车辆的边缘,从而进行静止和运动车辆的检测。相对于背景消减法,由于车辆的外表、形状及颜色不同,边缘检测法所能提供的信息相当显著。即便车辆与路面的颜色相同,因为车辆要比地面反射更多的光线所以车辆仍能被检测出来。在边缘检测算法中有很多的经典算子,但是每种算子都存在不一样的缺陷,有的抗噪声能力强,但检测精度达不到要求,有的正好相反,还有就是能够很好的实现抗噪声能力弱,检测精度也可以满足需求,但是算法复杂运行时间长,可见,任何单一的边缘检测算法都有一定的缺陷在实现某一特定目标的检测时。3.Harr-like矩形特征算法最早的Haar-like矩形特征库是PapageorgiouC.等提出,ViolaP.等的快速人脸识别系统采用了3种类型5种形式的矩形特征,分别为:2矩形特征、3矩形特征和4矩形特征。其特征值的定义为黑色矩形内所有像素值的和减去白色矩形内所有像素值的和。LienhartR.等对Haar-like矩形特征库作了进一步扩展,参加了旋转45度角的矩形特征。扩展后的特征大致分为4种类型:边缘特征、线特征环、中心环绕特征、和对角线特征。Haar特征一共有4类,15种形式,其中包括4种形式的边缘特征,8种形式的线性特征,2种形式的点特征和1种形式的对角线特征。每一种特征模板内都有白色和黑色两种矩形,计算白色矩形像素和,减去黑色矩形像素和,记作该特征模板的特征值。每一种特征模板都可以在垂直和水平方向各自缩放生成一个完整的特征集。对于每一种特征值,计算公式如下:〔2.2〕其中:N——表示矩形ri的个数;——表示权重;——表示矩形ri的像素和。面包车的主要特点及检测方案轮廓特征明显特性1,车型Figure1Model’sdifferences图1车型的区别如上图所示,面包车为中大车型,在外形轮廓方面明显区别于出租车及轿车等娇小型的车辆。特性2,轮廓一致性Figure2Silhouetteconsistency图2轮廓一致性由图片及统计可知:尽管颜色与品牌相异,但是从外形轮廓具有统一的相识性。特征3,外表颜色Figure3Exteriorcolor图3外表颜色由上图可知,在我们生活中,常用面包车外形轮廓颜色大局部为白色或偏白色。检测方案:HOG基于HOG特征的检测算法主要由两局部组成:HOG特征计算及提取。HOG特征计算步骤具体如下:1)输入图像:输入图像为样本库中的某一个样本图像或者是前面在检测阶段得到的某个RoIs。2)梯度计算:将采集视频图像按照[-101]和[-101]进行滤波计算出该图像的垂直梯度和水平梯度,最后求出梯度方向及梯度大小。3)将输入图像平局分成的小格,由几个小格合组成一个小块。4)方向通道确定:将0°~180°或者0°~360°均匀分成n个通道。5)直方图获取:统计每个小格中中每个像素的梯度方向直方图,取直方图用步骤3中选取的n个方向通道最为横坐标,直方图的纵坐标取某个方向通道的像素的梯度累加和。最终获得一组向量。6)归一化处理:以小块为单位,利用向量进行归一化处理,目前常用的归一化方法有以下3种:,,〔2.3〕其中,V——表示归一化之前的特征向量;——表示它的k阶范数(k=1,2);——表示一个很小的常数(它的值不会影响结果,目的是为了防止分母为0)。7)形成HOG特征:将经过处理后所有的向量合理连接起来,构成组向量组,为HOG特征。HOG特征的提取思想HOG特征的提取思想:梯度方向直方图(HOG)为基于图像形状边缘提取算法,根本思想:优点是对图像相关梯度和边缘位置的精确信息依赖性很小,可通过局部梯度大小和边缘信息将图像局部外观和形状进行特征化。在HOG特征提取的过程中,以下一些参数对检测的结果有很重要的影响:不同尺度的参数模板,梯度方向的选择,重叠块、单元格的大小及归一化因子。HOG特征过程如下:为减小光照因素的影响,所以进行图像的颜色空间进行归一化;将检测窗口划分成大小相同的单元格(cell),在每个单元格中分别提取相应的梯度直方图,将相邻的单元格组合成相互有重叠的块(block),利用有效的重叠边缘信息,进行整块的直方图特征统计,并进行归一化,最后对整个窗口收集所有块的HOG特征,并以特征向量的形式来表示整个目标窗口的HOG。该特征提取的全部流程如下图:Figure4HOGfeatureextractionprocess图4HOG特征提取流程基于HOG特征的面包车HOG特征提取实现根据上述HOG提取流程图可知,其主要步骤如下:1.标准化gamma空间及颜色空间为减少外界因素对HOG特征的影响,首先图像进行标准化。在图像的纹理强度中,因为局部的表层曝光奉献的比重较大,所以这种压缩处理方式能够有效地降低图像局部的阴影和光照等外界因素变化,通常先转化为灰度图。Gamma压缩公式:〔2.4〕比方可以取Gamma=1/2。2.计算梯度计算图像的一阶梯度。求导操作不仅能够捕获轮廓,人影和一些纹理信息,还能进一步弱化光照的影响。梯度大小:〔2.5〕梯度方向:〔2.6〕3.单元格梯度投影主要目的为局部图像区域提供一个良好的编码,能保持对图像中运动车运动姿势和外观弱敏感性。先把图像窗口分成假设干个小区域,称这个区域被称为“单元格〞。然后将每个单元格中所有象素的一维梯度直方图累加到其中,最后按照根本的方向直方图映射到特定角度上,构成了最终的特征。4.块内归一化梯度直方图比照度进行归一化,能够进一步将对光照、阴影和边缘进行压缩。通常每个单元格由多个不同的块共享,归一化根本原理是基于不同块的,导致计算结果各不相同。因此,一个单元格的特征会以不同的结果形式出现在最后的向量中。我们将归一化之后的块描述符就称之为HOG描述符。5.收集HOG特征最将所用将检重叠的块进行HOG特征的收集,由计算出它们共同合成总的特征向量供输入到分类进一步处理。例如对于一个80*80的训练图片,单元格=16*16像素,块=4*4单元格块,每次滑动一个单元格为,那么特征维数=8*8*〔4*4*9〕=576维。为了方便给可以看出各种车辆HOG特征的差异,在此分别提取128*128车辆图片的HOG特征进行比照,如图5所示:taxi’sHOGfeatureextraction(a)出租车的HOG特征提取〔b〕Jeep’sHOGfeatureextraction(b)Jeep车的HOG特征提取〔c〕Van’sHOGfeatureextraction(c)面包车的HOG特征提取Figure5HOGfeaturecomparisonofdifferentvehicles图5不同车辆HOG特征比照如下图,可以很明显的看出,面包车辆的HOG特征与其他车辆的HOG特征的区别,因此将HOG特征作为面包车辆的识别特征是可行的。本章小结通过对各种车辆检测算法的学习分析,最后选取HOG特征算法,作为面包车辆的特征进行提取,为后续的识别做准备。同时通过实验比拟分析可知,各种车辆的HOG特征存在差异性,所以将HOG算法运用到车辆检测是合理有效的。基于SVM的面包车分类识别识别〔分类〕主要任务就是对特征空间进行一种合理的划分。分类器就是用标记为类别的决策区域表征特征空间,理想适宜且唯一的分类结果是,这些决策区域完全覆盖整个特征空间且任意两个决策区域互不相交,对特征矢量分类就是为其找到适宜的决策区域且不同属于其他决策区域。运用特征提取的方法对车辆存在的区域提取统计特征以构造分类器,从而在车辆识别过程中应用训练好的分类器实现对车辆和背景的分类识别。车辆识别常用的分类器介绍一般模式识别问题可以描述如下:对某一类样本的收集整理,并对收集到的样本集合训练,很明显此时训练样本明确知道所属类别的。将训练样本按照如图6(a)所示的训练过程进行分类器的训练过程,就得出分类器的判决表示。然后将待测样本按照经过训练得到的分类器进行分类识别,此过程如图6(b)所示。(a)Trainingprocess〔a〕训练过程(b)Classificationprocess〔b〕分类识别过程Figure6Trainingandclassificationprocess图6训练和分类识别过程现阶段常用的分类器有人工神经网络、K-近邻分类器、贝叶斯网络、AdaBoost分类器和〔SupportVectorMachine〕SVM,文章就对这几种方法进行详尽的介绍。人工神经网络人工神经网络〔ArtificalNeuralNetworks,ANN〕工作原理是基于考人脑的大脑神经元网络及神经元决策原理根底上建立的,只是借鉴了人脑反射工作方式原理而不是人脑组织结构真实模拟反响。因此换一种说法就是人工神经元模型是对生物神经元模拟及抽象出来的数学描述,其模拟神经元根本组成局部包括:的细胞体、树突、轴突、突触。如图7所示:Figure7Artificialneuronmodel图7人工神经元模型它采用感知算法对决策区域进行分类,在这种模型中,分类决策知识被隐式地存储在连接的权值上,权值向量运用迭代算法来确定,当通过网络的输出判别为正确时,权值向量保持不变,反之,当输出为错误时,权值向量做增加或降低的调整,因此这种算法也称为奖惩法。通常情况下,神经网络分类法由训练局部和测试局部组成,将样本的特征项构造输入神经元,特征项的数量即为该神经网络输入神经元的数量,至于隐含层数量和该层神经元的数目要以实际情况而定。在训练局部需要通过对大量的训练样本的训练,以便得到训练样本输入与输出之间存在确实定关系,即在不断的训练中通过迭代算法,调整过程中得到连接权值矩阵,从而得到最适宜的连接权值矩阵;测试局部那么是主要针对用户输入的待测样本的特征得到相应输出值,即该样本所属类别。K-最近邻分类器最近邻分类方法以独特简单的性质优点在目前模式识别及类别推理方面中仍占有一席之地。如今在各种人工智能的问题上也广泛运用到最近邻规那么,如模式识别,数据挖掘,后验概率的估计,基于相似性的分类,计算机视觉和生物信息学等领域。最近邻算法的开展涵盖多方面,不仅在算法提出创新、对理论深入研究分析,而且还有跟可视化的结合。K-最近邻分类算法〔k-NearestNeighbour,KNN〕,从字意上的简单理解就是,在给定新样本后,在训练样本集中只寻找与该新样本距离最近(最相似)的K个样本,忽略其他相距较远的样本,由这K个样本所属类别就可以确定新样本所属类别。具体说就是:在N个己知训练样本集中找出待测样本x的k个近邻,如图8所示。设这N个己经训练样本中,来自ω1的样本有Nl个,来自ω2的样本有N2个,……,来自ωc的样本有Nc个,假设kl,k2,……,kc分别是k个近邻中属于ω1,ω2,……,ωc类的样本数,那么我们可以定义判别函数为,i=1,2,……,c。决策规那么为:假设,那么决策。在N足够大且贝叶斯理论误差足够小前提下,K-最近邻分类算法和贝叶斯分类器的性能及其相当。只有N取值足够大条件下,新样本x附近范围内,含k个样本数的超球面半径(欧几里德距离)都趋于无穷小时,此时样本空间认为是致密填充的。当x与k之间距离会非常小及k足够大时,可以用(假设是连续的)来表示为x附近超球面所以范围内条件概率。那么x附近超球面内为最大条件概率相应类大多数点。因此,K最近邻分类器趋向于贝叶斯分类器,诚然,所有这些都是渐进于真值的。K-最近邻分类算法在定类决策上,只利用了训练样本空间的个数信息,而没有利用其他距离信息等,即只与少量的邻近的训练样本有关。这种投票机制使得KNN有一个主要的缺乏:当训练样本不均衡时,比方某些类的样本容量很大,而只有少量的其余类样本时,在待测样本的k个近邻中非常有可能大容量类的样本数量多于其它类样本,从而导致误分类的情况;另外,KNN只利用了训练样本空间的个数信息,而忽略了其他距离信息等,从而使得识别率不高。Figure8KNNdecision-makingprocess图8KNN的决策过程贝叶斯网络贝叶斯网络〔BayesianNetworks,BNs〕是近年来人工智能学科最活泼的领域之一。以有向图来对事件间因果关系直观表达方式。利用贝叶斯概率描述事件发生可能性的程度大小。贝叶斯网络信息特征主要包括定量及定性两方面:1〕定性方面通过条件信息独立网络结构G相互连接,可用结构点描述为某领域中具体量,结构点连接方式〔有向弧〕表示变量间相关性大小来表达的;2〕定量方面是通过节点间及相关节点变量间条件概率及分布函数〔条件概率表〕来表达的。由此可见贝叶斯网络通过统计节点参数以及结构知识获得,具有标准性、数字化优点。实际应用过程中需要假设属性间条件为互补影响的,在此条件下贝叶斯分类器星形结构可由如图9所示。Figure9ThestarstructureofBayesianclassifier图9贝叶斯分类器星形结构其中Xi表示属性结点,C表示类结点。属性之间没有直接相连的边,表示属性之间条件独立。贝叶斯分类主要特征:1〕贝叶斯分类是通过比拟对象概率值的方式确定属于那一种对象类,因此对应最大概率类就是该对象所属类;2〕每个对象属性都提供奉献值,即所有对象属性都参与分类;3〕贝叶斯分类对象的属性形式没有统一要求可为:离散的、连续的及混合的。主要目的提供最小化误差的最优解决方法来分类和预测。实际工程应用中,贝叶斯分类主要依据某类分布概率来描述对象属性所示不能直接被利用,实际当中很多情况下都无法准确求出证据的概率分布。因此通过对分类方法提出某种假来逼近贝叶斯定理使用条件。AdaBoost分类器AdaBoost算法具有能够显著改善子分类器预测精度,不需要先验知识,理论扎实等优点[30],一经提出就受到不同领域研究人员的关注,在解决各行业应用问题中都获得了极大的成功。在更好地了解Adaboost方法之前,先了解一下Boosting方法。对一个是与否的问题作出判断,随机猜想有50%的正确率,如果一种方法能够使准确率稍微高于50%的正确率,那么可以称得到这个方法的过程为弱学习;如果一种方法能够使准确率显著提高,那么称获取该方法的过程为强学习。1994年,Kearns和Valiant证明,在Valiant的PAC〔ProbablyApproximatelyCorrect〕模型中,只要数据足够多,就完全有可能将弱学习算法通过不断地学习的方式提高到任意精度,从而获得强学习算法。实际上,1990年,Schapire就首先构造出一种多项式级的算法,将弱学习算法提升为强学习算法,就是最初的Boosting算法。Boosting意思为提升、加强,现在一般指将弱学习提升为强学习的一类算法。1993年,Drucker和Schapire首次提出将神经网络作为弱学习器,利用Boosting算法解决实际问题。1994年Kearns和Valiant[31证明将弱学习算法通过集成学习的方式可以提高到任意精度;虽然Boosting方法在1990年已经提出,但其理论的真正成熟,也是在1994年之后才开始的。1995年,Freund提出了一种效率更高的Boosting算法。1995年,Freund和Schapire提出了Adaboost算法,这是对Boosting算法理论一次质的飞跃。Adaboost是Boosting家族的代表算法之一[31],全称为AdaptiveBoosting。主要依据弱学习反响对假设错误率相应调整,因此Adaboost主要特点:不对错误率下限有什么依赖,对任何弱学习器先验知识都没要求,而具有和Boosting算法具有同样好的效率,为此得到广泛应用。Adaboost是一种由级联分类模型构成的分类器。级联分类模型如图10表示,其主要特征;由多个弱分类器组成且每一级结构复杂性逐渐递增。每一级分类器具有通正例阻负例的共性。因此这样检测好处在于每一级逐渐递减,减少大量非检测量,进而增强了目标检测速度。Figure10AdaBoostcascademodel图10AdaBoost级联模型其次,Adaboost是一种迭代算法[32]。初始时,所有训练样本的权重都被设为相等,在此样本分布下训练出一个弱分类器。在第i〔i=1,2,3,…T,T为迭代次数〕次迭代中,样本的权重由第i-1次迭代的结果而定。在每次迭代的最后,都有一个权重的调整过程,在此过程分类错误的样本的权重将会增加,这样错分的样本将被突出表现出来,得到一个新的样本分布。首先在新样本分布条件下,每次对样本进行训练,可获得一个弱分类器。以循环的方式进行T次,就可得到一系列T个弱分类器,然后在把这T个弱分类器通过一定的权重从新叠加,最终可获得强分类器。AdaBoost算法的重要意义在于为研究和实际问题的解决带来了新的思想,在绝大多数集成学习算法通关构造越来越复杂的分类器来提高预测精度时,AdaBoost主要特色:以最简单方式,通过在功能上实现比随机猜想略好分类器从弱到强方法,AdaBoost在训练子分类器思想方法中进行改革:在打破已有样本分布根底上,使分类器注意力主要集中于难学习样本上。在算法使用上,仅需要指定迭代次数,不需要任何先验知识,一切运行过程中的参数由算法自适应地调整,因此被评价为最接近“拿来即用〞[33]的算法。与此同时,AdaBoost算法也存在缺点以及一些尚未解决的问题:例如提高算法抗噪声能力、停止迭代条件确实定是不可防止的问题、增加子分类器多样性。SVM分类器支持向量机〔supportvectormachine,SVM〕属于一种解决二分类问题的模型,如图11所示,是定义在输入样本的特征空间上的间隔最大化的分类器,间隔最大化优化方法使支持向量机与感知机之间〔perceptron〕有所区别[34],也成为支持向量机的理论根底之一。(c)(c)Figure11Withthetwo-dimensionalfeaturevectorclassificationexamplefigure图11具有二维特征向量的二分类例如图随着模式识别技术的开展,支持向量机得到广泛应用,逐渐被用在机器学习数据挖掘方面,使理论研究及实际应用方面得到快速开展。因为支持向量机能够很好解决复杂线性回归及复杂识别中分类等诸多问题,还经常应用预测和综合评价等领域[35][36]。支持向量机实现原理为:首先把某种事非线性输入向量x转化到高维特征空间映射Z,并在该空间寻找到最优分类超平面[37]。SVM主要采用行非线性变换方式,对输入量进行处理,通过策规那么集合的超平面权值合成结构,再从结构中选择最好元素及该元素最好函数,实现最小化错误率最低,进而进一步保证结构风险最小化原那么。考虑到SVM分类器在解决小样本学习、非线性以及高维模式识别等问题中表现出的良好分类性能,因此本文的研究使用SVM作为分类器。基于SVM的面包车分类器支持向量机的实现原理是:通过某种事先选择的非线性映射(核函数)将输入向量映射到一个高维特征空间,然后在这个新空间中求取最优线性分类面[38],而这种非线性变换是通过定义适当的内积函数实现的。SVM分类器原理为了说明SVM是怎么的一个分类器,首先给出一个简单的线性可分的分类问题.所谓数据集线性可分是指,给定一个特征空间上的训练数据集〔3.1〕其中:;——表示第i个数据的特征向量;——为的类标记,当时,表示为正例;当时,表示为负例,称为样本。如果存在某个超平面S使得〔3.2〕能够将数据集的正实例点和负实例点完全正确地划分到超平面的两侧,即对所有的的实例,有,对所有的的实例,有,那么称数据集T为线性可分数据集;否那么称数据集T线性不可分[34]。线性可分的支持向量机是定义在线性可分的数据集的根底之上的。例如对图11〔a〕中黑点和白点所呈现的就是一个线性可分的数据集,需要用一条直线,将图11〔a〕中黑色的点和白色的点完美的分割开,很显然,图上的这条直线就是要求的直线之一。而这个分类问题中所有的样本点刚好可以用一条直线完全正确的别离开来,这种假设下建立的支持向量机称之为线性可分的支持向量机。假设令黑色的点记为-1,白色的点记为+1,直线,这里的x、w都是向量,这种形式等价于〔3.3〕其中:;。前者表示的是构建的模型参数〔例如局部可形变目标检测模型的参数〕,后者表示的是输入模式〔例如目标检测中的图像〕的特征向量,n表示的是特征向量的维数,是一个实数,表示的是特征向量的第i个元素。当向量x的维度n=2的时候,在二维空间中f(x)表示一条直线,当n=3的时候,在三维空间中f(x)表示一个平面,当n>3时,表示n维空间中的n维超平面。令白色黑色两类的点分别为+1,-1,当对一个新样本点x做预测分类时,用符号函数就可以进行预测。当f(x)>0的时候,,当f(x)<0的时候,之后令。最优分类超平面支持向量机进行训练的目的主要是在输入的特征空间中找到一个超平面,该超平面能将实例〔图11中的黑点和白点〕分到不同的类别中去。超平面对应于方程为,它由法向量w和截距b决定,可用〔w,b〕来表示。超平面将特征空间划分为两个局部,一局部为正类,即,一局部为负类,即。法向量w指向的一侧为正类,另一侧为负类。而问题在于,当训练数据集线性可分时,存在无穷个超平面可将两类数据正确分开。例如能将图11〔a〕中黑点和白点分开的直线有无数条,如图11〔b〕所示的直线根本都能满足要求,怎样才能得到一个最优的划分直线f(x)。感知机利用了误分类数最小的优化策略,求得所需的超平面,不过这时的超平面有无穷多个。线性可分支持向量机采用了一个叫做间隔最大化的理论求取最优超平面,这样做时,能保证解是唯一的。在图11〔c〕中,有A,B,C三个点,表示3个样本实例,它们均在超平面+1类一侧,在预测它们属于哪一类时,点A距离超平面较远,假设预测该点为+1类,就能比拟确信预测是正确的;点C距离超平面较近,假设预测该点为+1类就不那么确信;点B介于点A与C之间,预测其为属于+1类确实信度也在A与C之间。一般来说,一个点距离超平面的远近可以代表分类预测确实信度。在超平面确定的情况下,〔3.4〕可以表示点x离超平面距离值大小,利用及类标记y符号一致性判定分类正确性。因此采用y〔〕描述分类的正确性及确信度大小,这种说法称为间隔〔functionalmargin〕。可以理解为间隔最大化的直线具有特征:在黑白两类点正确分开前提下,两类点中不但满足最近原那么还要离直线之间距离最大。在数据集线性条件下具有直线唯一性。Figure12SVMoptimalseparatinghyperplane图12SVM最优分类超平面使用间隔最大化的前提是正确分类,对于一个点x,在正确分类时,离直线的距离可以表示为,其中,由于y和f(x)始终同号,所以g(x)始终为正。此时,容易注意到,对于上式的决策函数,权值和b同时放大或者缩小相同的倍数都不会影响样本到分类面的距离,因此上面定义的最优分类面没有唯一解,而是有无数个等价的解。为了使着个问题有唯一解,就需要把和b的尺寸定下来。一种解决方法就是令离分类面最近的样本点到分类面的距离为1,这样,对所有的样本点,有。由于在分类面两侧各有这样的样本点,因此间隔最大化就可描述成:,约束条件是〔3.5〕等价的描述是:,约束条件是〔3.6〕这样,就构建了能得到最优化直线或者超平面的数学表达,通过优化这个式子,就能得到间隔最大化理论下的最优化的结果,这个式子称之为目标函数。使用SVM对不能使用线性分类的分类工作的过程:第一步,运用预先选定的非线性映射将输入空间映射到高维特征空间,使得输入训练样本可以在高维属性空间中有可能实现超平面的分割,从而防止了在原输入空间中进行非线性曲面分割计算。SVM通过训练得出的分类函数具有这样的性质:它是一组以SV为参数的非线性函数的线性组合,因此分类函数的表达式仅和SV的数量有关[39],而独立于空间的维度。非线性可分模型映射到高维空间以后,分类的示意图为:Figure13SVMclassificationmodelinhigh-dimensionaldiagram图13SVM高维分类模型图支持向量机求得的分类函数形式上类似于一个神经网络,其输出时假设干个中间层节点的线性组合,而每一个中间层节点对应于输入样本与一个支持向量的内积,因此也叫做支持向量网络[40],如图14所示。Figure14SupportVectorMachineSchematic图14支持向量机示意图内积函数采用适当的的内积函数就可以获得满足需要的支持向量机,运用不同的内积函数将导致不同的支持向量机算法;目前得到研究的内积函数形式主要有以下几类[41],在以下几式中x表示测试样本,xi表示训练样本:采用线性关系表示的最简单内积函数,即〔3.7〕内积函数选择利用多项式进行描述为:〔3.8〕计算结果为具有q阶多项式的分类器。(3)利用核函数表示内积函数的表达式为:〔3.9〕可得到径向基函数分类器是支持向量机,基函数中心与支持向量具有相对应,算法自动获得输出权值起着决定作用。(4)利用S形函数描述内积函数表达式为:〔3.10〕此刻该表达式结果为具有两层的多层感知器神经网络的支持向量机,不但能输出网络的权值,而且还能得出网络的隐层节点具体数目。车辆库的建立车辆标准库是车型正确分类的关键。先建立标准模板库,然后根据Hog特征表达式,计算得到车标特征库。显然,这种基于特征的匹配识别算法,可以降低模版库对存储空间的要求,相比储存一副图像,只储存局部数据还能够极大提高匹配的识别速度。车辆特征库的建立,一般常用的方法有两种方法:一种是从大量的训练样本中,提取识别效果最理想的一个来进行特征计算,并作为模板的特征值,这种方法操作简单,但比拟依赖人的主观判断;另一种方法是对多个样本逐一进行特征计算,通过求平均值得出模板特征值。这种方法效果比拟好,能降低采集过程中的人为因素的影响,但是实现较为复杂。由于受环境影响,所以采集车形计算特征量需要先对车辆样本预处理。车辆标准特征库的建立流程如图15所示:Figure15Theflowchartsofvanlibrariescreate图15面包车库建立流程图在实验中,我们从收集到的大量图片中选择不同型号、大小、光照等,尽可能的是样式涵盖最全的图片作为模板样本,局部的正样本图像如图16〔a〕;局部负样本,如图16〔b〕所示:〔a〕Positivesamplespictures〔a〕正样本图片(b)Negativesampleimage〔b〕负样本图片Figure16Somesamplespictures图16局部样本图片在算法一定的情况下,样本库的大小和典型性共同决定着SVM分类器的准确性。所以本次设计在构建训练样本库的过程中投入了大量的时间,一共找到了正样本负样本各550多张,总共样本1100多张,这也为SVM分类器的准确性奠定了根底。通过种种渠道,我找到了交通监控录像,为样本的真实性,多样性提供了保障。为了方便SVM的训练,统一将图片的尺寸调整到64╳128。从上述样本可以看出,样本的选择具有了全面型,典型性,包含了各种车型,各种天气。正是这样全面的样本库,使得SVM分类器的准确性得到了保证。SVM分类器的训练在进行SVM分类器训练之前,需要做好各种准备工作,最重要的就是正负样本的HOG特征提取,之后将获取到的HOG特征数据库即车辆特征库送入SVM中进行分类训练,从而获得用于识别面包车的SVM分类器。其具体训练过程如下:〔1〕将所有车辆图片分为数量相等的正负样本:在实际获取收集到的车辆图片中,都比提取特征的图片要大且大小不统一,首先将所有照片统一到一样的尺寸并符合实验需求的大小64╳128,选取各种情况下的各种型号面包车的图片作为训练的正样本;用和正样本相等数量的其他车辆、和面包车不相关的图片作为负样本;〔2〕提取正负样本的HOG特征:在OpenCV中实现HOG特征的提取;〔3〕将在上一步中提取到的HOG特征投入到SVM中训练,得到初始分类器;〔4〕利用上一步获取到的初始分类器的支持向量和对应的权值加权得到检测面包车的检测子,再加上一维的偏移。但是,这个初始检测子,检测效果很不理想,有很多错检的结果,由于错检太多,需要对分类器继续训练加以完善;〔5〕利用这个初始的检测子对负样本的原图进行检测,这次需要对尺度不统一的图片进行检测,此时可以使用cv-HOG的多尺度检测方法,获得hardexample区域;〔6〕将第5步中hardexample区域分割出来,之后提取该局部的的HOG特征;〔7〕将在hardexample提取到的HOG特征和第2步中正负样本的HOG特征综合起来,再重新训练SVM分类器,这样得到的SVM分类器的分类效果得以改善。如果效果不理想,可以从第〔5〕步开始继续重复训练。基于SVM的面包车分类识别实验对上一章节获取到的SVM分类器进行分类识别实验,验证该分类器的真实可用性,具体验证流程如图17所示:Figure17TheprocessofvanidentificationwiththeSVMclassifier图17用SVM分类器识别面包车流程其具体实验结果如图18所示,有实验结果可以看出,通过此方法获得的SVM分类器对面包车的识别率根本可以满足实际需求。Figure18VanidentifieswiththeSVMclassifier图18用SVM分类器对面包车的识别本章小结本章主要针对面包车分类识别中分类器的建立做了分析介绍,首先将目前在图像分类识别上广泛使用的分类器做一简单了解认识,在比拟各分类算法的优缺点之后,针对本文的研究对象,选用SVM分类器;其次,对SVM分类器做了深入的研究认识,并对其算法认真学习,最后通过MATLAB将其实现;最后,为了获得关于面包车辆的SVM分类器,建立车辆特征库,并对其进行分类训练,将获得SVM分类器进行实验,实验结果较为理想。基于颜色+HOG的面包车检测识别颜色信息作为检测目标、检测道路非常有用的检测方法,很多监控系统运用颜色信息来实现道路险跟踪、车辆分割等的有用信息。颜色特征是一个全局特征,所以目标或目标所在区域的外表性质可以用颜色特征加以描述。因此面包车的颜色特征也是区别其他车辆的重要信息。通常情况下,颜色特征是基于像素点的特征,所有属于图像或图像区域的像素对图像的整体特征都有各自的奉献,由于颜色对图像或图像区域的方向、大小等变化不敏感,因此颜色特征更能很好的刻画对象的整体特征。车辆颜色信息也是运动车辆识别系统中一个重要辅助特征,它由车身的主要颜色成分确定。面包车的颜色一般是纯色,无需对局部环节进行区别,只是确定特征区域的分布就可,所以,在颜色空间中计算的HOG特征更有利于面包车的识别。颜色特征彩色图像在图像的众多特征中,颜色特征可以直观、清晰的表达出来,是图像视觉重要的感知特性之一。其不仅表征出图像中目标对象和周边环境的关系,而且对图像自身的尺寸、方向、视角的依赖性较小,因此基于颜色特征的图像查询在图像检索中最根本和最重要的方法[42]。经过大量的理论研究和实践证明,人类已经根本掌握了颜色的物理本质。详细的实验研究数据说明,人眼锥状细胞是接受彩色视觉信息的主要细胞,人眼中大概拥有六七百万锥状细胞,其中可将其分为三个主要的彩色信息感知类别。分别是红、绿、蓝,其中大约65%的细胞对红色光源敏感,33%对绿色光源敏感,只有2%对蓝色光源敏感[43],眼睛对红、绿、蓝吸收的平均实验曲线如图19所示。由于人眼对光源信息的吸收特性,所以通常认为被眼睛看到的彩色是由三种原色,红〔red〕、绿〔green〕和蓝〔blue〕通过眼睛接收量的多少组合得到。Figure19Thefunctionofconeseyesabsorbthered,green,andbluewavelengths图19人眼中锥状细胞对红、绿、蓝三色的波长吸收函数T.Young在1802年提出三色原理,其根本内容是:任何颜色都可以用3种不同的根本颜色按照不同比例混合得到,即〔4.1〕式中:C1、C2、C3——为三种原色〔又称为三基色〕,a、b、c≥0,为3种原色的权值或者比例,通过改变a、b、c即可得到不同的色彩。三原色原理在色度学中占有重要地位,是其他原理的根底。为了统一标准,1931年,国际照明委员会〔CIE〕规定各种颜色用红、绿、蓝三原色按照比例混合得到,其配色方程为:〔4.2〕其中:C为任意一种颜色,R代表红色,G代表绿色,B代表蓝色,a、b、c≥0,为3种原色的权值或者比例。三原色原理的应用,同时国际标准的推出,各种颜色用统一标准的表示,使得彩色图像的获取、表示、传输和复制不再是空想。经常使用亮度、色调和饱和度来区分颜色。如无彩色图像就只有亮度一个特性量的变化;色调主要表现光波混合中,和主波长相关的属性,表示观察者观察到的主要颜色;色调的纯度的对饱和度有一定的影响,当完全饱和时代表着纯光谱色的,随着白光的不断参加饱和度逐渐减少。色调和饱和度合称为彩色,因此,颜色用亮度和彩色表征。面包车的颜色特征从视觉上区分一件物体时,多数情况下从两方面入手,首先,先从其外观,从外表确定其大概属于什么类,进行粗划分之后,再进行仔细的划分,例如颜色、环境、声音等等特点。在现有的车辆中,车辆轮廓和车辆颜色都是描述一辆车的主要特征。就以面包车为例,在轮廓有稍微的变化的情况下,还有一个显著特征:颜色。随着三原色原理的提出,彩色空间的运用成为现实,通过监视器获得画面不再是单纯的黑白两色,而是展现出一个多姿多彩的画面,从而从颜色特征上区分车辆也不再是空想。由第三章中的车辆库中的各类面包车的图片可以得出,面包车外表颜色相对固定、车辆类型相对单一,这也是区别其他车辆的重要特征。面包车都是以某种纯色为主,很少有混合色。同时可以看到,有一局部的面包车的车型和现在比拟流行的SUV外形轮廓很是相似,但是SUV的颜色较为庞杂,有纯色、混合色等,相对颜色大多是乳白色或银灰色的面包车,用颜色特征将会更好的识别面包车。基于颜色特征的检测识别预处理常用的颜色特征提取方法有:颜色直方图颜色直方图可以描述一幅图像中颜色的全局分布,即不同色彩在整幅图像色彩分布中各自所占的比例;对于无法自动分割的图像和无需考虑物体空间位置的图像非常适用[45],该方法存在着缺点,即很难确定图像局部局部的颜色分布及每种色彩所在的图像位置。在日常生活中及图像处理中,常用的颜色空间主要有以下几种:RGB颜色空间、HSV颜色空间、HSI颜色空间等。颜色集颜色集是类似于颜色直方图的一种方法。首先,将图像从RGB颜色空间转化到视觉均衡的颜色空间〔如HSI空间〕,并将颜色空间用假设干个区间〔bin〕加以量化;然后,用色彩自动分割技术对图像进行分割,将其分为假设干区域,在对每个区域中的某个颜色分量量化作为该局部颜色空间的索引[44],从而可以用一个二进制的颜色索引集来表示图像。颜色矩颜色矩是在数学方法上建立的,颜色的分布用矩来描述。图像中任何颜色的分布均可以用它的矩来表示。颜色矩可以直接在RGB颜色空间计算,由于颜色分布信息主要集中在低阶矩。因此,仅采用颜色的一阶矩、二阶矩和三阶矩就足以表达图像的颜色分布[45],它们的定义分别为:〔4.3〕〔4.4〕〔4.5〕其中:Pij——是第j个像素的第i个颜色分量;N——是像素集。事实上,一阶矩i表征每个颜色分量的平均强度[44],二阶和三阶矩分别表征了颜色分量的方差和偏斜度。彩色空间彩色空间〔也称彩色模型或彩色系统〕的用途主要是在某些标准下,或图像处理要求上用通常可接受或利于图像处理的方式简化彩色标准。事实上,彩色空间就是坐标系统和子空间的标准[46],位于系统中任意颜色都由坐标系统中的某个点来表示。现在所用的大多数彩色空间都是为了更好地满足硬件或实际应用需求,RGB〔红、绿、蓝〕空间是最通用的面向硬件的彩色空间,主要用于彩色监视器或彩色视频摄像机;CMY〔青、深红、黄〕、CMYK〔青、深红、黄、黑〕空间主要用于彩色打印机;HSI〔色调、饱和度、亮度〕空间符合人类对彩色信息的描述和颜色的解释方式,用彩色信息和亮度信息两局部来描述图像;CIE颜色空间〔CIELuv、CIELab〕是另一种符合人类描述和解释颜色的方式;由于彩色科学涉及到的应用领域很宽广,所以还有很多应用的彩色空间,但在此只对以下几种作简要介绍:RGB彩色空间RGB颜色空间作为最常用的色度空间,广泛运用在计算图形学、数字图像处理中。该颜色空间模型是基于笛卡尔坐标系统建立的,用一个RGB彩色立方体对模型以图解展示[47],如图20所示,这个立方体的各顶点分别代表光的原色〔红、绿、蓝〕和三种典型合成色〔青、品红、黄〕。Figure20RGBcolorspacemodel图20RGB颜色空间模型在RGB彩色空间中,每一幅图像都由三个图像分量组成,即每幅图像可以向三个原色面进行投影,每一个面的投影获得一个图像分量,每一个分量图像代表着该图像在该原色面上的分布,用像素深度表示每一像素的比特[46];在这个彩色空间中,每幅图像可以用三个图像分量表示,所以,在此空间中可以用一个mn3的矩阵来表示一幅mn〔m,n为正整数,分别表示图像的高度和宽带〕的RGB彩色图像。可以用红、绿、蓝三个分量组成的三元组表示图像中的每一个像素点;三个分量不仅含有色彩和亮度的信息,而且三个分量之间存在着很大的相关性[48]。HSI彩色空间HIS彩色空间是基于人的视觉系统建立的,用色调〔Hue〕、饱和度〔Saturation〕和亮度〔Intensity〕共同来描述色彩。HIS颜色空间由两局部组成:一个垂直的亮度轴和与此轴垂直的一个平面上的彩色点的轨迹,平面沿着亮度轴上下移动,那么由平面和立方体外表相交形成的边界有可能是三角形,也有可能是六边形,甚至也有可能是圆形。假设从立方体的亮度轴看去,如图21〔a〕所示,在这个平面上,各原色之间都相隔120,合成色与原色相关60,合成色之间的角度也是120。图21〔b〕显示了六边形和一个任意的彩色点,这个点的色调是由其和参考点的连线与,参考点和红色轴连线之间的夹角决定,即定义参考点与平面和红色轴的交点之间的夹角为0,求彩色点与参考点之间的夹角,夹角从0逆向增加;饱和度指的是该点到亮度轴的距离,也就是从原点到该点的向量的模长,原点即为该彩色平面与垂直亮度轴的交点;亮度即为该彩色平面在亮度轴上的位置。所以,HSI彩色空间主要包括垂直亮度轴、到彩色点的向量长度以及该向量与红色轴之间的夹角三个分量[49],因此用六边形或者三角形〔如图21〔c〕〕、圆形〔如图21〔d〕〕,来定义一个HSI平面是可以的,选择哪种形状是不重要的,因为任意两种形状都可以相互转换。(a)Coloredhexagons〔a〕彩色六边形〔b〕〔c〕

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论