1006大设计翻译版高工以_第1页
1006大设计翻译版高工以_第2页
1006大设计翻译版高工以_第3页
1006大设计翻译版高工以_第4页
1006大设计翻译版高工以_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

我,本 及其研究工作是由在导师指导下独立完成的,在成 时所利用的一切资料均已在文献中列出。时间:2014年6ResearchandImplementationofObjectDetectionTechniqueBasedonDeformablePartModelAuthor:QIUTutor:SHENGWiththedevelopmentofcomputertechnologyandthewidelycitedprinciplesofcomputervision,usingcomputerimageprocessingtechnologyforreal-timetargettrackingstudiesincreasinglypopular,dynamicreal-timetargettrackinghasawiderangeofapplicationintermsofinligenttransportationsystems,inligentcontrolsystems,militarytargetdetectionandsurgicalinstruments,medicalsurgicalnavigationpositioning.Thispaperyzestherelatedofobjectdetection,andmainlyintroducetheobjectdetectiontechniquebasedondeformablepartmodel.Thisobjectdetectionalgorithmmainlyincludesthreesteps:featureextraction,modeltraininganddetection.Firstly,weextracttheHOGcharacteristicsofthesampleandrepresentintheformoffeaturevectors,thenusesupportvectormachinetrainingtheclassifier,finallycompletethetargetdetectionandlocation.WeuseHOGfeatureextraction,classifiertrainingalgorithmandslidingwindowdetectiontechnology.Basedontheysisofdetectionresultsofobjects,theobjectdetectionalgorithmbasedondeformablepartmodelcanlocatetheobjectundercomplexbackgroundandmeettheneedofrealtimeandaccuracy.Itcanbeusedformonitoringandinligenttrafficofcities.:Objectdetection,Deformablepartmodel,Histogramoforientedgradient(HOG),Latentsupportvectormachine,Slidingwindowdetection绪 背 的研究目的及意 国内外研究现 Boosting算法 基于Haar特征的AdaBoost算 基于梯度方向直方图的检测算 HOG特征混合模型结合LSVM的目标检测定位算 的主要研究内 的构 目标检测相关技术分 边缘检测算 基于微分算子的边缘检 高斯低通与微分算子的边缘检 Canny边缘检测算 多尺度的边缘检测算 图像特征提取算 图像特征的种 图像特征提取算 分类器训练方 支持向量机(SVM)算 贝叶斯学习算 Boosting算 本章小 基于可变形组件模型目标检测算法研 可变形组件模 滤波 滤波器得 检测窗口的得 变 3.2.1位 形变花 部件模版得 HOG特 HOG特征提 特征金字 目标的假设得 混合模 模型训 部件的添 隐藏变量 滑动窗口检测算 本章小 目标检测算法实 目标检测的系统组成框 模型训 部件模型HOG特征提 检测模型部件的选 分类 测试图像处 检测过 程序实现 实验结 实验目 模型训 检测结 实验结果分 不同阈值的检测准确 不同算法的检测准确 本章小 总结与展 总 展 致 参考文 绪从很长时期看来,我们的计算机还是一个需要人来介入的工具,之所以称之为要地接受由键盘、文件输入的信息,而不能主动从获取信息并自主处理。人们为了让计算机看到并主动从寻找信息,发展了计算机视觉;为了查询,往往查询出的仅仅是一些包含文字的,而的实际内容却与我们的目Boosting算法计算学计算的图形图像的处理乃至计算机视觉方面的作用非常重要,有了它才计算学习理论中常用的模型就是PAC(ProbablyApproximayCorrect)学习模型,在1984年首先由Valiant在其 中把“学习”当成是一种“过PAC学习的实质就是基于样本的训PAC模型本身并不强求学习器能输出零错误率的弱学习与强学Boosting算法的时候人们最关注的一个问题就是如何根据观测来的数据来学Valiant两人证明出只要在训练时输入足够的数据,弱学习算法就能通过集成的方式Boosting是为了提升、加强。现在一般指的是将弱学习算法提升为强学习算法的一分类规则转化为强分类规则。在一年之后,Freund又提出了一种效率更高的Boosting算法[11]。1993年,DruckerSchapire两人首先提出以神经网络作为弱学习器,然后应Boosting算法来解决实际中的问题[12]Boosting算法在很多领域已得到简单而有效的1995年,FreundSchapireAdaboost(AdaptiveBoostingBoosting算法的一大提高[13]。1995年,FreundSchapireHaarAdaboost算法[14],这在级联分类器进行再次检验,这样就保证了最后输出的正样本的伪正(FalsePositive)的可能性非其次,Adaboost是一种迭代算法。初始时,所有训练样本的权重都被设为相等,在这T个弱分类器按照一定的权加起来,就得到最终的强分类器。Haar积分分类最佳弱分类器,最后将每轮得到的最佳弱分类器按照一定方法提升(Boosting算法)图像算法的过程非常快,即使是遍历了这么多次,根据不脑的配置处理一幅图像一般也GradientHOGcell组成一个block在block内归一化直方图来消除光照的影响,一个检测窗口内由多个block内归一化直方图组成的结果就是特征向量,最后使用统计学习方法进行训练和判HOG描述方法具有以下的优点:HOG表示的是边缘(梯度)的结构特征,因此可对传统基于梯度方向直方图特征检测算法对解决目标模型单一、发生形变、存在遮于G合SM的目算。利练像的G特征金字塔得到包含待检测目标根模型、部件对可部征示模仅标整廓且够到更然用G特征混合特征训练部件检测分类器S(tntSupporttorhine)。最后通过动态规划和距离转换算法在测试图上扫描出与可变形部件模型相匹配的区域,实目的定经多验表所 能地决在 括模型,混合模型,HOG特征,训练,LSVM,目标检测等。目标检测相关技术分Roberts这是最简单的交叉梯度算子,其中GX,Gy分别由下GX=f(x+1,y+1)− Gy=f(x,y+1)−f(x+ 它采用的是3×3的模版,其中GX,GyGX=f(x−1,y+1)+f(x,y+1)+f(x+1,y+1)−f(x−1,y−−f(x,y−1)−f(x+1,y− Gy=f(x+1,y−1)+f(x,y+1)+f(x+1,y+1)−f(x−1,y−−f(x−1,y)−f(x−1,y+ Sobel某种程度的平滑效果,同Prewitt一样都属于中心差分算子。Canny1986年,JohnCanny在比较微分算子不同性能的基础上,对其进行理论和实践的总Canny三准则,他认为一种好的边缘检测算子应该满足三个准则:信噪比准缘的曲线,n0是高斯噪声 |∫+wSNR(f)=n0√∫+w

|∫+wLocalization= n0√∫+w其中G‘(x)是G(x)的一阶导数,f’(x)是f(x)的一阶导数

Canny多尺度技术也叫做多分辨率技术,它是指图像在不同分辨率下分别进行处理[16],有多尺度的操作需要对多尺度信号进行分解和重建。在多尺度图像分析中,小波变换[17]行人。GemmaRoig使用了条件随机场模型用于多机中的目标识别[18]。n等人Haar小波特一幅图像的颜色信息是其最基本,最直观的特征,可以用颜色来表示图像的重要信DphneKllr在树形结构中使用了最大边缘优化原则学习了颜色信息[21]硬件设备中显示,也可以独立于具体的设备,与人的视觉感知并不完全一致,主要有R、、YQSHSV,SVGZSV、HSI、HSL等利用饱和度和色度来表示对色彩的感知,用来避免光照的影响;YUV和YIQ则利用其中一个分量来表示对非色彩的感知,另外两个分量来表示对色彩的感知。RGB模型,根据人眼结构,所有颜色都可以看做三种基本颜色红、绿、蓝的不同组合。RGB模型的空间正是这三个轴所形成的立方体,HSI模型,H表示色调,S表示饱和度,I表示亮度或者灰度。HSVHIS更接近纹理是图像的一种局部特征,它反映的是图像在空间上的结构排列信息,用于描述ia3D场景中高效地提取目标的低层纹理[2]状特征也提出了诸多有效的算法,Y.Wu等基于概率统计的行人检测的模型将行对图像形状特征的描述可以分为基于区域和基于边界两种类型。基于区域的描述是用Hoh征提取算法要有边缘性法和算子。边缘特性是对图像状特征建,傅里叶子通过图做换析其率特。于区的像征提算主颜色特征提取算纹理特征提取算描述纹理的最简单方法之一就是使用一幅图像的灰度直方图统计矩。其中二阶矩在频谱是描述图像的循环的方向性特征较好的方法,这些整体的纹理模式主要集中于频谱中的高频区域,一般使用多通道滤波技术对图像进行分割,得到不同频率方纹理形状形状特征是最难以描述的特征,这是因为形状不是规则的,描述起来更加。许多模型在进行检测的时候大量使用了一些特征库进行检测并使用了边界信息。A.Bar-Hillel等人使用了视觉特征库,并没有考虑各部分之间的几何位置关系[24][25]。Gopalan使用了域适应方法对目标进行识别[26]。S.Agarwal、J.Amores、S.Ullman考虑了各部分之间成对的松散的联系[27][28]。Razavi在识别多类别目标的过程中使用了位置信息[29]。B.Leibe等人定义的各部分通过变换给目标中心不同的投票值,他们对不同种类的目标进行检测的效果比较好[30]。LiefengBo等人使用了内核描述符递归地提取图地去除搜索区域中非目标部分的位移。Rosenfeld提取了的前景和背景信息用来定基于部件的模型对每个部分的外观和几何模型参数化,通过训练大量的正负样本来ing使用了每部分的混合模型的息立种态态模.iola等在简单的模型中使Prikh对基于部件的检测器做了整体分析,选取了最能提高性能的部分。rownGrumn.Shill.plt支持向量机(SVM)算SVM是Cortes和Vapnik于1995年首先,它在解决小样本、非线性和模VC维理论和结构风险最小原理基础上的,根据有通过一个非线性映射p,把样本空间映射到一个甚至无穷维的特征空间中,使得在不能精确计算的,只能给出一个估计区间,它与两个参数有关:样本数量和VC维。样本数量越大,置信风险越小。VC维越大,置信风险越大。统计学习的目标是经验风险与置信风险的和最小,即结构风险最小。与其他方法相比,SVM需要的样本数量是相MartinDR等人使用了SVM训练包含两级的分类器。第一级提取各部位的Haar小波特征,第二级将各弱分类器组合起来形成强分类器完成对整个的检测[31]。Duchenne等人在做两幅图像匹配的时候使用了SVM进行类别匹配[32]。贝叶斯学习算法在图像识别中得到了广泛的应用,PieroPerona使用了分层的贝叶斯特征筛选出来,最后把强分类器组合成一个功能强大的级连分类器。Zhu等人使用AdaBoostBoosting算法。Boosting其他大部分算法都AdaBoost需要较长的时间,但是每一层都能分析了支持向量机、贝叶斯学习算法和Boosting算法这三种分类器的原理。基于可变形组件模型目标检测算法比较。我们选择可变形组件模型、HOG特征、SVM算法和滑动窗口检测算法来实现目可变形组件模型(DeformablePartModel)由三个部分组成(31:一个较为粗糙的,覆盖整个目标的全局根模版(或叫做根滤波器几个高分辨率的部件模版(或叫做部件滤波器部件模版相对于根模版的空间位置(行变量3.1个长度为whd,其中dHOG特征时,一个细胞单元的特征维数为9,则一个滤波器的大小为w×h×9。HOG金字塔中whHOG特征向量的点积(DotProduct。Position分最高的部件位置。此位置与的距离作为形变花费(DeformationCost。方向梯度直方图(HistogramofOrientedGradient,HOG)特征是一种在计算机视觉和与其他的特征描述方法相比,HOGHOG是在图像的局部HOG特征是特别适合于做图像中的检测的。 空间和颜色空部的表层贡献的较大,所以这种压缩处理能够有效地降低图像局部的阴影和光 计算梯

I(𝑥,𝑦)=𝐼(𝑥, √ R𝑥,𝑦 (𝐼𝑥+1,𝑦−𝐼𝑥−1,𝑦)+(𝐼 √ Ang(𝑥,𝑦)=cos−1(𝐼(𝑥+1,𝑦)−𝐼(𝑥−1, 单元格梯度投这是为局部图像区域提供一个编码,同时能够保持对图像中对象的和外观块内归一化梯度直方HOG描述符。将检测窗口中所有的块进行HOG特征的收集,并将它们结合成最后的特征向量在图像金字塔(不同尺度下的图像)下进行计算得到特征金字塔,其中训练部件模3.2是根滤波器,Pi是第i个部件的模型。每个部件模型用一个二元组定义:(Fi,vi),Fi是Position一个目标假设(Hypothesis)n个部件的位置:z(P0,P1,Pn),其中Pi=(xi,yi,li)i个部件的位置假设,li score(P0,…,Pn)= Fi×φ(H,Pi)− di×φd(dxi,dyi)+ hi子窗的特征向量,(dxi,dyi)=(xi,yi)−(2(x0−y0)+vi)是第i个部件相对位置的偏移,φd(dx,dy)=(dx,dy,dx2,dy2)是变形特征。Model3.3m元数组MM1,Mn)m组模型的混合模型,其中Mcc组的目标模型,其中1<c<n。混合模型中单一目标模型Mc中每个滤波器的位置设为z=(c,P0,Pnc),其中nc是模型Mcc组模型的滤波器位置简化为z’=(P0…,Pn)c。cβ是每个单一目标模型中模型参数向量的串联,β=(β1…,βm);向量ψ(H,z)具有稀疏性,ψ(H,z)=(0…,0,ψ(H,z‘),0,…,0),ψ(H,z‘)和β中的β相对应,c即βψ(H,zβcψ(H,z‘)na,使得na80%。Variables的支持向量机(LatentSupportVectorMachine,LSVM)来学习部件,能够充分利用SVM(正样本)检测窗口的综合得分(OverallScore)score(p0)=

score(p0,…, 当score(p0𝜆时,我们就认为包含该目标,否则认为不包含目标。目标检测算法实持向量机的分类器训练算法和检测过程。为了对检测对象进行验证,在上编程进试。下面介绍具体程序的设计。训程图4.1给出基于可变形组件模型的目标检测系统。该系统包括两个关键部分:对目标的图像样本计算HOG特征金字塔,训练分类器LSVM学习得到包含检测目标根模型训程4.1 校对输入图像进行颜色空间的标准4.2HOG始始束4.34.4LSVM在用基本分类器对负样本进行再次分类的时候,要注意滑动窗口的移动要有,程序主要由以下几个模块组成,如图所示。首先由读入一组图像,提取它的4.5(RGBImageGetHogeatr(widthheightcelSizelockSizenBnsHOG特征。width、height分别是图像的高度和宽度,cellSize是单元格的大小,blockSize是块大小,nBins是梯度方向柱的个数。FeatureTrainer(featureVector,typeHOGfeatureVector是提取的特征向量,type表示正负样本。SvmClassifier(svmDetector,featureVector含目标。svmDetector,featureVector4.64.7假设待检测中正样本的数是nP,从正样本中识别出目标的数是TP,从

我们在实验中给验证阶段的阈值参数λ给予不同大小,对500张单一行人进行了检测,得到的输出结果如表4.1所示。4.1λ阈值正样本负样本𝑇𝑃⁄(𝑇𝑃+963λ4.2配HOG-总结与展Boosting算法这三种分类器的原理。给出了在上实现算法的主要模块和函数功能说明,详细分析了HOG致的帮助和支持使我能够顺利地完成。习环境,传授给我专业知识,耐心指导我的,而且在学习中,不断地要求我积极主促下,我逐渐懂得规范的重要性、逐渐掌握科学的研究方法,这对我的顺利完成起参考文HsuRL,Abdel-MottalebM,JainAK.Facedetectionincolorimages[J].PatternysisandMachineInligence,IEEETransactionson,2002,24(5):696-706.CaiJ,GoshtasbyA.Detectionhumanfacesincolorimages[J].ImageandVisionComputing,CootesTF,TaylorCJ,CooperDH,etal.Activeshapemodels-theirtrainingandapplication[J].Computervisionandimageunderstanding,1995,61(1):38-59.RowleyHA,BalujaS,KanadeT.Rotationinvariantneuralnetwork-basedfacedetection[C].ComputerVisionandPatternRecognition,1998.Proceedings.1998IEEEComputerSocietyConferenceon.IEEE,1998:38-44.ViolaP,JonesMJ.Robustreal-timefacedetection[J].Internationaljournalofcomputervision,2004,57(2):137-154.HanB,DavisL.Objecttrackingbyadaptivefeatureextraction[C].ImageProcessing,2004.ICIP'04.2004InternationalConferenceon.IEEE,2004,3:1501-1504.ComaniciuD,RameshV,MeerP.Kernel-basedobjecttracking[J].PatternysisandMachineInligence,IEEETransactionson,2003,25(5):564-577.StaufferC,GrimsonWEL.Adaptivebackgroundmixturemodelsforreal-timetracking[C].ComputerVisionandPatternRecognition,1999.IEEEComputerSocietyConferenceon.IEEE,1999,2.ViolaP,JonesM.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C].ComputerVisionandPatternRecognition,2001.CVPR2001.Proceedingsofthe2001IEEEComputerSocietyConferenceon.IEEE,2001,1:I-511-I-518vol.1.WiskottL,FellousJM,KuigerN,etal.Facerecognitionbyelasticbunchgraphmatching[J].PatternysisandMachineInligence,IEEETransactionson,1997,19(7):LoweDG.Objectrecognitionfromlocalscale-invariantfeatures[C].Computervision,1999.TheproceedingsoftheseventhIEEEinternationalconferenceon.Ieee,1999,2:LindebergT.Scale-spacefordiscretesignals[J].PatternysisandMachineInligence,IEEETransactionson,1990,12(3):234-254.KoenderinkJJ.Thestructureofimages[J].Biologicalcybernetics,1984,50(5):363-DeSaJPM.Patternrecognition:concepts,methods,andapplications[M].Springer,ErcanG,WhyteP.Digitalimageprocessing:U.S.Patent6,240,217[P].2001-5-YujinZ.ImageEngineering[J].Imageysis,AlexanderIIIE,KooyHM,vanHerkM,etal.Magneticresonanceimage-directedstereotacticneurosurgery:useofimagefusionwithcomputerizedtomographytoenhancespatialaccuracy[J].Journalofneurosurgery,1995,83(2):271-276.BoixBoschX,BenShitritH,FuaP,etal.ConditionalRandomFieldsforMulti-CameraObjectDetection[C].InternationalConferenceonComputerVision.2011.nA,PapageorgiouC,PoggioT.Example-basedobjectdetectioninimagesbycomponents[J].PatternysisandMachineInligence,IEEETransactionson,2001,23(4):WenzelA.Computer-aidedimagemanipulationofintraoralradiographstoenhancediagnosisindentalpractice:areview[J].Internationaldentaljournal,1993,43(2):99-108.GaoT,KollerD.Discriminativelearningofrelaxedhierarchyforlarge-scalevisualrecognition[C].ComputerVision(ICCV),2011IEEEInternationalConferenceon.IEEE,2011:ZhangZ,GaneshA,LiangX,etal.TILT:transforminvariantlow-ranktextures[J].InternationalJournalofComputerVision,2012,99(1):1-24.WuY,YuT,HuaG.Astatisticalfieldmodelforpedestriandetection[C]puterVisionandPatternRecognition,2005.CVPR2005.IEEEComputerSocietyConferenceon.IEEE,2005,1:1023-1030.Bar-HillelA,HertzT,WeinshallD.Objectclassrecognitionbyboostingapart-basedmodel[C].ComputerVisionandPatternRecognition,2005.CVPR2005.IEEEComputerSocietyConferenceon.IEEE,2005,1:702-709.OpeltA,FusseneggerM,PinzA,etal.WeakhypothesesandboostingforgenericGopalanR,LiR,CappaR.adaptationforobjectrecognition:Anunsupervisedapproach[C].ComputerVision(ICCV),2011IEEEInternationalConferenceon.IEEE,2011:AgarwalS,AwanA,RothD.Learningtodetectobjectsinimagesviaasparse,part-basedrepresentation[J].PatternysisandMachineInligence,IEEETransactionson,2004,26(11):1475-1490.AmoresJ,SebeN,RadevaP.Fastspatialpatterndiscoveryintegratingboo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论