基于深度学习目标检测进展_第1页
基于深度学习目标检测进展_第2页
基于深度学习目标检测进展_第3页
基于深度学习目标检测进展_第4页
基于深度学习目标检测进展_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深度学习(xuéxí)综述报时间(shíjiān):2016.11.共二十六页深度(shēndù)学习是什么?深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。[1]深度学习是机器学习领域中对模式(声音、图像等等)进行建模的一种方法,它也是一种基于统计的概率模型。在对各种模式进行建模之后,便可以对各种模式进行识别(shíbié)了,例如待建模的模式是声音的话,那么这种识别(shíbié)便可以理解为语音识别(shíbié)(RNNHinton[3]2013)。共二十六页概念(gàiniàn)入门深度学习神经网络的发展神经网络(上世纪(shìjì)五六十年代)深度神经网络(Hinton[2]2006)卷积神经网络(AlexNet[1]2021)基于深度学习的目标检测进展共二十六页一、神经网络的发展(fāzhǎn)感知机的出现神经网络技术起源于上世纪五、六十年代,当时叫感知机(perceptron),拥有输入(shūrù)层、输出层和一个隐含层。输入(shūrù)的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。早期感知机对于计算稍微复杂的函数其计算力显得无能为力。多层感知机多层感知机可以摆脱早期离散传输函数的束缚,使用sigmoid或tanh等连续函数模拟神经元对激励的响应,在训练算法上则使用反向传播BP算法。对,这就是我们现在所说的神经网络(NN)!共二十六页激活(jīhuó)函数共二十六页构成:由“神经元”构成输入(shūrù)、偏置节点、激活函数、输出这个“神经元”是一个(yīɡè)以及截距为输入值的运算单元,其输出为,其中函数为激活函数前向参数计算:共二十六页反向传播损失函数:我们的目标是针对参数W和b

,来求函数J(W,b)最小值梯度下降(xiàjiàng)法中每一次迭代都按照如下公式对参数是学习率共二十六页二、卷积神经网络1、卷积神经网络共二十六页二、卷积神经网络卷积操作(cāozuò)AlexNet[1]共二十六页二、卷积神经网络与传统(chuántǒng)视觉算法区别:共二十六页二、卷积神经网络共二十六页二、卷积神经网络主要应用:图像(túxiànɡ)分类共二十六页三、基于(jīyú)深度学习的目标检测目标(mùbiāo)检测?其实刚刚的这个过程就是目标检测,目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别”。共二十六页传统(chuántǒng)的objectproposal方法Whatmakesforeffectivedetectionproposals?[4]共二十六页三、基于深度学习(xuéxí)的目标检测检测(jiǎncè) SelectiveSearch

DL:faster-rcnn适应不同尺度多样化RPN+CNN共二十六页传统目标检测(jiǎncè)方法区域选择

采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。特征提取这个阶段常用的特征有SIFT、HOG等分类器 SVM、

Adaboost传统目标检测存在的两个主要问题:一个是基于滑动窗口的区域选择策略没有(méiyǒu)

针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。共二十六页三、基于(jīyú)深度学习的目标检测Faster-rcnn(TowardsReal-TimeObjectDetectionwithRegionProposalNetworks)[5])网络结构:在regionproposal+CNN分类的这种目标检测框架中,regionproposal质量好坏直接(zhíjiē)影响到目标检测任务的精度。共二十六页Faster-rcnnRegionProposalNetworks(RPN)3*3滑窗对应的每个特征区域同时预测输入图像3种尺度(128,256,512),3种长宽比(1:1,1:2,2:1)的regionproposal,这种映射(yìngshè)的机制称为anchor。所以对于这个40*60的featuremap,总共有约20000(40*60*9)个anchor,也就是预测20000个regionproposal.共二十六页Faster-rcnnRPN的核心思想是使用卷积神经网络直接产生regionproposal,使用的方法本质上就是滑动窗口。RPN的设计比较巧妙,RPN只需在最后的卷积层上滑动一遍,因为anchor机制和边框回归(huíguī)可以得到多尺度多长宽比的regionproposal。Modify机制NMS(Non-maximumsuppression)非极大值抑制消除多余的boundingbox,找到最佳的物体检测位置NMS共二十六页Intersection-over-union(IOU)共二十六页Faster-rcnn1、网络结构一览(caffemodel)2、FasterR-CNN将一直以来分离的regionproposal和CNN分类融合(rónghé)到了一起,使用端到端的网络进行目标检测,无论在速度上还是精度上都得到质的提高提高。共二十六页四、基于(jīyú)深度学习的目标检测应用实例共二十六页个人(gèrén)经验研究生生活(shēnghuó)正确的打开方式研一:研究什么研二:研究出点什么研三:科研与工作共二十六页参考文献[1]KrizhevskyA,SutskeverI,HintonGE.ImageNetClassificationwithDeepConvolutionalNeuralNetworks[J].AdvancesinNeuralInformationProcessingSystems,2012,25(2):2012.[2]HintonGE,SalakhutdinovRR.ReducingtheDimensionalityofDatawithNeuralNetworks[J].Science,2006,313(5786):504-7.[3]GravesA,MohamedAR,HintonG.Speechrecognitionwithdeeprecurrentneuralnetworks[J].2013,1(2003):6645-6649.[4]HosangJ,BenensonR,DollarP,etal.Whatmakesforeffectivedetectionproposals?[J].IEEETransactionsonPatternAnalysis&MachineIntelligence,2015,38(4):814-830.[5]RenS,HeK,GirshickR,etal.FasterR-CNN:TowardsReal-TimeObjectDetectionwithRegionProposalNetworks[J].IEEETransactionsonPatternAnalysis&MachineIntelligence,2016:1-1.共二十六页Thanks共二十六页内容(nèiróng)总结深度学习(xuéxí)综述。深度学习(xuéxí)的概念源于人工神经网络的研究。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论