人工智能-第八章课件_第1页
人工智能-第八章课件_第2页
人工智能-第八章课件_第3页
人工智能-第八章课件_第4页
人工智能-第八章课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

RCNN系列算法SSD算法YOLO系列算法8.38.18.2第八章目标检测RCNN系列算法SSD算法YOLO系列算法8.38.18.21区域选择分类器目标检测三个阶段遍历图像确定可能存在目标的候选区域提取候选区域相关的视觉特征对选取的目标进行识别rcnn系列算法特征提取区域选择分类器目标检测遍历图像确定可能存在目标的候选区域提取R-CNN是一种基于卷积神经网络的目标检测算法,它在卷积神经网络上应用区域推荐的策略,形成自底向上的目标定位模型,摒弃了传统的滑动窗口(通过多尺度滑动窗口确定所有可能的目标区域)和人工选取特征的方法,将候选区域算法和卷积神经网络相结合,使得检测速度和精度明显提升。RCNNfast-RCNNfaster-RCNNrcnn系列算法R-CNN是一种基于卷积神经网络的目标检测算R-CNN利用选择性搜索算法在图像中提取2000个左右的候选框;把所有候选框缩放成固定大小(227*227),并进行归一化后输入CNN(AlexNet)网络,提取特征;提取到的CNN特征使用SVM来分类,用线性回归来微调边框位置与大小,其中每个类别单独训练一个边框回归器;非极大值值抑制(NMS)来滤除重叠的候选框存在问题训练时间长测试时间长占用磁盘空间大卷积出来的特征数据还需要单独保存rcnn算法R-CNN利用选择性搜索算法在图像中提取2000个左右的候选R-CNNFastR-CNN1.输入为整张图像并提取特征图。2.

RoI池化层从特征图中提取固定长度的特征向量。3.使用多任务损失函数,分别进行softmax分类和边框回归。fast-rcnn算法R-CNNFast1.输入为整张图像并提取特征图。fast-faster-rcnn模型结构123特征提取粗分类+定位NMS去重精分类+定位NMS去重faster-rcnn算法faster-rcnn模型结构123特征提取粗分类+定位NManchor框特征图的每个像素点生成三种不同尺度大小的anchor框,每种框的宽高比分别为:1:1,2:1,1:2,即特征图上的每个像素点共生成9个不同大小的anchor框。特征图

faster-rcnn算法anchor框特征图的每个像素点生成三种不同尺度大小的ancRPN网络

遍历特征图上的每个像素点,然后根据不同位置和宽高的anchor框从原图上生成候选框。faster-rcnn算法特征图RPN网络faster-rcnn算法特征图1.第一阶段CNN网络提取特征2.第二阶段(RPN网络)

使用锚框生成候选框,初步实现目标的粗分类和边框回归3.第三阶段实现目标的精分类和边框回归faster-rcnn算法faster-rcnn1.第一阶段faster-rcnn算法faster-rcnnYOLO结构简单,属于单阶段的检测方法速度快、资源消耗少精度较高YOLO(YouOnlyLookOnce):创造性地将目标区域推荐和识别这两个阶段合二为一,同时完成目标定位和分类。YOLO系列算法YOLOYOLO(YouOnlyLookOnce):创YOLOv1算法

YOLOv1的模型结构比较简单,与常规的CNN分类模型最大的差异是最后输出层用线性函数做激活函数,从而实现预测boundingbox的位置。YOLOv1算法YOLOv1的模型结构比较简每个点的维度:类别概率:置信度:边框信息:YOLOv1算法每个点的维度:类别概率:置信度:边框信息:YOLOv1算法损失函数YOLOv1算法损失函数YOLOv1算法使用聚类生成的锚点代替手工设计的锚点;在高分辨率图像上进行迁移学习,提升网络对高分辨图像的响应能力训练过程图像尺寸不再固定,提升网络对不同训练数据的泛化能力YOLOv2YOLOv2算法使用聚类生成的锚点代替手工设计的锚点;YOLOv2YOLOvyolov3改进策略1.使用Darknet-53主干网络2.使用k-means聚类9种尺度的先验框3.多尺度特征进行目标检测YOLOv3算法yolov3改进策略1.使用Darknet-53主干网络YO

SSD采用VGG作为主干网络,输入图像大小为300*300,采用了特征金字塔结构进行检测,即分别在6个不同大小的特征图上生成目标候选框。SSD算法SSD采用VGG作为主干网络,输入图像大小

SSD算法

SSD算法THANKYOUTHANKYOU18RCNN系列算法SSD算法YOLO系列算法8.38.18.2第八章目标检测RCNN系列算法SSD算法YOLO系列算法8.38.18.219区域选择分类器目标检测三个阶段遍历图像确定可能存在目标的候选区域提取候选区域相关的视觉特征对选取的目标进行识别rcnn系列算法特征提取区域选择分类器目标检测遍历图像确定可能存在目标的候选区域提取R-CNN是一种基于卷积神经网络的目标检测算法,它在卷积神经网络上应用区域推荐的策略,形成自底向上的目标定位模型,摒弃了传统的滑动窗口(通过多尺度滑动窗口确定所有可能的目标区域)和人工选取特征的方法,将候选区域算法和卷积神经网络相结合,使得检测速度和精度明显提升。RCNNfast-RCNNfaster-RCNNrcnn系列算法R-CNN是一种基于卷积神经网络的目标检测算R-CNN利用选择性搜索算法在图像中提取2000个左右的候选框;把所有候选框缩放成固定大小(227*227),并进行归一化后输入CNN(AlexNet)网络,提取特征;提取到的CNN特征使用SVM来分类,用线性回归来微调边框位置与大小,其中每个类别单独训练一个边框回归器;非极大值值抑制(NMS)来滤除重叠的候选框存在问题训练时间长测试时间长占用磁盘空间大卷积出来的特征数据还需要单独保存rcnn算法R-CNN利用选择性搜索算法在图像中提取2000个左右的候选R-CNNFastR-CNN1.输入为整张图像并提取特征图。2.

RoI池化层从特征图中提取固定长度的特征向量。3.使用多任务损失函数,分别进行softmax分类和边框回归。fast-rcnn算法R-CNNFast1.输入为整张图像并提取特征图。fast-faster-rcnn模型结构123特征提取粗分类+定位NMS去重精分类+定位NMS去重faster-rcnn算法faster-rcnn模型结构123特征提取粗分类+定位NManchor框特征图的每个像素点生成三种不同尺度大小的anchor框,每种框的宽高比分别为:1:1,2:1,1:2,即特征图上的每个像素点共生成9个不同大小的anchor框。特征图

faster-rcnn算法anchor框特征图的每个像素点生成三种不同尺度大小的ancRPN网络

遍历特征图上的每个像素点,然后根据不同位置和宽高的anchor框从原图上生成候选框。faster-rcnn算法特征图RPN网络faster-rcnn算法特征图1.第一阶段CNN网络提取特征2.第二阶段(RPN网络)

使用锚框生成候选框,初步实现目标的粗分类和边框回归3.第三阶段实现目标的精分类和边框回归faster-rcnn算法faster-rcnn1.第一阶段faster-rcnn算法faster-rcnnYOLO结构简单,属于单阶段的检测方法速度快、资源消耗少精度较高YOLO(YouOnlyLookOnce):创造性地将目标区域推荐和识别这两个阶段合二为一,同时完成目标定位和分类。YOLO系列算法YOLOYOLO(YouOnlyLookOnce):创YOLOv1算法

YOLOv1的模型结构比较简单,与常规的CNN分类模型最大的差异是最后输出层用线性函数做激活函数,从而实现预测boundingbox的位置。YOLOv1算法YOLOv1的模型结构比较简每个点的维度:类别概率:置信度:边框信息:YOLOv1算法每个点的维度:类别概率:置信度:边框信息:YOLOv1算法损失函数YOLOv1算法损失函数YOLOv1算法使用聚类生成的锚点代替手工设计的锚点;在高分辨率图像上进行迁移学习,提升网络对高分辨图像的响应能力训练过程图像尺寸不再固定,提升网络对不同训练数据的泛化能力YOLOv2YOLOv2算法使用聚类生成的锚点代替手工设计的锚点;YOLOv2YOLOvyolov3改进策略1.使用Darknet-53主干网络2.使用k-means聚类9种尺度的先验框3.多尺

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论