下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、卷积神经网络算法综述一、原理介绍1、数据集1根据使用场景自己制作数据集“使用网上开源的数据集2、前向传播前向传播核心是介绍如何通过输入的X得到输出的Y,前向传播相对于反向传播比较容易理解。a(2)+1h皿LaysrLj对于第2层第1个节点的输岀恋有:oj=7彳)=7遊1甸+诚円+诡代+时)对于第弓层第1个节点的输出鬭有:诵=artLaj+唸城+硒揖碎)占化的,假设1-1匡有m个神经元応二百有:mal=(?汕=(?(ii_1+山3、损失函数损失函数是主要是用来衡量神经网络输出的值Y和真实值丫之间的差距,常用的损失函数主要有交叉熵和均方误差损失函数。:匸交叉熵损失函数loss=-ylogy+(1-
2、y)log(ly)“均方误差损失函数loss=m工Z1(YfY)24、优化方法优化方法是一种能够帮我们最小化或者最大化目标函数(损失函数)的一类算法,通过神经网络输出的值丫和真实值丫之间存在差距,优化方法的主要目的是让该差距如何尽可能的达到最小。例如一个线性模型(x)=Wx+b,根据输入x我们能够得到输出产(x),并且可以计算出输出值和实际值之间的差距(产(x)Y)2,优化方法的最终目的是找出合适W和b,以使得上述的损失函数达到最小,损失函数的值越小,说明我们的模型越接近实际情形。目前优化方法的核心思想是对损失函数进行一阶优化或者二阶优化。一阶优化是采用参数的梯度值来最大化或者最小化目标函数,
3、二阶优化是采用二阶导数来进行优化,在实际应用中二阶导数计算量较大,一般很少使用。常用的优化方法主要有:-批量梯度下降(BatchGradientDescent)批量梯度下降是最原始的方式,它在每次迭代时使用了所有的样本来进行梯度的更新,训练速度较慢,但是参数更新的时候考虑了所有的样本,从而能够更准确的朝向极值所在的方向,易于实现并行计算。随机梯度下降法(StochasticGradientDescent)随机梯度下降是每次迭代使用一个样本来对参数进行更新,使得参数更新速度大大加快,但是准确度有所下降,可能会收敛到局部最优,并且不易于并行实现。小批量梯度下降(MiniBatchGradientD
4、escent)小批量梯度下降综合了上面两种方法的特点,每次迭代使用batch_size个样本进行来对参数进行更新,兼具了上面两种方法的优点,但是batch_size的选择不当能够带来一些问题。Momentum动量法的主要思想是让早期的梯度对当前梯度的影响越来越小,参数更新公式为:将该公式展开为如下:*一+(1-0)弘=呱+俨F-帕1沪f岛+优1_州(1-帕3tn可以看出离当前梯度越远,其系数越小,相乘之后导致之前的梯度大大降低。RMSprop我们希望沿着收敛速度快的方向步长大一些,与其垂直方向步长小一点,即将梯度震荡小的方向,增大其步长,震荡大的方向降低其步长,所以RMSprop的迭代更新公式
5、为:JM二+卩_0)血21miC_d证AdamAdam算法是上述算法的结合,迭代更新公式为:rv=阳+(1-=5+(l-ft)dw2rj*i亠箭5、反向传播反向传播两大核心就是计算误差和运用链式法则更新参数。误差计算方法上面已经介绍,整个流程如下:输入训热集对于钏氮集中的毎个样本儿设詈输入层(Inputlayer)对应的港活值川:甸向传播:z1二Na=疚()计算输宙层产主的錯误:6LPQ打(尹)*反向传播诸误:&=(w+1)r5f+1)(J用梯1艮下降(gradientdeuat)T训炼参数:川T皿_洛力,叫d#1厂6、常用技巧数据增强数据预处理BatchNormalization(BN)激活
6、函数正则化drop-outearly-stopping超参数的合理设定二、应用场景卷积神经网络算法在计算机视觉中得到了广泛的应用,目前主要用于检测、识别、分割、追踪,在无人驾驶、医疗图像、零售业等领域有广泛的使用。三、相关算法随着卷积神经网络的不断发展,一大批基于卷积神经网络的算法应运而生,下面将分别胸检测、识别、分割、追踪四个方面介绍相应的成熟算法。1、检测算法在检测领域目前的算法主要分为两个思路,即one-stage和two-stage。ne-stage速度较快,但精度略低;two-stage速度略慢,但精度较咼。one-stage的代表算法主要有丫0L0V1、YOLOV2、YOLOV3、
7、RetinaNet、SSD等。two-stage的代表算法主要有Fast-RCNN、Faster-RCNN、FPN等。anchor-free的代表算法主要有RefineNet、CornerNet、CenterNet等。轻量级神经网络的代表算法主要有MobileNet、ShuffleNet、SqueezeNet等。2、分类算法分类算法的基本思路主要有两种,通过卷积神经网络进行特征提取,然后通过sigmoid和softmax进行二分类和多分类。通过卷积神经网络进行特征提取,提取出一维特征向量,然后通过计算特征向量之间的L1或者L2距离来判断是否属于一类。常见的特征提取网络主要有LeNet、GoogleNet、AlexNet、VGG、ResNet等。3、分割算法分割算法是对每一个像素进行二分类的算法,主要分为语义分割和实例分割。语义分割是像素级别的,对图像中的每个像素都划分出对应的类别,即实现像素级别的分类;实例分割不但要进行像素级别的分类,还需在具体的类别基础上区别开不同的实例。常见的分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 遗产继承权益分割协议(2024年版)2篇
- 高三年级老师教学工作总结
- 正规附期限借款合同(34篇)
- 销售劳动合同15篇
- 试用期个人述职报告
- 四川省绵阳市2023-2024学年八年级上学期语文期末考试试卷(含答案)
- 解除合同通知
- 让与担保合同协议的协同效应
- 设计合同终止解除合同权益保护
- 诚信道歉保证书
- 与发包人、监理及设计单位的配合
- 交友婚恋商业计划书
- 行政诉讼(诉讼串讲)
- 非居民金融账户涉税信息尽职调查和信息报送制度
- 事业单位工作人员年度考核登记表(新表)
- 小学二年级心理快乐好心情课件
- 社会秩序的维护主要靠法律还是靠道德辩论赛
- 建筑大师林徽因智慧树知到课后章节答案2023年下潍坊工程职业学院
- 海康威视 摄像机选型
- 装修施工图设计说明
- 小学校本课程-【海洋教育】海上森林教学课件设计
评论
0/150
提交评论