计算机视觉与应用 课件 10.3 LeNet模型分解_第1页
计算机视觉与应用 课件 10.3 LeNet模型分解_第2页
计算机视觉与应用 课件 10.3 LeNet模型分解_第3页
计算机视觉与应用 课件 10.3 LeNet模型分解_第4页
计算机视觉与应用 课件 10.3 LeNet模型分解_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10.3LeNet模型分解CONTENTS目录LeNet模型简介01LeNet模型结构02Tensorflow实现LeNet03CONTENTS目录LeNet模型简介01LeNet模型结构02Tensorflow实现LeNet03LeNet是一个最典型的卷积神经网络,由卷积层、池化层、全连接层组成。其中卷积层与池化层配合组成多个卷积组,逐层提取特征,最终通过若干个全连接层完成分类。LeNet模型简介CONTENTS目录LeNet模型简介01LeNet模型结构02Tensorflow实现LeNet03LeNet模型结构1、结构模型LeNet模型其结构如图10-3-1所示。LeNet模型结构(1)INPUT层-输入层利用实现手写数字识别中,输入层输入的是尺寸统一归一化为32×32的手写体数字图像。在每个卷积层,数据都是以三维形式存在的。可以把它看成许多个二维图片叠在一起,其中每一个称为一个featuremap。每个层都含有多个featuremap,每个featuremap通过一种卷积滤波器提取输入的一种特征,然后每个featuremap有多个神经元。LeNet模型结构(2)C1层-卷积层C1层-卷积层的组成情况为:输入图片:32×32卷积核大小:5×5卷积核种类:6输出featuremap大小:28×28神经元数量:28×28×6可训练参数:(5×5+1)×6(每个滤波器5×5=25个unit参数和一个bias参数,一共6个滤波器)连接数:(5×5+1)×6×28×28=122304对输入图像进行第一次卷积运算(使用6个大小为5×5的卷积核),得到6个C1特征图(6个大小为28×28的featuremaps,32-5+1=28)。卷积核的大小为5×5,总共就有6×(5×5+1)=156个参数,其中+1是表示一个核有一个bias。对于卷积层C1,C1内的每个像素都与输入图像中的5×5个像素和1个bias有连接,所以总共有156×28×28=122304个连接(connection)。LeNet模型结构(3)S2层-池化层(下采样层)该层组成情况为:输入:28×28采样区域:2×2采样方式:4个输入相加,乘以一个可训练参数,再加上一个可训练偏置。结果通过sigmoid采样种类:6输出featureMap大小:14×14(28/2)神经元数量:14×14×6连接数:(2×2+1)×6×14×14第一次卷积之后紧接着就是池化运算,使用2*2核进行池化,得到S2,6个14×14的特征图(28/2=14)。S2这个pooling层是对C1中的2×2区域内的像素求和乘以一个权值系数再加上一个偏置,然后将这个结果再做一次映射。同时有5×14×14×6=5880个连接。LeNet模型结构(4)C3层-卷积层该层组成情况为:输入:S2中所有6个或者几个特征map组合卷积核大小:5×5卷积核种类:16输出featureMap大小:10×10(14-5+1)=10C3中的每个特征map是连接到S2中的所有6个或者几个特征map的,表示本层的特征map是上一层提取到的特征map的不同组合存在的一个方式是:C3的前6个特征图以S2中3个相邻的特征图子集为输入。接下来6个特征图以S2中4个相邻特征图子集为输入。然后的3个以不相邻的4个特征图子集为输入。最后一个将S2中所有特征图为输入。可训练参数:6×(3×5×5+1)+6×(4×5×5+1)+3×(4×5×5+1)+1×(6×5×5+1)=1516。连接数:10×10×1516=151600。LeNet模型结构(5)S4层-池化层该层组成情况为:输入:10×10采样区域:2×2采样方式:4个输入相加,乘以一个可训练参数,再加上一个可训练偏置。结果通过sigmoid采样种类:16输出featureMap大小:5×5(10/2)神经元数量:5×5×16=400连接数:16×(5×5)=2000LeNet模型结构(6)F6层-全连接层16层是全连接层。F6层有84个节点,对应于一个7×12的比特图,-1表示白色,1表示黑色,这样每个符号的比特图的黑白色就对应于一个编码。该层的训练参数和连接数是(120+1)×84=10164。(7)RELU层ReLu层:激活函数层,实现x=max[0,x],该层神经元数目和上一层相同,无权值参数。LeNet模型结构(8)Output层-全连接层2Output层也是全连接层,共有10个节点,分别代表数字0到9,且如果节点i的值为0,则网络识别的结果是数字i。采用的是径向基函数(RBF)的网络连接方式。假设x是上一层的输入,y是RBF的输出,则RBF输出的计算方式是:上式Wij的值由i的比特图编码确定,i从0到9,j取值从0到7×12-1。RBF输出的值越接近于0,则越接近于i,即越接近于i的ASCII编码图,表示当前网络输入的识别结果是字符i。该层有84×10=840个参数和连接。(9)softmax层实现分类和归一化。CONTENTS目录LeNet模型简介01LeNet模型结构02Tensorflow实现LeNet03(1)导入了3个包,分别是tensorflow、input_data以及time。importtensorflowastffromtensorflow.example.tutorials.mnistimportinput_dataimporttime(2)声明输入的图片的数据和类别x=tf.placeholder('float',[None,784])y_=tf.placeholder('float',[None,10])Tensorflow实现LeNet(3)将一维的数组重新转换为二维图像矩阵:

x_image=tf.reshape(x,[-1,28,28,1])(4)第一个卷积层设置:filter1=tf.Variable(tf.truncated_normal([5,5,1,6]))bias1=tf.Variable(tf.truncated_normal([6]))conv1=tf.nn.conv2d(x_image,filter1,strides=[1,1,1,1],padding='SAME!)h_conv1=tf.nn.sigmoid(conv1+bias1)(5)第一个池化层设置:maxPoo12=tf.nn.max_pool(h_conv1,ksize=[1,2,2,11,strides=[1,2,2,1],padding='SAME')Tensorflow实现LeNet(6)第二个卷积层设置:filter2=tf.Variable(tf.truncatednormal([5,5,6,16]))bias2=tf.Variable(tf.truncatednormal([16]))conv2=tf.nn.conv2d(maxPoo12,filter2,strides=[1,1,1,1],padding='SAME'h_conv2=tf.nn.sigmoid(conv2+bias2)(7)第二个池化层设置:maxPoo13=tf.nn.max_poo1(h_conv2,ksize=[1,2,2,1],strides=[1,2,2,1]padding='SAME')filter3=tf.Variable(tf.truncatednormal([5,5,16,120]))bias3=tf.Variable(tf.truncatednormal([120]))conv3=tf.nn.conv2d(maxPoo13,filter3,strides=[1,1,1,1],padding='SAME'h_conv3=tf.nn.sigmoid(conv3+bias3)Tensorflow实现LeNet(8)第一个全连接层设置:Wfc1=tf.Variable(tf.truncatednormal([7*7*120,80]))bfc1=tf.Variable(tf.truncatednormal([80]))(9)ReLu层设置:h_poo12_flat=tf.reshape(hconv3,[-1,7*7*120])h_fc1=tf.nn.sigmoid(tf.matmul(h_pool2flat,Wfc1)+bfc1)(10)第二个全连接层设置:Wfc2=tf.Variable(tf.truncatednormal([80,10]))bfc2=tf.Variable(tf.truncatednormal([10]))Tensorflow实现LeNet(11)使用softmax进行多分类,并利用交叉熵作为损失函数,使用梯度下降算法来对模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论