基于Squeezenet模型的蛇类图像识别_第1页
基于Squeezenet模型的蛇类图像识别_第2页
基于Squeezenet模型的蛇类图像识别_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于Squeezenet模型的蛇类图像识别摘要:随着人类活动范围的不断扩张,生态环境的恶化,蛇类的生存环境受到威胁。为实现对蛇类的准确识别,辅助蛇类 研究者对蛇类的识别与保护,通过对现有的解决方案进行分析,提出采用迁移学习方法对10种蛇类进行训练识别。首先 对现有数据集进行数据增强,从而让训练模型更好地收敛,采用基于Squeezenet模型具有更好的识别率,识别率达到了 85.71%,效果良好。并对训练好的模型进行加载,网络模型识别耗时2.69s,有着更好实时性,同时还能保证识别精度,节省 硬件资源,提升了模型的可移植性。关键词:迁移学习;Squeezenet模型;蛇类;图像识别Snakes

2、Image Recognition Based on SqueezenetAbstract: With the continuous expansion of human activities, the deterioration of the ecological environment, the living environment of snakes is threatened.In order to realize the accurate identification of snakes and assist the snake researchers in the identifi

3、 - cation and protection of snakes, this paper proposes to adopt the transfer learning method to train and identify 10 kinds of snakes by analyzing the existing solutions.Firstly, the existing data set was enhanced to promote better convergence of the training model. With the adoption of the Squeeze

4、net model, the recognition rate reached 85.71%, with good effect.It takes 2.69s to identify the network model, which ensures better real-time performance, ensures recognition accuracy, saves hardware resources, and improves the portability of the model.Key words:transfer learning; squeezenet model;

5、snakes; image recognition我国拥有十分丰富的蛇类资源,有200多种蛇类,其中我 国南方地区的蛇类占我国蛇类种数的88%左右七蛇类作为自 然系统中的次级消费者,在生态系统中发挥着维系生态系统的 能量流动和物质循环的重要作用。目前我国蛇类研究人员非 常匮乏,旦尚未有针对蛇类研究的公开数据集,在科研领域,蛇 类图像识别仍然是一个比较开放性的问题。近年来,随着人类 活动范围的不断扩张,蛇类的生存环境受到了巨大威胁,蛇类 图像识别对保护物种多样性和维持生态平衡更具意义。James Alex对蛇类特征进行手工分类,构建了 6中印度常见蛇类的特 征数据库,并采用贝叶斯网络等13种分类

6、器进行蛇类识别,效 果良好2。AmirAmiza等人对22种马来西亚常见蛇类进行颜色 和边缘方向的特征提取,并采用最近邻分类器取得了 89.22% 的准确率3。浙江大学付永钦通过采集和收集蛇类图像,建立 了包含银环蛇、竹叶青蛇、舟山眼镜蛇、尖吻蝮、王锦蛇、黄金 蟒、玉斑丽蛇、红尾蚺、红脖颈槽蛇和钩盲蛇等10种中国常见 蛇类共计10336幅图像的CHINESESNAKES蛇类图像数据集, 对蛇类图像分类问题进行了研究,设计了 BRC卷积神经网络结 构,其在CHINESESNAKES蛇类图像数据集上的分类准确率达 到了 89.061%田。近年来,深度学习和人工智能在图像识别领 域越来越受欢迎,而传

7、统的卷积神经网络(Convolutional Neural Networks, CNN)不仅训练时间长,而且需要大量的训练样本区 因此,在训练样本较少的情况下,采用迁移学习进行图像识别, 可以提高整体的识别性能。本文基于Squeezenet模型对10种 蛇类进行图像识别,该模型不仅网络参数量相较Alexnet模型 减少50倍左右,而且有着更快的识别速度,有更好的可移植 性,对于快速识别蛇类意义重大,有利于蛇类研究者对蛇类的 快速识别与保护。1 Squeezenet网络结构1.1 Squeezenet 模型Squeezenet是由Landola提出的轻量级网络结构,与Alexnet 相比较而言,

8、其结构内的参数更少,模型也更小,但是却有着和 Alexnet相当的识别精确度,且模型缩小50倍左右回。 Squeezenet模型有2个卷积层、Fire模块(Squeezenet的核心)、两个最大池化层(max-pooling)和一个全局平均池化层(GAP, Global Average Pooling)以及最后的 softmax 函数71o Fire module 结构如图1所示,该结构主要由squeeze层和expand层构成。其 中squeeze层开创性地将3*3的卷积核替换为1*1的卷积核,减 少了特征通道数。除此之外,squeeze层的输出是expand层的 输入,且expand层中不

9、仅有1*1的卷积核,还有3*3的卷积,图 像经过两种卷积后,有concat进行操作输出。特征图在经过 Fire Module结构后,图片的尺寸不会改变,但是由于经过了 1*1 的卷积核后,其参数量减少了很多,这也是Squeezenet相较 Alexnet减少50倍左右的根本原因。Squeezenet模型结构图如 图1所示。ImageFire2SoftmaxConv10Fire9图1 Squeezenet模型结构Convl/Fire3ImageFire2SoftmaxConv10Fire9图1 Squeezenet模型结构Convl/Fire3/Fire4ISFire5池化层又称下采样层或欠采样

10、层,其目的就是对输入特征 图进行压缩,降低网络模型的计算复杂度,在一定程度上能够 抑制过拟合现象的发生,提高模型的容错率|810输入的图像经 卷积层输出相应的特征图,由于输出的特征图过大,会导致后 续的计算量复杂,因此根据图像的静态特征,在卷积神经网络 中引入池化层,降低计算复杂度。常见的池化方式有平均池化 和最大池化,计算如下:WV;,:,(0wX,|xs)(2)WV;,:,(0wX,|x:)上输出的特征图;,是经池化后在心上输出的特征图;是池化 核的大小;广为参数,其中0wXs,0W|s。2蛇类数据集本文使用的数据集包含10种蛇类的图片信息,所有的图 片统一处理为227*227*3(3为彩

11、色图片的颜色通道),此次实 验中对数据集以训练集:验证集=8:2的比例进行了划分,最后 每种蛇类随机挑选100张作为测试集。由于现有的蛇类数据 集样本数量较少,旦不同类别之间还存在数量不均等的情况, 为了防止出现网络过拟合严重和泛化效果差等现象,对蛇类数 据集图像进行数据增强处理,如对图像进行旋转,从而增加样 本数量。其中泥蛇的数据集原始样本只有139张,而最多的银 环蛇数据集样本有836张,样本的之间数量差距过大会导致所 训练出的模型无法迁移到测试集进行准确测试。因此,为了解 决该问题,数据集样本较少的图片进行数据增强处理(此次实 验样本中的赤链蛇、侏儒响尾蛇、泥蛇、乌梢蛇和剑纹带蛇)。图2

12、数据集增强3实验及结果分析图2数据集增强3.1实验环境实验采用的是具有六核AMD Ryzen5 1600 x Six-Core的 CPU旦装备有8G内存的计算机,软件平台是Windows版的Mat- lab R2019b。3.2结果分析虽然对蛇类数据集进行扩充和数据增强,但是数据集样本 仍然是小样本,不适合从零开始训练样本,因此本文为了解决 样本数量过少的问题,采用迁移学习的方式训练模型。本文采 用的模型为Alexnet模型和Squeezenet模型,对原始数据样本和 扩充数据样本进行训练和验证,本次实验数据集原始样本总共 为4171张,扩充后的数据集样本为5543张,将训练集:验证集二 8:

13、2的比例进行划分。训练模型参数设置:学习率为0.00001, 每次输入模型的批尺寸(Bachisize)为50,验证频数为500,训练 周期为30个epoch,并使用随机梯度下降动量(SGDM)优化器 作为训练选项。其中批尺寸是Alexnet模型和Squeezenet模型 进行迭代训练时处理图片的数量,批尺寸越大,整个网络的收 敛速度也就越快,其训练的时间也更短,但是会占用更多的 GPU显存,因此需要根据计算机的配置来进行相应的设定。学 习率的设定也影响着网络的收敛,其取值过大会导致损失函数 (Loss)不稳定,取值过小会导致网络收敛速度过慢或过拟合现 象的发生。如表是Alexnet和Sque

14、ezenet两种模型在数据集扩 充前后的性能比较:表1原始数据集两种模型性能比较模型训练时间模型大小/M准确率/%,Alexnet10min32s20275.09%、Squeezenet8min14s10879.04%、表2扩充数据集两种模型性能比较模型训练时间模型大小/M准确率/%,Alexnet13min46s21678.81%、Squeezenet10min5s11385.71%、从表1和表2中可以看出,扩充数据集后,虽然训练时间更 长了,模型也更大了,但是两种模型的准确率都得到了提升,其 中Alexnet模型扩充数据集后,识别率提高了 3.72% , Squeezenet 模型识别准确

15、率提高了 6.9%,因此扩充数据集能够在一定程度 hi上提高识别准确率。除此之外、Squeeze模型在两种数据集模式下,依然保持着相较Alexnet模型更好的性能,在实际应用 中有更好的移植性,对硬件资源的要求更低,其服务器可以在 同一时间处理更多的数据,提高了工作效率。本文最终选取Squeezenet模型对10种蛇类图像进行识别, 此次实验主要对比扩充数据集前后模型的收敛速度,图中实线 为训练集,虚线为测试集,横纵为迭代次数,纵轴为损失函数。 从图3和图4中可以看出,数据集扩充以后,模型的收敛速度更 快。原始数据在300个epoch开始收敛,而扩充后的数据集在 200个epoch就已经开始收

16、敛了。图5中class1-10依次为斑背响尾蛇、赤链蛇、侏儒响尾蛇、 泥蛇、菜花蛇、银环蛇、乌梢蛇、剑纹带蛇、银环蛇和竹叶青,其 中横轴为准确率,纵轴为召回率。由于竹叶青颜色鲜艳旦单 一,其识别率最高,为97%。识别率较低的有三种蛇类,分别为 菜花蛇、银环蛇和乌梢蛇,由于这三种蛇类花纹较复杂,旦银环 蛇和乌梢蛇有着比较相似的特征,导致识别率偏低。4结语Squeezenet模型和Alexnet模型在同等条件下,Squeezenet 始终保持着相对明显的优势,训练时间更短,模型也更小,能够 节约更多的硬件资源,并提升工作效率,同时也利于移植到小 型硬件中,便于开发。扩充数据集能够在一定程度上促进收

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论