《深度神经网络在交通标志识别中的性能提升研究13000字》_第1页
《深度神经网络在交通标志识别中的性能提升研究13000字》_第2页
《深度神经网络在交通标志识别中的性能提升研究13000字》_第3页
《深度神经网络在交通标志识别中的性能提升研究13000字》_第4页
《深度神经网络在交通标志识别中的性能提升研究13000字》_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-11-1绪论1.1研究意义随着社会和经济的发展,家庭拥有私家车的人数日益增多,而与之相应的是,交通事故的发生率也在持续上升,交通事故的因素也不尽相同。人为的酒驾、超速,自然条件的天气恶劣而导致无法看清交通标识而发生意外交通事故。为此,西方发达国家提出了智能交通系统,致力于根据电子信息技术来减轻交通堵塞和管理方法公共交通(李明,张思远,2022)。此外,在辅助驾驶行业,Google、百度搜索等着名企业也慢慢将独立自动驾驶系统运用到具体安全驾驶自然环境中。由此可以窥探交通标志识别是道路交通系统软件的关键构成部分,旨在提示驾驶员标准安全驾驶,安全文明驾驶(王志刚,赵文涛,2023)。交通标志的自动识别和识别可以在辅助驾驶系统软件中为驾驶者给予提示,进而降低交通事故的发生。交通标志的自动识别广泛运用于人力安全驾驶和自动驾驶中(陈立新,刘建伟,2021)。交通标志是明亮、显眼、突出为特点的特殊标记符号,用来提示驾驶人员来降低交通事故发生的概率。依这些表现可以推测得出自动驾驶的总体目标是确保安全性和高效率,与此同时用计算机信息技术替代人们安全驾驶。现阶段自动驾驶还存有下列问题(韩晓峰,孙志远,2021):(1)交通标志模糊不清或有缺陷。(2)天气原因,如雾霾天气、浓雾导致识别能力差。(3)有障碍物,公路绿化植物和房屋建筑挡住交通标志。根据现实因素,传统式的图像处理技术存在分类不精确、效率低等问题。伴随着硬件配置性能的提高,近些年,深度神经网络获得了较大的进度,已经广泛运用于视频语音识别、文字识别、数字图像处理等[1]领域。深度神经网络在目标检测和识别层面也得到了较大的提升(张卫东,李俊杰,2023)。由此可以推断与传统的图像处理技术性对比,它在特征提取层面具备自动化技术和抗干扰能力强的特性。依据交通标志自然环境的多元性,设计出准确度高、性能好、可扩展性强的交通标志识别优化算法(周慧敏,吴天瑜,2018)。因而,论文使用根据卷积神经网络的深度神经网络模型,针对交通标志识别有着关键的实际意义。1.2国内外研究现状目前,无论是在工业界还是在学术界,如何高效准确识别在复杂多变的场景中交通标志,减少驾驶人员生命财产损失,是热门研究之一。在工业界应用上,更加侧重于识别的精度、行车的安全性、系统的时效性、稳定性。学术界的着重点是:算法优化带来的精度提高、实时性、可应用性。根据现有结果可推断无疑的是,深度学习在交通标志识别中无论是工业领域还是在学术领域的研究都是热门(赵鹏,钱程远,2024)。国外对于交通标志识别研究起步较早,在上世纪,Gotoh课题组基于各种颜色的阈值分割来提取特征,给出了一种识别率较高的算法(黄志强,何伟明,2020)。Piccioli等人使用黑白灰度图,来进行边缘提取,鉴于本文的研究环境我们考虑了这种情况的发生并将边缘信息采用特定的模型进行分割,然后将子图进行归一化为50*50的像素,与数据库中的图像进行对比,进行分类。LiuC等[2]通过总结交通标志识别方法,将传统基于形状特征、基于颜色特征、基于激光雷达和机器学习等方法(林晓红,谢思远,2022)。在此文中,对原始数据的处理方法相较于先前的方法显得更为直接且高效。本文采用了一种更为简化的预处理流程,该流程消除了多余的转换步骤,优化了信息的清理与标准化工作,从而显著提高了信息处理的快速性和有效性。利用此方法,本文得以更迅速地组织好分析所需的信息资源,同时减少了复杂处理可能导致的误差。此外,通过对不同源头和类别的信息进行全面试验,本文进一步验证了本方案的稳定与可信。这些都是基于传统图像处理的方法,并非深度学习方法,深度学习的研究得到质的飞跃。于此相似条件下可以推知其趋势在交通标志识别领域也是如此,Shijin等[3]使用卷积核替换与模型压缩的方法用小型数据集训练8层的卷积神经网络,在数据集上表现良好。郭建华,陈宇翔等[4]提出了基于深度学习的IRCNN去雾算法,该方法主要是通过正定分割的方式引入退化矩阵,再结合现有的卷积神经网络,实现在雾霾天气下的图像复原,解决弱光条件下交通标志识别问题。程思,雷振华使用Resnet作为基础网络,构建交通标志识别,在对清华-腾讯交通标志数据集(Tsinghua-Tencent100K,TT100K)上的45类识别进行分类总体取得了95%的召回率和94%的准确率[5]。在此特定情境之中不难看出针对目标小,距离远导致交通标志信息缺失的问题解决方案,由高忠文等[6]提出将对抗生成网络引入到FastR-CNN[7]中来修复交通标志信息缺失,来增强这个网络的精度(邓博宇,郝立新,2019)。随着YOLO系列[8]目标检测网络模型,在检测领域的优秀性能吸引了一众研究人员将其应用在交通标志识别领域。张泳祥等[9]等注意力机制,遵循这种理论框架进行调研可获知引入到YOLOv3模型中,来解决小目标问题,能够较好地解决交通标志干扰性问题。冯志远,蒋晓峰[10]等将U-net与YOLOv3结合,采用U-net进行定位优化,YOLOV3进行交通标志识别。孔祥瑞,沈志刚等[11]提出将深度可分离卷积融入到YOLOv3中,并修改损失函数,识别准确率得到了较大的提升。由此可以看出,随着人工智能的发展,深度学习被广泛地应用于交通标志识别中,尤其是YOLO系列,在交通标志识别中能够精度、鲁棒性更佳(吕建华,汪思远,2021)。1.3研究内容本课题针对上述情况,在深度学习算法上通过对比YOLOv4和YOLOv5在TT100K交通识别数据集上的应用,与传统图像增强方法结合处理方式,展示出较高的准确率和鲁棒性,能够较好地识别交通标志。目的在于开发一套实用的、高准确率、高实时性和鲁棒性的交通标志识别算法。主要研究内容如下:1、对原始数据集的训练集进行预处理,采用固定裁剪、数据增强等方法生成符合卷积神经网络模型输入尺寸的图像块。结合之前的成果可以推导出固定裁剪图像块保留交通标志的原始信息;而数据增强则是在数据集中对小尺寸交通标志进行过采样,增加了特征信息和位置分布的多样性,使检测模型具有较强的鲁棒性。2、模型算法的对比和训练(邵立新,殷晓红,2018):为减少外部环境对方案输出结果的负面影响,本研究在规划与实施阶段采取了一系列措施来确保数据的精确无误和方案的稳健运行。首要工作是全面分析了可能影响方案实施效果的外部变量。基于这些分析,本文在方案制定阶段纳入了环境敏感性测试的方法,通过模拟不同的外界环境状况来评估它们对方案结果的潜在效应,并据此调整方案的设计变量,以提升其适应能力和鲁棒性,确保方案能实时响应外界变化,保持其有效性和相关性。这充分说明了目前大多数高精度神经网络不仅不能实时运行,而且需要在多GPU上进行训练。YOLOv4和YOLOv5只需要一块GPU就能实时运行,完美解决了实时交通标志的检测问题,而且精度高,满足了实际需要,模型训练采用了默认配置和超参数(谭伟明,姚志远,2024)。1.4论文组织架构论文共分五章,章节安排及每章的研究内容如图1-1所示。图1-1论文章节安排示意图第一章:绪论。主要介绍了论文的选题背景、意义、国内外的研究状况,并对论文的研究内容、组织架构作了简要的说明。第二章:基于YOLO的目标检测算法。介绍了YOLO探测器系列的相关知识。对卷积神经网络的基本原理进行了综述,并对其基本组成进行了介绍,并对论文所采用的YOLOv4和YOLOv5网络结构进行了说明。第三章:数据集与模型评价指标。概述了TT100K数据集的情况和常见的交通标志类别,最后将交通识别标志模型评价指标进行了一一叙述。第四章:模型训练与实验。本章主要阐述了实验环境和数据集的准备及模型训练的训练参数初始化,并对模型在测试数据上的验证进行了分析和总结。第五章:总结和展望。介绍了论文所采用的研究方法和研究结果;最后,对本研究的理论贡献和实践价值进行了讨论,吸纳已有成果可以推导出新的结论提出了今后有待改进的地方,并指出了未来的研究内容和发展趋势。

2基于YOLO的目标检测算法在本章中,我们介绍基于深度学习目标检测算法相关理论知识以及卷积神经网络的构成与训练。并对于卷积神经网络为基础的目标检测进行展开,将YOLO系列的算法进行深入地介绍。2.1卷积神经网络理论基础2.1.1卷积神经网络的组成卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一种深度学习中具有自动提取图像特征的数学映射模型(谢晓刚,邹志强,2020)。通常,该方法包括输入层、卷积层、池化层、全连接层和输出层,其中池化层和卷积层交替地设置了多层,由此可以窥探并利用全连接层对输出类的概率和类数进行汇总。(1)输入层将图片或文本转化为规则数学矩阵,采用矩阵的方式作为神经元的输入值,参与卷积运算。(2)卷积层卷积层由滤波器构成,滤波器也称为卷积核。卷积层的本质主要通过卷积核的矩阵运算自动提取特征。依这些表现可以推测得出训练神经网络主要为了使得卷积核能够获取参数。(3)池化层池化层(PoolingLayer)又称下采样层,由于数据经过卷积层后根据卷积核形成多个特征平面,这是一个升维过程,由此可以推断需要进行适度的降维,否则会产生“维数灾难”[12]。池化层的目的通常用于对海量的特征信息进行过滤和压缩图像信息,对卷积层进行降维,以减少模型参数量,筛选出最具代表性的特征信息(阎志国,傅晓宇,2022)。(4)全连接层全连接层是经过卷积层卷积计算、池化层降维后输出具有深层抽象的二维图像特征。通常采用全连接层,将多维特征映射成一维向量,对特征进行分类(侯博文,余思远,2019)。(5)输出层在网络输出层,一般采用softmax等激励函数,把全连接层输出值转换为概率值,输出值代表相应类别的概率。根据现有结果可推断在完成卷积神经网络模型的构建后,为了使模型具有较好的拟合能力,需要对网络模型进行训练,以达到更新网络参数的目的(姜立军,陆晓峰,2021)。2.1.2训练神经网络CNN的训练主要是通过大量数据学习,获取卷积核参数的学习,并使得网络的输出值尽可能接近真实值(翁志强,柏晓红,2023)。鉴于本文的研究环境我们考虑了这种情况的发生主要的方法是通过比较网络输出值与真实值的误差,采用优化方法不断地迭代更新网络参数,从而达到减小输出值与真实值之间的差值。如2-1图所示,模型的训练主要分为两个阶段:(1)前向传播阶段(FP)首先,随机抽取一组样本数据,将训练样本数据随机输入网络模型,由卷积层和池化层交替构成的网络结构进行特征提取,于此相似条件下可以推知其趋势再通过非线性激活来实现新特征映射,最后将信息逐层传递到输出层。经过计算得出输出结果(袁晓天,孟志远,2018)。在理论上,只要执行策略时输入的信息符合预期,就能期望得到满足设计要求的结果。即,如果最初的条件和参数设置正确,且所用的模型或理论结构合理,那么其产出将会非常可信和有效。这不仅取决于数据输入的精确性,也受制于分析框架的科学性、技术设备的先进程度以及研究途径的恰当性。还需关注外界因素对最终结果的影响,确保研究流程的可控性和再现性,从而为结论的广泛应用奠定坚实的基础。(2)反向传播阶段(BP)反向传播主要利用损失函数计算网络输出值与真实值之差,结合随机梯度下降和反向传播,迭代使网络模型损失值最小化,在此特定情境之中不难看出并逐层更新网络参数,直至达到停止更新条件为止,最后保存网络参数。反向传播的作用主要是通过优化网络损失值来获取网络参数(姚建新,黄思远,2024)。图2-1训练卷积神经网络的原理图2.2典型交通识别模型YOLO2.2.1YOLO目标检测器通常,目标检测器主要分为四个组成部分,分别为输入端(Input)、主干网络(Backbone)、Neck网络、输出端(Prediction)。如图2-2所示,首先,通常情况下Input主要是输入图片,对图像进行预处理,增加网络精度。其次,Backbone用于提取图像特征,目前采用主流的网络架构VGG16[13]、Resnet50[14]、Darknet53[15]等网络,再次,Neck用于连接Backbone主干网络和输出层,提升特征的多样性及鲁棒性,一般采用FPN[16]、PANet[17]、BI-FPN[18]等(高鹏,蔡晓刚,2020)。遵循这种理论框架进行调研可获知最后,Prediction层主要是用来完成目标检测的结果输出。通常可由DensePrediction和SparsePrediction组成。图2-2目标检测器示意图DensePrediction通常由RPN[19]、YOLO、SSD[20]等任意一个组成。SparePrediction通常由FastR-CNN、R-FCN[21]等任意一个组成(卢振华,丁晓宇,2022)。YOLO(Youonlylookonce)是卷积神经网络在目标检测任务中自定义目标检测器框架。与两阶段网络相比,Yolo目标检测算法是基于深度神经网络的单阶段目标检测算法中最典型的代表,结合之前的成果可以推导出用于目标检测和定位。它运行速度快,优越的实时性与其不错的识别精度使其在交通标志识别中应用广泛。2.2.2YOLO基础组件YOLO是一种特殊的卷积神经网络,它由大量的基础部件组成。常见的基本构件有CBM、CBL、Resunit、CSPX、SPP等。CBM组件卷积层主要由卷积层(Conv)、批归一化处理(BN)、激活函数(Mish)构成。与CBL组件相比,CBL组件结构采用不同的激活函数(LeakyRelu)(马思远,樊立新,2019)。Leaky_Relu激活函数主要是为了使输入小于零的部分在方向传播时也能得到梯度。本文对上述计划的调试进行了理论探讨与实践测试。在理论探讨部分,详尽讨论了计划的基本概念及其目标,并通过理论框架和逻辑推导为实验提供了理论支持。接着,在实践测试阶段,本文设计了一系列测试来验证计划的有效性和稳定性,采用了精确的数据记录和分析方法确保结果的真实可靠。为了进一步验证计划在不同条件下的实用性,本文选择了几种典型的应用实例,并针对每个实例调整了系统配置,不仅证明了计划的可行性和正确性,也为今后的研究提供了有价值的参考资料。这充分说明了基础组件Resunit主要由CBM组件和ResNet网络中残差级联来构建网络。Resunit采用ResNet网络体系结构,能够解决深度神经网络的“退化”问题(倪晓峰,许志强,2021)。基础组件CSPX是从CSPNet[22]中借鉴的,它在提高学习能力的同时也保证了轻量化,降低了计算成本和内存成本。CSPX主要由CBM组件、Resunit组件和Concate构成。其中Concate主要是将特征进行联合,将图片的通道进行合并,吸纳已有成果可以推导出新的结论也就是图像本身的特征增加了,而每一特征下的信息没有增加。最后一个基础组件SSP采用空间结构的金字塔池结构,有效地避免了由于剪裁和缩放操作而造成的图像失真,该方法有效地克服了卷积神经网络不能进行重复特征抽取的困难,极大地加快了候选框的生成,节省了大量的计算量(彭博宇,叶晓红,2023)。2.2.3YOLOv4网络结构Yolov4是一种特殊卷积神经网络的扩展。Darknet研究框架灵活开发了计算机视觉地图中最合适的实时目标检测器,如Yolov1、yolov2、yolov3、yolov4和yolov5,主要用于目标检测领域(冉志国,殷志远,2018)。目前Yolov4在目标检测领域性能较优的网络。Yolov4结构如图2-3所示,由此可以窥探主要由Input、Backbone、Neck、Prediction组成。首先,Backbone部分包含了1个CBM和5个CSP组件主要用于特征提取[23],这种组成方式能够有效地增强CNN的学习力,减少计算量和内存成本(傅智渊,狄晓鹏,2022)。其次,Neck作为特征增强模块,主要由CBL组件,SPP模块和上采样方式组成,融合不同尺度特征来达到增强特征的目的。依这些表现可以推测得出最后,Prediction其实是利用获取的特征进行预测,是一个解码过程,主要构建整个YOLOv4整个功能。图2-3YOLOv4结构图此外,在过去的目标检测模型中,采用均值方差作为损失函数,通过预测框和真实框的中心点坐标和长宽信息设置的。但是均值方差作为损失函数存在对坐标与长宽的关联信息缺失问题(耿立新,闵晓妍,2019)。由此可以推断为了能够更精确地检测目标,损失函数由边界框损失函数、置信度损失函数和分类损失函数加权组成。与YOLOv3的损失函数相比,边界框关联相关坐标信息对模型优化和提高模型精准度有这个巨大的作用,其余损失函数均继承于YOLOv3。本文在行为思路上也有所创新,作者创新性地融入了前人关于此主题已有的研究成果,在研究深度上有所加强,首先通过综合分析现有文献中的关键理论和实证发现,本文构建了一个更为系统且全面的框架,旨在为该领域的研究提供新的视角和方法论指导。其次,为了确保研究的有效性和可靠性不仅验证了前期理论假设,还进一步探索了未被充分关注的研究空白。2.2.4YOLOv5网络结构YOLOv5结构如图2-4所示,与之前的YOLOv4相似,但在性能上有了较大的提升。为了提高检测效率,在输入端增加数据Mosaic,自适应图像缩放,自适应锚计算。在YOLO算法中,根据不同数据集,根据现有结果可推断初始设定长宽的锚框。在网络训练中,首先根据初始锚框输出预测框,然后将预测框与真实框进行比较,计算出两者之间的差距,最后通过反向更新来迭代网络参数。在以前的YOLO系列网络中,不同数据集的训练都是单独计算初始锚框值(靳志宏,卞晓宇,2020)。鉴于本文的研究环境我们考虑了这种情况的发生但是在YOLOv5中,这个功能被嵌入到代码中,在每次训练时都可以根据不同的训练集来自适应地计算出最优的锚框值[24]。其中Backbone引入了Focus结构,主要为了对图像进行切片操作(匡晓龙,湛志远,2023)。在Backbone部分,CSPX结构应用于Backbone主干网络中为了增强网络学习能力,于此相似条件下可以推知其趋势提高小目标的准确性。Neck部分与YOLOv4部分一致。另外在Prediction层中,输出部分包含了Boundingbox损失函数和非极大值抑制函数NMS(Non-MaximumSuppression)。图2-4YOLOv5结构图其中的边界框函数,GIOULOSS(GeneralizedIntersectionoverUnion)来源于IOU的边框预测函数,在此特定情境之中不难看出但是IOU损失函数存在只关注对应的“距离”,导致与真实的IOU值相差较大(赖博文,覃思远,2018)。这一结果与已有的文献结论大致相同,这也验证了前期研究中所提出的构思,从而进一步拓展了该领域的理论边界。本研究通过引入新的变量和分析方法,为现有理论体系注入了新的活力,使其能够更全面地解释相关现象。同时,这一发现也为后续研究提供了新的理论支点,有助于推动该领域理论的进一步深化和精细化。为了解决这个问题,GIOU其思想主要是首先假设两个任意性质的A、B找到最小的封闭形状C,让C把A、B包含在内,其次,计算C中没有覆盖A和B的面积除以面积C。最后用IOU的值减掉比值,GIOU的损失函数表示为(1)非极大值抑制函数主要是为了能够将产生数量巨大的目标框向着同一个目标,抑制冗余的框而进行的操作(令狐翔,禹晓峰,2024)。在YOLOv5中,预测时,每个预测框包含着物体的置信度和预测框位置信息,遵循这种理论框架进行调研可获知面对数量较大的目标框时,需要采用加权的非极大值抑制函数来剔除冗余目标框,找到最佳物体检测位置,来完成目标检测(慕容志,寇晓红,2021)。2.3本章小结本章主要基于YOLO的目标检测算法,阐述YOLO目标检测器的基础组件,最后在介绍了论文采用的YOLOv4与YOLOv5模型的架构,也可以看出YOLOv5在与YOLOv4模型对比发现,YOLOv5是在YOLOv4上的改进,结合之前的成果可以推导出主要工作体现在Backbone引进了Focus结构,损失函数不同,初始锚框在训练中不断地调整等几点不同。

3数据集与模型评价指标3.1交通标志数据集数据的好坏决定了模型的上限,对模型起着关键性作用,深度学习的有效性取决于输入数据的质量(南宫博,邬志新,2019)。论文采用清华大学公开的国内交通标志数据集TT100K数据集,在数据集中分别有限速、警告、提示、禁止、红灯、绿灯、黄灯等多类不同的类别标签。将此作为训练模型的训练集和测试集。以充分让模型获取对国内交通标志识别能力。3.1.1交通标志简介在国内,交通标志主要起到三种作用,这充分说明了分类对应为警告、禁止、指示。如图3-1所示,主要分为三类(欧阳骏,茹晓刚,2022)。图3-1各类交通标识图交通标志识别作为辅助驾驶交通系统中技术之一,意在提示驾驶员标准安全驾驶,安全文明驾驶。交通标志的自动识别和检测可以在辅助驾驶系统软件中为驾驶者给予提示,进而降低道路交通事故的发生(裴晓天,轩辕志,2020)。3.1.2TT100K数据集TT100K是清华大学和腾讯联合制作的交通标志数据集,有9180幅国内交通标志图片。数据集中的图片来源于腾讯街景图,原图像的分辨率大小为2048*2048的高清图片,且根据相关统计,吸纳已有成果可以推导出新的结论交通标志只占整张图片的0.2%,基于原数据集高分辨率小目标,论文实验前直接把一张图画框裁剪640*640大小的4块,把标志有目标信息的块筛选分块,只保留了有目标的图(漆志远,阎晓宇,2023)。在后续的研究中会对已有的研究成果进一步从不同的角度进行优化,会考虑引入国际视角和比较研究的方法,以丰富研究内容并提升其普遍适用性。通过借鉴国外先进经验,结合本土实际情况,努力提出具有前瞻性和实用性的解决方案,推动全球范围内的知识共享和技术进步。与其他数据集相比,TT100K数据集中包含警告、禁止、指示等221类标志类别,由此可以窥探同时还包含了约300多个中国城市交通街景。如图3-2所示,处理后的数据集中大部分是自然场景下的小目标的交通标志,适用于我们现实生活场景。图3-2TT100k数据集示例正是由于数据集自然场景下的数据集,所以具备一定的随机性,也导致了各个交通类别标志数量不一致,会导致模型偏向于数据量多的类别(冉晓辉,司徒博,2018)。因而在开始实验前,从原有221种标注数中筛选出了样本数较多的45类交通标志如图3-3所示,筛选后的训练集和验证集的数量分别是5552张和2844张。图3-345类实验数据集分布图3.2模型评价指标在深度学习模型训练中,由此可以推断如何利用训练数据集对模型进行评估是关键。根据应用场景的不同,需要选择具有较好模型指标的模型。如何对模型进行性能评价,需要根据模型要解决的问题和任务来判断(司晓楠,尉迟志,2024)。从上可以可以看出该方案相比于其他方案具有更好的性价比,同时其高度的定制化能力允许根据特定需求进行调整优化。这种个性化的解决方案能够更好地满足不同客户的独特要求,提高客户满意度和忠诚度。目标检测模型的性能主要由检测精度和速度两个方面来评价。论文采用平均检测精度mAP检测精度和每秒帧数FPS(FramesPerSecond)检测速度作为评价最终模型性能和实用性的依据(滕思远,濮阳晓,2021)。根据现有结果可推断当mAP值越高、FPS越大时模型性能越好。论文以交通标志识别为业务场景,要理解mAP指标,首先要了解(1)TP:表示实际是正样本被预测为正的样本数目。(2)FP:一个样本数目,它表示实际是负的,但是预测结果却是正的。(3)FN:鉴于本文的研究环境我们考虑了这种情况的发生表示实际是正样本但预测为负的样本数(4)TN:表示实际是负样本被预测为负的样本数目(万志海,赫连红,2019)。Precious(精度)是指模型预测中所有目标的最后预测结果正确的比例计算公式(2)如下: (2)平均精度(AveragePrecision,AP)计算如公式(3)其中N表示样本的数量 (3)而mAP是对每个类别求平均精度 (4)另外论文选择平均对数误检率(log−averagemissrate,LAMR)作为评价指标。LAMR是指在每张图片中平均检测到的目标误检数,于此相似条件下可以推知其趋势而对数平均误检率LAMR这个指标越小,模型性能越好(奚晓峰,慕容翔,2022)。3.3本章小结本章节主要阐述了交通标志的类别和TT100K数据集的情况,首先,本章介绍了中国公开交通标志数据集(闫博涛,钟离宇,2020)。为了使实验结果真实可靠,论文还对数据集进行了裁剪预处理。接下来,本章详细介绍了实验的评价指标,最后将交通识别标志模型常用的Map检测精度和FPS检测速度以及对数评价指标LAMR进行了概述。

4模型训练与实验4.1实验平台环境配置本实验基于Yolov4以及Yolov5的交通标志识别的实验环境。如表4-1所示,主要硬件支持为14GB内存大小的型号为英特尔i7-4790的CPU和8GB显存大小的型号为NVIDIAGeforceGTX1070Ti显卡。在Ubuntu操作系统基础上采用python3.6编程平台,利用Pytorch深度学习框架构建网络模型(宇晓雷,刘合志,2023)。表4-1硬件配置参数软硬件环境配置CPUInteli7-4790内存14GBGPUNVIDIAGeforceGTX1070Ti显存8GB编程语言Python学习框架Pytorch4.2数据集准备从上文交通数据集的详细描述可以得出结论:TT100K数据集类别分布不平衡和图片原始分辨率较大,会导致网络提取类别中少实例数量的特征不完全和性能不足以处理高分辨率图片数据。在此特定情境之中不难看出论文实验的数据准备选择了标注数据量较多的45类交通标志进行识别,且裁剪为640*640的图像尺度(湛立新,长孙鹏,2018)。上述优化方案是依据对当前状况的深度分析以及对现有资源与技术的合理利用而诞生的。与传统方案相比,它在多个关键点上展现出突出的优点。首先,该方案凭借引入更具创意的设计理念,达成了效率的提升与错误率的减少,显著提高了整体的可达成率。其次,从成本效果的角度分析,新方案有效减少了实施和维护的成本,实现了资源的有效利用,增强了经济效益。此外,它还强化了系统的兼容性和可扩展性,使其能更灵活地适应未来的发展趋势和应用需求的变化。针对数据集不平衡问题,在YOLOv4、YOlOv5算法中,都有一个很重要的数据增强,就是Mosaic数据增强。Mosaic数据增强从训练集中每次把四张图片进行随机的大小缩放、左右翻转以及明亮度、饱和度、色调的变化,遵循这种理论框架进行调研可获知再随机分布进行拼接成一张新的图片,然后将拼接好了的图片传入到神经网络中去学习。这个过程丰富了训练数据集,让网络的鲁棒性更好(邹晓宇,宇文博,2024)。4.3基于YOLOv4、YOLOv5模型训练将交通标志数据集TT100K按照原数据集官网的数据集比例,随机分成5552张训练集和2844张验证集,分别剪裁为640*640的图片,其中用训练集对YOLOv4和YOLOv5的模型训练。结合之前的成果可以推导出为了使特征提取效果明显,减少训练时间,达到快速收敛的目的,采用模型的预训练权重从非零开始训练。模型预训练权重的重要作用在于主干特征抽取网络权值部分用于特征提取(许志诚,程雅琳,2021)。如4-2所示,在训练该模型时,采用随机梯度下降法进行训练,这充分说明了初始化学习率为0.01,训练周期分为冻结阶段epoch=50和解冻阶段epoch=250。在设计优化阶段,本文着重考虑了经济性与方案的通用性,相较于原始方案,在多个关键点上进行了革新与改进。成本控制上,通过剔除多余步骤、选择性价比更优的方案,显著降低了实施成本,使方案更加经济可行。同时,为了增强方案的普及性,设计时充分考虑了地域多样性和环境适应性,确保其在各种条件下都能稳定运行,便于其他组织或个人轻松采纳与推广。在解冻阶段,模型主干网络不冻结,特征提取网络发生变化,占用显存较大,网络参数发生变化,前50个epoch按16个批次大小随机分成16个部分,随后的250个epoch按8个批次大小(李明,张思远,2022)。在训练过程中,通过mosaic数据增强、平移、水平转换、色彩抖动等方法增加训练样本,提高模型的性能。训练过程中,吸纳已有成果可以推导出新的结论验证集的误差在下一轮训练中没有出现下降时,对学习率进行一次衰减,在实验的过程中的衰减权重设置为0.0005,直到模型收敛为止。表4-2训练参数设置学习率BatchsizeMosaci数据增强权重衰减系数前50epoch0.0116True0.0005后250epoch0.018True0.0005YOLOv5训练参数与YOLOv4模型基本相同,但训练速度远高于YOLOV4。对于TT100K的数据集,YOLOV4的最大验证时间是36小时,相比YOLOV5只有16小时。4.4模型评价对比分析与应用4.4.1模型评价对比分析模型分析需要通过验证集对模型的验证,根据上述评价指标mAP的计算公式,mAP越大对模型性能的预测越准确。图4-1YOLOv4各类别的AP值 图4-2YOLOv5各类别的AP值如图4-1和4-2图所示,在4-1图中为YOLOv4的Map为82.92%,在4-2图中为YOLOv5的Map为92.09%,在Map评价上高出10%,由此可以窥探可以看出YOLOv5比YOLOv4精准度更佳,同时,也可以得出TT100k数据集在YOLOv5模型上能够较好识别交通标志(王志刚,赵文涛,2023)。 图4-3YOLOv4各类对数平均误检率 图4-4YOLOv5各类对数平均误检率如图4-3和图4-4所示,YOLOv5比YOLOv4对数平均误检率小,但也出现个别类别误检率较高,综合该类的训练数据集中的数量,因数量少特征提取不完全导致,模型对该类欠拟合(陈立新,刘建伟,2021)。但YOLOv5依旧表现对该类较强的拟合能力,所以YOLOv5所有的类别拟合能力都非常强,依这些表现可以推测得出能够对交通标志进行识别。表4-3数据集在不同模型上记录数据对比模型名称mAPFpsSecondsLamrYOLOv40.82920.0921/0.0920.2524YOLOv50.92090.0341/0.0340.1071结合表4-3所示,论文采用的评价指标得出结论,Map是45类AP的平均值,只能替代整体效果。根据不同类别训练数据的分布情况,Map值可能对特定类别有良好的效果,但在其他类别(数据量缺少)中则没有,所以需要查看每个类的AP。整体上绝大部分类别的识别精度接近80%,由此可以推断但仍然存在某些类别因数据集中训练图片数量少而导致特征提取不完全,模型对该类欠拟合(韩晓峰,孙志远,2021)。但相比而言YOLOv5依旧表现对该类较强的拟合能力,所以YOLOv5所有的类别拟合能力都非常强,能够对交通标志进行识别(张卫东,李俊杰,2023)。4.4.2模型应用为了展示模型的应用能力,使用经过训练的YOLOV5模型进行检测,并将该类别的概率作为置信度进行输出,根据现有结果可推断如图4-5所示,随机从测试集中挑选两张道路环境中的交通标志照片作为模型预测的输入,最后我们可以看出图像上,有多种交通标志能够被准确地识别并给出置信度(周慧敏,吴天瑜,2018)。图4-5TT100K测试集实验结果图4.5小结本章主要阐述了相关训练数据和训练参数,并对YOLOv4和YOLOv5模型在数据上的验证进行了对比分析和总结(赵鹏,钱程远,2024)。鉴于本文的研究环境我们考虑了这种情况的发生由此可以看出,在数据量充分的环境下YOLOv5模型是可以胜任交通标志识别工作。

5总结与展望随着家用汽车的普及,交通标志自动识别技术在汽车辅助驾驶中的应用越来越广泛。与传统数字图像处理方法相比,深度学习在目标检测和识别方面也有很大突破,在特征提取方面具有自动化、抗干扰性强等特性,能够针对交通标志所处环境的复杂性(黄志强,何伟明,2020)。于此相似条件下可以推知其趋势论文重点介绍了道路标志识别的具体实现方法,将YOLOv4方法与目前较为成熟的YOLOv5方法相比较,在45类的TT100K数据集上建立了高精度、高性能、鲁棒性强的交通标志识别算法模型。与此同时,论文也存在诸多不足之处,也希望在下一步的工作进行展望,进一步的进行提升模型的精度。论文希望在今后的工作中能够从以下几个方面进行完善(林晓红,谢思远,2022)。在今后的研究中,尝试对算法的改进,比如改变网络结构、改进卷积层结构、增加注意力机制来补充完善准确的交通标志识别研究。针对国内交通标志数据集的不足,对TT100k数据集进行扩展,增加不同角度和特殊环境下的交通标志数据,在此特定情境之中不难看出丰富交通标志样本数据库,使实验模型能够更好地处理真实环境中各种场景下的识别工作(郭建华,陈宇翔,2021)。在国内外不同公共交通标志数据集上比较其他检测任务算法的性能。在模型评价分析上增加Recall、F1、Precision等评价指标。

参考文献李明,张思远.计算机图像处理与识别技术的应用研究[J].黑龙江科学,2022,12(24):110-112.LiuC,LiS,ChangF,etal.MachineVisionbasedTrafficSignDetectionMethods:Review,AnalysesandPerspectives[J].I(张卫东,李俊杰,2023)Access,2023,PP(99):1-1.SongS,QueZ,HouJ,etal.Anefficientconvolutionalneuralnetworkforsmalltrafficsigndetection[J].Journalof阎志国,傅晓宇temsArchitecture,2019.王志刚,赵文涛,等.基于深度学习的雾霾天气下交通标志识别[J].重庆交通大学学报:自然科学版,2020.陈立新,刘建伟.基于残差单发多框检测器模型的交通标志检测与识别[J].浙江大学学报(工学版),2021,53(05):127-136.韩晓峰,孙志远.基于生成对抗网络改进的更快速区域卷积神经网络交通标志检测[J].汽车技术,2021(7):5.张卫东,李俊杰.FasterR-CNN:TowardsReal-TimeObjectDetectionwithRegionProposalNetworks[J].I(张卫东,李俊杰,2023)TransactionsonPatternAnalysis&MachineIntelligence,2017,39(6):1137-1149.RedmonJ,DivvalaS,GirshickR,etal.Y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论