图像名牌自动识别系统设计_第1页
图像名牌自动识别系统设计_第2页
图像名牌自动识别系统设计_第3页
图像名牌自动识别系统设计_第4页
图像名牌自动识别系统设计_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绪论1.1课题研究背景与意义等课题研究背景在这个飞速发展的时代里,人人都离不开电网,这近年来国家也对电力的需求明显增大,电力设备的种类以及数量明显增多,所以电力在我们生活中的作用非常大且很重要。电力设备名牌简单的定义为记录设备基本电路信息与身份信息,而我们对这个信息进行巡检,进行管理等工作时需要名牌信息,以及方便对名牌设备图像进行采集工作。家家做到供电安全是国家十分重视的课题之一。我国电网的规模也比较广泛,慢慢走向智能化与大容量的高电压。电力名牌是由额定电压,额定电流,额定容量,额定频率等一些内容组成。但我国对各种电力设备的安全及有效性,以及可靠性非常重视,对其要求也高。用电过程中,某个电力设备出故障了,会引起“链式反应”,导致电路不能正常工作以及带来一些不必要的麻烦。因为电力变压器在长时间在室外且会收到一些雷击,暴雨,刮风,冰雹等自然因素带来的侵害。因此,这些因素可能会将把电力设备的各种设备元件发生氧化,腐蚀等现象严重到引起各种灾害,或者人员死亡,其实通过一些研究形成电力设备故障的原因是一些性能发生恶化,比如绝缘性等。其实电力设备长期处于高电压,还有磁场强的情况下,同时会遭受一些外来因素侵袭。也有可能发生电力设备放电等情况。如果我们不能及时处理这些电力设备存在的各种故障,否则对电力设备的安全性和可靠性带来威胁。为了提防电力设备发生一些故障或者严重事故,一定要及时检查电路设备,做好安全工作,且及时对电力进行检查,将做好一些防备工作,从而达到电网可靠高效地运行。最近这些年,随着我国经济水平的飞速发展,整个电力设备技术得到改革,通过深入研究,我国电力设备的科技发展也得到了飞速发展的机会,并且各种技术变得更加智能化,自动化了。而且电力设备巡检方式也得到了改革,根本用不着人工操作了,一切都机器自动操作。电力变压器一般在室外。随着科技发展,人们供电需求也明显增加。每个设备状态准确率与设备的检修遇到一些麻烦。主要表现在以下几个方面:1.电力设备发生故障的情况下,没有专家专门分析,那么工作效率更加低。还加上最近检测数据的越来越快速增长,与电网的正常运行,气象环境数据量比较高,若人工进行分析那么效率很低。2.各种业务系统包括电力设备状态信息,有多种多样的数据结构,数据的接口也不一样,从从而导致了电力设备状态信息与资源比较分散,数据质量也面临困难,影响了电力设备状态的诊断的结果以及工作效率。最近年来,电力设备名牌涉及到的所有巡检工作都是有管理电力设备机器人的帮助下完成的,如果我们采用人工巡检的方法,进行人工巡检,会有存在一些缺陷。比如:工作效率不高,因为整个管理系统的内部网络线比较复杂,运用到的电力设备也比较多,若用人工巡检,必须亲手一个个记录设备的名牌,再对性能进行对比,由于人工工作量也较大。操作不方便,一般我们所看到是电力设备安装在高处,平时进行人工巡检,必须用梯子上去,带来操作不方便等一些问题,还有些电力设备名牌安装在地下通道,必须工作人员下井检查,也有带来不方便操作。人工进行巡检时候记录数据过程中也有可能出差错,如遗漏信息或者输错数据等导致数据缺陷。在机器人进行巡查的电力设备通过传感器可以得到电力设备参数,因为机器人一般会自动携带传感器,并这个传感器还帮助机器人规划巡检路线等。比如:对电力设备名牌进行图像采集我们可以用摄像机操作,让电力设备仪器达到自动识别的目的,还运用传感器可以检查设备的红外检测,并按时做到正确无误的设备信息记录,及时发现遗漏或出错的参数,并及时给工作人员反映出现的异常。而且工作人员在室内就可以解决异常参数,随时掌握电力设备信息并解决出现的问题。最终做到一流的电力设备巡检工作。从而可知,这种方式大大提高了电力设备名牌的工作效率与工作质量安全,为整个电力设备系统提供安全可靠的用电服务。这么先进的电力服务,对经济发展与社会发展的影响很好。课题的研究意义机器人电力设备技术多用于传感技术,智能导航,规划电力电路路线,还包括计算机图像视觉技术与数字图像技术于都是一体的复杂的系统。目前在电力设备名牌识别与分析参数过程中,专家们对图像视频技术和图像数据流进行分析的不够好,不够透彻,现在处于最起阶段,如何去利用媒体的数据信息,并对这些数据进行进一步分析与采纳,找出其中的特点,并把它提取出来,运用到图像设别技术当中,并及时解决这些问题。图像识别技术是巡检机器人的一部分,运用计算机图像视觉技术可以在很远的距离对电力设备名牌进行设别,记录电力设备的状态信息,可以判断是否处于健康状态,并及时更换巡检信息的记录。若我们运用人工提取和选择来进行计算机图像视觉的颜色特征,形状特点来对电力设备图像进行描述,那么在整个过程中出现的参数也有限制,不能得到图像和视频的内在信息,而且还可能影响到图像识别的准确性。若运用机器人那就更方便了,机器人有导航的功能,它在资料库中存着电力设备电站的地图,通过这个地图基本可以确定电力设备位置,而且还可以知道自身所处的位置。对非结构化图像数据流的图像进行检测与自动识别。还能解决电力长时间依赖的人工处理,效率低,转化率较弱等一系列问题。计算机视觉技术在电力设备的应用中存在以下场合:范围广泛,比较自由,并且可及时监视。需要一整天落实电力的重要设备与场合。人的视觉做不到识别图像以及分析,总会出现一些漏洞。而这里存在的技术难处有以下几个:1.受到自然因素,如:天气变化等,会引起图像采集质量不好,在明暗程度不一样也会影响所拍出来的图像效果不好,不清楚。2.有时不能识别汉字,可知识别效率低。3.在机器人操作过程中,拍摄的图像角度不固定,导致图像产生倾斜等状况,甚至不能识别图像。为了解决上述存在的问题进行解决。所以本次课题主要研究电力设备名牌的通过计算机视觉技术特征提取,对图像参数目标的检测,以及图像设别方法。采用C/S结构,用摄像头采集电力设备名牌图片,然后识别图像角度,首先进行图像预处理,然后进行灰度化,二值化处理,高斯去噪点等一些列操作,然后把图像识别结果传给巡检模块,如电力设备名牌的信息模块,获取设备参数,从而和别的传感器一起完成巡检工作。并且为后续的电力设备系统巡检提供了理论基础。研究现状分析很早之前的电力设备的巡检工作是由人工完成的,它工作效率较低,而且还会需要大量人力还有物力等,还有时候遭受大自然的环境因素引起的影响,尤其是走向高压线路过程中,光靠人工无法检测准确信息,还会出现供电故障,所以,随着社会与经济的发展,电力设备系统自动巡检也有成为可能。电力设备巡检对于电网的设备在远处进行操控,监视一级控制一个系统。是现代是视觉技术,计算机机器视觉在电网上监督与控制上的运用。目前,有些西方的国家也推广这门技术。随着各个电力部门对电力设备系统工作的高度重视,巡检的自动化已经成为目前国家电力行业的技术进步的重要部分。目的就是提高电力设备工作效率,设备的管理水平以及质量,增强供电的安全性,有效提高电能质量。在国外的电力设备巡检工作很早就开始实行了。巡检自动化工作已经构成了馈线分段开关的检测,电容器组元件的调节,电力用户负荷调整,还有电力数据采集等一些列的配电网管理系统(简称DMS),有一百多种功能。1.3课题的主要研究内容电力设备名牌自动识别涉及图像预处理与文字识别等工作。本文主要针对电力设备名牌图像的特点,着重对识别前图像预处理做深入的研究,具体包括:1、电力名牌结构比较复杂。其中作用也比较重要,通过电力名牌识别才能可以清楚这个设备的基本情况。从而我们对电力名牌图像进行预处理工作,才能改善图像质量,有效改变图像识别效果。预处理内容包括图像灰度化,二值化,高斯去噪点等。2、图像名牌自动识别也是电力名牌识别当中主要的内容之一。文字识别是电力名牌图像抽取了特征之后进行进一步处理得到的图像结果。在图像文字识别大部分运用到模板匹配法,神经网络以及基于支持向量机的分类等一些方法。在这个课题中第一步用模板匹配法,在图像预处理的过程上,进一步把待识别图像与模板进行匹配,然后距离较短的作为本次识别的结果。然后依次待识别图像再与提取出来的十三网络特征进行匹配。从而达到分类目的。3、电力名牌识别要做好怎么与电力站的设备信息,设备安装具体位置以及厂家的联络信息等一些列信息关联起来,做到信息正确无误,可靠,然后再通过网络以及图像模式识别技术对电力名牌进行处理,然后提高设备的质量安全程度,还提高对设备全面维护工作,提高整个电网安全工作效率。1.4论文组织结构这次论文分为五个部分,每个章节进行概括描述为以下几个部分:绪论主要介绍了本次课题研究的意义以及背景,电力设备在目前国内现状分析,以及组织结构等。图像识别处理相关环境,简单介绍Opencv和Python环境,以及对比总结特点和Opencv的几个模块等。还介绍了Opencv和Python的基本图像处理过程。如:载入图像,保存图像,显示图像等。识别图像预处理理论。对电力设备名牌进行图像预处理。图像灰度处理,二值化处理,高斯去噪过程的相关理论的介绍。还有边缘检测,Canny算法的简单介绍,以及实现图像霍夫变换。名牌识别介绍文字识别最基本的过程。并且实现电力设备名牌灰度化,二值化,图像边框检测,去边框,去噪点过程。对本次电力设备名牌自动进行总结,指出论文当中不足之处,提些建议,以及对今后的展望。第二章识别处理相关环境2.1opencv与Python的简介2.1.1Python的来历Python语言由世界著名的荷兰人吉多·范罗苏姆GuidovanRossum在20世纪80年代的某一个圣诞节,他为了打发时间而编写的一个计算机编程语言编译器,并且把这个程序叫作Python(大蟒蛇),有一个喜剧团队叫MontyPython,他是这个团体的爱好者之一。Python程序设计语言是目前最受欢迎的语言。Python语言是由很多其他语言的逐步发展而产生的,这其中包括ABC、Modula-3、C、C++、Algol-68、Unixshell和一些其他的脚本语言组成等等。Python语言源代码遵循GPL(GNUGeneralPublicLicense)协议。现在的Python在一个核心开发团队的维护中,在python语言中GuidovanRossum的占据作用极其大,他主要负责指导其进展。Python语言涉及到的领域很广泛,比如在金融,人工智能,科学运算,各种软件开发,云计算等当中。Python语言的特点是:1.优美,非常明确,简单。2.可移植,可扩展,可嵌入性。3.免费并且开发效率高。Python是一种很优秀且简洁易懂的程序设计语言,与C语言和c++语言相比起来更简单,易于使用。它语法与设计也比较简单;运用过程中Python不需要建立main()函数,直接可以输出字符串或一些语句。与c++语言相比虽然Python的性能会有一些差别,不过开发的相率相当高。之所以Python比较简洁,而且比起javac++,它代码的大小也占不了很多;Python具有跨平台性,用途领域范围非常广泛。2.1.2Opencv的来历OpenCV技术是在网络研究中心开发的一种视频处理和图像处理技术,OPENCV为算是大型的计算机视觉开源库。其是一个开放的源码组成的,引用了计算机技术,形成了一个跨越平台的计算机视觉开源库。它的全称是OpenSourceComputerVisionLibrary。Opencv是1999年由世界顶级的Inter研究中心开发的。openCV在各种领域和商业中免费运用,而且opencv优化的源代码是对外开放的。OpenCV在进行图像处理的过程中,使用的是C语言和一些c++的编写构成,简洁易懂且高效,有效地实现了图像处理的各种算法。opencv兼容性高,运用在不同的接口,不同的系统的操作运行,还在各种的平台上运用。OpenCV软件中的函数大约有500多个,并且在全国计算机图像处理领域中广泛使用,并且成为了流行的图像处理的软件。opencv在学术界和工业界的影响力也也比较大,它具有巨大的功能。Opencv随着时代计算机视觉技术扩展到每个计算机视觉领域,其功能也很强大,实现一些二位卷积,形态学图像处理等各种图像处理算法,opencv主要的扩展库cv2通过图像处理的函数Numpy数组进行一些处理,然后编写图像,实现图像各种操作,让计算机视觉变动简洁易懂,丰富。几乎覆盖每个研究的方向,其中实现的一些算法随着计算机视觉技术的发展,将把最新的算法加入其中。Opencv应用扩展。在计算机视觉领域中也广泛运用。如:人脸识别,制作机器人,图像分割技术等。还可以在计算机图像操作底层也运用广泛。如:数字图像处理技术:高斯滤波,边缘检测,直方图等等。各种数据结构:树,图,线性表等。Opencv的特点总结以下是几个;1.Opencv技术具有兼容性,可移植性等特点,还有可以跨过平台运用。2.OpenCV能够进行跨约平台使用,可以在windows,Linux平台上运行,opencv在桌面软件上使用,也可以在Web后台也运行。3.Opencv支持各种编译器上运行,比如C/c++等。可视化以及易调整代码。4.Opencv对外开放免费,其源代码是公开的,使用opencv不需要开源其他项目。5.提高开发工作效率,适量减少了开发者的工作量,保证程序可靠的运行。有多种功能,比如:包含了数据结构当中的树,图,以及线性表。6.运用的用户接口灵活且方便,大部分用C语言,C++语言编写。7.Opencv运行程序速度相当快。它有效提高了计算机编程速度。8.Oencv具有独立性。Opencv可以在各种操作系统上运行如:LINUX,windows等,与python,matlab等接口也有密切联系。Opencv(python)使用中存在的缺点:1.文档不完善,很难找到关于opencv文档。2.技术比较落后。3.与C++相比运行速度比较慢。4.进行修改比较麻烦,若修改opencv,那么一定要首先修改源文件。2.1.3OpenCV的几个模块概述Opencv内部是通过模块来组成的,每个模块都能完成相应的功能。这里对Opencv内部的几个主要模块进行简单介绍。打开Opencv官方手册,我们可以看到它包括如下主要模块:1、TheCoreFunctionality这模块在Opencv当中的基础的数据结构,包含Mat,称为opencv的基石,其作用是保存储图像,还有一些点结构、长宽形状结构等等。而这个Mat包含了一些矩阵运算的算法与方式,其实可以认为利用Mat类来操作矩阵运算。2、ImageProcessing这个模块是进行图像各种运行操作的,有高斯滤波去噪、直方图、灰度化,特征检测等一些功能。在这些图像处理领域中运用Opencv算法的实现比较靠谱的。3、High-levelGUIandMediaI/O一般用到简单的Opencv界面,用来载入,显示、输出数据,保存图片,创建窗口等等。4、video.VideoAnalysis视频处理分析图像视频分析模块,包括运动分析和物体跟踪。5、MachineLearningOpencv当中还包括机器学习的模块,有统计学习模型,随机森林等等许多机器等各种算法模块组成的。6、Contributed/ExperimentalStuff这是个实验模块是在图像处理中比较前沿。但是功能上有差别,功能比较落后。可以实现立体视觉、人脸识别等图像处理功能。2.2OpenCV-Python基本图像处理操作Opencv为python提供了使用的接口。Opencv在一些系统上可得到有效应用,比如在Windows操作系统,Linux操作系统等。Opencv在计算机视觉图像处理中广泛的使用。要做图像各种处理,那就首先配置python环境搭配工作。环境搭配先要等python的网站,下载下来。使用3.6版本的python下载。因为3.6版本的python实用性,可拓展性比较强。Opencv一般在WindowsCMD模式下可以安装运行。2.2.1imread载入图像我们在读入图像第一个做的工作是插入opencv包,importcv2。再调试函数cv2对采用的NumPy数组进行图像处理操作。然后再使用函数img=cv2.imread来实现读入图像操作。Python载入图片过程中不需要声明变量。img=cv2.imread("d:\\tupian\\5.jpg")在这个文件夹中读取的图片格式用jpg,png,等来表示。这其中有两个参数,第一个参数表示该程序的基本工作流程,2后面的参数表示怎么获取图像。img=Image.open('d:\\tupian\\5.jpg'再使用open打开图片。2.2.2imshow显示图像cv2.imshow("Image",image)使用imshow来显示指定图像,Image为表示窗口标题,image所显示的图片。我们还可以创建窗口来显示图片dWindow("Img"),用namedWindow函数来表示。而这个窗口的功能是可以调节图像尺寸的比例。可以建立一个或多个窗户。后面加这个函数cv2.waitKey(0),其作用是在执行代码过程中响应窗口。cv2.waitKey()函数为等待用户按键操作,若用户没有按,那就接着循环。也有更新图像的功能。最后使用函数cv2.destroyAllWindows()来释放窗口。2.2.3保存图像保存图片比较简洁,只需要cv2.imwrite函数即可。代码为cv2.imwrite("d:\\tupian\\5.jpg",img)来保存一个图像。包括两个参数,前面参数表示文件名或文件的具体地址,第二个参数表示保存的图像。还可以用第三个参数表示图片的。2.3Tessract介绍Tessrac本身代码是由C语言和C++语言混合编写而成的。Tesseract的OCR引擎一开始由20世纪80年代期间HP实验室开发出的。后面十年之后被成为OCR业里最准确的识别引擎之一。后面HP放弃了与OCR业的合作,从此被Tesseract覆盖了。到了21世纪Tesseract由美国内某一个信息研究所得知,并且让Google对它进行改造优化等工作。目前Tesseract比较前进状态的开源项目,它还发布了GoogleProject,并且与Leptonica图片处理库互相结合,可以识别出各种格式的图像并且将它们转化很多种语言的文本,它还不断操作当前自己的库,有效加强了图像文本转换的能力。如果后面还需要的话,还可以把它做成模板,便于开发令自己满意的并且达到自己需求的OCR引擎。第三章识别预处理相关理论3.1OpenCV-Python进行图像预处理图像预处理是有效提高运算效率,改善图像的设别效果与图像视感质量,删除无关的数据量。减少无关信息(减少图像中的噪声),恢复有用信息以及提高可检测性与化简数据,从而改变图像分割,匹配与图像亮度,颜色空间。用增强,平滑,滤波,还有转换,二值化等方式除去噪点,将原来的图像变化成计算机特征提取的形式。图像预处理包含图像灰度化处理,图像二值化处理,图像过滤处理,以及除去噪点,霍夫变换等。3.1.1OpenCV-Python图像灰度处理灰度处理简单的说就是带颜色图像转换为黑白图像的过程。平时彩色的图像彩金大量颜色信息,若不及时进行处理,那么有可能影响到图像设别的效率。Opencv中灰度处理可以直接使用CV::Cvtcolor来实现。灰度代码为:gray=cv2.cvtColor(img,cv2.COLOR_RGB2GRAY)。彩色图像Red,Green,Blue三个颜色表示的矩阵,其中每个像素点由三个分量共同决定的,三个分量同时决定图像的深度,分量的取值范围为0-255种。0表示黑色,而255表示白色。图像灰度和色彩图像都能反映出图像整体和局部的亮度等级分布与形态特征。图像灰度处理指的是图像的亮度信息,而不是彩色的信息的显示图像。它一般有黑和白两个颜色组成的,但点与点之间的颜色程度有差别,这就是图像深度。灰度变换也可以叫作图像的点运算。图像处理中最简洁的方法。变换公式以下:S=T(r)这里面,T是灰度的变换函数,r表示的是变换之前的图像灰度,S表示的是变换后的图像像素。图像灰度的主要作用有改善图像的像素质量,能够更清楚地显示图像各种特征,提高图像的亮度(对比度)。选出图像当中的有用的像素特征。还可以改善图片的分布图,使得像素分布的更加均匀,直观。灰度变换函数一般分为三个,线性函数,幂律函数以及对数函数等。输入的灰度值与输出的灰度值之间的联系由灰度变换来表示。灰度函数的各种性质确定图像灰度变换能达到的最佳效果。下图为灰度变换函数的曲线图,根据下面的各种曲线形状,可知图像灰度变换能所得到的效果。幂律函数更清楚地表示下图灰度级扩展或者压缩的效果。图3.1灰度级扩展或缩图灰度线性变换公式s=x·r+y当中r表示变换之前的灰度,s表示变换之后的灰度。X表示直线的斜率,而y表示直线与坐标轴y的截距。公式当中1.如果x>1,会增加图像灰度的对比值。2.如果x<1,会减少图像灰度对比值。3.x=1,y不等于0,那么整个图像的灰度值上升或下降,图像像素变亮或者变暗。但是图像对比度不会发生变化。4.x<0,y=0,那么图像最亮的地方变暗,要么最暗的地方变亮。5.x=1,y=0,图像像素不会发生变化。6.x=-1,y=255那么图像发生反。对数变换公式:s=clog(1+r),其中,c是一个常数,假设r等于0,根据对数函数的曲线明显看出灰度值的范围发生改变。对数函数去曲线与反对数函数的曲线都是对称的,在运用到图像变换时候结果就相反了,压缩与扩展灰度值区间是反对数函数的作用。通过对数函数进行图像变换时,通过图像灰度值的变化,得出的图像也发生变化,变换后的图像变得更明亮,还能够压缩像素的动态范围。幂律变换幂律变换的公式是s=crv公式当中c和v表示常数。当v>1时,窄灰度值变范围为宽灰度值。而当v<1时,v的值变得越小,灰度值相当明显,宽灰度值映射变为窄图3.2灰度值函数曲线图3.3RGB三种颜色空间表示图下面显示原图和灰度图对比结果:图3.4原图与灰度图3.1.2OpenCV-Python二值化处理图像二值化是指图像由黑和白两个颜色组成的,图像上的像素点灰度值为0和255.电力设备名牌中图像背景区域淡化,存在一些外界噪声,此时需要对图像宽度进行变换。从而达到图像的字符与图像背景独立开来,还能够减少计算量,达到明显的黑白效果。进行二值化处理后图像特征很明显,数据量也变少。二值化一般分为两种,一种是全局二值化,另一种是局部适应二值化等。图像二值化用函数cv2.threshold(image,140,255,0,img)中第一个参数image表示—源图片,第二个参数表示—阈值(取值范围0-255),第三个参数表示—填充色(取值范围0-255),第四个参数img表示阈值类型。显示图片效果:原图1和二值化图片2图3.5原图与二值化结果3.2灰度图像滤波去噪

噪声是在图像上常见的视觉效果的像素点。噪声一般会扰乱图片信息,使得图片变得模糊。由于噪声影响图片质量,对图像造成一些干扰,使图像亮与暗点不清楚,影响后续图像特征提取,图像识别等工作的正常运行。噪声的来源更多种,1.图像获取中产生的噪声。如外界因素的干扰,获取的图像会收到一些光照强度变化,天气环境原因,遮挡等一些因素引起。2.图像信号传输过程中产生的噪声。还有我们采集到的电力设备名牌图像也因为外界因素弱光噪点等,设备出现干扰,也有因为本身原因造成的图像噪声。为了减少电力设备名牌图像的噪声信息对后续处理的干扰,使用简单且频率高的图像处理方法,对图像进行改造,得到清晰的图像。因此,需要消除图像噪声,提高图像识别率。为了减少不必要图像噪声,需要对图像进行去噪处理。去噪的方法挺多的,图像平滑处理,也可称模糊处理,平率相当高的图像噪点处理方法,还有低通滤波,可以达到使得图像噪点减少,边界模糊效果。一般常用的滤波方法有统计排序滤波、自适应维纳滤波器,中值滤波、均值滤波,形态学滤波等。线性滤波与非线性滤波构成空瓶滤波,这里的线性滤波对图像中的傅立叶变换进行操作,而非线性变换基于领域。一般来说,图像的噪声具有随机性,服从正态分布,对图像进行去噪滤波处理的同时,并且能够更多的保存原来图像的灰度总体分布特征。在图像预处理中一种常用的去噪滤波方法。高斯滤波能够很好地消除高斯噪声的同时不会对图像边缘造成明显的模糊,因此这次采用的高斯滤波方法作为图像预处理阶段的去噪方法。 高斯滤波可定义为是一种通过函数形状来选择加权值的线性平滑滤波,对于消除高斯噪声有较强的抑制作用。高斯滤波的工作原理是通过一个卷积核扫描图像的每一个像素点,对核内的每个像素进行加权平均灰度值求和与区域内各个像素值来替代模板中心像素点值,因为图像的噪声一般服从高斯分布,其中高斯滤波分布参数决定滤波器宽度,而高斯滤波的过程就是将图像和正态分布进行卷积操作,因此高斯滤波器在图像预处理减少噪声过程中普遍使用。高斯函数的一维和二维表达式如下:GG 其中,a是模糊半径,在二维表达式中a2=b2+c2,在图像处理过程中高斯滤波实现两个功能。第一,离散化窗口卷积操作。二,傅里叶变化的实现。高斯核主要用于离散化窗口卷积操作,高斯核一般用奇数来表示大小。在覆盖区域输出结果。下面用矩阵表示3×3的窗口,如下:1下面是用来表示矩阵5×5的窗口,如下:1下面显示3×3大小的高斯滤波器的对灰度化的铭牌图像进行高斯滤波处理,其实验结果如下图所示:图3.6原图与高斯滤波结果图3.3边缘检测边缘检测在计算机图像处理与计算机视觉技术中最基础的问题。边缘检测简单地说就是用各种算法提取图像中物体与背景之间交际线。边缘检测主要功能是删除一些不必要的信息,保存了图像结构属性。在计算机存储和处理图像的单位为基于像素信息。,这个像素信息也跟原来的信息没区别。如果我们直接对像素信息进行处理,那么给计算机带来运算量大,运算困难等麻烦。但是我们可以在像素中直接取得对计算机有用的信息。为了达到让计算机清楚地“认识”电力设备铭牌图像,做好特征匹配以及有效处理图像。计算机视觉领域中一个普遍研究问题是计算机视觉技术的研究特征。,在1960年的时候人们就提出要让图像光谱信息作为图像的特征进行处理,但当时提出的特征信息受到一些限制。在图像处理中特征提取方法相对比较简单,所能够有限的表达图像的信息。不过随着图像技术的发展最近科学家们对计算机视觉特征的研究越来越深入,同时计算机硬件不断更新,其中运算能力不断加强,一些原理变得复杂、不断的提出了一些有效的表达信息更丰富的视觉特征方法,图像边缘检测最重要的目标是提取图像中有用的特征信息与感兴趣的图像区域,放弃不重要的图像信息,并保存图像的原有的属性。边缘检测是计算机视觉和图像处理中的常用提取图像视觉特征的方法,我们根据对图像边缘的定义,边缘检测的原理可以分成为求梯度值的局部最大值和方向:f公式当中,∂f∂r表示的是图像沿r处的梯度,图像梯度方向一般用θ来表示,而图像的梯度幅值在横坐标与纵坐标上的分量值一般用fx和fy表示。当公式当中满足∂f∂r∇在公式当中,计算梯度幅值一般常用绝对值之和来替换原本平方根。边缘检测的二阶导数的梯度幅值计算公式如下:∇3.4Canny边缘算子Canny算子在20世纪80年代被CannyJohn提出的,canny算法是比较先进的算法。Canny算子是一种梯度型边缘检测算子,它由图像降噪,计算图像梯度,非极大值抑制,阈值筛选等四个步骤组成的,由于Canny算子能够有效地抑制噪声干扰,减少噪声敏感度,同时梯度上检测表现十分优秀,也是目前研究最多的一种边缘检测算子。Canny算子的实现步骤如下:图像去噪:采用二维高斯滤波器对原始图像作高斯滤波;求一阶导数梯度值:根据求一阶导数公式Gu,v=G非极大值抑制:运用非极大值抑制算法,将像素为局部非极大值的幅值设为0,极大值则保持不变;双阈值处理:设定两个阈值X1和X2,并且X1<X2,遍历图像中的每个梯度幅值与V1和V2做比较:假设当前遍历梯度幅值为G弱边缘处理:对步骤4)检测的弱边缘做进一步判断,若弱边缘像素点周围的八邻域中出现强像素点,则转化为强像素点并设置幅值为1;若周围无强像素点,则设置为0。在上述的Canny算子实现步骤中,非极大值抑制是实现的关键步骤,其作用是在于“瘦边”。计算图像梯度信息之后,直接根据梯度值来提取图像边缘效果依然模糊,Canny算子中采用非极大值抑制方法则可以有效地抑制局部最大值之外的梯度信息。从以上对Canny算子的实现步骤以及关键思想分析中不难看出,Canny算子在实现上主要遵循一下三个原则:精确的边缘检测标准。在保证重要边缘信息不丢失前提下,尽量抑制“假”边缘的产生;保证准确判断边缘检测位置。保证所判断提取的边缘与实际图像中边缘定位偏移量最低;单边缘相应原则。为了抑制检测过程中出现双边缘线效应,Canny算子将若干各相邻响应降低为单边缘响应。下面电力名牌设备图片的左边是原图,右边是canny图效果:图3.7Canny边缘效果图3.5霍夫变换霍夫变换是一个用来检验图片形状的比较先进的技术,若要用数字的形式展现一个图像的形状,即是它是不完美的或者有漏洞的,照样也会检测出来的。那就我来介绍下通过直线表达的形式。若用一次函数y=ax+b表示直线或者数学坐标系的形式表达p=xcosθ+ysinθ,其中p是从原点到直线的垂直距离,θ是垂直线和水平坐标轴的夹角。任何直线都可以表示成(ρ,θ).首先它创建一个2D数组或者是收集器(拿着两个参数)初始化是0。用行来代表ρ列代表θ.数组的大小由你需要的准确率来决定。假设你想要角度的准确率是1度,你需要180列。对于ρ,最大的可能距离是图的对角线的距离。所以对于一个像素的精确度来说,行数就是图像对角线的长度。

图3.8灰度图结果第四章铭牌识别4.1文字识别的最基本过程电力设别名牌自动识别过程一般包含图像预处理,文字识别,还有一些最后的处理。图像的预处理过程可以表示为:文字识别流程图这里的文字识别主要由以上三个部分构成。图像处理过程中文字识别部分非常重要,其次是预处理也很重要。第四章主要对图像预处理和文字识别做进一步的研究。电力设备名牌一般因为一些自然因素的影响或者其他外部因素引起(环境光照等)

,得到的图像不清楚(图像模糊),质量方面存在问题。为了更好的解决这一些列问题我们对图像进行灰度化,二值化,边框检测,去框,高斯去噪点等一系列处理工作。其主要的目的就是减少这些外部环境引起的干扰和噪声,使获取的图像质量得到改善,图像变得更清楚,分割文字识别的图像,以方便图像特征提取。然后人和机器更容易识别图像。电力设备名牌的文字识别指的是,在制定的模板库中找出待识别文字相似度较高的字符的过程。4.1.1图像灰度化过程灰度化是指将彩色的图像(像素由红色,绿色,蓝色)三个部分组成的图像转化为无颜色的图像。像素每个颜色分量值为255,且每个像素点可以一千多万中变化的范围,在灰度图像显示的像素点三个颜色可以取同样的值,像素点灰度值越来越高,图像就越来越明显,亮度也大,反之则显示的图像越暗。通过图像灰度变化可以看出整个图像的色度和亮度分布与特点。一般原图像转化为灰度图的过程中图像的计算量也变得更简单。在图像的灰度处理中先把像素点的平均值求出来,然后把平均值分配给三个分量。4.1.2图像二值化处理对图像进行灰度处理时,可知每个图像像素点有一个值,那就叫作灰度值。灰度值一般会决定得到图像的亮度。灰度值越大图像越亮,灰度值越小,图像越暗。在进行文字识别图像之前,首先把待识别的文字与它的背景进行图像分割,然后对图像灰度化需要进行二值化处理。这样方便减少了图像数据存储的容量大小。图像二值化处理一般分为三种,(整体阈值选择法)整体阈值二值化处理,局部二值化处理,动态阈值二值化处理等。整体阈值选择法的功能是保存图像的有用信息,并且较少外部环境因素带来的干扰。4.1.3图像边框检测电力设备名牌的图像中为了做好图像特征和文字识别的方便,为了提高效率和释放空间,将电力设备名牌图像由灰度化转换为二值化图像。先定位电力设备名牌准确位置,所以定位之后的电力名牌图像有边框,这样影响电力设备后续的图像分割和图像识别的功能。所以电力设备名牌进行图像分割之前必要进行图像边框检测并且去边框。需要处理图像分割前需边框带来的干扰。4.1.4图像去噪点处理噪点可以定义为平时影响人们接受外界信息时候的妨碍点。如果对一个图像亮度可以用函数f(x,y)表示,那么在这过程中起到影响作用的函数用R(x,y)表示。这一系列过程可以称为图像噪声。噪声一般分为四种由加性噪声,乘性噪声,量化噪声以及椒盐噪声等等。噪声模型也一般分为几种。去噪点技术就是减少这些噪声的干扰。图像去噪技术是图像处理过程中一个最重要的部分。噪声一般会影响图像的载入,采集和处理工作。去噪效果的程度也会影响后面的图像分割,还有边缘检测等工作。图像去噪处理中高斯噪声是最有效的方法之一。通过高斯去噪达到满意的效果。 图4.1原图与灰度化图4.2二值化与边框检测图4.3去边框与去噪点4.2图像文字识别处理图像文字识别处理功能是由tesseract-orc软件实现的。Tesseract软件其实就是ORC的一个库。一直由酷

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论