(测试计量技术及仪器专业论文)电子电度表读数图像识别系统的研究.pdf_第1页
(测试计量技术及仪器专业论文)电子电度表读数图像识别系统的研究.pdf_第2页
(测试计量技术及仪器专业论文)电子电度表读数图像识别系统的研究.pdf_第3页
(测试计量技术及仪器专业论文)电子电度表读数图像识别系统的研究.pdf_第4页
(测试计量技术及仪器专业论文)电子电度表读数图像识别系统的研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 视觉是人类最重要的感知手段,而图像是视觉的基础。随着图像信 息在各领域的广泛应用,数字图像处理技术已成为科学技术各领域中必 不可少的手段。数字图像处理的目的在于通过对图像的处理和分析,从 中提取出感兴趣的信息。 本课题对电子电度表读数的识别进行了研究,它应用图像处理与模 式识别技术来识别电度表所显示的读数,以达到自动校验电度表准确性 的目的。本系统利用摄像头摄取待测电度表的读数图像,通过视频图像 采集卡送入计算机。计算机根据读数图像的灰度特征,从电度表图像中 分割出读数区域,并且对读数区域的灰度图像进行二值化、滤波去噪等 处理。然后主要通过读数区域图像的投影图将字符和刻度从处理过的读 数区域分割出来。并且由刻度与指针的位置关系计算出刻度的值。最后, 采用模式匹配的方法将分割出的字符图像识别出来。 本文提取读数区域图像采用了基于图像灰度平均值的分割方法,并 提出了一种根据长刻度与刻度指针的位置关系识别刻度值的方法。而且 详细讨论了模式匹配的方法在数字字符识别中的应用。 为了改善字符识别的结果,本文还讨论了h o p f i e l d 神经网络在图像 识别中的应用,并提出了改进的字符图像识别算法。 关键词:数字图像处理,字符识别,h o p f i e l d 神经网络,电度表 a b s t r a c t v i s i o ni st h em o s ti m p o r t a n tm e a n s f o rm a n k i n dt of i n do u tt h ew o r l d ,a n d i m a g e i st h ef o u n d a t i o no f v i s i o n a l o n gw i t ht h ea p p l i c a t i o no fi m a g e i nm a n y f i e l d s ,d i g i t a li m a g ep r o c e s s h a sb e c o m eaa b s o l u t e l yn e c e s s a r yt o o l si ns c i e n c e a n dt e c h n o l o g yr e s e a r c h d i g i t a lp r o c e s sd i s t i l l st h eu s e f u li n f o r m a t i o nb y p r o c e s s i n ga n da n a l y z i n g t h ed i g i t a li m a g e t h ep a p e rr e s e a r c h e st h er e c o g n i t i o nt e c h n o l o g yo fe i e c t r o n i c a lp o w e r m e t e rr e a d i n g ,w h i c hr e c o g n i s e st h ep o w e rm e t e rr e a d i n gb ym a k i n gu s eo f i m a g ep r o c e s sa n dp a t t e r nr e c o g n i t i o nt oa u t o m a t i c a l l yc h e c k o u tt h ev e r a c i t y o fm e t e r c a m e r ai su s e dt oc a p t u r et h en e e d c h e c k e dm e t e rr e a d i n gi m a g e s , a n dt h ei m a g e sa r et r a n s m i t t e dt oi t sh o s tc o m p u t e r b y t h e i m a g e c a p t u r i n gc a r d t h eh o s tc o m p u t e re x t r a c t sr e a d i n gi m a g e sf r o mt h eo r i g i n a lm e t e ri m a g e sb y a n a l y z i n gt h ei m a g e sg r a y - s c a l ec h a r a c t e la n dt h r e s h o l d st h e s eg r a y s c a l e i m a g e si n t o t w oc l a s s e sa n df i l t e r st h e mt ow i s eo u tn o i s e s t h e n ,e a c h c h a r a c t e ri m a g ea n dt h eg r a d u a t i o ni m a g ea r ee x t r a c t e df r o mt h ep r o c e s s e d r e a d i n gi m a g e sm a i n l yb ya n a l y z i n gp r o j e c t i o no ft h er e a d i n gi m a g e s n e x t , g r a d u a t i o n sv a l u e i sc a l c u l a t e do u tt h r o u g ht h el o c a t i o nr e l a t i o nb e t w e e n g r a d u a t i o n a n dp o i n t e r f i n a l l y , t h ee x t r a c t e dc h a r a c t e r i m a g e sa r er e c o g n i z e d t h r o u g hp a t t e r n m a t c h t h i sp a p e ru s e sas e g m e n t a t i o nm e t h o db a s e do ni m a g e sa v e r a g eg r a y s c a l et oe x t r a c tt h er e a d i n gi m a g e s ,a n dp r e s e n t san e wm e t h o dt oc a l c u l a t e g r a d u a t i o n sv a l u eb yl o c a t i o nr e l m i o nb e t w e e nt h el o n gg r a d u a t i o na n dt h e p o i n t e r a n dt h ea p p l i c a t i o no f p a t t e r nm a t c h o nn u m b e rc h a r a c t e rr e c o g n i t i o n i sd i s c u s s e di nd e t a i l i no r d e rt o g e t b e t t e rr e s u l ti nc h a r a c t e r r e c o g n i t i o n ,t h i sp a p e ra l s o i n t r o d u c e st h ea p p l i c a t i o no fh o p f i e l dn e u r a ln e t w o r ko ni m a g er e c o g n i t i o n 6 a n d p r e s e n t si m p r o v e dr e c o g n i t i o n a r i t h m e t i ct oc h a r a c t e ri m a g e s k e yw o r d s :d i g i t a li m a g ep r o c e s s i n g ,c h a r a c t e rr e c o g n i t i o n , h o p f i e l d n e u r a ln e t w o r k ,p o w e rm e t e r 7 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究 工作。除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已发表或撰写过的研究成果。参与同一工作的其他 同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示t n 意。 签名:日期 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文的规定,即:学校 有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可以公 布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 签名: 日期: 导师签名: 上海大学研究生论文 第一章前言 1 1 课题简介 数字图像处理的发展历史不长,但已引起各方面人士的广泛关注。 视觉是人类最重要的感知手段,而图像是视觉的基础。因此数字图像成 为心理学、生理学、计算机科学等诸多方面的视觉感知研究的有效工具, 在军事、气象、工业控制等应用中有广泛的需求。 广义数字图像处理包含图像处理和图像分析两个部分。图像处理是 指将一幅图像变换为另一幅经过修改的图像,是一个由图像到图像的过 程。图像分析则是指将一幅图像转化为一种非图像表示,如一个测量数 据集或一个决策等,通过分析获得图像中感兴趣的信息。 模式识别是和数字图像处理密切相关的学科,对图像的识别以图像 处理为基础,也是图像处理的一个重要应用领域。计算机模式识别系统, 就是使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理 解周围环境的能力。模式识别理论在图像识别、语音识别及信号处理和 自动控制领域均有重要的应用。 本课题就是应用图像处理与模式识别技术来识别电度表所显示的读 数,以达到自动校验电度表是否准确的目的。 在电度表厂对出厂的电子电度表进行校验时,通常给被测电度表输 入一电脉冲,在理想情况下,该电度表会显示一个与输入电脉冲对应的 标准电能值。若被校电度表有误差,则显示出的电能值与与输入电脉冲 就会有不同的读数。计算此差值,就可得到被校电度表的误差值,判断 被校电度表是否合格。以往该项工作是由人工完成的,现在采用计算机 视觉技术来实现电度表数值的自动识别与比较。 该系统能自动完成被校电度表的读数采集、识别、误差计算、打印 报表并给出结果,克服了以往电度表校验中由人工读表而引起的读数不 准确、速度慢而且不利于自动化管理的缺点。 第1 页共5 9 页 上海大学研究生论文 由于电度表数值显示的特点,如具有刻度、显示的数字图像不完整 等,本系统所使用的数字图像处理与识别算法也适用于许多类似的工业 仪表的自动识别,具有比较广泛的适用性。 1 2 电子电度表读数图像识别系统的组成 电子电度表读数图像识别系统要求对2 4 台电子电度表依次进行图像 采集、识别和误差计算。本系统包括:安放2 4 台待测电子电度表的校 验台,摄像头,步进电机,电表读数装置( p c 机) ,校验台与p c 机之 间的输出接口等。 工作过程中,由校验台发命令给电表读数装置,由电表读数装置通 过步进电机控制摄像头,依次对2 4 台待测电度表采集读数图像,然后 进行处理、识别,最终由电表读数装置将处理识别后的读数值发给校验 台。其中要识别的读数图像如下所示。 图1 1 要识别的读数图像 1 3 课题的任务 本课题的主要任务就是开发出一个能够对电度表读数实时、准确地 进行采集、识别,从而检测电度表读数准确率的系统。本人主要完成的 工作是: 1 了解国内外对电度表读数检测的研究与现状,为开发工作做准 备。 2 对电度表读数识别系统的结构进行总体设计,主要是对其中硬件 电路的设计。在对电度表检测时,要求摄像头逐个采集校验台上 第2 页共5 9 页 上海大学研究生论文 的2 4 台电度表的读数;并在采集过程中出现中断或者采集完成 后,摄像头返回初始位置等待。设计了采用p c 一6 4 0 8 光隔离开关 量输入输出接口卡的步进电机驱动电路,编制了相应的驱动程 序。 3 设计读数图像的识别软件,这是本课题的核心任务。要求研究出 一种准确、实时性好的电度表的自动识别算法,即对采集到的电 度表读数的数字图像进行预处理,提取出电度表上读数的字符和 刻度图像,并对这些字符图像进行识别处理,对刻度进行测量, 最终识别出电度表的读数。 4 编制了校验台和电表读数装置之间的通讯规程,编写了通讯软 件。 1 4 实验条件 硬件条件 c p u 主频9 3 3 m h z p c i 1 4 0 8 图像采集卡 a k i t aa k 一2 0 2 dc c d 摄像头 p c 一6 4 0 8 光隔离开关量输入输出接口卡 步进电机及传动机构 电度表校验台 软件条件 w i n d o w s9 8 2 0 0 0 操作系统 l a b v i e w6 i 及v i s i o n 5 0 v i s u a lc + + 6 o 拍摄条件 摄像头距离电度表约2 0 c m 1 5 前人做的工作 在数字图像处理这一领域的研究已经有多年的历史,许多相关理论 均已经成熟,各种算法和技术也十分丰富,这是本课题研究内容的坚实 第3 页共5 9 页 上海大学研究生论文 基础。 利用机器来识别字符,可以说从1 9 2 9 年陶舍克利用光学模板匹配 识别开始。当时,他使用1 0 块模板对应l o 个数字,依次把待识别的数 字投影到这些模板上,当模板透过的光达到最小时( 数字遮挡模板的透 光部分) ,数字就被识别成这块模板上的数字。电子计算机于1 9 4 6 年问 世,而在5 0 年代末6 0 年代初就已经出现关于利用计算机识别数字及英 文字母的研究论文。现在,光学字符识别( o c r ) 已成为许多科学家、 工程师等非常感兴趣的课题,通过人们的深入研究,提出了基于各种理 论的字符识别方法,o c r 已经能够从纸张、书本和其他有字符的物品上 获取信息,并将数据送入计算机,这种性能大大地扩展了计算机的应用 领域。 字符识别的发展可分为三个阶段。第一阶段为初级阶段。在这一阶 段中,技术上是应用对一维图像的处理方法完成识别二维图像的任务。 这样产生一个基本思想抽取特征向量的构造和它的相关函数。第二 阶段为基础研究阶段,提出表示边界的链码法,用于结构分析的细化思 想以及一些离散图形上拓朴性的研究,形成不仅能抽取局部特征而且能 够抽取大范围的凹凸区域、连通性、孔等特征的算法,完成了作为基础 理论的“特征抽取理论”。第三阶段为发展阶段,这一阶段的研究工作 是技术与实际工作相结合。特别是到了8 0 年代后,随着个人计算机的 出现以及c c d 平板扫描仪的商品化,文字识别的技术和应用得到了蓬 勃发展,在手写字符识别、机动车辆车牌识别、集装箱字符识别等领域 有了比较成功的应用。 我国是从此7 0 年代开始字符识别研究工作的。1 9 7 8 年,中国科学 院自动化研究所研制出“信函自动分拣机”,可以识别0 - 9 的数字。1 9 8 7 年,清华大学研制的印刷体汉字识别系统可识别二级汉字库的6 0 0 0 多 个汉字,识别率可达9 9 。9 0 年代以后的汉字研究工作主要集中在手写 汉字的识别以及一些新的识别算法上。 但应用于电度表这一特定方面的例子并不多,缺乏国内外比较成功 第4 页共5 9 页 上海大学研究生论文 的先例。与字符识别在其他领域的应用相比,电度表读数识别要求识别 刻度值和非完整的两个相连字符,而这方面的研究并不多。 第5 页共5 9 页 上海大学研究生论文 第二章电子电度表图像识别系统总体设计 电子电度表图像识别系统是计算机视觉技术在电度表生产管理中的 应用,它综合运用了数字图像处理技术、图像分析技术、模式识别技术 等,要求实时准确的对2 4 台待测电度表读数的图像进行采集、处理、 识别并校验。整个系统由安放待测电子电度表的校验台,摄像头,步进 电机,电表读数装置( p c 机) ,校验台与p c 机之间的通讯部件等部分 组成。工作过程中,摄像头要在步进电机的驱动下逐个到达电度表读数 的位置,并读取电度表的读数图像,电表读数装置完成读数的识别、处 理,并将结果返回电度表校验台,在完成对所有待测电度表的图像处理 后,步进电机带动摄像头返回到初始位置,等待检测下一批电度表。 2 1 系统总体框图。 图2 1 系统总体框图 本系统中电表读数装置一p c 机发挥着核心的作用,机上安装的图像 采集卡将摄像头摄取的实时图像转换成指定的数据格式,然后由开发的 图像识别软件对所采集到的图像进行预处理、识别处理,并将结果返回 电度表校验台。 2 2 软件要完成的工作 上海大学研究生论文 本课题主要是要求研究出一种准确、实时性好的电度表的自动识别 算法,即对采集到的电度表的数字图像进行预处理,提取出电度表上的 字符串、刻度,并对这些字符串图像进行识别处理,对刻度进行测量, 最终识别出电度表的读数。 整个电度表识别过程大致分为三个阶段。 第一阶段为物体分离阶段,即在整幅图像中提取出电度表读数所在 区域的予图像,并进一步从该予图像中将字符和刻度分离出来。在实际 应用中,本系统是在工厂生产线上运行的,电度表与摄像头的相对距离、 高度可以预定,即电度表读数所在区域在整幅图像中的位置是可以预先 确定的。从而可以用一个预定大小、位置的矩形框将读数所在区域提取 出来。在读数区中,再根据字符和刻度所在背景灰度值的变化将字符与 刻度分割出来。 第二阶段为刻度测量阶段,就是要识别出当前刻度指针所指向的刻 度值。电度表的刻度包括短刻度和长刻度,其中长刻度又分别表示o 和“5 ”。在测量时,首先要在分割出的刻度图像中确定长刻度与刻度指 针中心的位置,并且要先判断出所选取的长刻度是表示“0 ”或“5 ”。 然后测量长刻度与刻度指针的相对距离,计算出刻度值。确定长刻度与 刻度中心的位置是通过分析二值化后的刻度图像的灰度值变化完成的。 第三阶段为字符识别阶段。电度表中的字符识别技术属于模式识别 中的文字识别,字符的模式识别过程又可以细分为字符图像预处理、特 征提取和识别字符。文字识别是比较成熟的技术,能够获得满意的识别 结果,但是在实际应用中,由于受摄像机分辩率、光照条件以及电度表 盘面对下陷的字符图像边缘的遮挡影响,会使字符损失一些特征,从而 增加识别的困难程度。因此,电度表读数区域图像的预处理以及图像二 值化是一个非常重要的问题。如果处理不当,会给字符分割、字符识别 造成困难,甚至得到错误的识别结果。另外,识别字符是根据字符的特 征值将字符识别出来。经典的方法是采用聚类分析来判别。这种方法首 先要对每种字符的特征值进行分析,根据特征值来选取一个合适的判别 第7 页共5 9 页 上海大学研究生论文 函数。这样,需要花很多精力在特征值分析和建立判别函数的过程中。 而采用模板匹配来识别字符则不用特征值分析和建立判别函数,我们只 需要将分割出的单个字符在预先制作好的模板上搜索,从被搜索图中找 到匹配值最大的字符图像,从而识别出字符。这里有一个很关键的问题, 由于字符是滚动显示的,所以显示的并不总是完整的单个字符,会出现 包含两个相连字符的上下两部分的图像。这两个字符都不完整,而且它 们显示出的部分大小也不能确定,所以难以对它们进行特征分析,采用 模板匹配则避免了特征分析的过程。对非单个完整字符的文字图像的识 别要采用与识别单个字符不同的模板。 一百订再6 而一 上海大学研究生论文 第三章图像处理与识别 从原始图像可以提取出许多特征,常用的图像特征一般有图像的灰 度、边缘( 描述灰度变化程度和位置) 、纹理特征( 反映灰度变化的规 律) 以及图像的形状特征等。利用图像的特征可以从原始图像分离出电 度表读数区域以及对该区域中的数字字符与刻度进行分割,并最终对分 割出的单个数字图像进行识别。 本章将阐述读取原始图像数据的方法、对图像数据分析以分离电度 表读数区域的方法、电度表图像的预处理方法、电度表字符与刻度分割 的方法以及它们的识别方法。 3 1 获取b m p 文件中的数据 视频图像采集卡读入的图像数据是以b m p 文件格式存储的,在对 图像处理之前,首先要把图像文件中的数据转换成2 5 6 级灰度的图像数 组数据。这里的图像数组的大小是根据图像的宽度和高度建立的,而数 组中的数据是由图像中对应像素点的灰度值决定的。 首先要说明一下b m p 图像文件的格式。 b m p 图像文件的文件结构如图所示,可分为三部分,即表头、调色 板和图像数据。表头的长度固定为5 4 个字节。只有全彩色的b m p 图像 文件没有调色板,其余不超过2 5 6 种颜色的图像文件都必须设定调色板 信息。 w i n d o w s 把b m p 图像文件的表头细分为两个数据结构,第一组命 名为b i t m a p f i l e h e a d e r ,第二组为b i t m a p i n f o m e a d e r ;如果 有调色板数据时,则存放在表头后面。 w i n d o w s h 中所定义的b i t m a p f i l e 玎! a d e r 数据结构如下: t y p e d e f s t r u c t t a g b i t m a p f i l e h e a d e r u i n t b f t y p e ; 第9 页共5 9 页 上海大学研究生论文 d w o r db f s i z e ; u r n tb f r e s e r v e d l ; u i n tb f r e s e r v e d 2 ; d w o r db f o f f b i t s ; ) b i t m a p f i l e h e a d e r ; b f t y p e :图像文件的形态,内容固定为“b m ”,作为文件辨辨别之 用,表示这个文件是b m p 图像文件。 , b f s i z e :图像文件的大小。 b f r e s e r v e d l b f r e s e r v e d 2 :保留未用,此域应设定为0 。 b f o f f b i t s :图像数据偏移量,表示从文件的起始位置到图像数据开 始之间的距离。 w i d o w s h 中所定义的b i t m a p i n f o h e a d e r 数据结构如下: t y p e d e f s t r u c t t a g b i t m a p i n f o h e a d e r d w o r db i s i z e ; l o n g b i w i d t h ; l o n g b i h e i g h t ; w o r d b i p l a n e s ; w o r d b i b i t c o u n t ; d w o r d b i c o m p r e s s i o n ; d w o r d b i s i z e l m a g e ; l o n g b i x p e l s p e r m e t e r ; l o n g b i y p e l s p e r m e t e r ; d w o r d b i c i r u s e d ; d w o r d b i c m m p o r t a n t ; b i t m a p i n f o h e a d e r ; b i s i z e :表示数据结构的大小,固定为4 0 。 b i w i d t h :以像素点为单位指定图像的宽度。 第1 0 贞共5 9 页 上海大学研究生论文 b i h e i g h t :以像素扫描行为单位指定图像的高度a b i p l a n e s :目标设备的色彩平面数,必须置为l 。 b i b i t c o u n t :指定一个压缩位图的压缩类型,如未被压缩,则取值 为0 。 b i c i r u s e d :指定位图裤子实际使用的颜色表的颜色数。 调色板数据是由r g b q u a d 数据结构组成,在w i n d o w s h 中定义 如下: t y p e d e f s t r u c t t a g r g b q u a d b y t e r g b b l u e ; b y t e r g b c r r e e n ; b y t e r g b r e d ; b y t e r g b r e s e r v e d ; ) r g b q u a d ; 其中r g b b l u e 、r g b g r e e n 、r g b r e d 分别表示颜色组成中的蓝、绿、红 的强度;r g b r e s e r v e d 是保留值,必须置为0 。 b m p 图像数据的存储顺序是由上往下( 即图像上下颠倒) ,并且图 像的宽度( 以字节为单位) 必须是4 的倍数,如果不到4 的倍数必须补 足。这一点很关键。 图像数组的数据必须是2 5 6 级灰度图像的数据,所以彩色图像首先 要转换成灰度图像。对于真彩色的图像( 2 4 b i t s 像素) ,可以通过对- - z o o 颜色成分加权的方法将个r g b 的彩色图像转换为2 5 6 级灰度图像, 其灰度计算公式为: g r a y = 0 3 0 + r e d + 0 5 9 4 9 r e e n + 0 11 + b l u e 对于8 b i t s 的彩色图像,先将调色板索引表中的每一种颜色的r g b 成分加权转换成灰度值,计算方法如上面的公式所示;然后,各像素点 的灰度值就可以通过查找调色板对应的灰度值而得到。 第1 1 页共5 9 页 上海大学研究生论文 3 2 电度表读数区域的分割 在一幅图像中,通常是由代表物体的图案与背景组成,简称物体与 背景。为了对物体进行特征抽取与识别,首先需要将物体从背景中划分 出来,这种把图像空间按照一定的要求分成一些“有意义”的区域的技 术叫图像分割。它是是图像理解的关键,被广泛应用于文字处理、医学 图像处理、遥感图像处理等领域。 电度表图像被捕获到计算机以后的图像大小约为4 0 0 2 1 6 个像素, 处理这么大的图像不论采用什么算法都是比较费时的,因此不断的减小 感兴趣的区域的面积是必须的。图像分割的常用方法有空间域聚类算 法、分裂合并算法、直方图域算法等。 在本系统中,摄像机的位置与电度表的位置是固定的,所以摄像机 摄取的电度表图像大小不变。而且如图3 1 所示,在电度表图像中,读 数区域是的灰度明显较其它地方暗的区域,根据这一特征,本文采取这 样的一种算法:选取一个固定大小的搜索矩形( 该矩形的大小应比电度 表的读数区域大一定的长度和宽度,例如,电度表读数区域图像大小约 为2 8 0 t 7 5 像素,那么可以设置搜索矩形的大小为3 1 0 9 0 像素) ,以此 搜索矩形在原始的电度表图像中从左到右,从下到上移动。同时,计算 落在此矩形内的图像的平均灰度值,平均灰度值最小的矩形区域即为电 度表的读数所处的大致位置。然后将该位置处的矩形分离出来进行下一 步处理。 图3 1 原始电度表图像 第1 2 页共5 9 页 上海大学研究生论文 图3 2 电度表读数区域图像 第1 3 页共5 9 页 上海大学研究生论文 3 3电度表数值区域的二值化 3 3 1 获取直方图 就数字图像f ( i j ) 来讲,在图像中不同灰度值的像素的数目是不同 的。如果取灰度值大的像素数量多,则整幅图像看上去就比较亮:反之, 则偏暗。 ab 图3 3 灰度直方图 直方图是用于表达图像灰度分布情况的统计图表。其横坐标是灰度 值g ,纵坐标是出现这个灰度值的概率密度p ( g ) ( 对连续图像) ,或者 是出现这个灰度值的概率值p ( g ,) ( 对数字图像) ,如下图所示 直方图反映了取不同灰度值的面积或像素数在整幅图像上所占的比 例,还可以求出一幅图像中所含的信息量:但是直方图排除了取灰度值 为g 的像素在图像中位置方面的任何信息,因此直方图并不回答原图像 中有关目标形状方面的任何问题。 直方图反映了一种空间聚类信息,是一种统计量。这种统计量反映 的是图像全局信息,根据此信息,可以确定图像整体的亮度、对比度, 从而为后面的选择图像二值化时的域值提供一种依据和思路。 3 3 2 数字图像的直方图的求法 对数字图像f ( i j ) ,设图像的灰度级别为m a x g r a y ( 就是我们平常所 说的用多少种颜色来描述一幅灰度图像,比如这个值可以取2 ,4 ,6 4 , 2 5 6 等等) ,图像像素的灰度值为g ,( 滓o ,1 ,2 ,m a x g r a y 一1 ) ,则 第1 4 页共5 9 页 上海大学研究生论文 概率p ( g ,) 为: p ( g 。) = 灰度值为g 。的像素数图像上的总的像素数( 即图像的面积 a ) 其中,a ;n l m a g w i d t h x n i m g h e i g h t 由概率知识,有 m a ( i m y l p ( g ,) = 1 l = 0 统计直方图时,可以对着整幅图像进行,也可以只针对所选择的图 像区域进行。 3 3 3 图像二值化的概述 二值化处理是一种典型的图像分割技术,它根据物体和背景的各区 域内部在灰度特性上具有某种均匀性来判别哪些像素点是属于区域内部 的点和哪些像索点属于背景。如何从多值的数字图像中取出对象物,最 常用的方法就是选定一个闽值t ,通过以下定义产生一个新的闽值化后 的图像f ,其( x ,y ) 位置上的像素点获得的新的灰度值,( x ,y ) 如下 胞炉 :翁嚣昌 此时新的阂值化后的图像称为二值( o ,1 ) 图像,这个过程就是图像的 二值化处理。当阈值选择彳导过高时,有部分物体像素点将会误划分为 背景,使检测出来的物体区域偏小;反之,又会使分割出来的物体区域 偏大。 图像二值化的关键是选取一个合适的域值,能够将目标从背景中分 离出来。一个好的域值不仅可以将目标从背景中分离出来,而且要自动 取出,根据不同的图像来智能地选取,不出现人为的干预,这一直是图 像处理中一个经典而又长盛不衰的课题。域值选取的方法有两大类:全 局门限技术和局部门限技术。前者只考虑用一个门限去二值化整个图 像,后者考虑先将一帧图像划分为若干个子图像,对每个子图像确定相 第1 5 页共5 9 页 上海大学研究生论文 应的门限值。 阈值的选择有许多方法。具体的讲,有如下一些域值选取法:简单 的直方图分析法;直方图凹形分析法;类别方差自动门限法;最佳熵自 动门限法;矩不变自动门法;极小误差自动门限法;基于边缘特性的方 法;基于二阶统计特性的方法;利用两个“累计测量”选门限;松驰迭 代法等。这些方法的具体内容均可在有关文献中查阅到。 在本系统采集到的电度表图像中,由于相对于图像中的背景,电度 表读数区的灰度较浅,且电度表读数区一般要占整幅图像的三分之一左 右,所以可以采用实现简单并且速度最快的平均亮度确定闽值方法。 设图像的高度为h e i g h t ,宽度为w i d t h ,则图像共有h e i g h t * w i d t h 个像素点。 扫描图像,对图像作灰度直方图,即计算图像中从0 到2 5 5 中灰度 值所包含的像素点数c o u n t ( g r a y ) 。 高i = o t o2 5 5 ,计算 s u m g r a y ( i ) 2s u m g r a y ( i 一1 ) + c o t m t ( i ) 当s u m g r a y ( i 一1 ) ( h e i g h t + w i d t h ) 2 时,选择i 为闽值进行二值化。 这种选定闽值的方法速度最快,但由于没有考虑到图像的空间纹理 特征,效果不是很好,只适用于不需要保留纹理特征的情况。不过在本 系统中,在采集图像时,由于电度表上的光照可以控制,所以获得的图 像中要识别的读数与背景的对比明显,采用这种方法就能够得到良好的 二值化图像。 下图即为二值化后的电度表读数区域图像。 图3 4 二值化的电度表读数区域图像 _ _ 。- _ - _ - 。_ _ 。_ _ _ _ _ - 。_ _ _ _ - _ _ - _ _ _ 。_ _ - - 。_ _ - 1 。_ _ _ _ _ _ - _ _ _ _ _ _ - - 第1 6 页共5 9 页 上海大学研究生论文 3 4 图像的增强 3 4 1 图像的灰度增强的概述 图像增强的目的在于使图像的背景和客体分开,改善图像的视觉形 象或使它变换成一种更适合人或机器分析的形式。通常,我们用c c d 获得的图像普遍的弱点是对比度低、物体与背景的灰度差小;在采集、 传输和终端处理等环节中,总要造成图像的某些降质。例如:在摄像时, 光学系统的失真、相对运动、大气流动等都会使图像模糊;在传输过程 中,由于噪声污染,图像质量会有所下降,所以图像增强的过程就是要 将图像中感兴趣的特征有选择的突出,衰减其次要信息,提高图像的可 读性。 图像增强技术通常有两类方法:频率域法和空间域法。频率域法就 是在图像的某种变换中( 通常是频率域中) 对图像的变换值进行某种运 算处理,然后变换回空间域。例如:可以先对图像进行付立叶变换,再 对图像的频谱进行某种修正( 如滤波等) ,最后再将修正后的图像进行 付立叶反变换回空间域中,从而增强该图像。它是一种间接处理方法, 一般在频率域进行图像增强算法复杂,耗时较长,在硬件实现时随着专 用数字信号处理芯片的发展,应用较广,但不适宜软件实现目标识别的 实时性。空间域法主要是在空间域中对图像像素灰度值直接进行运算处 理。例如:将包含某点的一个区域内的各点灰度值进行平均计算,用所 得的平均值来代替该的灰度值,这就是通常所说的平滑处理。空间域法 的图像增强技术可以用下式来描述: g ( x ,y ) = f ( x ,y ) h ( x ,y ) 其中,f ( x ,y ) 是处理前的图像;g ( x ,y ) 表示处理后的图像;h ( x ,y ) 为空 间运算函数。 根据本课题的需要,本文主要研究了中值滤波的噪声平滑技术。 为了抑制噪声,通常选用低通滤波,但由于边缘轮廓信息属于高频 量,这样势必削弱边界信息;反之,为了提升边缘轮廓,需要使用高通 滤波,这又会加强噪声。中值滤波在一定的条件下可以克服线性滤波器 第1 7 页共5 9 页 上海大学研究生论文 如最小均方滤波、均值滤波等带来的图像细节模糊l 一面对滤除脉冲干扰 及图像扫描噪声最为有效。中值滤波是一种非线性的信号处理方法,它 是在1 9 7 1 年由j w j u k e y 首先提出并应用在一维信号处理技术( 时间序 列分析) 中,后来被二维图像信号处理技术所引用。 中值滤波的原理如下: 一般采用一个含有奇数个点的窗口w 在图像上扫描,把窗口内所包 含的图像像素值按其灰度值升序或降序排列成为一个数列,f l f n ( n 为窗口w 的面积) ,令此数列中间元素的值为窗口中央像素的值, 将一帧图像中所有的像素都应用此算法,遇完成了中值滤波。对于奇数 个元素,中值是按大小排序后,中间的数值;对于偶数个元素,中值是 指排序后中间两个元素灰度值的平均值。 例如:取一个一维的长为5 的窗口,窗口中的像素的灰度值为4 0 , 8 0 ,6 0 ,1 1 0 ,9 8 ,中值为8 0 ,则在此窗口正中的像素其灰度值由6 0 变 为8 0 。 中值滤波可由下式表示: g ( m ,疗) = m e d i a n f ( m k , n - 1 ) ,( 女,) w 其中,g ( m ,n ) 为中值滤波后的结果图像,f ( m - k ,1 3 一1 ) 为原始图像。 一般,取窗口边长为奇数,则g ( m ,n ) = 工。,2 ,否则为 g ( m ,”) = ( 厶,2 + 兀2 + 】) 2 常用的窗口一般如下面两图所示的线形、十字形、方形、菱形、圆 形等。 a 匠口 懿 b c 图3 5 中值滤波器的常用窗口 第1 8 页共5 9 页 上海大学研究生论文 圈 衄 图3 6 中值滤波器的常用窗口二 一维中值滤波不影响阶跃函数和斜坡函数,并可以有效地消除单、 双脉冲,使三角函数的顶端变平。二维中值滤波比一维中值滤波更能抑 制噪声。二维中值滤波的窗口如上图所示。不同形状的窗口产生不同的 滤波效果。所以使用中必须根据图像的内容和不同的要求加以选择。一 般方形或者圆形窗口适宜外廓线较长的图像,十字形窗口优选于有尖顶 角物体的图像。 3 4 2 图像的灰度增强 本文中采用中值滤波主要是为了消除二值化图像后出现的噪声点, 为下一步的分割图像做准备。由图可知,可能会对后面图像处理造成影 响的噪声点位于左边的图上,只需对左图进行滤波就可以了,而且图像 中要识别的字符和刻度分为左右两部分,这两部分的背景有明显的差 异,必须采用不同的分割方法来提取出字符和刻度,所以首先就要初步 对图像进行左右分割。 由图可知,这两部分的中间是一块象素值全为“l ”的区域,可以采 用逐列检测的方法快速找到分割位置。即从左边第一列开始检测该列象 素的象素值,并判断出这些象素值中是否有“o ”,有就继续检测下列 象素;没有则该列象素所在的位置就是分割的位置。这样就可以将读数 区域图分成左右两部分。分割结果如下图所示。 第1 9 页共5 9 页 上海大学研究生论文 图3 7 区域分割结果 接着就可以对左图进行中值滤波来消除二值化图像后出现的噪声 点,这里我们了采用方形窗口的二维滤波,经过对左图的两次滤波后, 获得了满意的滤波效果。两次滤波后的结果如图所示。 图3 8 两次滤波后的结果 第2 0 页共5 9 页 上海大学研究生论文 3 5 数字字符与刻度的分割 字符和刻度的分割是要从以下左右两个图中分别提取出字符和刻 度,这两个图中字符和刻度所处的背景相差很大,必须根据它们各自的 特点采用不同的方法来分割。 图3 9 待分割的图像 3 5 1 读数区域左图的字符分割 字符的分割有许多方法,本文提出的是二值图像投影分割法,该 方法简单,时间性能好,应用了字符的先验知识,分割结果准确。 投影操作的实质就是把二维图像的象素分布特征简化为x 轴和v 轴的两个一维函数,通过对这两个函数的分析,找到我们想要的结果。 对区域左图分别进行垂直和水平投影,结果如下图: 图3 1 0 垂赢投影图 图3 1 1 水平投影图 我们首先找到水平投影图中从0 到l 以及从1 到0 跳变的行,也 就是水平投影图中第一列象素的象素值中产生跳变的值,这些值就是可 能的字符上下边界值,根据水平投影图,相邻两个值大于或等于已知的 第2 l 页共5 9 页 上海大学研究生论文 字符高度h 的话,这两个值就是字符的上下边界。由上下边界提取图像, 如下图。 图3 1 2 提取出的图像 接着对按上下边界提取的图像进行垂直投影,如图 图3 1 3 垂直投影图 由上面的垂直投影图确定每个字符的左右边界。找到垂直投影从 0 到1 和从1 到0 跳变的列,也就是垂直投影图中第一行象素的象素值 中产生跳变的值。本系统在左图中只需要识别4 位数字,所以可以直接 取两个中间象素值为1 的数为该位字符的边界,并分别提取出字符。 3 5 2 读数区域右图的字符和刻度的分割 右图的特点是,由于电表读数是下凹的,在灯光作用下,二值化 后的图像中字符和刻度处在一个矩形中,该矩形有三条边上的象素值全 为0 ,我们就是通过该矩形来确定提取框的参数( x l ,y ,x 。,y 。) ,并 将字符和刻度从复杂的背景中提取出来的,然后再在提取出的图像中把 字符和刻度分别分割出来。 首先,将字符和刻度从背景中提取出来的具体步聚如下: 1 ) 要确定刻度指针的中心坐标,这里采用了模板匹配的方法来实 现。通过预先制作好的刻度指针模板,在右图中进行模板匹配, 可以得到刻度指针的中心坐标o ,( x p ,y p ) ,这是确定提取框 的基准点。 2 ) 取中心为o r 、长为。的竖直线丽,以它为检测初始线, 向左逐列平移,并检测该线所经过图像的象素值。当检测到线 上的象素值全为0 时,这时检测线的位置为提取框的右边框, 确定x 。 3 ) 取中间为o 。( o ,y p ) ,长为。的竖直线面j f ,以它为检测 第2 2 页共5 9 页 上海大学研究生论文 初始线,向右逐列平移,并检测该线所经过图像的象素值。当 检测到线上的象素值全为0 时,这时检测线的位置为提取框的 左边框,确定x t 。 4 ) 在右图顶取水平线面两,m t 为( x l ,h ) ,n t 为( x n ,h ) , h 为右图高,以该水平线为检测初始线,从上往下逐列平移, 并检测该线所经过图像的象素值。当检测到线上的象素值全为 0 时,这时检测线的位置为y 。图中读数的上边缘应该与读数 框相连的,但由于电表读数是下凹的,在上方光源的作用下, 读数的上边缘因光线遮挡而无法显示出来,为了下一步确定下 边框方便,在不影响上边缘的条件下,提取框的上边框可适当 下移妙,从而确定y r = y r o a y r 。 5 ) 由图可知,提取框的下边框上的象索值可能不全为o ,不能如 上直接检测得到。考虑到指针大体上位于图中读数框的中间位 置,所以提取框可以取相对于指针上下对称,所以应有: y 口= y p 一( y r y p ) = 2 y ,一y z 。 这样就确定了提取框的4 个参数( x l y t x r y 。) ,并将字符和刻度 从背景中分离出来。结果如图。 图3 1 4 图像提取 要把上图中的字符和刻度分别分割出来,分界线应该取长刻度顶 端所处的坚直线,这就是要找的分割图中字符与刻度的准确位置x 。由 图可知,字符和刻度之间不同列的象素中含“i ”象素值的数量明显少 于两旁,对图像采用二值图像投影法进行垂直投影处理,结果如下图所 示。 第2 3 页共5 9 页 上海大学研

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论