




已阅读5页,还剩65页未读, 继续免费阅读
(计算机应用技术专业论文)图像识别方法与实现技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 近年来,有关自然景物中标的自动识别引起了广泛关注,其无论在军事领域 还是民用领域都有重要的应用价值。桥梁和机场这类大型地物目标成为研究的重 点,许多专家学者针对特定背景图像目标提出了各种有效的识别方法。但是到目 前为止,还没有一种通用性较强的目标识别方法。 本文采用知识驱动型目标识别策略。结合前人的理论成果,分别研究和实现 了基于形状特征和边缘特征的两种对水上桥梁识别方法,以及一种基于直线模型 的机场识别方法。 基于形状特征的水上桥梁识别方法利用桥梁外形类似于矩形的特点,首先使 用差影法和区域标记法对目标分割,然后采用一系列具有良好r s t 不变性的矩特 征,来描述桥梁形状的特征,从大致轮廓到细节对分割出来的桥梁进行检测和识 别。基于边缘特征的水上桥梁识别方法利用桥梁两边是水域的特点,从桥梁边缘 线上每一点按照其法线方向可以进入到水域,先用k i t s c h 算子提取边缘后,计算 每一点的梯度来获取法线,以得到桥梁的两条边缘线,最后使用弗里曼链码对直 线进行跟踪、拟合和配对从而识别桥梁。基于直线模型的机场识别以跑道为核心, 先使用c a n n y 算子提取边缘,然后用改进的h o u g h 变换提取主副跑道的边缘线, 再根据主副跑道的中点坐标,最后利用区域扩充法确定机场的大致范围。实验表 明,这3 种方法是有效的。 关键字:图像识别形状特征弗里曼链码梯度区域扩充 a b s t r a c t i i i a b s t r a c t i nr e c e n ty e a r s ,t h ea u t o m a t i cr e c o g n i t i o no fo b j e c t si nn a t u r a ls c e l l eh a sa t t r a c t e d e x t e n s i v ei n t e r e s t s ,w h i c hh a sp o t e n t i a la p p l i c a t i o ni nc i v i lf i e l da sw e l la sm i l i t a r yf i e l d a i r p o r ta n db r i d g ew h i c ha l et h et y p i c a ll a n dt a r g e t sb e c o m ei m p o r t a n tp o i n t si n r e s e a r c h a l t h o u g hal o to fe x p e r t sa n ds c h o l a r sp r o p o s em a n ye f f e c t u a lr e c o g n i t i o n m e t h o d s ,t h e r eh a sb e e nn oe f f e c t i v ea n da d a p t i v eo n e si nt h el i t e r a t u r et o0 1 1 1 b e s t a c k n o w l e d g ey e t t h i sp a p e ra d o p t sm o d e l d r i v i n gs t r a t e g y s t u d y i n g0 1 1a n di m p l e m e n t i n gt w o w a t e r - b r i d g er e c o g n i t i o n m e t h o d sb a s e d0 1 1 s h a p e c h a r a c t e r i s t i c sa n d e d g e c h a r a c t e r i s t i c sa n da i r p o r tr e c o g n i t i o nm e t h o do nl i n em o d e lc o m b i n i n gw i t hp r i o r t h e o r i e s t h ef i r s tm e t h o db a s e do n s h a p ec h a r a c t e r i s t i c sa d o p tas e r i e so fm o m e n t c h a r a c t e r i s t i c sw i t hn i c er s t i n v a r i a b i l i t yt od e s c r i b eb r i d g et od e t e c ta n dr e c o g n i z ei t f i o ma p p r o x i m a t es h a p et od e t a i l sa f t e rs e g m e n t a t i o nu s i n gd i f f e r e n c ei m a g em e t h o d a n dd i s t r i c tl a b e l i n g t h es e c o n dm e t h o db a s e do ne d g ec h a r a c t e r i s t i c sd e r i v e st h et w o e d g el i n e so fb r i d g ew i t hk i t s c ho p e r a t o rb yu s i n gn o r m a lf r o mg r a d s t h e nu s et h e f r e e m a nc h a i n sy a r d s t r a c k ,f i ta n dp a i rt h ec h a i n st or e c o g n i z et h eb r i d g e t h ea i r p o r t r e c o g n i t i o nm e t h o db a s e do nl i n em o d e lt a k e si m p r o v e dh o u g ht r a n s f o r mt oc h e c kt h e e d g el i n e so fp r i m a r ya n ds u b s i d i a r yr u n w a y ss e g m e n t e db yc a n n yo p e r a t o ra st h e r u n w a y sb e i n gt h ec o r e t h e na c c o r d i n gt ot h ec e n t e rc o o r d i n a t e so ft h ep r i m a r ya n d s u b s i d i a r yr u n w a y s ,u s et h ed i s t r i c te x p a n s i o nt oc o n f i r mt h ea r e ao fa i r p o r t e x p e r i m e n t s h o w st h a tt h e s et h r e em e t h o d sa r ec o m p a r a t i v e l ye f f e c t i v e k e y w o r d s :t a r g e t - r e c o g n i t i o n s h a p e - c h a r a c t e r i s t i c f r e e m a n c h a i n 叫跹a s g r a d s d i s t r i c t e x p a n s i o n 西安电子科技大学 学位论文独创性( 或创新性) 声明 秉承学校严谨的学分和优良的科学道德,本人声明所呈交的论文是我个人在导 师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注 和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果; 也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明 并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名: 日期 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再攥写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本学位论文属于保密,在- 年解密后适用本授权书。 本人签名: 导师签名: 日期 日期 第一章绪论 第一章绪论 1 1 课题研究背景及任务 随着通信、网络、计算机的发展,计算机图像识别技术已经在很多领域得到 了广泛的应用,如军事中敏感目标识别,医学影像中病灶识别,工业生产中零件 识别,交通运输中自主行走车辆对障碍物识别等等。识别的主要任务是由计算机 来确定所拍摄图像中是否存在感兴趣的目标,若存在则要给目标以合理的解释, 有时还要确定其位置并标绘出来。 利用飞机或卫星等拍摄的图像来检测与识别地面目标,已经被广泛应用于国 防和经济建设以及环境保护与地球资源勘探中。如何从这些图像中自动获取有用 的信息一直是图像识别方面的重要课题之一,国内外科学工作者己经做了大量的 研究并取得了一些进展,进行这方面研究的目的之一是为了推广其应用。因此, 寻找一条解决图像识别的途径来满足实用要求是很重要的。图像中的目标一般可 分为两类:一种是自然目标即一些自然物;另一种是一些人造目标,比如高楼、 公路、大桥等。通常要寻找的是一些特定的目标,对于这类目标的识别称为特定 目标识别。 本文的主要任务是对遥感图像进行处理分析,检测识别图像中的机场跑道、 水上桥梁大型目标并精确定位。在此基础上给出桥梁长度、宽度信息以及大致的 机场区域。 1 2 图像识别的现状和趋势 图像识别技术已经应用到人类社会的各个领域,从指纹识别、车辆检测、医 学研究到军事影像目标识别、匹配及典型目标打击效果评估,深深地影响着人类 生活。图像识别技术日渐向高智能、非人工干预的方向发展。虽然图像识别技术 近年来取得了非常大的进展,但仍然存在着一些问题。 ( 1 ) 图像目标识别应用的领域 目前,国内、国外已经把图像识别技术应用到很多领域,其中最典型的应用 有: 光学信息处理上如光学文字识别、光学标记识、光学图形识别、光谱能量 分析等。 医疗仪器上的样本检查分析、眼球运动检测、x 射线摄像、胃镜、肠镜摄 像等。 自动化仪器如自动售货机、自动搬运机、监视装置等。 2 图像目标识别方法与实现技术研究 在工业自动检测上如零件尺寸的动态检查、产品质量、包装、形状识、,表 面缺陷检测等。 军事上有卫星侦察、航空遥感、微光夜视、导弹制导、目标跟踪、军事图 像通信等,例如美国及一些国际组织发射了资源遥感卫星( 如l a n d s a t 系列) 和天 空实验室( 如s k y l a b ) 。 人工智能方面有机器人视觉、无人自动驾驶、邮件自动分检、指纹识别、 人脸识别等,例如中科院计算所自主研制的“面像检测与识别核心技术”。 ( 2 ) 图像目标识别的现状 战略目标无论是在军事还是民用方面,都有着非常重要的意义,但是令人遗 憾的是,经过这么多年,各类文献中有关遥感图像中战略目标识别的研究方法的 部分仍然少之又少。相对而言,道路目标识别较多,但很少用于军事用途,而是 用于g i s ( 地理信息系统) 或者其它测绘需求。像桥梁这样的大型地面目标识别也是 以水上桥梁居多,而陆地桥梁方面的研究则是较为少见。机场识别大部分也仅仅 是能够检测出直线特征明显的主副跑道,而对于机场其它附属设施的识别则是很 少涉及到。很多战略目标没有固定的模型,例如不同的分辨率图像中的港口、道 路、桥梁、机场和交通枢纽等,模型都不相同。这些目标不像战术目标( 飞机、舰 船、车辆等) 可以提取很多不变特征,如h u 矩和小波矩特征等,所以大型战略目 标的分割和检测都需要先验知识指导。 ( 3 ) 图像目标识别存在的问题 识别现实世界中的各种复杂景物对人类来说是一件轻而易举的事,而计算机 进行图像识别却非常困难。在相对较为简单领域,图像目标识别得到了成功的应 用。当前所面临的主要问题有: 首先,完成一幅图像的识别一般要经过许多不同处理过程,图像识别正是这 些综合应用的结果。然而,至今没有一个通用的方针来指导这些过程在完成特定 任务时应该如何组织和搭配,即便对于各种常用图像,分割算法之间的性能比较 也没有一个较好的统一标准。 其次,现有的各种图像识别算法都或多或少的带有一定的局限性,在一种环 境效果很好的算法换一种环境就有可能很糟。 再次,一些有一定通用性,效果很好的算法往往计算量很大,难以实时应用。 ( 4 ) 图像目标识别的发展趋势 尽管计算机图像识别面临着巨大的困难,但是这一技术还是得到了很大的发 展。综观图像识别技术近十年来的发展变化,不难看出一些特点:图像识别将经 历一个飞速发展的阶段,立体视觉与人工智能仍然是计算机图像识别今后的发展 方向;短期内实现全自动通用性较大的计算机视觉系统可能性不大,今后应结合 各种实际应用开发各种计算机图像目标识别系统。 第一章绪论 3 可以预期,图像识别技术为人类生活创造新的文化环境,成为提高生产的自 动化、智能化水平基础科学之一。图像识别的基础性研究,特别是结合人工智能 与视觉处理的新算法,从更高水平提取图像信息的丰富内涵。 1 3 本文研究内容安排 当前己有的研究表明,在任意一幅图像中实现任意目标全自动检测是一个极 其困难的任务,现阶段很难得到解决,都是采用机器加人工辅助来进行识别。人 们早已认识到这一点,因此围绕着不同的识别目标进行多种研究。 本文研究机场和水上桥梁识别,这两类目标在军事上是比较典型的,同时也 有很重要的价值。 本文现对已有的机场和水上桥梁识别算法进行了深入分析研究,然后结合已 有的一些方法,针对遥感图像中机场跑道和水上桥梁识别问题做了一些研究和改 进,并取得了一些进展,可以总结为以下几条: ( 1 ) 研究和实现了o t s u 、k a p o u r 熵和r c n y i 熵3 种阈值分割的方法,并对3 种 方法做出比较; ( 2 ) 研究和分析了圆形度、矩形度、n m i ( 归一化转动惯量) 和z 跗l i k e 矩在描述 物体外形特征的作用,在此基础上实现了基于形状特征的水上桥梁识别方法: ( 3 ) 研究梯度和法线在二值图像像素点的定义,并用链码检测桥梁边缘线,在 此基础之上实现了基于边缘特征的水上桥梁识别方法; ( 4 ) 研究和分析传统h o u g h 变换的优缺点,并做出改进以达到跑道精确定位的 目的,并用区域扩充法检测机场的大致区域。 本文组织如下: 第二章图像识别的基本原理和方法。首先介绍了图像识别的概念、基本原理、 识别策略和常用方法。 第三章水上桥梁识别算法研究。研究和实现了两种桥梁识别的方法,一是基 于桥梁的外形特征,先利用差影法分割出桥梁目标后,然后提取形状特征( n m i 、 圆形度、矩形度和z e m i k e 矩) 来对目标进行考察,并进行最后的识别;二是基于 桥梁的边缘特征进行识别,先利用k i t s c h 算子提取边缘,然后使用弗里曼链码对 桥梁边缘线进行跟踪、拟合和配对,最后达到识别的目的。这两种方法都是知识 驱动型方法,利用桥梁、水域和陆地三者之间的关系对桥梁进行分割和识别。 第四章机场识别算法研究。其核心思想是采用基于直线模型的方法对机场跑 道进行定位和识别。首先利用抗噪性强的h o u g h 变换提取跑道的边缘线,然后合 并和配对平行直线以识别跑道,最后利用区域扩充法,确定机场的大致范围。 第五章实验和仿真结果。使用桥梁和机场的真实图像进行实验,对实验结果 4 图像目标识别方法与实现技术研究 进行分析,并对三种算法的优缺点做出说明。 本文最后对所作的工作进行了总结,指出了本文研究的不足之处,提出了下 一步改进的建议。 第二章图像识别的基本原理和方法 第二章图像识别的基本原理和方法 2 1 图像预处理处理方法 图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增 强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、 匹配和识别的可靠性。预处理过程一般有数字化、几何变换、归一化、滤波、复 原和增强等步骤。 本文采用了图像滤波和增强的方法来提高图像的质量,以便于之后的图像分 割、边缘提取等。 2 1 1 图像滤波 ( 1 ) 空域滤波【1 】 在图像处理中,空域指又像素组成的空间,空域增强方法之间作用于像素的 增强方法,可表示为: g ( x ,少) = e h ( f ( x ,y ) ) ( 2 - 1 ) 其中厂( ) 和g ( ) 分像,而删代表增强操作。如果e h 是定义在每个( x ,y ) 上,则为点操作;若是定义在( x ,y ) 的一个临域内,则为模板操作。 中值滤波属于统计滤波的一种。它将模板( 通常为3 x 3 大小) 在图中漫游,并将 模板中心与图中某个像素位置重合,读取模板下各相应像素的灰度值,将这些灰 度值从小到大排列,找出这些值里排在中间的那个值,将这个值赋给对应模板中 心位置的像素。通常中值滤波器有以下几种形式,其中灰色为中心像素。 田册目 l 蛳l d ,i c ,l 田 图2 1 中值滤波的几种形式 图2 2 ( a ) 是一幅原始s a r 图像,图2 1 ( b ) 是经过图2 1 中( a ) 模板中值滤波处理 后的图像。s a r 图像属于微波成像,雷达发出特定波段的微波波束,通过接受回 波,利用各种物体对微波反射率不同的特点,在屏幕上形成影像或经过处理后形 成数字图像。由于回波在返回的途中会遇到反射率较强的物体,使在形成的图像 上出现一个一个细小的斑点噪声( 散斑噪声) ,影响图像质量。中值滤波恰好可将这 些小的噪声绎过处理融入到图像的背景之中很好的消除了细节噪声对整幅图像 的影响。 a ) 原始s a r 罔像( b ) 经过中值滤波后的s a r 图像 圈22 经过中氆窨量波处理的s a r 阁像 212 图像增强 图像增强技术有多种方法,反差展宽、对数变换、密度分层和苴方图均衡等 都可用于改变图像灰调和突出细节。 扶度拉伸“实际是增强原图像各部分的反差。实际往往通过增加原图中里某两 个灰度之间的动态范围来实现的。典型的增强对比度的函数如图23 ( a ) 叶 所示。通 过这样的一个变换原图中灰度值在0 到和l 到l l 间的动态范同减d t ,而 灰度值在s 到s :间的动态范罔增加了,从而使这个范围内的对比度增加了。实际卜 s s ,f 。,可取不同的值进行组合,从而得到不同的效果。 mn 罔2 3 灰度拉伸变换函数 图23 ( b ) 是经过灰度拉伸的s a r 图像,从结果看陆地和水域的对比度被拉大。 其中5 = 4 0 ,= 8 0 、h = 2 0 0 、t ,= 2 2 0 。 22 特征提取和选择 特征提取是目标识别的关键,特征的选择和描述是识别性能的直接体现。理 想的图像特征应该具备以下特点: 第二章图像识别的基本原理和方法 ( 1 ) 特征应具有直观意义,符合人们的视觉特性; ( 2 ) 特征应具备较好的分类能力,能够区分不同的图像内容; ( 3 ) 特征计算应该相对简单,以便于快速识别; 2 2 1 特征的分类 由于目标的多样性及复杂性,寻找具有良好描述和分类性能的图像特征就成 为解决图像识别问题的一个关键。 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特型3 1 。 ( 1 ) 颜色特征。颜色特征是一种全局特征,描述了图像或图像区域所对应的景物 的表面性质。例如灰度直方图等。 ( 2 ) 纹理特征。纹理特征是一种全局特征,它也描述了图像或图像区域所对应 景物的表面性质。例如基于共生矩阵的熵、角二阶矩和局部平稳性等。 ( 3 ) 形状特征。形状特征是一种局部特征,描述了局部区域内物体的外形的性 质。例如矩特征,边界特征等。 ( 空间关系特征。是指图像中分割出来的多个目标之间的相互的空间位置或 相对方向关系。这些关系也可分为连接邻接关系、交叠重叠关系和包含包容关系 等。 2 2 2 特征的提取与选择 特征的提取与选择是模式识别过程中一个重要的处理步骤,直接影响着后面 对目标的判别,在很大程度上决定着最后识别结果的正确与否。 ( 1 ) 特征提取与选择 特征是根据被识别的对象产生出的一组基本特征,可以是计算出来的,也可 以使用仪表或传感器测量出来的测量值,很多情况原始测量就可以作为原始特征, 而有些情况则需要计算得出一组原始特征。 特征提取原始特征的数量可能很大,或者说样本是处于一个高维空间中,通 过映射( 或变换) 的方法可以用低维空间来表示样本,这个过程叫特征提取。 特征选择从一组特征中挑选出一些最有效的特征以达到降低特征空间维数 的目的,这个过程叫特征选择。 为有效实现特征提取与选择,需要首先制定特征提取与选择的准则,可直接 以反映类内类间距离的函数作为准则,也可以使用类别判决函数作为准则,还可 以构造与误判概率有关的盘局来刻画特征对分类识别的贡献或者有效性。在具体 实施特征提取与选择时有如下两个基本途径【4 】: 特征选择:设原始特征维数为n ,选取分类识别特征维数为d ,则可分性判 8 图像目标识别方法与实现技术研究 据,的值应该满足下式 歹瓴,x 2 ,而) = m a x j ( x , l ,五2 ,劫) 】f = 1 ,2 9 * t 9 n( 2 2 ) 其中( 而,五:,) 是个原始特征中任意d 个特征,即直接寻找刀维特征空间中 的d 维子空间。这类方法称为直接选择法。 在使判据- ,取最大的目标下,对行个原始特征进行变换降维,即对原珂维特 征空间进行坐标变换,再取子空间。这类方法称为变换法。 设娩,口2 ,) 是,l 维特征空间f 的一个基底,矢量工是对象f 中关于 口i ) 的 一个观测,则x 可表示为 x - q i = l ( 2 - 3 ) 在此基底“) 上x 的各分量( 坐标) 娩) 成为对象的特征值。 特征提取与选择实质上只在矿中找出一个空间形,对象的新特征是通过z 向 子空间投影得到的。令缈是聊各线性无关的矢量鸲,屋,尾) 张成的,即 形= 印册鸲,屈,尾) 聊 o ,当f 耐; - 0 ,当净时; j ;i :ji l ( 2 7 ) 对特征数目是单调不减的,即加入新的特征后,判据的值不减 乇( 五,恐,) ,( 西,恐,劫,“) ( 2 8 ) 2 3 图像模式识别问题 在一些最棘手的模式识别问题中,数据以图片形式出现。由于人类视觉的物 理基础尚未被很好认识,这一课题对模式识别提出了特殊的挑战。概括图像模式 识别将涉及下列各步: ( 1 ) 图像的取样与量化:一幅景物或张照片被转化为一个矩阵,以适合计算 机处理; ( 2 ) 图像分割:按亮度、色彩或纹理的一致与否确定该区域; ( 3 ) 景物分析:由分割获得的区域合并或修改,使之被定为物体; ( 4 ) 形状描述:物体被编码反映它们形状的结构; ( 5 ) 物体描述:可能是简单分类( 例,所见物体被纳入字母a 类) ;或是一段语 言描述( 例,所见物体由2 个被水平线连接的圆盘组成1 。 2 3 1 图像模式识别的两种控制策略 在图像处理中,图像信息采用不同的表示方式存储,在处理的控制中,关键 的问题是:处理过程应当由图像的数据信息控制还是由更高层的知识控制。 ( 1 ) 自底向上的控制策略 6 】 这种方法采用图像数据控制,处理过程从光栅图像开始到分割图像,再到区 域描述,最后到目标的识别。该方法不管识别目标属何类型,一律先对原始图像 进行一般性的分割、标记和特征抽取等低层处理,然后将每个带标记的己分割区 域( 物体) 的特征矢量集和目标模型相匹配。目标识别过程包括低层处理和高层匹 配、解释等两个互不相关的过程。这种方式的优点是适用面广,对单目标识别及 复杂景物分析系统均适用,具有较强的代换性。缺点是在分割、标记、特征抽取 、,勤 l 如 d 捌 = 、, 吃砭五 l = 1 0 图像目标识别方法与实现技术研究 等低层处理过程中缺乏知识指导,盲目性大,故工作量大,匹配算法比较繁复。 ( 2 ) 基于模型的控制策略 这种方法是一种自顶向下的控制,它利用可用的知识,建立一组假设和期望 的性质,按照自顶向下的方式,在不同的处理层次的图像表示中测试是否有满足 这些性质的区域,一直到原始图像为止。图像理解就是验证其内部模型,该模型 可能被正式并接受,或是被拒绝。自项向下的控制策略,其主要思想在于内部模 型的建立和模型的验证,是一种面向目标的处理过程。 这种基于知识的目标识别过程一般为:根据知识建立目标模型,有模型驱动, 选择其中一些典型特征建立一组假设和期望的性质,在图像中寻找可能的目标区 域,最后根据目标模型其它知识验证目标存在与否。 这种方法的优点在于其低层处理是在知识指导下的粗匹配过程,可避免抽取 过多不必要的特征集,提高算法的效率,其精匹配过程也因而变得简单和有针对 性。它的缺点是代换性和兼容性差,识别目标改变,知识和假设要随之而变。模 型驱动控制策略的关键在于知识的表示,知识表示一般有3 个方法【7 】: 产生式表示法 产生式表示也称为产生式规则,或简称为规则。这里所说的“规则”是指人 们思维判断活动中的一种固定逻辑结构关系,通常,产生式的结构关系可简单表 达为: pj q ( 2 9 ) 或表示为自然语言形式,形如:i fp ,t h e nq 其中p 是产生式的前提或引入的事实,表示规则成立时必须满足的条件,称 为产生式的前件;q 是产生式的输出结果,表示规则成立时导出的结论或要采取 的行动,或进展状况或执行的操作等,称为产生式的后件。 语义网络表示法 语义网络是一种通过概念及其语义关系来表达知识的有向图,基本的语义关 系是语义网络知识表示的基础,也是构成复杂语义关系的基础。事实上,任何复 杂的语义关系,都可以通过许多基本的语义关系予于关联来实现,基本语义关系 具有多样性和灵活性。一些常见的语义关系如下: 从属关系:又称为分类关系,包括事例关系和泛化关系等,指具有共同属性 的不同事物间的类别归并关系,成员关系或实例关系。 包含关系:又称为聚类关系,表示了下层概念是上层概念的一个组成部分的 关系。 属性关系:表示对象及其属性之间的关系。 框架表示法 第二章图像识别的基本原理和方法 框架理论认为自然界各种事物都可以看作是由一种通用的框架( f r a m e ) 组织构 成,每个对象的框架又分别具有不同的特殊知识结构形式,并能够存储在大脑或 计算机的记忆中,因此,当需要认识某个事物或对象时,就可以按照框架理论的 知识来表示和处理。 框架是一种被用来描述某个对象属性知识的数据结构。一个框架有一组用来 描述框架各方面特性的框架槽和框架的侧面所组成。其中,框架槽用来描述所选 对象某一方面的属性,侧面用于描述框架架槽相应属性某个方面的细节知识 2 3 2 图像模式识别技术 图像模式识别技术现今有很多,大概可以归纳为以下6 种: ( 1 ) 统计( 或决策理论方法) 统计方法以数学上的决策理论为基础,根据这种理论建立统计学识别模型, 其基本模型是对研究的图像进行大量的统计分析,找出各类分布特征规律性,提 出反映图像本质特点的特征进行识别。基本技术为聚类分析法、判别类域代数界 面法、统计决策法、最近邻法等。统计方法忽略了图像中被识别对象的空间相互 关系,即结构关系,当被识别对象( 如指纹、染色体等) 的结构特征为主要特征时, 用统计方法就很难进行识别。 ( 2 ) 句法识别 句法识别也称结构识别,是对统计识别方法的补充,统计方法用数值来描述 图像的特征,句法方法则是用符号来描述图像的特征。它模仿了语言学中句法的 层次结构,把复杂图像分解为单层或多层的简单子图像,主要突出识别对象的结 构信息。句法方法不仅对景物分类,而且用于景物的分析与物体结构的识别。 ( 3 ) 神经网络方法 神经网络方法是指用神经网络的算法对图像进行识别的方法,神经网络系是 由大量简单的处理单元( 神经元) 广泛地相互连接而形成的复杂网络系统,是人脑神 经网络系统的简化、抽象和模拟,侧重于模拟和实现人的认知过程中的感知过程、 形象思维、分布式记忆和自学习自组织过程,特别适用于处理需要同时考虑许多 因素和条件的、不精确和模糊的信息处理问题。 ( 4 ) 模糊集识别法 模糊集识别法在模式识别、自动控制等许多方面已有较为广泛的应用。在图 像识别中,有些问题极为复杂,很难用一些确定的标准做出判断。模糊集识别方 法的理论基础是模糊数学,模糊数学把事物特征判别的二值逻辑转向连续值逻辑, 用不太精确的方式来描述复杂系统,更接近于人类大脑的模拟式思维活动。基于 模糊集理论的识别方法有:最大隶属原则识别法,临近原则识别法和模糊聚类法。 1 2 图像目标识别方法与实现技术研究 ( 5 ) 人工智能 人工智能是研究如何使机器人具有人脑功能的理论和方法,识别的本质是根 据特征进行类别的判别,所以可将人工智能中知识学习、知识表示、推理等技术 用于识别,主要形式是专家系统。 ( 6 ) 模板匹配 模板匹配算法可以通过直接在图像上变换完全二值化或多灰度的目标模板或 场景模板,计算模板和图像的互相关,找出最大的互相关函数响应,来完成识别 过程。对于上述处理,既可以在原始域进行,也可在变换域中进行 第三章桥梁识别技术研究 第三章桥梁识别技术研究 3 1 概述 目前已有的桥梁识别算法主要采用自上而下的知识驱动型识别方法,即根据 识别目标的模型,先对图像中可能存在的特征提出假设,根据假设有目的地进行分 割、标记和特征提取,在此基础上再进行判别以达到识别的目的。 由于桥梁目标位置的特殊性,遥感图像中桥梁目标的自动识别和精确定位对 g i s ( 地理信息系统) 数据获取、制图及作为其它固定或移动目标的先验参照信息, 都有很重要的意义。 水上桥梁识别方法大致可以归纳为三类:基于差影检测的方法,基于边缘提 取的方法和基于道路信息的方澍7 】: ( 1 ) 基于差影检测方法的基本思想是通过提取水体,运用数学形态学进行差影 检测提取初始桥梁目标,采用形状特征判决去除虚警得到最终识别结果。这类方 法虽然具有速度快的优点,但是差影检测中运用的膨胀腐蚀这一对形态学算子不 互为可逆算子,且膨胀腐蚀次数难以选择。 ( 2 ) 基于边缘提取方法的基本思想是通过边缘提取算子( 常用c a n n y 算子) 提取 图像边缘,利用h o u g h 变换检测平行线的方法提取桥梁上下边缘。然而这类方法 的缺点是未考虑桥梁与河流的位置关系,而仅根据目标的平行线特征,因而会产生 较多的虚警,而且h o u g h 变换的参数比较难以选择。 ( 3 ) 基于道路信息方法的基本思想是利用已经提取的道路信息,根据道路、河 流及桥梁的位置关系,提取交通干道上的桥梁目标。这类方法的前提是图像中道 路信息已知,然而遥感图像中道路信息的自动提取本身就是图像理解中一个悬而 未决的难题。因而这类方法虽具有一定理论意义,目前来讲现实的可能性不大。 3 2 基于外形特征的桥梁识别方法 高空拍摄的水上桥梁的外形特征有很多种,从细节上看,有的桥梁是带有拉 索的,而有的只有桥墩。但是从宏观上看,桥梁可以看作是一个团块目标【1 1 】,它 的外形特征都有一个共性,就是几乎大部分的桥梁的外形都类似于矩形。尽管经 过提取的桥梁目标与标准矩形之间还存在一定的差异,但是两者却有着许多相似 的特征。所以可以从形状上来考虑,建立一个以矩形形状为基础的桥梁模型。 3 2 1 桥梁目标识别算法模型 先前许多的论文已经对水上桥梁模型做出过很详细的论述,但是考虑到水上 桥梁是一个比较大的目标,可以运用场景识别框架来对水上桥梁模型做进一步的 1 4 图像目标识别方法与实现技术研究 描述。利用水域,陆地域,桥梁三者的关系,可以作为先验知识来指导图像处理 的过程。 场景框架【1 2 】由一组描述物体各个方面的域组成。每个域都有它自己的名字和 填入这个域的值。 水域表达为: 水域i 灰度,g l ,l 是估计的g 的下限值( 即陆地域 是较亮的区域) ; 。 桥梁域、水域和陆地域又是构成整个图像场景框架的元素。 整个图像表达为: 图像l 桥梁;水域;陆地域;区域之间的关系;) 。 根据场景框架所确定的桥梁模型如下所述: ( 1 ) 在水上桥梁中水域在可见光图片由于镜面反射的缘故,在s a r 图像中由 于回波较弱,在图像中呈现大片灰度较低暗色的区域,且内部灰度比较均匀光滑, 与桥梁和陆地形成比较明显的反差。 ( 2 ) 桥梁和陆地的灰度都比较大,陆地呈现大片的亮色区域,桥梁与陆地灰度 相近。由于桥梁是横跨水域之上,表现出两大块暗色区域之间亮色的线条,线条 的宽度相对水域来说非常小。 ( 3 ) 陆地域与水域相邻部分灰度值和水域灰度相似,有可能形成弯弯曲曲的边 缘,甚至会在水域边上富有细长弯曲的伪水域。水域内部可能会因亮度不均匀在 分割图像时会形成孤立的小洞。 ( 4 ) 桥梁横跨与水域之上,所以多个桥梁会把水域分割为互不连通几个部分, 并且桥梁从宏观上看是类似于矩形的团块目标,它有一定的长度和宽度,并且桥 梁的长度相对于宽度而言较长。 其中( 1 ) 和( 2 ) 是辐射方面的知识,( 3 ) 是陆地域和水域位置方面的知识,( 4 ) 是桥 梁的功能方面和几何形状方面的知识。根据这些知识规则,可以有针对性地选取 算法,制定一套桥梁识别的流程。处理方法从河流的提取入手,将桥梁的检测范 围缩小到河流区,然后再进行桥梁检测,这样大大的提高了检测效率,也减少了 大范围检测而带来的误检率。 3 2 2 桥梁目标识别技术实现 本节正式进入到桥梁的识别阶段,桥梁的识别过程主要分为两个阶段:目标 提取阶段和验证与描述阶段。 下面分步介绍在图像处理中,从图像增强到目标筛选过程中用到的各种算法 第三章桥梁识别技术研究 1 5 和方法。 ( 1 ) 图像分割方法 对于水上桥梁识别而言,图像分割是很重要的处理过程。图像分割可以有效 地分割出水域和桥梁,并且直接影响到下一步目标定位的准确性。图像分割一般 有3 种方法:直方图分割法;最大类间方差法;熵函数法。这里根据不同质量的 图像,分别用最大类间方差和熵函数法分割原始图像。 最大类间方差法【1 3 】 由o s t u 提出的最大类间方差法,是在判决分析最, j 、- - 乘法原理的基础上推导。 该方法首先假设阈值t ,将所有l 级灰度x 划为两类c o 【0 ,t 】,c 1 t + l ,l - 1 】, 并对直方图进行归一化,由此可得: n = 万n t 奶 o ,姜鼽一1 ( 3 - 1 ) 其中为图像总像素数,为灰度i 的像素数,则c o ,q 出现的概率及均值 为: 吼= p a c o ) - e p i = 烈f ) 铲骞罢= 器 其中蜥= 慨为图像的灰度均值, q = b ( g ) = p i = l - r e ( t ) 一v 识一州“( 3 - 2 l - ! u r - u ( t ) ) :y 亟= 7 1 高0 4 1 一o j ( t ) 则c o 和c l 的类间方差为: 以= c o o ( u o 一蜥) 2 + q ( + 坼) 2 ( 3 - 3 ) 最佳阈值t 应该使类间方差最大,即: a r g m a x 以( 3 4 )=aj【3 o i ( 3 - 1 8 ) = m i n u jf ( i ,歹) = 1 ,i = 1 ,2 ,n ,= 1 ,2 ,m ) k = m i n j i f ( i ,歹) = 1 ,i = 1 ,2 ,n ,j = 1 ,2 ,m ) 利用矩形面积公式 a r e a = ( 乙一瓦i n ) 幸( k 一) ( 3 - 1 9 ) 计算面积,取这9 0 个面积值中最小的一个作为物体最小外接矩形的面积。 jl 1 。 歹姊食 l 。 二一 陟, , f 反 厶 i 一 、。, k 夕 、 办 v 夕弋 图3 4 物体圆形度和矩形度的计算示义 z e m i k e 矧2 0 】 z e m i k e 矩是一种正交复数矩它引入一组在单位圆f + y 2 = l 上定义的具有 完备性的复数正交函数集 ( 五y ) ) 。 ( x ,y ) ) 的完备性和正交性使得可以表示 定义在单位圆盘内的任何平方可积函数,其表示形式为: ( x ,y ) = ( 户,伊) = e x p ( j q 0 ) ( 3 - 2 0 ) 第三章桥梁识别技术研究 式中p 表示原点到点( x ,y ) 的矢量长度,口表示矢量p 与z 轴逆时针方向的夹 角,( p ) 是实值径向多项式 啪) = 。蒌1 2 ( - i h 而丽啬击丽习坤( 3 - 2 )蹦纠= 萎y 面而拦蒹赢万矽p 2 ( 3 - 2 1 ) 这些多项式正交并满足 , :组 ( z ,y ) ( x ,y ) d r d y = 寿( 3 - 2 2 ) 其中嘬示共轭 = 怯翕。 由于z e r n i k e 矩多项式的正交完备性,所以单位圆内的任意一幅图像f ( x ,y ) 都 可以唯一地由下式展开: f ( x ,y ) = ( p ,口) ( 3 2 3 ) 式中复数系数值彳w 可表示为下式: 厶= 竿如:组f ( x , y ) v m ( p ,p ) + d x d y ( 3 - 2 4 ) 对于离散图像可将积分形式改为: 厶= 孚e e s ( 训) ( p ,乡) 】,工2 + y 2 l ( 3 - 2 5 ) 在计算一幅图像的z e m i k e 矩时,应当将图像中的中心作为原点,并将所有的 像素映射到单位圆内,单位圆外的点不做计算。从( 3 2 0 ) 式可以明显看出 厶= 4 ,一g ,这样可以选择z e r n i k e 矩的辐值l 厶i 为分类时需要的特征。 由于z e m i k e 矩只有旋转不变性,因此在提取z e m i k e 矩特征之前必需对图像 进行平移和尺度的归一化。本文采用标准矩的方法归一化。标准矩定义为: = ,y 叮f ( x ,y ) ( 3 2 6 ) 由标准矩可以得到目标重心。因为目标重心对平移。尺度和旋转是不变的, 可以将图像原点放在目标中心上以解决问题评议问题。定义一个尺度因子 口= ,解决尺度问题,其中是一个预定义的常量。实际上,若二值图像上 目标像素值为2 5 5 ,背景为0 ,则则是目标的面积,这样做的目的是使目标的 面积为一个固定的大小,不存在尺度的问题,这样可以通过坐标变换 图像i ;i 标识别方法与实现技术研究 g ( f ,j ) :( 三+ 丁,+ 7 )f 3 - 2 7 ) 得到对平移、尺度和旋转不变的z e m i k e 矩特征。 一幅图像的形状特征可以用一组z e r n i k e 矩集很好地表示。低阶矩描述的是一 个图像目标的整体形状,而高阶矩描述的是目标的细节。使用n m i 、圆形度和矩 形度筛选完之后,已经可以将大量的非桥梁目标去除掉,但是还会有一些伪目标 存在于原图中,并且与桥梁目标非常相似,已不能用以上3 个特征加以区分,所 以就用一组z e r n i k e 高阶矩来考察目标的细节方面。后面实验表明这是一种很有效 的方法。 3 23 识别处理流程 经过上一节对该桥梁识别方法中所用到的一些关键技术和所提取的判别特征 的介绍。从这一节起,本文开始介绍识别处理算法的流程。圈3 5 是本算法的基本 流程图。 莓蒸 羔篓翌型。兰露, 目3 i 桥粱口! 别流程 预处理过程 由于水上桥粱的地面信息非常丰富,会有各种各样的标记,例如陆地上很多 建筑物的屋顶,还有桥面和公路上的汽车,都会在在图像分割后形成很多较小的 黑色空洞,使得在目标定位的过程中也要对这些细小的黑色空洞进行标记从 而增大了程序的计算量,处理时间较长。所以在图像分割之前,必须减少或者消 除图像中的这些噪声。因此,本文采用中值滤波进行去噪,将这些细小的噪声进 行模糊,中值滤波的模板采用图31 ( a 1 的3 x 3 类型模板。 一 图3 2 中值滤波前后对比效粜 蕊 瓣 国 目翩 第三章桥梁识别技术研究 可以看出,桥梁周围的防波堤由于灰度较高,在图像分割后,还会残留在图 像之中,在目标定位之后,很可能会成为干扰识别的为目标,但在经过中值滤波 之后防波堤消失在水域之中。还有原图中岸上的一些植被,经过滤波之后由原 先零碎的孤立小块变成大片的区域。这就减少了目标定位时的计算量。 经过中值滤波之后,图像的对比度有所下降,尤其是一些边缘的信息,希望 背景和目标的反差越大越好,在随后的图像分割之中,两类之间的差别越大,分 割的效果就要越好,所以为了拉大这两者之间的差距,本文采用动态压缩和拉伸 的方法,即前面提到的灰度拉伸。由于桥梁的灰度值较高,并且是希望得到的目 标物体,而大片的水域灰度较低,是为背景,所以脏缩低灰度区域,而拉伸高灰 度区域,这样,不仅能是二者之间的差别增大,并且桥梁灰度区域的拉伸,有利 于获得细节的信息。 图33 肌度拉忡后的图像 这里灰度拉伸的参数根据前面的定义,4 个参数依次定义为: s = l o o ,r = 2 0 ,巳= 2 0 0 ,t 2 = 2 2 0 。从拉伸后的效果来看,确实达到了预期的效果, 桥梁和水域的对比度被拉大r 。 ( 2 1 图像分割 图像分割的算法占有非常重要的地位。这里爿j 了最大类间方差和两种基于嫡 的分割方法。 正如前面所述,图像的分割没有一个通用的方洁,最大类间方差法适用于背 景和目标差别大的图像,而对于灰度集中在某一个区域内或是直方图变化很小的 图像效果就不是很好,分割之后甚至还会出现大片黑色的区域,将目标也纳八 图像目标识别方法与实现技术研究 到背景之中了。 所以这里需要对分割方法进行选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit 3 ATravel Plan Lesson 13 Beijing Is Great!(教学设计) -2024-2025学年冀教版(三起)英语五年级上册
- 2023九年级化学下册 第十单元 酸和碱 课题2 酸和碱的中和反应第2课时 溶液的pH及其应用教学设计 (新版)新人教版
- Unit 7 Lesson 38 Hobbies Are Fun!2024-2025学年八年级英语上册同步教学设计(冀教版)河北专版
- 船舶卫生与卫生设施管理
- 3 荷花 教学设计-2024-2025学年语文三年级下册统编版
- 4《地球 我们的家园》《环境问题敲响了警钟》教学设计-2023-2024学年道德与法治六年级下册统编版
- 七年级生物上册 第一单元 第一节 生物的基本特征教学设计 新人教版
- Unit 6 The power of plants 第6课时Presenting ideas +Reflection教学设计 -2024-2025学年外研版英语(2024)七年级上册
- 2033三年级数学下册 五 年、月、日第4课时 24 时计时法教学设计 苏教版
- Module 2 Unit 2 What are you doing?(教学设计)-2024-2025学年外研版(三起)英语四年级上册
- 微信生态运营全景解读
- 《陕西省全过程工程咨询服务导则(试行)》
- 辩论理论之需根解损(需要性、根属性、解决力、损益比)
- (完整版)道路交通事故现场图绘制课件
- 现代一体化手术室建设发展现状及展望
- 经纬度数转换工具
- NB_T 10438-2020《风力发电机组 电控偏航控制系统技术条件》_(高清最新)
- 混凝土凝结时间计算及报告(样表)
- 外研版小学英语五年级下册期中测试卷二
- 第七章_材料显微断口分析
- 创伤护四项技术
评论
0/150
提交评论