




已阅读5页,还剩55页未读, 继续免费阅读
(计算机应用技术专业论文)图像识别研究及应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 图像识别在军事国防以及民用领域的作用日益显著。近些年,从遥感希i 航拍 图像中实现目标的自动识别取得了长足的发展,但目前仍没有一种可以普遍适用 的方法。这其中的困难不仅体现在目标的多样性和场景的复杂性本身,同时也是 由于对人类视觉机制认识上的不足。 目前常用的图像识别策略有两种:一种是传统的由下而上的数据驱动型,另一 种是由上而下的知识( 假设) 驱动型。前者常用于飞机、工件等团块目标的识别中; 后者常用于复杂场景中的跑道、桥梁等目标的识别中。本文采用后- - 乖1 策略对机 场跑道、水上桥梁等目标识别做了较为详细的研究。 本文针对常见的人工目标一机场跑道、水上桥梁,总结了可见光图像、红外 图像、s a r 图像中机场跑道、水上桥梁的现有识别方法,并给出了自己的实现算法。 机场跑道的实现算法主要结合了线状特征提取的思路,以l l o u g h 变化提取出的机 场跑道中线的中点为种子,生长出整个机场跑道。水上桥梁识别的算法则主要结 合了区域特征分析的方法,首先提取出河流区域,在河流区域中再提取桥梁。通 过实验验证,这两种算法是有效的。 关键字- 图像识别知识驱动机场跑道水上桥梁 a b s t r a c t a b s t r a c t t h er o l et h a ti m a g er e c o g n i t i o np l a y si nt h ep r e s e n t - d a ym i l i t a r yn a t i o n a ld e f e n s e a n dc i v i ll j s eb e c o m e sm o r ea n dm o r em a r k e dd a yb yd a y a l t h o u g hm u c hp r o g r e s sh a s b e e nm a d ei nt h er e s e a r c h e si nt h ea u t o m a t e dt a r g e tr e c o g n i t i o ni nr e g a r dt ot h ea e r i a l i m a g e r ya n dr e m o t es e n s i n gi m a g e r y , t h e r ei ss t i l ln oc o m m o n l ya c c e p t e dm e t h o d t h e d i f f i c u l t i e sc o m en o to n l yf r o mt h ed i v e r s i t yo ft a r g e ta n dt h ec o m p l e x i t yo fs c e n e i t s e l f , b u ta l s of r o mt h ew e a kk n o w l e d g ea b o u tt h ep n n c i p l eo f h u m a nv i s u a lp e r c e p t i o n t h e r ea r et w ob a s i ci m a g er e c o g n i t i o ns t r a t e g i e s o n ei sp r o c e s s e df r o mb o t t o mt o t o p ,w h i c hi sc a l l e dd a t a - d r i v i n gm e t h o d ,t h i st r a d i t i o n a lm e t h o di sm o s to f t e nu s e di n c l u s t e r e do b j e e bs u c ha sa i r p l a n e ,w o r k p i e c e t h eo t h e ro n ei sp r o c e s s e df r o mt o pt o b o t t o m ,w h i c hi sc a l l e dk n o w l e d g e - d r i v i n gm e t h o d ,i ti sa l w a y su s e di nr e c o g n i z et h e t a r g e t ss u c ha sr u n w a ya n db r i d g ef r o mc o m p l e xs c e n e t h i st h e s i sa d o p t st h el a t t e r s t r a t e g ya n dr e s e a r c h e st h er e c o g n i t i o no ft h et a r g e t ss u c ha sr u n w a ya n db r i d g ea b o v e w a t e ri nd e t a i l t h ep r e s e n ta l g o r i t h m so fa i r p o r t - r u n w a ya n dw a t e r - b r i d g er e c o g n i t i o ni nv i s i b l e i m a g e ,i n f r a r e di m a g ea n ds a ri m a g ea r es u m m a r i z e di n t h i st h e s i s o nt h eb a s i so f p r e v i o u sr e s e a r c h ,t w oa l g o r i t h m so fa i r p o r t r u n w a ya n dw a t e r - b r i d g er e c o g n i t i o na r e p r e s e n t e di n t h i st h e s i s a l g o r i t h mo na i r p o r t - r u n w a yr e c o g n i t i o ni s b a s e do nl i n e a r f e a t u r ee x t r a c t i o n , t a k e st h em i d p o i n to ft h er u n w a yc e n t e rl i n ee x t r a c t e db yh o u g h t r a n s f o r m a t i o na ss e e d ,t h e ng r o w se n t i r ea i r p o r tr u n w a y t h ea l g o r i t h mo nw a t e r - b r i d g e r e c o g n i t i o ni sf o c u s e do nr e g i o nc h a r a c t e ra n a l y s i s ,f i r s te x t r a c t sr e g i o n a lr i v e r s ,t h e n e x t r a c t sb r i d g ei n r e g i o n a lr i v e r s e x p e r i m e n t ss h o wt h a t t h e s et w oa l g o r i t h m sa r e e f f e c t i v e k e y w o r d s :t a r g e t r e c o g n i f i o n k n o w l e d g e - d r i v i n g a i r p o r t - r u n w a y w a t e r - b r i d g e 声明 创新性声明 秉承学校严谨的学分和优良的科学道德,本人声明所呈交的论文是我个人 在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以 标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究 成果:也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过 的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的 说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名:岔峙日期竺12 :兰:f 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本学位论文属于保密,在年解密后适用本授权书。 本人签名: 导师签名: 贰言 ,二, 毫叠 日期 丝12 :兰:l 同期 第一章绪论 第一章绪论 1 1 选题背景和研究意义 目标识别系统是现阶段和未来武器系统的一个重要组成部分。在现代战争中, 如果能实时地识别机场跑道、桥梁、指挥所等军事目标,对掌握战场主动权和正 确确定打击目标、显著地提高未来指挥作战系统的性能,具有重要意义,是当代 军事领域研究的热点。 利用飞机或卫星等拍摄的图像来检测与识别地面目标,已经被广泛应用于国 防和经济建设以及环境保护与地球资源勘探中。如何从这些图像中自动获取有用 的信息一直是图像识别方面的重要课题之一。国内外科学工作者己经做了大量的 研究并取得了一些可喜的成果。进行这方面的研究的目的之一是为了推广其应用。 因此,寻找一条解决图像识别的途径来满足实用要求是很重要的。图像中的目标 可以分成两种类型:一种是自然目标即一些自然物;另一种足一些人造目标,比 如高楼、公路、大桥等。通常要寻找的是一些特定的目标,对于这类目标的识别 称为特定目标识别。 1 2 图像识别的现状和趋势 1 2 1 图像识别应用领域 目前,国内、国外已经把图像识别技术应用到很多领域,其中最典型的应用 有: ( 1 ) 光学信息处理上如光学文字识别,光学标记识别,光学图形识别,光谱能 量分析等。 ( 2 ) 医疗仪器上的样本检查分析,眼球运动检测,x 射线摄像,胃镜、肠镜摄 像等。 ( 3 ) 自动化仪器如自动售货机,自动搬运机,监视装置等。 ( 4 ) 在工业自动检测上如零件尺寸的动态检查,产品质量、包装、形状i p , n , 表面缺陷检测等。 ( 5 ) 军事上有卫星侦察,航空遥感,微光夜视,导弹制导,目标跟踪,军事图 像通信等,例如美国及一些国际组织发射了资源遥感卫星( 如l a n d s a t 系列) 和 2图像识别研究及应用 天空实验室( 如s k y l a b ) 。 ( 6 ) 人工智能方面有机器人视觉,无人自动驾驶,邮件自动分检,指纹识别, 人脸识别等,例如中科院计算所自主研制的“面像检测与识别核心技术”。 1 2 2 图像识别面临的问题 对于真实世界的图像识别的研究,面临着下面几个问题: ( 1 ) 大数据量的图像,一般来说,要取得较高的识别精度,原始图像应具有较 高的分辨率,至少应大于6 4 6 4 。 ( 2 ) 图像污损,由于目标环境的干扰、传感器的误差、噪声、背景干扰、变形 等会污损图像。 ( 3 ) 位移、旋转、尺度变化、扭曲不变性,和人类视觉系统样,目标和传感 器之问存在有位置的变化,因此,要求系统在目标产生位移、旋转、尺度变化、 扭曲时,仍然能够正确识别目标。 ( 4 ) 实时性,在军事领域的应用中,大都要求系统能够实时地识别目标,这就 要求系统有极快的处理速度和识别效率。 1 2 3 图像识别的发展阶段和趋势 图像识别的发展经历了三个阶段:文字识别、图像处理和识别、物体识别。 1 文字识别:一般是识别字母、数字和符号,从印刷文字识别到手写文字识别, 应用非常广泛,并且已经研制了许多专用设备。 2 图像处理和识别:过去人们主要是对照相技术、光学技术的研究,而现在则 是乖j 用计算技术,通过计算机来完成。计算机图像处理不但可以消除图像的失真、 噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别, 如航空照片的解析、遥感图像的处理与识别等。 3 物体识别:也就是对三维世界的认识,物体识别是和机器人的研究有着密切 关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必 须将环境模型化。在自动化技术己从体力劳动向部分智力劳动自动化发展的今天, 尽管机器人的研究非常盛行,但还只限于视觉能够观察到的场景。随着计算机和 信息科学的发展,计算机视觉、人工智能的研究已成为新的动向。 可以预期,图像识别将经历一个飞速发展的阶段。为深入人民生活创造新的 文化环境,成为提高生产的自动化、智能化水平的基础科学之一。图像识别的基 础性研究,特别是结合人工智能与视觉处理的新算法,从更高水平提取图像信息 的丰富内涌,与现实c 界直接联系的视觉和“形象思维”这一智能的模拟和复现, 第一章绪论 3 是一项艰难而重要的任务。 1 3 本文研究的主要内容 当前己有的研究表明,在任意的一幅图像中实现任意目标的全自动检测足一 个极其困难的任务,现阶段很难得到解决。人们早已认识到这一点,因此围绕着 不同的识别目标进行多种研究。基于此原因,本文着重讨论两类目标一机场跑道、 水上桥梁的识别。 这两类目标在军事上是比较典型的,同时也有很重要的军事价值,而且国内 外尤其是国内的研究不多,还有很多待完善之处。 本文先对国内外现有的关于机场跑道和水上桥梁识别的算法进行研究,并指 出其优缺点。然后结合已有的一些方法,针对可见光图像中的机场跑道和水上桥 梁的识别中的若干问题做了一些研究和改进,取得了一些有意义的结果。本文共 分为4 章。 第一章绪论。首先简要介绍了图像识别研究及应用的选题背景和研究意义, 然后分析了国内外的研究现况和趋势,最后指出了本文研究的主要内容。 第二章图像识别的基本原理和方法。首先介绍了图像识别的概念、基本原理、 识别策略和常用方法。最后给出了图像识别的具体步骤。 第三章机场跑道的识别研究。分类介绍了现有的可见光、红外、s a r 图像中 机场跑道的识别算法,并对其进行了分析,指出了其优缺点。详细介绍了本文提 出的机场跑道识别算法:首先对原始图像进行预处理、二值化;然后用i l o u g h 变换 提取机场跑道的中线,求出中点;最后以中点为种子点生长出整个机场跑道。实 验结果证明了该算法是一种较好的机场跑道识别算法。 第四章水上桥梁的识别研究。分类介绍了现有的可见光、红外、s a i 图像中 水上桥梁的识别算法,并对其进行了分析,指出了其优缺点。详细介绍了本文提 出的水上桥梁识别算法:首先对原始图像进行二值化;然后利用河流面积比较大、 灰度均匀、与陆地的桥梁的灰度相差较大的特点,提取出河流区域;最后在河流 区域中提取出桥梁。实验结果证明了该算法是一种较好的水上桥梁识别算法。 本文最后对所作的工作进行了总结,指出了本文研究的不足之处,提出了下 一步改进的建议。 第二章图像识别的基本暇理和7 法 5 第二章图像识别的基本原理和方法 2 1 模式识别的概念 广义地说,“模式”是指人所生活的客观世界的总称。人生活在客观【鲢= 界中, 为了改造客观世界,首先必须认识模式,这就是对模式的识别。人通过感觉器官 从外界取得信息,然后通过思维建立对客观世界的真正认识。而在人工智能或信 息科学范畴内,模式与模式识别就赋予了新的说法。一个模式类是由一些给定的 共同属性所决定的一个类别,该类别中的一个成员就是一个模式。所谓模式识别 也就是对研究的对象依据其共有特征或者属性进行识别与分类。 所以,模式识别问题所研究的主要内容可以分成两大类: ( 1 ) 对人类和其它生物的识别能力的研究,这方面的课题属于生物学、心理学、 生理学的范畴。 ( 2 ) 为满足某些应用的识别装置的设计理论和技术的研究,这一类课题属于工 程学、计算机科学、应用数学范畴。 本文所讨论的内容是信息领域的模式识别,而且主要是以图像为对蒙的模式 识别,因此在所讨论的范围内可以对模式及模式识别作以下定义: 模式( p a t t e r n ) :是对某些感兴趣的客体的定量的或结构的描述;模式类则是 具有某些共同特征的模式的集合。 模式识别( p a t t e r nr e c o g n i t i o n ) :是研究一种自动技术,依靠这种技术,机器 将自动地把识别模式分到各自的模式类中去。 2 2 图像识别的一般策略和关键技术 2 2 1 图像识别的一般策略 目前常用的图像识别策略有两种【i i :一种称为由下而上的数据驱动型策略,另 一种称为由上而下的知识( 假设) 驱动型策略。前者不管识别目标属于何利,类型, 一律先对原始图像进行一般性的分割、标记和特征抽取等低层处理,然后将每个 带标记的已分割区域( 物体) 的特征矢量集和目标模型相匹配。目标识别过程包括 低层处理和高层匹配、解释等两个互不相关的过程。这种方式的优点是适用面广, 对单目标识别及复杂景物分析系统均适用,具有较强的代换性。缺点是在分割、 6 图像识别研究及应用 标记、特征抽取等低层处理过程中缺乏知识指导,盲目性大,故工作量大,匹配 算法比较繁复。而后者,需要对待识别目标有一定的了解,须先对目标在图像中 可能存在的特征提出假 殳,再根据假设,有目的地在图像中进行分割、标记和特 征提取等处理。在此基础上和目标模型进行精匹配。由于其低层处理是在知识指 导下的粗匹配过程,可避免抽取过多不必要的特征集,因而提高了算法的效率, 其精匹配过程也因目标区域的缩小而变得简单和有针对性。但知识( 假设) 驱动型 策略的缺点是代换性和兼容性差,即待识别目标改变,相应的知识、模型和假设 也要随之而变。 2 2 2 目标识别的关键技术嘲 采用由上而下的知识驱动型策略,在大范围的包含复杂背景的图像上快速地 检测和识别目标需要强调以下几点: ( 1 ) 目标知识表达模型的建立。 对图像进行目标自动识别,首先要对目标和背景特征有一合理描述,因为图 像背景复杂,背景区域和目标区域常具有极高的相似度。为此,必须建立正确的 目标模型,这是精确检测和识别目标的根本,也是采用由上而下知识驱动策略的 方法进行目标识别的难点之一。为了建立合理准确的表达模型,要针对具体目标, 询问专家和查阅大量文献,充分分析和挖掘目标的内在特征,建立合适、完善的 知i ; 库,形成准确、全面的目标判定规则,这一工作是指导和控制目标检测以及 识别的整个过程的关键任务之一。 ( 2 ) 合适实用的图像分割算法的设计。 图像分割是目标检测和识别的基础工作。虽然目前在众多的文献中已提出数 以千计的分割算法,但在实际应用中,由于背景和目标图像的复杂性,目前还没 有一种方法是普遍适用的。特定的分割算法只能适用于特定的应用范围。因此针 对具体问题,选择和研究合适的分割策略和算法是一项非常重要的工作。 ( 3 ) 目标特征匹配和推理模型的建立。 目标特征的匹配和推理是最后验证图像中目标真实性假设的依据。由于原始 图像覆盖地面范围广、包含背景复杂,而目标图像只占其中很小的一部分,要在 整个一幅图像上进行精匹配,无疑会大大增加匹配的时间,效率极低。为改善这 一问题,需要首先根据目标的结构特征,在粗分辨率图像上提取出区域信息,与 目标特征进行粗匹配,确定目标的存在及其可能区域,然后在包含这些可能区域 的小窗口,根据目标的细节特征再进行精确匹配和推理,这样可以大大提高匹配 的效率,达到快速检测和识别目标的需求。 第二章图像识别的基本原理和方法 2 3 1 统计模式识别法 2 3 图像识别的方法 许多人认为,当今自动目标识别算法的源头是统计模式识别算法。统计判断 与估计理论是所有目标识别算法的根本性基础。其目的是从信号域中抽取感兴趣 的部分,并把这些候选部分同一些预先存储的有关物体或目标的模型相比较。 统计模式识别使用的是统计的和与结构有关的知识和方法。该方法基于以下 假设:同类物体的特征聚集于多维特征空间的同一区域,而不同种类的物体的特 征位于特征空间的不同区域。并且这些区域易于区分。其具体实现过程如下:由 于待识别图像中目标、背景的灰度分布不同,从而明暗程度各异,因此通过计算 图像中每个候选检测区的亮度来检测兴趣区。找到目标的潜在区域后,通过提取 图像的统计特征,在特征空间中聚类,并将每类所对应的特征度量与系统已存储 的各种具体目标类型的特征度量比较,选择最接近的为待识别图像e l 标的类型。 统计模式识别方法完全依赖于目标系统大量的训练和基于模式空j 距离度量 的特征匹配分类技术,对样本的选取及样本数量较为敏感,而且统计模式识别算 法难以有效处理诸如复杂背景、高噪声环境、部分遮挡、姿态变化等情形的目标 识别和跟踪任务,也不具有学习并适应动态环境中的智能和推理能力。因此,大 多数成功的应用只局限于很窄的场景定义域内。 2 3 2 模板匹配识别法 模板匹配算法可以通过直接在图像上变换完全二值化或多灰度的目标模板或 场景模板,计算模板和图像的互相关,找出最大的互相关函数响应,来完成识别 过程。对于上述处理,既可以在原始域进行,也可在变换域中进行。 模板匹配算法存在模板及相关匹配阈值的选择问题,且受噪声、目标旋转和 尺度变化的影响较大,只适用于理想情况,或者与其它方法结合使用。 2 3 3 模型识别法 基于模型的算法是通过对待识别图像形成假设并试图验证候选假设来进行 的。顶层假设是在没有作出具体的目标假设的基础上开始特征和证据的提取。随 后将己提取的特征和假设结合,触发目标假设的形成。接着从目标假设中产生二 级假设,二级假设反过来又去预测图像中的某些特征,然后推理机制试图通过与 8 图像识别研究及应用 随后提取的图像特征进行匹配来验证预测结果。这样,从下一层假设中得到的推 论性证据用于更新和修改目标假设,然后启动另外一轮的下一层假设和验证,循 环往复直到最终识别出目标。又有人把基于模型的算法泛称为基于知识的方法。 基于模型( 知识) 的方法利用人工智能技术,具有规划、推理和学习能力,在 一定程度上克服了统计和模板匹配的缺陷。但是目前对自动识别领域各种知识的 认识程度和利用程度十分有限,还需要进行以下几个问题的深入研究:知识源 的开发、辨别和利用;知识的验证:知识在适应场景变化时的有效组织和处 理:知识规则的明确表达和理解。另外,大知识库的构造、空间时问推理和 层次稳健推理等都是基于模型( 知识) 的自动识别方法研究的关键问题。 2 3 ,4 句法识别法 句法模式识别是依靠模式的结构信息,利用形式语言理论进行分类。基本思 路是:分析模式的结构,把复杂的模式看成是由简单的子模式所组成,把最简单的 子模式作为基元,从基元的集合出发,按一定的构成规则去描述较复杂的图像。 基元与基元之问的连接规则称为文法。对洲练模式样本构造文法的过程为造句。 识别一个模式是不是某文法规定的那一类图像,就是分析该模式,看是否能从基 元按该文法生成这个模式。所以句法模式识别的过程是首先将模式分割成子模式 并且选取适当的基元,然后按模式中各部分的结构关系把该图像变换成基元表示 的字链,或高维文法中基元表示的树状结构或关系图。最后通过语法分析判决代 表模式的基元字链、树或关系图是不是某一个文法所生成的,属不属于该文法所 代表的模式类别。 图2 1 句法分析的图像识别系统框图 第二章图像识别的基奉原理和方法 9 图2 1 是句法分析的图像识别系统框图,其中上半部分是识别部分,下半部 分是分析部分。在分析部分中,用一些已知结构信息的图像作为训练样本,来构 造出一些文法规则,再用这些文法对未知结构信息的图像所表示的句子来进行句 法分析。如果能够被已知结构信息的文法分析出来,那么这个未知图像也有这样 的结构信息,否则,该未知图像就不是具有这种结构信息的图像。 2 3 5 神经网络识别法 神经网络方法是指用神经网络的算法对图像进行识别的方法,神经网络系统 是由大量简单的处理单元( 神经元) 广泛地相互连接而形成的复杂网络系统,是人 脑神经网络系统的简化、抽象和模拟,侧重于模拟和实现人的认知过程中的感知 过程、形象思维、分布式记忆和自学习自组织过程,特别适用于处理需要同时考 虑许多因素和条件的、不精确和模糊的信息处理问题。 2 3 6 模糊集识别法 模糊集识别法在模式识别、自动控制等许多方面已有较为广泛的应用。在图 像识别中,有些问题极为复杂,很难用一些确定的标准做出判断。模糊集识别方 法的理论基础是模糊数学,模糊数学把事物特征判别的二值逻辑转向连续值逻辑, 用不太精确的方式来描述复杂系统,更接近于人类大脑的模拟式思维活动。基于 模糊集理论的识别方法有:最大隶属原则识别法,择近原则识别法和模糊聚类法。 2 3 7 识别方法小结 值得注意的是,严格按照理论定义开发的算法,不论是统计模式识别、模板 相关匹配算法、基于模型( 知识) 的算法,还是句法模式识别、基于人工神经网络 的模式识别、基于模糊集的模式识别都尚未达到实用化,还有许多关键的技术问 题亟需解决。所谓“具体问题具体分析”,真正有实用价值的自动目标识别算法, 都要靠实践经验、以及对目标、背景等场景表现出的图像特征进行深刻理解和分 析才能获取。由于自动识别问题本身的复杂性,以及待识别目标的多样性,自动 识别的研究任务仍然非常艰巨。 2 4 图像识别的步骤 一般来说与不同的识别方法所对应的识别步骤也是不同的,常用的基于统计 1 0 图像识别研究及应用 模式识别方法的识别步骤主要由以下五个部分组成:预处理、图像分割、特征提取、 特征选择、分类决策。 2 4 1 图像预处理 图像预处理是数字化图像处理的一个重要环节,主要包括图像的增强和复原。 图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度 等。 图像增强技术是通常不考虑图像降质的原因,只将图像中感兴趣的特征有选 择地突出,而衰减其不需要的特征,故改善后的图像不一定要去逼近原图像。如 突出目标物的轮廓,去除各类噪声,将黑白图像转换为彩色图像等等。从图像质 量评价观点来看,图像增强的主要目的是提高图像的可懂度。图像增强技术有两 类方法:空域法和频域法。空域法主要在空域内对像素灰度值直接运算处理,如图 像灰度变换、直方图修正、图像空域平滑和锐化处理、伪彩色处理等。图像增强 的频域法就是在图像的某种变换域内,对图像的变换值进行运算。如先对图像进 行傅立时变换,然后在频域内进行滤波处理,最后将滤波处理后的图像交换值反 变换到空域中,从而获得增强后的图像。 图像复原技术与增强技术不同,需要了解图像降质的原因,一般要根据图像 降质过程的某些先验知识,建立“降质模型”,再用降质模型,按照某种处理方法, 恢复或重建原来的图像。一般地讲,显然复原的好坏应有一个客观标准,以便能 对复原的结果做出某种判断。图像复原技术的目的是提高图像质量的逼真度。 2 4 2 图像分割 图像分割是图像处理中的关键问题之一,也是计算机视觉领域低层次视觉中 的一个重要问题,同时又是一个经典难题。 图像分割的基本概念是将图像中具有特殊涵义的不同区域区分开来,这些区 域是不相交的,每一个区域都满足特定区域的一致性。 目前,己经提出的图像分割方法很多。从不同的分割依据出发,大致可分为 相似性分割( 也称为基于区域相关的分割技术) 和非连续性分割( t g 称为基于点相 关的分割技术) 。从分割算法来分,有域值法、界限探测法、匹配法等。近年来还 出现了一些新的边缘检测方法,如m a r t 边缘检测方法、应用小波变换的多尺度边 缘检测方法,模糊边缘检测方法等。 第二章幽像识别的基本原理和方法 2 4 3 图像特征提取 由于目标的多样性及复杂性,寻找具有良好描述和分类性能的图像特征就成 为解决图像识别问题的一个关键。 目前,用于图像识别的特征大概可归纳为如下四种: ( 1 ) 灰度的直观特征:例如图像中的边缘、轮廓、纹理和区域等,这些都属于 图像灰度特征。 ( 2 ) 灰度的统计特征:例如图像的灰度直方图特征。若将图像看作是一种二维 随机过程,引入其各阶矩作为特征是普遍采用的方法。如h u 的7 个不变矩、z e r n i k e 矩等。在矩的诸性质中,几何不变性对图像识别最为有用。 ( 3 ) 变换系数特征。对图像进行各种数学变换,可以将变换的系数作为图像的 一种特征。例如傅里叶描绘予对于物体轮廓有较好的描述能力。 ( 4 ) 代数特征。代数特征反映的是图像的一种内在属性。由于图像可以表示为 矩阵形式,因此可以对其进行各种代数变换,或者作各种矩阵分解。众所周知的 k - l 变换,实际上就是以协方差矩阵的本征矢量为空间基底的一种代数特征抽取。 由于矩阵的本征矢量反映了矩阵的一种代数属性,并且具有几何不变性,因此可 以用作图像特征。 如果要建立一个识别不同种类对象的系统,首先必须确定应测量对象的哪些 特性以产生描述参数。被度量的这些特珠的属性称为对象的特征,而所得的参数 值组成了每个对象的特征向量。适当地提取特征是很重要的,因为在、j ! 别对象时 特征是唯一的依据。 良好的特任应具有5 个特点。 ( 1 ) 可区别性:对于属于不同类别的对象来说,特征值应具有明显的差异。 ( 2 ) 可靠性:对同类的对象特征值应比较接近。 ( 3 ) 独立性:所用的各特征之间应彼此不相关。 ( 4 ) 不变性:特征不会因图像的平移、旋转等改变。 ( 5 ) 数量少:模式识别系统复杂度随系统的维数( 特征的个数) 迅速增长。尤为 重要的是用来训练分类器和测试结果的样本数量随特征的数量呈指数关系增长。 在某些情况下,甚至无法取得足够的样本训练分类器。总之,增加带噪声的特征 或与现存特征相关性高的特征实际上会使分类器的分类能力下降。特别是在训练 集大小有限的情况下。 图像识别研究及应用 2 4 4 图像特征选择 在模式识别问题中,经常面邻的一个问题是:从许多可能的特征中选择一些 付诸于度量并呈现给分类器的特征。几乎没有解析方法能够指导特征的选取。很 多情况下凭知觉的引导列出一些可能有用的特征表,然后用特征排序方法计算不 同的特征的相对效率。利用其结果对表进行删减,从而选出若干最好的特征。 如2 4 3 节所述,所要选取的特征应当是具有可区别性、可靠性、独立性、不 变性好的少量特征。一般而论,如果特征是有用的话,则当排除该特征后,分类 器的性能至少要下降。而实际上去掉噪声大的或相关程度高的特征反面能改善分 类器的性能。 因此,特征选则可以看作是一个( 从最差的开始) 不断删去无用的特征和组合 有关联的特征的过程,直至特征的数目减少到易于驾驭的程度,同时分类器的性 能仍然满足要求为止。例如,从一个其有m 个特征的特征集中挑选出较少的n 个 特征时,要使采用这n 个特征的分类器的性能最好。 一种特征选择方法是这样执行的:对每一种可能的由n 个特征组合的子集训 练分类器。然后用各个类别的测试样本进行测试,统计分类器的错分率。然后跟 据这些错分率计算分类器总的性能指标。作为一个例予,可以用错误概率的线性 求和,其权重取决于错误的严重性。最后,选择一组具有最佳性能指标的n 个特 征。 除了一些非常简单的模式识别问题外,使用这种方法的最大问题自然是计算 量最大。在实践中往住只能得到足够作一次训练和评价分类器往能的资源,因此 在多数实际问题中这种方法是不实用,必需使用一种开销较小的方案以达到同样 的目标。 2 4 4 1p c a ( p r i n c i p a lc o m p o n e n ta n a l y s j s ) 算法 p c a 是统计学中分析数据的一种有效的方法,是基于k l 分解的。其目的是在 数据空间中找一组向量以尽可能地解释数据的方差,通过一个特殊的向量矩阵, 将数据从原来的高维空间投影到一个低维的向量空间中,降维后保存了数据的主 要信息,从而使数据更易于处理。 将第k 幅样本的灰度图像表示成向量x k = x k l ,x k 2 ,# k l n 】1 的形式,其中m 为图 像的像素数。首先,计算n 。个样本的平均值j , 一 1 且 x = 音五 ( 2 1 ) 第二章图像识别的基本原理和方法 1 3 然后求出向量的协方差矩阵c c :百1 芝n ( 置一j ) ( 以一j ) r ( 2 - 2 ) c 2 可萎( 置一j ) ( 以一j ) 7 c 为对称矩阵,可进行对角化,维数为m x m 。计算c 的特征值九l 九,k 和 对应的特征向量u l u 2 ,u m ,这些特征向量就足图像的讵交基底。用这些特征向量 的线性组合可以重构得到n 个样本中任意的图像。特征向量所对应的特征值越大, 在重构时的贡献也越大,所以对那些特征值很小的特征向量,可以忽略。设 九1 2 九之魏。,考虑九l ,如,a 。中前m 个最大的特征值,定义方差贡献率为 妒( 肘) = 丑 ( 2 3 ) i = li = l 当方差贡献率妒( m ) 足够大( 比如达到7 0 、8 0 或9 0 等) ,即可将前m 个特征 向量u l ,u 2 ,u m 构成的空问作为低维投影空间( m 0 ( 3 ) 确定性集合x 中只要有一个必然事件,其熵值必为零。 ( 4 ) 极值性集合x 中各事件以等概率出现时,其熵值为最大,即有 h ( p l ,p 2 ,p 。) h ( 1 n ,1 n ,1 n ) = l o g a n ( 2 - 6 ) 熵值越小,不同类别的分离程度越大。从特征提取的角度看,显然用具有最 小不确定性的那些特征,即熵值最小的特征进行分类是有利的。 熵值分析法就是利用不确定性来选择有效特征的一种方法,使用这种方法时, 不必知道特征量的具体大小及其分布细节。 对于有m 类模式的识别问题,设初步提取到的特征参数共有1 3 个。对每一个 1 4 图像识别研究及应用 特征f j ( j 2 1 ,2 ,n ) ,将其分为相等的n 段,记为门( k = 1 ,2 ,n ) 。若以为一 个有f j 的样本被判为i 类的概率,则有 础= n p ( 2 - 7 ) 式中n i n 为有f i e 的样本数:砖为:。中属于第i 类的样本数,于是有 = 皑1 ( 2 8 ) i f f i l 又设矗 为一个样本有f j d 的概率,则 馥1 = n p f n ql 式中n 0 为总的样本数,即0 = 磁 ( 2 - 1 0 ) k = l 定义特征f j 的熵( f ) = 反7 l 0 9 2 p o 一 ( 2 1 1 ) 根据熵函数的性质,熵值h ( f j ) 越小,各类模式在特征f j 上的类间分离性越大, 则特征f j 对分类的贡献越大。如果有f j 的所有样本都属于同一类,则有 h ( f j ) = 0 ,在这种情况下,用这一特征f j 就可以实现分类。实际的模式识别问题一 般不会这么简单,因此需要选择熵值小的若干个特征进行分类识别。 2 4 4 3 粗糙集理论 1 机糙集的几个重要概念 信息系统一个信息系统是一个四元组s = ( u ,凡v ,f ) 。其中u = x i ,x 2 k ) 是论域,a 是属性集合,a = c u d ( 其中c 是条件属性,d 是决策属性,且满足 c a d = g ,d 一般只有一个属性) 。v 是属性值的集合,f 是信息函数, f :u 4 寸v ,厂( t ,a i ) 一。对每一个x u ,q a ,有f ( x ,q ) 。具有条件属性和 决策属性的信息系统可表达为决策表,记为t = ( u ,a ,c ,d ) 。 约简设r 是一个等价关系族,r e r ,如果t n d ( r ) = t n d ( r - r ) ,则称r 在r 中是可被约去的知识;如果p = r f 是独立的,则p 是r 中的一个约简。一 个属性集的约简可能有多个,r e d ( p ) 表示r 的所有约简的集合。 粗糙集的核( c o r e )核是所有属性的公共部分,c o r e ( c ,d ) = f i r e d ( p ) 。核在 约简中起到了提高精度与加快速度的作用。 不可分辨关系设属性集p c a ,对象x ,y u ,对于每个a e p ,当且仅当 f ( x ,a ) = l ( y a ) 时,x 和y 是不可分辨的,定义如下: 第二章图像识别的基奉原理和方法 i n a ( p ) = ( j ,y ) u :v a p f f ( ,口) = 厂( r ,口)( 2 一1 2 ) 分辨矩阵分辨矩阵m 的任一元素为 白= a l a e c f ( a , x , ) f ( a 嬲一堙坝一 白2 砌( p ) 。 u 。1 3 j 其中,i , j = l ,2 ,n 。直观地解释为:分辩矩阵的行和列都是对象,矩阵中的每一 项都是属性的集合,是由那些能区分个体,x ,的属性组成。 2 基于粗糙集的特征选择方法 基于特征集合a 的分辨矩阵,可以构造一个新的信息系统s ,信息系统s 的 构成为 论域:u 。= ( ,x j ) u u :d ( 一) d ( x j ) ) 决策特征:d :u 一 l 条件特征集a 中的特征与a 中的特征一一对应,但特征的取值发生了变化。 在新的信息系统中,对于每一个条件特征a a ,特征a 的取值为 a f = ,口饥) 口 v ( 而,x j ) u ( 2 - 1 4 ) 垤e l s e 按照以上过程,可以构造一个新的信息系统。特征选择的目的足选择那些能 尽可能多的划分不同类样本的特征。特征值取1 的数目越多,则说明该特征所能 划分的不同类的样本对的数目越多,即该特征的分类能力越强。基于这一思想, 提出一种简单的特征选择方法,即首先选择信息系统s 。中特征值为1 的个数最多 的特征作为首选特征,设为a ,然后将被特征a 划分的样本从【,。中册除,将特征a 也从特征集合4 中册除,将剩余特征作为新的信息系统的特征集合,剩余样本对 作为新的信息系统的论域,重复以上选择过程,直到论城u 为空集为止。 由核心的定义可知,核心中的特征对于决策特征足不可缺少的,因此可以先 计算特征集合的核心,以核心为起点,使用该选择方法对剩余特征进一步选择。 由新的信息系统s 。可以很方便的计算特征集合的核心。由定义可知,若两个不同 类样本仅能被一个条件特征划分,则该特征为核心中的特征,由这些特征构成的 集合即为条件特征集的核心。该特征选择算法的计算过程如下: 特征选择过程: ( 1 ) f e a = ( 2 ) 由信息系统s 构造信息系统s = ( u ,a u d :y 。 ( 3 ) 在s 中,找出两个不同类样本仅能被一个条件特征划分的特征,山这些特 征构成的集合既是特征集合爿的核心c o r e ( a ) 。 ( 4 ) 对于核心c o r e ( a ,) 中的每一个特征,从论域u 中删除1 所对应的样本对。 图像识别研究及应朋 ( 5 ) 从特征集合a 中删除核心c o r e ( 4 ) ,a = a 一c o r e ( a ) ( 6 ) 当( ,不为空集时 在s7 中找出特征值为i 的个数最多的特征a f e a = f e a u a 从论域u 中删除特征a 的取值为1 的样本对,= 一- 口 ( 7 ) 输出所选特征c o r e ( a ) u 砌。 2 4 5 图像识别分类咖 2 4 5 1 分类器的设计 分类器的设计包括建立分类器的逻辑结构和分类规则的数学基础。通常对每 一个所遇到的对象,分类器计算出表示该对象与每类典型之间的相似程度。这个 值是该对象特征的一个函数,用来确定该对象属于哪一类。 大多数分类器的分类规则都转化成阈值规则,将测量空间划分成互不重叠的 区域。每一个类对应一个( 或多个) 区域。如果特征值落在某一个区域中,就将该 对象归入对应的类别中。在某些情况下,某些区域对应于无法确定的一类。 2 4 5 2 分类器的训练 一旦分类器的基本决策规则确定以后,需要确定划分类别的阈值。一般的做 法是用一组己知的对象来训练分类器。训练集是由每个类别中已被正确识别的一 部分对象组成的。对这些对象进行度量,并将度量空间用决策面划分成不同的区 域,使得对训练样本集的分类准确性最高。 当训练分类器时,可以使用简单的规则,诸如将分类错误的总量降低至最小 值。如果希望某些错误分类要少于其它的错误分类,可以借助于使用损失函数, 对不同的错误分类采用适当的加权。决策规则则变为使分类器操作的整个“风险” 达到最低。 如果一个训练样本集代表了对象集的总体分布。那么分类器对新的对象操作 的性能就和对训练样本集一样。然而要获取足够大的样本集经常是比较困难的 为了使样本集成为具有代表性的,必须包括可能遇到的各种类型对象的例子,包 括一些很少见的时象。如果样本集未包含某些不常见的对象,那么该样本集就不 具有代表性了。 第二章图像识别的摹奉原理和方法 2 4 5 3 分类器性能的测量 分类器的准确率可以通过直接对一组已知类别的对象的测试集进行分类的结 果进行估计。如果该测试集大到对对象总体具有代表性并且没有错误,则所得到 的性能估计是很有用的。 另一种估计性能的方法是使用一组己知对象的测试集,估算每一类别中对象 特征的p d f ( p r o b a b l i t yd e n s i t yf u n c t i o n ) 。给出了相应的p d f 后,就可以根距 分类参数来估算期望错误率了。如果p d f 的一般形式已知,这种方法比使用数量有 限或不足的测试集计算的方法要好。 直观上觉得可以直接用对训练集的分类性能来评价分类器的整体性能。但这 种估计通常是偏于乐观的。较好的方法是使用一个独立的测试集来评价分类器的 性能,但这种方法无疑增大了需要预先分类的数据。 如果预先分类的对象代价很高的话,可以使用循环的方法对分类器整体性能 进行估计:以每一个对象为测试对象,而数据集中的其它对象作为训练样本训练 分类器,并进行测试。当循环结束时,就可以得到分类器整体性能的估计。 2 4 5 4 分类识别 将从目标对象中提取到的特征输入分类器。计算出表示该目标对象与每类典 型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 七年级语文上册 第六单元 12童区寄传教学设计 北师大版
- 人教版地理八上第一章第2节《人口》教学设计
- 人教版三年级音乐下册(简谱)《可爱的家》教学设计
- 九年级数学下册 第二章 二次函数2 二次函数的图象与性质第2课时 二次函数y=ax2+c的图象与性质教学设计 (新版)北师大版
- 九年级物理下册 第十六章 电磁转换 五 电磁感应 发电机教学设计 (新版)苏科版
- 人教A版 (2019)选择性必修 第一册1.2 空间向量基本定理教案设计
- 三年级英语上册 Unit 6 Happy birthday Part A 第三课时教学设计 人教PEP
- 九年级化学上册 第六单元 碳和碳的氧化物 课题1 金刚石、石墨和C60教学设计(新版)新人教版
- 人教版七年级下册历史(2016新编版)第2课《从“贞观之治”到“开元盛世”》教学设计
- 六年级下册有趣的平衡教案及反思
- CJJ-T 34-2022 城镇供热管网设计标准
- 流体力学(刘鹤年) 全集通用课件
- 配偶户口调京央属企事业单位有关规定
- 机动车检验员现场操作考核表.docx
- 剑桥国际少儿英语KB2--测试题
- 湘潭电信校园团队执行手册
- 《多媒体技术与应用》课程教学大纲
- SJG 68-2019 人行地下通道设计标准
- 品牌CIS导入报价表高端品牌文化理念加设计
- 商业楼工程量清单完整版
- “日、四”笔画问题新解
评论
0/150
提交评论