版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于聚类的智能图像分析算法毕业设计论文基于聚类的智能图像分析算法摘要智能图像处理技术在众多领域得到了广泛应用。在具有监控、报警等功能的安防系 统中,在自然基因显微系统中,在模式识别系统中等,智能图像处理技术都起到了不可 小觑的作用。目前基于内容的智能图像识别与分类技术在准确性具体应用方面还面临着许多难 题。本文通过介绍智能图像分析方法及相关算法理论,重点研究以SVM算法为代表的监督分类算法及以k-means聚类算法为代表的费监督分类算法,并结合 Hu图像矩不变 特征,对图像进行聚类分析及分类。在理论学习的基础上,运用MatLab实现算法并验证应用效果。有监督分类方面,本文采用了提取能够较好的保
2、持图像的边缘、形状等特性的Hu矩不变特征作为训练特征,分类方法采用了基于聚类的SVM算法。在提取出训练样本的特征值后,将其输入SVM的训练网络进行训练。最后将待分类图片输入即可得到分 类结果。本文计算出了该非监督分类方式分类结果的准确性,并对其进行了分析与讨论。无监督分类方面,本文采用了 k-mea ns分类方法。预先设定好分类的类别数后,输 入待分类图片,则系统通过调用分类函数,将自动分类的结果输出。在算法研究的基础上,设计并实现了水果图像智能分析应用系统,具有创建特征值 数据库、创建训练网络、图像有监督分类和图像无监督分类等功能。当进行图像有监督 分类,即SVM算发分类时,准确率可达到将近
3、 70%。关键词 SVM k-means图像分类Intelligent Image Analysis Based on Clustering AlgorithmABSTRACTIn tellige nt image process ing tech no logy has bee n widely applied in many fields. In mon itori ng and alarm security system, in n atural gene microscope, and in the middle pattern recog niti on system, in tel
4、lige nt image process ing tech no logy has played highly importa nt role.Curre ntly conten t-based image recog niti on and classificati on of in tellige nt tech no logy are facing many problems in specific application for accuracy. This paper will describes in tellige nt image an alysis method and a
5、lgorithm theory, mea nwhile comb ines with the same characteristics of HU image mome nts, and focuses on the SVM algorithm for classificati on and supervisi on of represe ntatives of the costs of supervised classificati on algorithms. In the theoretical study, verify the applicati on of results base
6、d on the use of MatLab algorithm.In the phase of supervis ing classificati on, this paper used Hu mome nts in varia nt feature as a trai ning feature that can keep the extracted image edge, shape and other characteristics using SVM-based clustering algorithm. After extracting samples characteristic
7、value, put into SVMs trai ning n etwork to have trai ning. Fi nally the in put image can be classified by the classification results. This paper concludes the approach to the classification of non-supervised classificatio n accuracy of the results mean while an alyzes and discussesthe accuracy.This
8、paper used K-me nas classificatio n method in the field of un supervised classificati on. After pre-configuring data, put into classified image, and then by calling the classification fun cti on, the system will output the results of automatic classificati on.Based on algorithm, design and implement
9、ation of fruit intelligent image analysis applicati on system with a characteristic value database,trai ning n etwork, image supervised classificati on and image un supervised classificati on features. Whe n the image has supervised classificatio n, the SVM classificati on count classificati on, the
10、 accuracy rate can reach n early 70%.KEY WORDS SVM k-means Image classification II目录 TOC o 1-5 h z HYPERLINK l bookmark6 o Current Document 第一章 绪论 1 HYPERLINK l bookmark8 o Current Document 1.1 智能图像分析概述 11.1.1 课题背景 11.1.2 国内外研究现状 2 HYPERLINK l bookmark10 o Current Document 聚类分析 3 HYPERLINK l bookmar
11、k12 o Current Document 课题目标及本文研究内容 31.3.1预期目标 3主要研究内容 31.3.3系统方案 41.3.4本文的结构 4 HYPERLINK l bookmark14 o Current Document 第二章 技术基础 5图像特征 52.2图像分类方法 5图像分类概念 5图像分类原理 6图像分类方法 6 HYPERLINK l bookmark16 o Current Document MatLab 及图像智能处理工具箱 7 HYPERLINK l bookmark18 o Current Document 第三章 图像矩不变特征提取 9 HYPERLI
12、NK l bookmark20 o Current Document 3.1图像矩不变特征介绍 11 HYPERLINK l bookmark22 o Current Document 3.2图像矩不变特征提取 12 HYPERLINK l bookmark24 o Current Document 第四章 分类算法 144.1SVM 分类算法 14k-mea ns 分类算法16 HYPERLINK l bookmark26 o Current Document 第五章 基于 MatLab 的图像分析软件实现 19 HYPERLINK l bookmark28 o Current Docume
13、nt 5.1软件功能及系统流程 19 HYPERLINK l bookmark30 o Current Document 关键函数详述 195.2.1图像灰度化 195.2.2图像平滑与图像锐化 205.2.2.1中值滤波 205.2.2.2图像锐化 215.2.3 Hu 矩不变特征值 215.2.4 SVM 神经网络的建立和训练 22525 k-mea ns 分类函数24 HYPERLINK l bookmark36 o Current Document 第六章 系统测试 26 HYPERLINK l bookmark38 o Current Document 6.1 系统界面 26 HYP
14、ERLINK l bookmark40 o Current Document 6.2 功能测试及统计 306.2.1 训练样本 306.2.2 结果与分析 30 HYPERLINK l bookmark42 o Current Document 第七章 结论与展望 33 HYPERLINK l bookmark44 o Current Document 结果与结论 33 HYPERLINK l bookmark46 o Current Document 问题与展望 33 HYPERLINK l bookmark48 o Current Document 7.3心得体会 33 HYPERLINK
15、 l bookmark50 o Current Document 参考文献 35致 谢 36北京邮电大学本科毕业设计(论文) 第一章绪论1.1智能图像分析概述随着我国人民生活水平的提高,数码相机、DV机等摄影器材得到了极大范围的普 及,数字图像的数量也在飞速增长,同时,互联网的普及使得人们对于图像检索的需求 大大增加。近年来,为了满足人们日益增长的生活、学习、工作、娱乐等各方面的需要 数字图书馆中储存了数以万计的图像。图像处理技术从一开始就是一个基于线性代数、统计理论和物理学之上,具有很强 理论背景的研究领域,它需要广泛的基础知识,包括计算机科学、数字信号处理、随机 过程和统计数学、矩阵分析、
16、信息论、控制论和最优化理论等。同时,图像处理又是一 门与应用紧密结合的学科,应用领域涉及计算机视觉、地理、气象、航空航天、医疗保 健、刑事侦查等。1.1.1 课题背景在20世纪初,运用机器来处理图片是一件非常困难的事。但随着计算机硬件、图 像获取设备、显示设备的不断改进和各种高性能能工作站的出现,图像处理技术迅猛发 展。而信息时代的到来,又无疑使图像处理技术进入了一个更加蓬勃发展的阶段,特别 是以多媒体技术、通信技术、信息存储技术和以In ternet为代表的计算机网络技术的加速发展以及高清晰度电视的深入应用研究,图像处理技术研究和应用前景更为广阔。数字图像处理所涉及的知识非常广泛,具体的研究
17、方法种类繁多。传统的图像处理 技术主要集中在图像的获取、变换、增强、恢复(还原)、压缩编码、分割与边缘提取等方面,并且随着新工具、新方法的不断出现,这些图像处理技术也一直在更新与发展。 近十多年来,随着信息技术的发展,图像特征分析、图像配准、图像融合、图像分类、 图像识别、基于内容的图像检索与图像数字水印等领域取得长足的进展。这些图像处理 技术反映了人类的智力活动,它在计算机上模仿、延伸和扩展了人的智能,具有智能化 处理功能,因而称之为智能图像处理技术。其中最具代表性的是图像分类技术以及基于 内容的图像检索。图像分类就是利用计算机对图像进行定量分析,把图像中的每个像元或区域划归为若干个类别中的
18、一种,以代替人的视觉判读。图像分类的过程就是模式识别的过程,是 目视判读的延伸和发展。图像分类主要用于遥感、医学与军事等领域。以遥感图像分析为例,遥感技术是通 过对遥感传感器接收到的电磁波辐射信息特征的分析来识别地物类型的,这可以通过人工目视解释来实现,或是用计算机进行自动分类处理,也可以用人工目视解释与计算机 自动分类处理相结合来实现。用计算机对遥感图像进行地物类型识别是遥感图像数字处理的一个重要内容,也是模式识别技术在遥感技术领域中的具体应用。基于内容的图像检索就是根据图像的语义和感知特征进行检索,具体实现就是从图像数据中提取出特定的信息线索(或特征指标),然后根据这些线索从大量存储在图像
19、 数据库的图像中进行查找,检索出具有相似特征的图像数据。与传统的基于关键词的数 据库检索相比,具有相似度检索、近似检索和要求给出检索结果的集合限制等特点。人们常说“物以类聚,人以群分”。面对数量庞大的图像信息,寻找一种方便快捷、 直接有效的对图像进行分类方法已经成为进行图像处理工作的重要基础和必不可少的 重要环节,尤其是对于基于内容的图像检索具有极其重要的作用。聚类分析分类方法是 先对图像按照某种相似性原则进行聚类,把相似的图像聚合为一类,检索过程在类内进 行,从而大大的缩小图像检索范围,就能够达到快速、准确检索图像的目的。1.1.2 国内外研究现状人类从一出生,人眼就在不断地接受、分析和理解
20、周围的景物,这是人类的一种本 能活动。在计算机技术的不断发展中,人类更是将这一本能发挥的淋漓尽致。在20世纪70-80年代,图像处理的研究方向主要集中于用图像变换和数学模型来表征图像信号。 20世纪80年代中期,各种高性能的工作站和个人电脑应用的普及使图像处理研究和应 用不再仅仅是大机构和大型学术团体的“专利”。现在随着In ternet的广泛普及。图像处 理技术和应用前景将更为广阔。从应用的角度来看,数字照相技术、电子影像、数字化电视机、图像数据库和多媒 体技术的出现都在推动这一领域不断地向前发展。总的来说,图像处理技术将不再局限 于电子工程研究领域,它已设计到其他学科,如计算机科学、地理、
21、医疗保健、刑事侦 查等领域。另外,除了处理位于可视频谱范围的图像信号外,在过去的20年里,对射电望远镜形成的图像、红外图像、合成孔径雷达(Synthetic Aperture Radar.SAR)图像的研究都非常活跃。特别是 CT和核磁共振的利用都极大地丰富了这一领域研究的内 容。除了上述这些研究领域外,图像处理技术研究人员还积极地眷力于纹理和图形形状 的分析与识别、运动检测与估计、图像处理并行系统、图像处理技术的软硬兼研究等工 作。由于图像处理技术从一开始就具有很强的理论背景,因此一些具有高鲁棒性的图像处理算法已经应用到消费类型的产品中,一些较成熟的算法也已逐步形成公认的标准。如在20世纪8
22、0年代末逐步规划形成、20世纪90年代全面公布的H.263,JEPG,MPEG-2 等图像压缩与传输标准使图像处理技术在产业化方面取得巨大的成功。最近的成果也将在JPEG2000标准中体现一一标准中将用近年来图像变换研究的新成果:小波变换来取 代原来的DCT变换,这是因为小波变换克服了傅里叶变换不具有时频局部性质的缺陷, 并且和DCT 一样具有快速算法。图像处理技术发展非常快,随着基础理论研究的不断推前、更新,各种新颖的图像 处理技术层出不穷。就近年来产生了大量研究结果的图像分类算法来说,从有无监督的监督划分为有监督分类和无监督分类。无监督分类方法中K-mea ns分类方法得到了广泛的研究,P
23、aredes等利用K-means算法对训练图像块区生成的 KD树进行类似类别搜索, 得到了不错的分类效果。但传统K-means算法搜索匹配效率低,特别是对于高维的大型 数据集,搜索分类非常费时。Stefan Berchtold等提出了一种预先计算 K-means不相似 测度的动态解空间的方法,简化了计算,提高了搜索分类效率。Bin Zhang等采用基于聚类的树算法加速K-means,而不用预先计算K-means不相似测度的特性和矩阵式,从 而更大的加快了算法的速度,并减小了计算准确性的损失。另一类在图像分类中广泛使 用的有监督分类方法是支持向量机(SVM )分类。何灵敏等采用基于径向基核函数的
24、 SVM方法对遥感图像分类,并证实采用一对多的SVM分类方法比BP神经网络方法更适合于对复杂小样本多原数据的分类,蒋芸等将粗糙集理论与SVM结合起来,利用粗糙集理论处理大数据量、消除冗余信息等方面的优势,减少训练数据,提高了 SVM的 分类能力。大部分SVM方法都采用单一的核函数的类型,当采用局部核函数则学习能 力强、泛化性能较弱,采用全局性核函数则泛化性能强、学习能力较弱。1.2聚类分析聚类分析(cluster analysis)是一种将研究对象分为相对同质的群组(clusters)的统计分 析技术。聚类分析也叫分类分析 (classification analysis)或数值分类(nume
25、rical taxonomy), 是用数学的方法来研究和处理给定对象的分类,即对同类型对象抽象出其共性,从而形成 类。聚类分析是一种数值分类方法(即完全是根据数据关系)。要进行聚类分析就要首先建立一个由某些事物属性构成的指标体系,或者说是一个变量组合。入选的每个指标 必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,它们互 相配合可以共同刻画事物的特征。所谓完备的指标体系,是说入选的指标是充分的,其 它任何新增变量对辨别事物差异无显著性贡献。如果所选指标不完备,则导致分类偏差。简单地说,聚类分析的结果取决于变量的选择和变量值获取的两个方面。变量选择 越准确、测量越可靠,得到
26、的分类结果越是能描述事物各类间的本质区别。13课题目标及本文研究内容预期目标本论文拟将智能分类技术应用于图像的自动识别,以水果图像分类为目标,研究其特征提取方法及智能分类算法,实现基于Matlab平台的水果图像智能分析软件。主要研究内容论文主要研究内容包括:图像特征提取方法研究:分析图像的典型特征,并研究Hu矩不变特征值的计算方法。分类算法研究:在理解算法原理的基础上运用算法,实现算法功能并分析比较算法 性能。智能图像分析软件实现:系统以MatLab为平台,通过用户界面形式实现了基于聚 类的智能图像分类软件,具有建立根据现有图库训练网络、对任一图像实现分类并以图 文结合方式展现分类结果等功能。
27、1.3.3 系统方案论文以水果图像的分类为目标,通过图像的预处理、特征提取与分类,基于MatLab 实现图像的智能分析。在图像预处理阶段,系统将对输入图像进行灰度化、中值滤波以 及锐化并提取图像边缘的操作。特征提取阶段,系统将计算出输入图像的圆度、拉伸度、 周长等中间值,将这些必要的中间值带入 Hu特征迭代计算公式,即可获得后续处理所 需要的特征值向量。分类阶段,系统为用户提供了选择界面。当使用者选择SVM分类方法时,系统将通过使用图库训练学习的方式得到分类结果。当使用者选择K-means分类时,系统将得到自主聚类的分类结果。1.3.4 本文的结构本文分为七个部分,各部分的内容依次如下:第一章
28、,绪论。介绍要解决的主要问题问题。第二章,技术基础。介绍本文涉及到的知识以及使用的工具。第三章,图像矩不变特征提取。对本文采用的训练特征进行详细介绍。第四章,分类算法。对本文用到的两类不同的分类算法进行详细介绍。第五章,算法软件实现。对系统涉及的核心算法、关键函数以及系统界面进行详细 的介绍。第六章,系统测试。第七章,结论与展望。论文的成果总结及不足展望。第章技术基础2.1图像特征图像特征指的是图像场中可用作图像标志的属性,通常可以分为统计特征与视觉特征两大类。统计特征包括直方图、频谱和矩等,是人为特征,需要经过变换才能得到。 视觉特征指的是具有直观意义的图像的形状与颜色特征,如颜色、纹理、形
29、状等。图像 特征的提取和分析是智能图像分析的关键步骤。近年来,随着多媒体技术的发展,许多 图像特征被研究人员发掘并利用,为进一步的图像处理提供了极大地便利。对于某幅特定图像,根据不同的需要,通常要提取其不同的特征,因而一幅图像又 有了许多不同的表达方式。也就是说,图像的不同特征从各个角度反映了图像在这个特 定维度中的特点。在图像统计特征中,直方图描述的是图片显示范围内的灰度分布曲线,它的横轴从 左到右代表照片从黑(暗部)到白(亮度)的像素数量。频谱是以横轴纵轴的波纹方式, 记录画出图像中包含的各种信号频率的图形资料,是图像信号的频域表征。矩特征表征 了图像区域的几何特征,又称为几何矩,其具有平
30、移、旋转、尺度等特性的不变特征,又 称其为不变矩。也是本文中应用到得特征。在视觉特征中,颜色特征是一种全局特征,表征了图像区域所对应的景物的表面性 质,是基于像素点的特征。纹理特表征了图像区域所对应景物的表面性质征,也是一种 全局特征,但是纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进 行统计计算。形状特征由其集合属性(长短、距离、面积、凹凸)、统计属性(投影)、拓扑属性(欧拉数、连通)表征,是图像最本质的特征反映。不变矩特征由于其在图像 平移、伸缩、旋转时均保持不变,而且具有全局性,是图像识别的主要方法,广泛的应 用于机器视觉、目标识别与分类、纹理分析等等。Hu首先提出了七个
31、几何不变矩用于图像识别,利用不变矩进行形状识别获得了广泛的应用。 后来人们进行了多方面的研究, 发现不变矩还具有绝对的独立性,没有信息冗余现象,抽样性能好,抗噪能力强,更适 合用于几何不变图像描述和识别。本文就将使用到 Hu的不变矩特征。2.2图像分类方法2.2.1 图像分类概念从人眼角度看,提高图像对比对、增加视觉维度、进行空间变换或滤波,其目的就 是让人们能够凭借知识和经验,根据图像色调、亮度、位置、纹理以及结构等特征,准 确的对图像类型或者目标,做出正确的判断和解释,并根据当下的需求,对所需图像进 行绘制处理。图像分类就是通过计算机对图像进行定量的分析的过程,把图像中的各个像素或者 区域
32、划归到若干类别中的一类去,以代替人眼的视觉判读。图像分类的过程其实是一个 模式识别的过程,是人眼目视判读的延续以及发展。图像分类具有计算精度高、速度快、 图像测量准确度高等特点。222 图像分类原理图像分类的理论依据是:图像中的同类景物在相同条件下,应具有相同或类似的光 谱信息特征,从而体现出某种同类景物的某种内在相似性,即同类景物像素的特征向量 将聚类于同一特征的空间区域,从而不同的景物的光谱信息特征和空间信息特征不同, 它们将聚类于不同特征的空间区域。从统计决策理论来看,图像分类在数学上就是对呈现统计可变的数据作出决策的过 程。将一个像素归入任一类别的决策,可以说是统计上的一种明智的“猜测
33、”。统计决策比较成熟,对模式不太复杂的应用已经相当的成功,但不能反映模式结构特性,概率 表示形式使使用上也存在局限性。神经网络分类方法是只能信息处理的重要内容,它可以处理一些环境复杂、背景不 清楚、推理规则不明确的问题。2.2.3 图像分类方法用统计方法进行图像分类时,首先从待分类对象中提取能够反映对象属性的特征向 量,并将这些向量定义在一个特征空间之中。之后运用统计决策的方法对特征空间进行 划分,用以区分不同特征对应的对象,进而达到分类的目的。同时,在分类的过程中, 按照有无样本学习可以分为非监督分类法和监督分类法。监督分类就是用已知的类别样本选择特征参数和建立判别函数,对各个像素进行分类。
34、通常意义上的监督分类包含以下两个具体的分类方法。1.最小距离分类法最小距离分类法是最简单的监督分类方法。这种方法的基本思想是:从训练样本中 提取各个类别对应的均值向量并求出待测向量到各个均值向量的距离,比较后将待测类别归入距离最小的一类中。设待分类像素X二伙必2.人丁到类别的距离为di=|x-z|( i =1,2,,m)式(2-1)其中,m为类别数,乙为类的中心。当di二河监心2.最大似然分类(多类分类)最大似然分类建立在贝叶斯准则上,其分类正确率最高,是风险最小的判决分析。 在n维特征空间中,待测像素=以律2.人对于类的条件概率密度函数P(X/i)和类 打的先验概率P(均已知,则最大似然分类
35、法建立的判别函数集为:Dj(x)=P( i)P(x/ J( i=1,2,.m)式(2-2)若则X三当x服从咼维正态分布时,有P(xr i)二n1 exp - (x - zj i (x - Zi)式(2-3)0)2|匚|22而非监督分类则需要在进行分类之前获得类别的先验属性,通过这个属性求出判别函数中的未知参数。在先验属性未知的情况下将所有样本就将所有样本划分为若干个类 别的方法称为费监督分类,这种方法是根据像素间的相似度大小进行聚类。在聚类过程 中,通常是按照某种相似性准则来对样本进行合并或分离。像素聚类有两种途径:迭代法与非迭代法。迭代法先给定一个初始分类,然后通过 迭代算法找到能够使准则函
36、数取极值的最优聚类结果,因此这是一个动态聚类分析过 程。常用动态聚类法有K-means算法、LBG算法和分裂算法。2.3 MatLab及图像智能处理工具箱MatLab是Matrix Laboratory (矩阵实验室)的缩写,是一款由美国 Math Works公 司出品的商业数学软件。MatLab是一款用于数据可视化、算法开发、数据分析以及数 值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功 能外,MatLab还可以用来创建用户界面及与调用其它语言(包括C,C+和FORTRAN)编写的程序。尽管MatLab主要用于数值运算,但利用为数众多的附加工具箱(Toolbo
37、x)它也适 合不同领域的应用,例如图像处理、控制系统设计与分析、信号处理与通讯、金融建模 和分析等。另外还有一个配套软件包 Simulink,提供了一个可视化开发环境,常用于系 统模拟、动态/嵌入式系统开发等方面。本系统的功能实现就是是借助 MatLab的工具箱完成的。Vapnik经过多年研究,提 出了统计学理论和一种新的经验建模工具:支持向量机(Support Vector Mach in e,SVM)。SVM的训练是依据统计学理论中的结构风险最小化原则,在最小化经验风险的同时最 小化SVM的模型复杂度,提高了模型的泛化能力。尽管如此,SVM训练为一个有约束的二次规划问题,其约束条件数等于训
38、练样本容量,因此在用于大训练样本容量的建模北京邮电大学本科毕业设计(论文) 问题时,会导致训练时间过长。针对SVM这一缺点,Suykens提出了损失函数为二次函数,约束条件为等式形式的支持向量机:最小二乘支持向量机( Least Squares Support Vector Machine,LSSVM)。LSSVM的训练问题为一个线性方程组求解问题,相对于SVM训练的二次规划问题求解,其计算量有了很大的降低。此次系统所用的工具包为由比利时鲁汶大学的K.Pelckmans以及J.A.K.Suykens等开发的LS-SVMlab Toolbox( Version 1.5)。此工具箱实现了基于 SV
39、M算法的多类分类。 此外,在展现运行结果时用到了MatLab中的GUI用户界面设计。图形用户界面(Graphical User In terface简称GUI,又称图形用户接口)是指采用图形方式显示的计 算机操作用户接口。北京邮电大学本科毕业设计(论文) 第三章图像矩不变特征提取常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。一颜色特征(一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。 一般颜色特征是基于像素点的特征, 此时所有属于图像或图像区域的像素都有各自的贡 献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地 捕捉图像中
40、对象的局部特征。(二)常用的特征提取与匹配方法颜色直方图。其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩 在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体 空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空 间位置,即无法描述图像中的某一具体的对象或物体。(三)常用的颜色空间:RGB颜色空间、HSV颜色空间。颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累 加颜色直方图法。二纹理特征(一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表 面性质。但由于纹理只是一种物体表面的特性,并
41、不能完全反映出物体的本质属性,所 以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基 于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这 种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统 计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特 征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。(二)常用的特征提取与匹配方法纹理特征描述方法分类(1)统
42、计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb和Kreyszig等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱 函数的计算,提取纹理的粗细度及方向性等特征参数(2)几何法所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的 形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio棋盘格特征法和结
43、构法。(3)模型法模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随 机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs随机场模型法(4)信号处理法纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura纹理特征、自回归纹理模型、小波变换等。灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneous auto-regressive, SAR 是马尔可夫随机场(MRF )模型的一种
44、应用实例。三形状特征(一)特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标 来进行检索,但它们也有一些共同的问题,(二)常用的特征提取与匹配方法通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图 像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。几种典型的形状特征描述方法:(1) 边界特征法该方法通过对边界特征的描述来获取图像的形状参数。其中Hough变换检测平行直线方法和边界方向直方图方法是经典方法。Hough变换是利用图像全局特 性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点一线的对偶性;边界方向直方图法首
45、先微分图像求得图像边缘,然后,做出关于边缘大小和方向的 直方图,通常的方法是构造图像灰度梯度方向矩阵。(2)傅里叶形状描述符法傅里叶形状描述符(Fourier shape descriptors基本思想是用物体边界的傅里叶变换作 为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。由边界点 导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。(3)几何参数法形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape facto)在QBIC系统中,便是利用圆 度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特
46、征的图像检索。四空间关系特征特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相 对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通 常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。前一种关系强 北京邮电大学本科毕业设计(论文) 北京邮电大学本科毕业设计(论文) 调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离 大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置 信息常比较简单。空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变
47、化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是 不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其 它特征来配合。常用的特征提取与匹配方法:提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划 分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引; 另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特 征,并建立索引。3.1图像矩不变特征介绍矩特征主要表示了图像区域内的几何特征,又称为几何矩,由于其具有平移、旋转、 尺度等特性的不变特征,所以又称其为矩不变。在图像处理中,几何矩不变可以被用来 当做
48、一个重要的特征来表示物体,可以据此特征来对图像进行分类等操作。几何矩是在在 1962 年被 Hu(Visual pattern recognition by moment invariants)提出的, 矩不变的主要思想是通过使用对变换不敏感的基于区域的几个矩作为形状特征。矩是描述图像特征的算子,在图像分析与模式识别领域中有重要的应用。迄今为止,常见的矩 描述子可以分为以下几种:正交矩、几何矩、旋转矩和复数矩。其中几何矩最早被提出 并且形式最简单,所以对它的研究最为充分。几何矩对简单图像有一定的描述能力,虽 然在区分度上不如其他三种矩,但与其他算子比较起来,较为简单,一般通过一个数字 就可表达
49、。矩不变特征的优越性,特别是其具有的旋转不变形、图形的扭曲伸缩等不变形,对 于本系统的分类训练具有极其重要的作用。比如,输入系统的待分类图片中的感兴趣区 域很可能由于拍摄角度的问题扭曲、拉伸、变形等,但是矩不变特征的这一特性很好的 避免了此类操作造成的误差,提高了系统的分类准确度。以下是两个矩不变特征的图像 检索实例。示洌国像示例图像蜓索詰果V Aj J图3-2扭曲、伸缩性变不变性从图3-1中的图像检索结果可以看出,形状检索算法对于图像的旋转具有不变性。 图3-2检索的结果证明形状检索算法对于图像的扭曲。伸缩形变具有不变性,并对图像 的基本形状特性具有鲁棒性,在具有一定形变的干扰情况下,仍能得
50、出较好的图像检索 结果。3.2图像矩不变特征提取数字图像是通过一个数字矩阵表征的。图像f(x,y)的(p+q)阶几何矩定义为:式中f(x,y)是图像的灰度。矩在统计学中通常被用来反映随机变量的分布情况,当被推广到力学中,它用作描 述空间物体的质量分布。同理,如果我们将图像的灰度值看作是一个二维或三维的密度 分布函数,则矩方法就可用于图像分析领域并且用作图像特征的提取。最常用的,物体 的零阶矩显示了图像的 质量”:OO Q0式(3-1)m。 i , i f(x, y)dxdy一阶矩(m01,mi0)用于确定图像质心(Xc,Yc):若将坐标原点移至qXc和M Nx经y THu在文中提出了Xc =m
51、io/moo;Yc moi/m。丫C处,就得到了对于图像位移不变的中心矩gx屮小叫y)dxdy(p,q = ,i2.)7个几何矩的不变量,这些不变量满足于图像平移、(3-2)(3-3)伸缩和旋转不变。如果定义pq = %/pqr =( p q)/2, p q =2,3,Hu的7种矩为:1 = 20 022 =( 20 - 02)2 V 2113=( 30 -3 J 2 21 - 03)2 TOC o 1-5 h z =(30* 12)* (21*03)=(303 12)(30*12)(3012)3(21,03)(3 21 _:03)(21,03)3(30,12)_(21,03)- (20_02
52、)(30*12)一3(21*03)4 11( 30,12)(21,03)=(3 21 - 03)(30*12)(30J -3(21,03)2-( 30一312)(203)3(30,J-(203)2在本系统中,使用SVM神经网络对图像进行分类时,需要提取图像的Hu矩不变特征。特征提取具体步骤如下:(1)对初始图库图像和待分类图像进行二图像滤波、直方图均衡、图像均衡、边 缘检测、二值法锐化等预处理,将目标从背景中分割出来。经过以上步骤后,目标被突 出,图像背景被弱化,从而使目标更容易辨识;图3-3图像分割与特征提取(2) 通过MatLab中的自有函数对初始图库图像和待分类图像进行提取面积、矩形度、
53、原型度、拉伸度以及周长等特征值,为之后的Hu矩不变特征做好准备;(3)通过带入步骤(2)的运算结果计算出初始图库图像和待分类图像的面积、矩形度和伸长度。并按照上文提到的算法计算出每幅图像的7个矩不变特征。这样一来每幅图像就包含了 10个特征值,建立一个数组,将特征值存储进去即可。第四章分类算法本系统在图像分类的功能上,既使用到了监督分类方法,又使用到了非监督分类方 法。一下就将这两种分类方法对应的具体算法进行主要介绍。本文使用到了支持向量机 分类算法(SVM )以及K-means分类算法。4.1 SVM分类算法算法简介支持向量机(SVM, Support Vector Machin是在高维特征
54、空间使用线性函数假设 空间的学习系统。它将向量映射到一个更高维的空间里,在这个空间里建立有一个最大 间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两 个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越 小。支持向量机由一个来自最优化理论的学习算法训练,该算法实现了一个由统计学习 理论导出的学习偏置1。算法详述(1)二类分类SVM是从线性可分情况下的最优分类面发展而来的,主要思想可用图1的两维情况说明。图4-1最优分类面图中,实心点和空心点代表两类样本, H为分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距
55、离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间 隔最大。分类线方程为 x w 0。对于二类模式分类问题,设有训练样本S1:xi, yi, i =1,2,n,其中Xj 血P为模 式向量,yj1,1为类别标号,n为样本容量,则将SVM优化问题约束条件由不等 式改为等式,并将经验风险函数改为二次函数,则可得如式(4-1)所示约束优化问题:min J (w,b,e)we22vs.t.式( 4-1)y wT(Xi) b =1 -e,i =1,2,.,n式中,w(Xi) b为高维特征空间中的分类超平面,w和b为分类超平面的参数;nU 2ei
56、为第i个样本点的训练误差,则仝 为经验风险;wT |w|2衡量了学习机器的复杂 性; 0为惩罚因子,作用是在训练中平衡学习的复杂性和经验风险。根据约束优化理论,式(4-1)的解由其对应的如式(4-3)所示的Lagrange泛函数 的鞍点给出:n3用(心廿皿愀式(4-3)式中ai为Lagrange乘子,取值为一切实数。根据式(4-3)的鞍点条件,可得下式:cL=0二twnW 八:iYi :(Xi)i cLcLce2L?: i=0= yi wT :化)b = 1 -e,i = 1,2,.,n式(4-4)从式(4-4)的第三式可知,X正比于其对应的样本上的训练误差。将上述式子合 并,可通过如下式所示
57、的线性方程组求解出i和b0式(4-5)_y式(4-5)中,I为n维的单位矩阵,1为n维的元素全是1的列向量,门为n维对 称方阵,其元素为 J-yiyj (xi)T (xj),其中 心)T二仏)*佻“),而k(为核函 数,因此J,厂必凶)为的第)行j列元素。求解(2.20)得到a和b之后,贝U可以得到如下的分类函数:ny(x)八:jyjk(x,Xj) b匕式(4-6)模式向量x的类别由判别函数c(x) =sgn(?(x)决定,其中sgn()为符号函数北京邮电大学本科毕业设计(论文) 多类分类显然上述分类只能应用于二类模式分类问题,当minJ(Wi,b)云TWiLSSVM应用于多类问题时,n 1
58、2Wiek,i2 k4 t J假设给定I类分类问题的训练样本 S :Xi,yj, i =1,2,.n,其中y为丨维的由-1和+1组成的 I维向量,当Xi为第j类时,yj的第j个元素为-1,其余皆为+1。将训练样本S2存储为 两个数据矩阵X和丫,它们的第i行分别为Xi和y。根据SRM原则可得到式(4-7)所 示的约束优化问题: 0.由于只有支持向量处的系数-0(参考附录),表达式(14)只是w0的一种简写形式要求出参数向量:i:凡=0,1 IM)J需要求解以下二次规划问题:AW(t)1- 一上T D TOC o 1-5 h z 2(15)其中.J =( 5川,1),且满足限制:上 0,(16)A
59、T Y = 0,(17)1T = (1,.,1) 是维的单位向量,丫丁二卜1,)是维的类标签向量,D是,X-的对称矩阵其元素Dj =%Xi xj, i,j=1,.,l(18)不等式(16)表示非负象限.因此,问题变为在非负象限中最大化二次式(15),并服从 约束条件(17).当训练数据可完全无错地分开时,在附录A中我们证明了在最大泛函(15)、(上0,)和式(13)的最大间隔0之间有以下关系:WC;0)=如果存在某个 J和某个较大的常数W0使得不等式(20)w(J) W0成立,则所有把训练集(8)分开的超平面其间隔都满足如果训练集(8)不能被超平面完全分开,则两个类的样本间的间隔变的任意小,使
60、得 泛函W(上)的值变得任意大.因此,要在约束条件(16)和(17)下最大化泛函(15),要么能 求得最大值(这种情况需要构造最大间隔为订的最优超平面),要么求出超过某个给定的常数W的最大值(这种情况下不可能以大于2/W0的间隔分开训练数据).在约束条件(16)和(17)下最大化泛函(15)的问题如下方法可有效地解决.将训练数 据集划分为几部分,使每部分占有合理的少量数据.先求解由第一部分训练数据决定的 二次规划问题.对于该问题,会有两个结果:其一,这部分数据不能被任何超平面分开(这 种情况下整个数据集都不能被任何超平面分开);其二,找到了能分开这部分数据的最优超平面.假设对第一部分数据泛函(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 意识的课件教学课件
- 2024年建筑工程施工合同详细描述
- 2024年度战略合作合同(含合作领域)
- 春艾青课件教学课件
- 2024年度水果品牌授权合同:授权生产和销售的具体条款
- 2024年度金融服务合同:银行为客户提供2024年度综合金融服务
- 2024年专利实施许可合同:生物医药产品专利应用
- 2024年度航空器材买卖合同
- 幼儿清明课件教学课件
- 毛笔楷体课件教学课件
- 第15课《诫子书》课件(共29张PPT) 部编版语文七年级上册
- 大型设备说明-涂胶显影机第1台
- 压力变送器的安装与校验演示教学课件
- 六年级上册美术课件 8《参观券的设计》 人美版
- 阿基米德原理 公开课一等奖课件
- 扁平鱼骨图模板课件
- 公司食堂人员工资及绩效考核方案-
- 人教部编版语文五年级上册第六单元:语文园地六教学课件
- A级招聘法(聘谁)解析课件
- 农行流水模板
- 四年级上册生命生态安全期末复习资料
评论
0/150
提交评论