图像分割方法综述_第1页
图像分割方法综述_第2页
图像分割方法综述_第3页
图像分割方法综述_第4页
图像分割方法综述_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上精选优质文档-倾情为你奉上专心-专注-专业专心-专注-专业精选优质文档-倾情为你奉上专心-专注-专业 图像分割方法综述摘要:图像分割是计算计视觉研究中的经典难题,已成为图像理解领域关注的一个热点,本文对近年来图像分割方法的研究现状与新进展进行了系统的阐述。同时也对图像分割未来的发展趋势进行了展望。关键词:图像分割;区域生长;活动边缘;聚类分析;遗传算法Abstract: Image segmentation is a classic problem in computer vision,and become a hot topic in the field of im

2、age understanding. the research actuality and new progress about image segmentation in recent years are stated in this paper. And discussed the development trend about the image segmentation.Key words: image segmentation; regional growing; active contour; clustering analysis genetic algorithm1 引言 图像

3、分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。 关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对

4、于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。本文根据图像发展的历程,从传统的图像分割方法、结合特定工具的图像分割方法、基于人工智能的图像分割方法三个由低到高的阶段对图像分割进行全面的论述。2 传统的图像分割方法2.1 基于阀值的图像分割方法 阀值分割法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。阀值分割法的基本原理是通过设定不同的特征阀值,把图像像素点分为具有不同灰度级的目标区域和背景区域的若干类。它特别适用于目标和背景占据不同灰度级范围的图,目前在图像处理领域被广泛应用,其中阀值的选取是图像阀值

5、分割中的关键技术。 灰度阀值分割方法是一种最常用的并行区域技术,是图像分割中应用数量最多的一类。图像若只用目标和背景两大类,那么只需要选取一个阀值,此分割方法称为单阀值分割。单阀值分割实际上是输入图像f到输出图像g的如下变换:在上述表达式中,T为阀值,对于目标物体的图像元素g(i,j)=1,对于背景的图像元素g(i,j)=0。但是如果图像中有多个目标需要提取,单一的阀值分割就会出错。就需要选取多个阀值将每个目标分割开,这种分割方法称为多阀值分割。阀值分割的结果取决于阀值的选择。由此可见,阀值分割算法的关键是确定阀值。阀值确定后,将阀值与像素点的灰度值比较以及对各像素的分割并行地进行。常用的阀值

6、选择方法有利用图像灰度直方图的峰谷法、最小误差法、基于过渡区法、利用像素点空间位置信息的变化阀值法、结合连通信息的阀值方法、最大相关性原则选择阀值和最大熵原则自动阀值法。图1是利用单阀值方法和局部阀值方法对细胞图像分隔的结果,结果表明,在很多情况下,目标物体和背景的对比度在图像的不同位置并不是一样的,这是如果用一个统一的单阀值将目标与背景分开,效果是不理想的。如果根据图像的局部特征分别用不同的阀值对图像进行分割,即局部阀值分割,则效果要比单阀值分割要好得多。阀值分割方法的优点是图像分割的速度快,计算简单,效率较高。但是这种方法只考虑像素点灰度值本身的特征,一般不考虑空间特征,因此对噪声比较敏感

7、。虽然目前出现了各种基于阀值分割的改进算法,图像分割的效果有所改进,但在阀值的设置上还是没有很好的解决方法,若将智能遗传算法应用在阀值筛选上,选取能最优分割图像的阀值,这可能是基于阀值分割的图像分割法的发展趋势。2.2 基于区域的图像分割方法 基于区域的分割方法是以直接寻找区域为基础的分割技术,具体算法有区域生长和区域分离与合并算法。基于区域提取方法有两种基本形式:一种是区域生长,从单个像素出发,逐步合并以形成所需要的分割区域;另一种是从全局出发,逐步切割至所需的分割区域。2.2.1 区域生长区域生长是串行区域技术,其分割过程后续步骤的处理要根据前面步骤的结果进行判断而确定。常见的区域生长算法

8、包括:同伦的区域生长方式、对称区域生长方式和模糊连接度方法与区域生长相结合等算法。区域生长的基本思想是将具有相似性质的像素集合起来构成区域。具体是先对每个需要分割的区域找一个种子像素点作为生长的起点,然后将种子像素周围领域中与种子像素有相同或相似性质的像素合并到种子像素所在的区域中。将这些新像素当作新的种子像素继续进行上面的过程,直到再没有满足条件的像素可被包括进来。这样一个区域就长成了。区域生长的优点是计算简单,对于较均匀的连通目标有较好的分割效果。它的缺点是需要人为的选取种子,对噪声较敏感,可能会导致区域内有空洞。另外它是一种串行算法,当目标较大时分割速度较慢,因此在算法设计时应尽量提高运

9、行效率。2.2.2 区域分裂合并区域生长是从某个或者某些像素点出发,最后得到整个区域,进而实现目标的提取。而分裂合并可以说是区域生长的逆过程。它是从整个图像出发,不断分裂得到各个子区域,然后再把前景区域合并,得到前景目标,继而实现目标的提取。分裂合并的假设是对于一幅图像,前景区域是由一些相互连通的像素组成的,因此如果把一幅图像分裂到像素级,那么就可以判定该像素是否为前景像素。当所有像素点或者子区域完成判断以后,把前景区域或者像素合并就可以得到前景目标。四叉树分解法就是一种典型的区域分裂合并法。对Lena图的分割效果如图2所示。设R代表整个正方形图像区域,P代表逻辑谓词。基本分裂合并算法步骤如下

10、:对于任一区域,如果H(Ri)=FALSE就将其分裂成不重叠的四等分;对相邻的两个区域Ri和Rj,它们也可以大小不同(即不在同一层),如果条件H(RiURj)=TURE满足,就将它们合并起来;如果进一步的分裂或合并都不可能,则结束。分裂合并法的关键是分裂合并准则的设计。这种方法对复杂图像的分割效果较好,但算法较复杂,计算量大,分裂还可能破坏区域的边界。在实际应用中,通常是将区域生长算法和区域分裂合并算法这两种基本形式结合使用。该类算法对某些复杂物体定义的复杂场景的分割或者对某些自然景物的分割等类似先验知识不足的图像分割,效果较为理想。2.3 基于边缘检测的图像分割方法基于边缘检测的分割方法试图

11、通过检测包含不同区域的边缘来解决分割问题,它可以说是人们研究的最多的方法之一。通常不同的区域之间的边缘上像素灰度值的变化往往比较剧烈,这是边缘检测方法得以实现的主要假设之一。边缘检测方法一般利用图像一阶导数的极大值或二阶导数的过零点信息来提供判断边缘点的基本依据。边缘检测技术通常可以按照处理的技术分为串行边缘检测和并行边缘检测。串行边缘检测是要想确定当前像素点是否属于检测边缘上的一点,取决于先前像素的验证结果。并行边缘检测是一个像素点是否属于检测边缘上的一点取决于当前正在检测的像素点以及与该像素点的一些相邻像素点。最简单的边缘检测方法是并行微分算子法,它利用相邻区域的像素值不连续的性质,采用一

12、阶或二阶导数来检测边缘点。近年来还提出了基于曲面拟合的方法、基于边界曲线拟合的方法、基于反应-扩散方程的方法、串行边界查找、基于变形模型的方法。常用的一阶导数算子有梯度算子、Prewitt算子和Sobel算子。二阶导数算子有Laplacian算子、Kirsch算子和Wallis算子。图3是分别用Sobel、LoG和Canny算子对Lena图做的边缘检测。有图3可以看出,Canny算子的分割效果比Sobel和LoG算子的好。虽然边缘检测的优点是边缘定位准确、运算速度快,但它有两大难点限制了其在图像分割中的应用,即:a不能保证边缘的连续性和封闭性;b在高细节区存在大量的碎边缘,难以形成一个大区域,

13、但是又不宜将高细节区分为小碎片。由于上述两个难点,因此无论采用什么方法,单独的边缘检测只能产生边缘点,而不是完整意义上的图像分割过程。这也就是说,边缘点信息需要后续处理或与其它相关算法相结合,才能完成分割任务。常用的方法是边缘生长技术最大程度的保证边缘的封闭性,或用有向势能函数(DPF)将有缺口的两边缘强制连接,得到封闭边缘图。在未来的研究中,用于提取初始边缘点的自适应阀值选取、用于图像的层次分割的更大区域的选取以及如何确认重要边缘以去除假边缘将变得非常重要。3 结合特定工具的图像分割算法3.1 基于小波分析和小波变换的图像分割方法小波变换是近年来得到广泛应用的数学工具,它在时域和频域都具有良

14、好的局部化性质,能将时域和频域统一于一体来研究信号。而且小波变换具有多尺度特性,能够在不同尺度上对信号进行分析,因此在图像分割方面得到了应用。二进小波变换具有检测二元函数的局部突变能力,因此可作为图像边缘检测工具。图像的边缘出现在图像局部灰度不连续处,对应于二进小波变换的模极大值点。通过检测小波变换模极大值点可以确定图像的边缘小波变换位于各个尺度上,而每个尺度上的小波变换都能提供一定的边缘信息,因此可进行多尺度边缘检测来得到比较理想的图像边缘。图4是运用小波变换方法对图像进行的有效分割。 另外,将小波方法与其他方法结合起来处理图像分割也得到广泛研究。文献8提出把Hilbert图像扫描方法和小波

15、变换相结合,获得了连续光滑的阀值曲线,从而建立了一种局部自适应阀值法进行图像分割。3.2 基于马儿可夫随机场模型的图像分割方法马儿可夫随机场(Markov Random Field)方法建立在马尔可夫模型和Bayes理论基础上,根据统计决策和估计理论中的最优化准则确定分割问题的目标函数,求解满足这些约束条件下的最大可能分布,从而将分割问题转化为优化问题。MRF最重要的一个特点是,图像中每个点的取值由其领域像素决定,其本质上是一种基于局部区域的分割方法。如果我们把图像理解为定义在矩形点阵上的随即过程,则Markov性很好的描述了各个像素之间的空间依赖性,即一个像素可以由它周围的像素确定。而事实表

16、明,图像像素的这种空间相关性总是存在的。因此可以使用马尔可夫随机场对图像进行建模。文献9讨论了基于马尔可夫随机场的图像分割方法,建立了相应的基于马尔可夫随机场的图像分割模型,以实现复杂遥感图像的快速分割,并由此将图像分割问题转化为图像标记问题,进而转化成求解图像的最大后验概率估计的问题。利用此方法得到的效果图如图5、6所示: 3.3 基于遗传算法的图像分割方法遗传算法(Genetic Algorithms,简称GA)是1973年由美国教授Holland提出的,是一种借鉴生物界自然选择和自然遗传机制的随机化搜索算法。是仿生学在数学领域的应用。其基本思想是,模拟由一些基因串控制的生物群体的进化过程

17、,把该过程的原理应用到搜索算法中,以提高寻优的速度和质量。此算法的搜索过程不直接作用在变量上,而是在参数集进行了编码的个体,这使得遗传算法可直接对结构对象(图像)进行操作。整个搜索过程是从一组解迭代到另一组解,采用同时处理群体中多个个体的方法,降低了陷入局部最优解的可能性,并易于并行化。搜索过程采用概率的变迁规则来指导搜索方向,而不采用确定性搜索规则,而且对搜索空间没有任何特殊要求(如连通性、凸性等),只利用适应性信息,不需要导数等其他辅助信息,适应范围广。遗传算法擅长于全局搜索,但局部搜索能力不足,所以常把遗传算法和其他算法结合起来应用。将遗传算法运用到图像处理主要是考虑到遗传算法具有与问题

18、领域无关且快速随机的搜索能力。其搜索从群体出发,具有潜在的并行性,可以进行多个个体的同时比较,能有效的加快图像处理的速度。但是遗传算法也有其缺点:搜索所使用的评价函数的设计、初始种群的选择有一定的依赖性等。要是能够结合一些启发算法进行改进且遗传算法的并行机制的潜力得到充分的利用,这是当前遗传算法在图像处理中的一个研究热点。4 基于人工智能的图像分割方法4.1 基于人工神经网络的图像分割方法在20世纪80年代后期,在图像处理、模式识别和计算机视觉的主流领域,受到人工智能发展的影响,出现了将更高层次的推理机制用于识别系统的做法,于是出现了基于人工神经网络模型(Artificial Neural N

19、etworks, ANN)的图像分割方法。人工神经网络是由大规模神经元互联组成的高度非线性动力系统,是在认识、理解人脑组织机构和运行机制的基础上模拟其结构和智能行为的一种工程系统。基于神经网络分割的基本思想是:通过训练多层感知机来得到线性决策函数,然后用决策函数对像素进行分类来达到分割的目的。近几年神经网络在图像分割中的应用按照处理数据类型大致上可以分为两类:一类是基于像素数据的神经网络算法;另一类是基于特征数据的神经网络算法也即特征空间的聚类分割方法。基于像素数据分割的神经网络算法用高维的原始图像数据作为神经网络训练样本,比起基于特征数据的算法能够提供更多的图像信息,但是各个像素是独立处理的

20、,缺乏一定的拓扑结构而且数据量大,计算速度非常慢,不适合实时数据处理。目前有很多神经网络算法是基于像素进行图像分割的,如Hopfield神经网络、细胞神经网络、概率自适应神经网络等。随着技术的不断发展,第三代脉冲耦合网络PCNN的研究,为图像分割提供了新的处理模式,它能克服图像中物体灰度范围值有较大重叠的不利影响,达到较好的分割效果。4.2 基于聚类的分割方法对灰度图像和彩色图像中的相似灰度或色度合并的方法称之为聚类,通过聚类将图像表示为不同区域即所谓的聚类分割方法。此方法的实质是将图像分割问题转化为模式识别的聚类分析,如k均值、参数密度估计、非参数密度估计等方法都能用于图像分割。实际中受到普

21、遍欢迎的是基于目标函数的模糊C-均值算法(Fuzzy C-Means),简称FCM。由Bezdek于1981年提出,利用初始化方法确定聚类中心、聚类数,通过不断迭代循环,调整和优化聚类中心,最终使类内方差达到最小,从而实现聚类。目前常用的还有基于支持向量机聚类、基于遗传算法聚类等以及与其他算法相结合的聚类方法。4.3 基于主动轮廓模型的分割方法主动轮廓模型(active contours)是图像分割的一种重要方法,具有统一的开放式的描述形式,为图像分割技术的研究和创新提供了理想的框架。在实现主动轮廓模型时,可以灵活的选择约束力、初始轮廓和作用域等,以得到更佳的分割效果,所以主动轮廓模型方法受到

22、越来越多的关注。该方法是在给定图像中利用曲线演化来检测目标的一类方法,基于此可以得到精确的边缘信息。其基本思想是,先定义初始曲线C,然后根据图像数据得到能量函数,通过最小化能量函数来引发曲线变化,使其向目标边缘逐渐逼近,最终找到目标边缘。这种动态逼近方法所求得的边缘曲线具有封闭、光滑等优点。传统的主动轮廓模型大致分为参数主动轮廓模型和几何主动轮廓模型。参数主动轮廓模型将曲线或曲面的形变以参数化形式表达,Kass等人提出了经典的参数活动轮廓模型即“Snake”模型10,其中Snake定义为能量极小化的样条曲线,它在来自曲线自身的内力和来自图像数据的外力的共同作用下移动到感兴趣的边缘,内力用于约束

23、曲线形状,而外力则引导曲线到特征此边缘。参数主动轮廓模型的特点是将初始曲线置于目标区域附近,无需人为设定曲线的的演化是收缩或膨胀,其优点是能够与模型直接进行交互,且模型表达紧凑,实现速度快;其缺点是难以处理模型拓扑结构的变化。比如曲线的合并或分裂等。而使用水平集(level set)的几何活动轮廓方法恰好解决了这一问题。文献11针对Snake模型在弱边缘处容易溢出等不足,通过引入区域信息、粒子群优化算法等优化特性和良好的数值稳定性来对Snake模型的分割结果进行优化。5 图像分割技术的发展趋势随着神经网络、模糊集理论、统计学理论、形态学理论、免疫算法理论、图论以及粒度计算理论等在图像分割中的广

24、泛应用,图像分割技术呈现出以下的发展趋势:进一步提高算法的性能 现有的多数图像分割算法只能针对某一类图像或者已经进行初步分类的图像库,其效率不高,也不具有通用性。为此,可以通过各种特征的融合(原始灰度特征、梯度特征、几何空间特征、变换特征和统计特征等)和多种分割方法的结合两个方面来提高现有算法的效率和通用性。新理论与新方法的研究新的分割方法的研究主要以自动、精确、快速、自适应和鲁棒性等几个方向作为研究目标。随着图像分割研究不断深入,图像分割方法将向更快速、更精确的方向发展,图像分割方法的研究需要与新理论新工具和新技术结合起来才能有所突破和创新。面向专门领域的应用目前,随着图像分割在医学、遥感、电子商务、专利检索和建筑设计等领域得到了广泛应用,人们不断寻找新的理论和方法来提高图像分割的效果。随着不同学科研究人员对图像分割的日益关注,新的理论和方法会不断应用到更多领域中去。6 结论与展望当前,图像分割已成为图像理解领域关注的一个热点。未来的发展需要研究者借鉴数学、统计学、神经学、认知心理学、计算机科学等领域的成果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论