多门限图象分割技术_第1页
多门限图象分割技术_第2页
多门限图象分割技术_第3页
多门限图象分割技术_第4页
多门限图象分割技术_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北工学院分院学士学位论文PAGE华北工学院分院学士学位论文毕业设计论文学士学位论文题目:多门限图象分割技术系别:电子工程系学科专业:电子信息工程学生:许佳指导教师(签名):华北工学院分院二○○四年六月设计任务书题目:多门限图象分割技术的研究设计工作量:1、查资料,了解图象分割技术的应用背景和发展前沿;2、查资料,了解阈值分割技术的基本原理和实现方法;3、查资料,了解多门限分割的应用背景和实现的原理;4、设计算法和编写软件实现自动多门限图象分割;5、实验、效果分析;6、写论文。设计日期:发题日期2004年3月10日完成日期2004年6月15日设计者:班级:0020221-01姓名:许佳指导教师(签名):40-1-【摘要】图象分割是一种重要的图象技术,也是图象处理到图象分析的关键步骤。本文在对传统的分割技术进行分类介绍的基础上,重点讨论了阈值分割方法。由于实际中大部分图象其直方图不具备明显的双峰特点,用普通的单门限分割达不到最佳效果,本文针对此研究了多门限分割方法,介绍了几种不同的多门限分割方法,并对常用的基于类别方差的自动单门限图象分割方法进行了扩展,给出了一种适合于灰度图象的自动多门限图象分割方法。实验结果表明,本方法具有很好的分割效果。【关键词】多门限,阈值,图象分割【Abstract】Imagesegmentationisakindofimportantimagetechnique.Itisalsothekeyprocessfromimageprocessingtoimageanalysis.Therefore,torealizeimagesegmentationaccuratelyisveryimportant.Sometraditionalsegmentationtechniquesareintroducedseparatelyinthispaper,andsegmentationmethodsbasedonthresholdarediscussedchiefly.Becausethehistogramsofmanyimagesdonothavetheobvioustwopeakscharacteristics,thesinglethresholdsegmentationcannotreachthebesteffect.Aimingatthisproblem,thepaperdiscussesmultithresholdsegmentationmethodmainly.Somemultithresholdssegmentationmethodsarediscussed.Moreover,weimprovethesinglethresholdgray-levelimagesegmentationmethodandgiveanapproachofautomaticmultithresholdgray-levelimagesegmentationbasedonthebetweenclassvariance.Theexperimentalresultsshowthatthetechniqueisveryeffectiveonimagesegmentation.【Keyword】multithreshold,threshold,imagesegmentation目录中文摘要…………….1英文摘要…………….21、引言…………….42、图象分割的基本技术…………...6 2.1图象分割的数学描述……………………..6 2.2图象分割的基本技术……………………..62.2.1并行边界类技术…………………...7 2.2.2串行边界类技术…………………. 2.2.3并行区域类技术…………………. 2.2.4串行区域类技术…………………. 2.3单阈值分割方法………………………..15 2.3.1基于各象素值的阈值……………. 2.3.2基于区域性质的阈值……………. 2.3.3基于坐标位置的阈值……………. 2.3.4基于过渡区的阈值……………….3、多门限图象分割方法………………………...24 3.1多门限分割的必要性……………………24 3.2基于模糊测度的多门限图象分割………24 3.3基于目标特征的多门限图象分割方法…………………27 3.4基于类别方差的自动多门限图象分割方法……………28 3.4.1基于类别方差的自动二级门限分割……………. 3.4.2基于类别方差的自动多门限分割………………. 3.4.3软件实现…………. 3.4.4实验结果分析…………………….设计有感…………………………...37致谢………………...38参考文献…………………………...39引言图象分割是一种重要的图象技术,它不仅得到人们广泛的重视和研究,也在实际中得到大量的应用。图象技术在广义上是各种与图象有关技术的总称。图象技术种类很多,跨度很大,但可以将他们归在一个整体框架――图象工程之下。图象工程是一个对整个图象领域进行研究应用的新学科。它的内容非常丰富,根据抽象程度和研究方法等的不同可分为三个各有特点的层次(见图1.1虚线框内):图象处理、图象分析和图象理解。图图1.1图象分割在图象工程中的位置图象分割图象处理图象分析图象理解目标表达参数测量操作对象象素符号目标图象处理着重强调在图象之间进行变换还以及改善图象的视觉效果。图象分析则主要是对图象中感兴趣的目标进行检测和测量,以获得它们的可观信息从而建立对图象的描述。图象理解的重点是在图象分析的基础上,进一步研究图象中各目标的性质和它们之间的相互联系,并得出对原始成像客观场景的解释,从而指导和规划行动。图象处理、图象分析和图象理解具有不同的操作对象,可参见图1.1。图象处理是比较低层的操作,它主要在图象象素级上进行处理。图象分析则进入了中层,它侧重于对象素集合――目标的表达测量描述。图象理解主要是高层操作,基本上是对从描述中抽出来的疏忽符号进行运算推理。在对图象的研究和应用中,人们往往仅对图象中的某些部分感兴趣。这些部分常称为目标或前景(其他部分称为背景),它们一般对应图象中特定的、具有独特性质的区域。为了辨别和分析图象中的目标,需要将它们从图象中分离提取出来,在此基础上才有可能进一步对目标进行测量和对图象进行利用。图象分割就是把图象分成各具特性的区域并提取出感兴趣目标的技术和过程。这里特性可以是象素的灰度、颜色、纹理等,预先定义的目标可以对应单个区域,也可以对应多个区域。图象分割是由图象处理到图象分析的关键步骤,是图象处理中的重要问题,也是计算机视觉研究中的一个经典难题,在图象工程中占据重要的位置。一方面,它是目标表达的基础,对特征测量有重要的影响。另一方面,因为图象分割及其基于分割的目标表达、特征提取和参数测量等将原是图象转化为更抽象更紧凑的形式,使得更高层的图象分析和理解成为可能。图象分割在实际中也已得到了广泛的应用,例如在工业自动化,在线产品检验,生产过程控制,文档图象处理,遥感和生物医学图象分析,保安监视,以及军事,体育,农业工程等方面。概括来说,在各种图象应用中,只要需对图象目标进行提取,测量都离不开图象分割。图象分割又是一种特殊的图象技术。尽管图象分割得到了广泛重视、研究和应用,国际上许多图象技术学术会议都有图象分割主题和分会,有关图象分割研究的文章早已数以千计,在许多图象工程书籍中也有独立的章节论述,但至今国内外罕有专门介绍图象分割的书籍出版。事实上,虽然图象分割的研究已有几十年的历史,但至今还没有建立统一的理论系统,因为虽然有关图象分割的技术和算法种类繁多且层出不穷,但是在具体应用中都存在各种各样的问题,主要是很难用一个精确的数学公式来表征图象分割的过程,这些分割方法对具有某种特定特征的图象具有较好的分割结果,而对实际工作中遇到的其它类型的图象分割效果却较差。当前没有一种方法对所有测试图象分割效果均为最佳。因此,在实际应用时,应针对具体的应用背景和给定的图象类别,综合考虑时间和存储空间的要求,选择适当的分割方法。图象分割的基本技术2.1图象分割的数学描述图象分割是将图象分成若干个区域,每一个区域内部有相同或相似的特性,而相邻区域的特性不同,下面借助集合的概念给出图象分割的确切数学描述:令集合R代表整个图象区域,对R的分割可看做将R分成N个满足以下五个条件的非空子集(子区域)R1,R2,…,RN:①Ri=R;②对所有的i和j,i≠j,有Ri∩Rj=Φ;③对i=1,2,…,N,有P(Ri)=TRUE;④对i≠j,有P(Ri∪Rj)=FALSE;⑤对i=1,2,…,N,Ri是连通的区域。其中P(Ri)是对所有在集合Ri中元素的逻辑谓词Φ代表空集。上面的五个条件中:条件①指出在对一幅图象的分割结果中全部子区域的总和(并集)应能包括图象中所有象素(就是原图象),或者说分割应将图象中的每个象素都分进某个子区域中。条件②指出在分割结果中各个子区域是互不重叠的,或者说在分割结果中一个象素不能同时属于两个区域。条件③指出在分割结果中每个子区域都有独特的特性,或者说属于同一个区域中的象素应该具有某些相同特性。条件④指出在分割结果中,不同的子区域具有不同的特性,没有公共元素,或者说属于不同区域的象素应该具有一些不同的特性。条件⑤要求分割结果中同一个子区域内的象素应当是连通的,即同一个子区域内的任两个象素在该子区域内互相连通,或者说分割得到的区域是一个连通组元。这些条件不仅定义了分割,也对进行分割有指导作用。对图象的分割总是根据一些分割准则进行的。条件①与条件②说明正确的分割准则应可适用于所有区域和所有象素,而条件③和条件④说明合理的分割准则应能帮助确定各区域象素有代表性的特性,条件⑤说明完整的分割准则应直接或间接得对区域内象素的连通性有一定的要求或限定。2.2图象分割的基本技术图象分割的研究多年来一直受到人们的高度重视,至今已提出了上千种各种类型的分割算法,而且近年来每年都有上百篇有关研究报道发表。由于现有的分割算法非常多,所以将他们进行分类的方法也提出了不少。例如有把分割算法分成三类的:①阈值分割;②边缘检测;③区域提取。但事实上阈值分割的方法在本质上也是一种区域提取反方法,所以③实际上包含了①。另外也有把分割算法分成六部分讨论的:①阈值分割;②象素分类;③深度图象分割;④彩色图象分割;⑤边缘检测;⑥基于模糊集的方法。从算法的角度来看,各部分内容是有重叠的。事实上对深度图象和彩色图象的分割仍须用或可用①,②或⑤这几部分中的方法进行,而⑥所讨论的只是把模糊集合理论用于①,②和⑤中的方法里。另外①和②中的方法有许多相似之处,而常见的基于区域生长原理的算法却没有包含进这些类中去。将算法分类实际上是把一个集合分成其子集的问题,这与分割本身有一定的相似性。参考关于分割的定义,可知一个合适的算法分类应满足以下四个条件:①每个算法都能被分进某一类中;②各类的综合能包含所有算法;③在同一类中的算法应该具有某些相同的性质;④在不同类中的算法应该具有某些不同性质。分类总是根据一些分类准则进行的。上述前两个条件说明分类准则应能把所有算法进行分类而后两个条件说明分类准则应能帮助确定各类算法有代表性的特性。参照这些条件可以用下面两个准则来对分割算法进行分类。首先对图象的分割可基于相邻象素值方面的两个性质:不连续性和相似性。区域内部的象素一般具有某种相似性,而在区域之间的边界上一般具有某种不连续性。所以分割算法可据此分为利用区域间特性不连续性的基于边界的算法和利用区域特性相似性的基于区域的算法。另外根据分割过程中处理策略的不同,分割算法又可以分为并行算法和串行算法。在并行算法中,所有判断和决定都可独立的和同时的作出,而在串行算法中,早期处理的结果可被其后的处理过程所利用。一般串行分割算法所需的时间常比并行分割算法要长,过程控制较复杂,但抗噪声能力也较强。上述这两个准则互不重合又互为补充,所以分割算法可根据这两个准则分成四类:①PB:并行边界类;②SB:串行边界类;③PR:并行区域类;④SR:串行区域类。上述分类法既能满足分割定义的五个条件,也可以包容不同文献中所提到的各种算法,还可以包容近年来人们所提出的一些综合利用以上四类方法基本思想的混合算法,即将分属四类的算法用不同的形式组合起来得到的算法。例如基于边缘检测的方法可以使并行的或串行的,主要取决于边缘连接或跟踪时采用的策略,阈值分割法和象素分类法都属于并行区域类,而区域生长和区域分裂合并法则属于串行区域类。表2.1分割算法分类表分类边界(不连续性)区域(相似性)并行处理PBPR串行处理SBSR 今年来,人们还提出了一些综合利用以上4类方法基本思想的混合算法,但一般只是将分属4类的算法用不同的形式组合起来,所以在下文中,分别介绍这4类方法的基本原理和各类中一些典型的算法。2.2.1并行边界分割技术并行边界技术指采用并行的方法通过对目标边界的检测来实现图象分割的技术。它采用的方法原理与人的视觉过程有些相似。人对场景中亮度或其他性质变化较快的部位比较敏感,一般当人观察场景时总先注意到其中不同物体的相交处,并可以很快得出每个物体各自的轮廓。人在进行这个工作时常常时同步开展的,即同时检测轮廓的各部分。并行边界技术在确定图象中区域边界时也是同步进行的。采用并行边界技术进行图象分割主要有两个步骤:①检测目标的边缘点;②组成目标的边界。第一个步骤可采用微分算子来直接检测,也可建立边缘模型通过拟和来间接检测。第二个步骤往往比较复杂。对实际由噪声的图象,仅用微分算子检测出的边缘点并不能组成封闭的边界而将目标从背景中分离出来。边缘检测边缘检测分割法是通过检测出不同区域边界来进行分割的。边缘总是以强度突变的形式出现,可以定义为图象局部特性的不连续性,如灰度的突变、纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始。图象的边缘包含了物体形状的重要信息,它不仅在分析图象时大幅度地减少了要处理的信息量,而且还保护了目标的边界结构。因此,边缘检测可以看作是处理许多复杂问题的关键。对于边缘的检测常常借助于空域微分算子进行,通过将其模板与图象卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘。灰度边缘是灰度值不连续(或突变)的结果,这种不连续常可利用求一阶和二阶导数方便检测到。在现存的局部技术边缘检测方法中,主要有梯度算子、方向算子、拉普拉斯算子、马尔算子和坎尼算子等。1梯度算子梯度算子是一阶导数算子。在边缘灰度值过度比较尖锐且图象中噪声比较小时,梯度算子的工作效果较好。根据模板的大小和元素(系数)值的不同,提出了许多种不同的梯度算子。最简单的梯度算子是罗伯特交叉(Robertscross)算子,它的两个2×2模板见图(a).比较常用的还有蒲瑞维特(Prewitt)和索贝尔(Sobel)算子,它们都用两个3×3模板,见图(b)和(c)。100-101-10-101-101-101111000-1-1-1(a)Roberts(a)Roberts(b)Prewitt(b)Prewitt-101-202-101121000-1-2-1(c)Sobel(c)Sobel图2.1几种常用梯度算子的模板图2.1几种常用梯度算子的模板2方向算子方向算子利用一组模板分别计算在不同方向上的差分值,取其中最大的值作为边缘强度,而将与之对应的方向作为边缘方向。常用的八方向Kirsch(3×3)模板如图所示,各方向间的夹角为45°-533-503-533333-503-5-5333330-53-5-5333303-5-5-53-5-530-533333-530-533-5-5-53-503333-5-5-5303333图2.2图2.2Kirsch算子的八方向3×3模板3拉普拉斯算子拉普拉斯(Laplacian)算子是一种二阶导数算子,是无方向性的算子,它比计算多个方向导数算子的计算量要小,因为只需用一个模板,且不必综合个模板的值。计算数字图象函数的拉普拉斯值也是借助各种模板卷积实现的。对模板的基本要求是对应中心象素的系数应该是正的,而对应中心象素邻近象素的系数应该是负的,且所有系数的和应该是零,这样就不会产生灰度偏移。实现拉普拉斯运算的几种模板见图。0-10-14-10-10-1-1-1-18-1-1-1-1-10-1040-10-1(c)(b)(a)(c)(b)(a)图2.3图2.3几种实现拉普拉斯运算的模板由于拉普拉斯算子是一种二阶导数算子,所以它对图象中噪声相当敏感。而且它常产生双象素宽的边缘,且也不能提供边缘方向的信息。基于以上这些原因,拉普拉斯算子很少直接用于检测边缘,而主要用于已知边缘象素后确定该象素是在图象的暗区或明区的一边。另外,一阶差分算子会在较宽范围形成较大的梯度值,因此不适合于精确定位,而二阶差分算子的过零点可以精确定位边缘。马尔算子马尔(Marr-Hildreth)算子是在拉普拉斯算子的基础上实现的,它得益于对人的视觉机理的研究,具有一定的生物学和生理学意义。用到的卷积模板一般较大,不过这些模板可以分解而借用一维卷积来快速计算。数学上已证明,马尔算子是按零交叉检测阶跃边缘的最佳算子。这些边缘检测器对边缘灰度值过度比较尖锐且噪声较小等不太复杂的图象,大多数提取算法均可以取得较好的效果。但对于边缘复杂、采光不均匀的图象来说,则效果不太理想。主要表现为边缘模糊、边缘非单象素宽、弱边缘丢失和整体边缘的不连续等方面。在噪声较大的情况下常用的边缘检测算法,如Marr算子,递归滤波器和Canny算子等都是先对图象进行适当的平滑,抑制噪声,然后求导数,或者先对图象进行局部拟合,然后再用拟合的光滑函数的导数来代替直接的数值导数。Canny算子较为简单,而且考虑了梯度方向,效果比较好。无论是那一种边缘检测算子,遗憾的是至今为止仍没有一个固定的评价其性能优劣的准则。下面介绍一下Canny给出的准则。Canny准则认为一个优良的边缘算子应具有以下特性:①好的检测性能。即具有低的把真实边缘点为非边缘点或把非边缘点误判断为边缘点的概率。②好的定位性能。即判断为边缘的点应尽可能靠近真实边缘的中心。③唯一性。即对于单个边缘点仅有一个响应。因为第一准则可能对相同的边缘给出两个响应,所以必须认为其中有一个是假的。第一准则不能给出单一响应,必须进行明晰化操作。一个好的边缘检测算子应优化上面所有的准则。边界闭合在有噪声时,用各种边缘算子检测得到的边缘象素常常是孤立的或仅分小段连续的。为组成区域的封闭边界以将不同区域分开,需要将边缘象素连接起来。前述的边缘检测算子是并行工作的,如果边界闭合也能并行完成,则分割基本上可以并行实现。下面介绍一种利用象素梯度的幅度和方向进行边界闭合的方法。边缘象素连接的基础是它们之间有一定的相似性。用梯度算子对图象处理可得到象素2方面的信息:①梯度的幅度;②梯度的方向。根据边缘象素梯度在这两方面的相似性可把它们连接起来。具体说来如果象素(s,t)在象素(x,y)的邻域且它们的梯度幅度和梯度方向分别满足以下两个条件(其中T是幅度阈值,A是角度阈值):那么就可将在(s,t)的象素与在(x,y)的象素连接起来。如对所有边缘象素都进行这样的判断和连接就有希望得到闭合的边界。2.2.2串行边界分割技术 串行边界技术指采用串行的方法通过对目标边界的检测来实现图象分割的技术。串行边界技术常通过顺序搜索边缘点来工作,所以有三个关键:①确定起始边界点,顺序搜索将从这里开始;②选择所搜策略,确定先前的结果对选择下一个检测象素和下一个结果的影响,并根据一定的机理依次检测新的边界点;③设定终止条件,并当搜索进程结束时使之停下来。 一般对目标轮廓边界的期望主要有三个:①细,轮廓为单象素宽;②连,连续无间断(对完全在图象中的目标其边界应闭合);③准,各边界点在正确的位置上。用并行方法检测边缘点和连接边缘点的方法在图象受噪声影响较大时对边界的比金额效果比较差。其中的原因之一就是没有利用各边缘点间的空间关系,所以会出现应连接的但相距较远的同一目标边界上的边缘点连不起来,而不应连接的但相距较近的不同目标边界上的边缘点被连接起来的情况。另外,把一个微分算子应用于梯度强度有较宽范围变化的区域会检测出若干行并列的边缘象素。采用在边缘检测的基础上利用串行方式连接边缘点成为闭合边界的方法有可能解决这些问题。正确设计串行宾接的算法可以除去假设的边缘点,直接得到单象素宽而连续的边界。至于边界的位置,由于串行方式在作出当前的决定时比较充分地考虑和依据了先前得到地结果,所以如果起始点选择正确,则整个边界的位置准确性容易有较高保证。串行边界分割技术主要可才取两种策略:先检查边缘点再连接它们;对边界点的检查和连接交叉或结合进行。边界跟踪边界跟踪也称边缘点链接,是由梯度图中的一个边缘点出发,一次搜索并连接相邻边缘点从而逐步检测出边界的方法。为了消除噪声的影响,保持边界的光滑性,再在搜索时每确定一个新的边界点都要考虑先前已得到的边界点。而为了克服噪声造成的边缘点之间的不连通,对梯度图要充分保持其已有的信息。一般来说边界跟踪包括三个步骤:确定作为搜索起点的边缘点(根据算法不同,可以是一个点或多个点),起点的选择很重要,整个算法对此的依赖很大;确定和采取一种合适的数据结构和搜索机理,在已发现的边界点基础上确定新的边界点,这里要注意研究先前的结果对选择下一个检测象素和下一个结果的影响;确定搜索终结的准则或终止条件(如封闭边界则回到起点),并在满足条件时停止进程,结束搜索。状态空间搜索状态空间搜索法也称为图搜索法或启发式搜索。在图搜索法中,用图结构表示边界点和边界段,通过在途中搜索对用最小代价的通道以找到闭合边界。这相当于把边缘检测和边界连接结合进行。状态空间搜索法是一种全局的方法,它在图像受噪声影响较大时效果仍较好。但与传统的边界跟踪法相比,这种方法比较复杂,计算量也比较大,这里不作介绍。动态规划动态规划是一个多步决策过程,它通过把一个N步过程化为N各单步过程的方法使算法的复杂性按对数律降低。根据动态规划的原理,可将全局最优化成局部最优之和。在许多实际应用中,为加快运算速度常常只要求得到亚最优解。下面介绍一个结束有关具体问题的启发性知识减少搜索的方法。令r(n)为从起始点s出发经过当前结点n到达目标结点g的最小代价通路的估计代价。这个估计代价可以表示成两个代价之和,即从起始结点s到当前结点n的最小代价通路的估计t(n)以及从当前结点n到目标结点g的通路估计代价h(n)之和:r(n)=t(n)+h(n)这里t(n)可取为目前从结点s到结点n为最小代价通路,h(n)可借助某些启发性知识得到。常用的启发性知识通常包括通路的方向性(是否指向搜索的终点),光滑性(可通过曲率计算来估计)以及代价估计(和t(n)的计算类似)。代价的计算可参照前面的方法。根据上式进行图搜索算法有以下几个步骤构成:⑴将起始结点标记为OPEN并置t(s)=0;⑵如果没有结点为OPEN,失败退出,否则继续;⑶将上式算得到估计代价r(n)为最小OPEN结点标记为CLOSE;⑷如果n是目标结点,找到通路(可由n借助指针上溯至s)退出,否则继续⑸展开结点n,得到它的所有子结点(如果没有子结点,返回步骤⑵)⑹如果某个子结点还没有标记,置,标记它为OPEN并将指向它的指针返回到结点n;⑺如果子结点已标记为OPEN或CLOSE,根据t`()=min[t(),t(n)+c(n,)]更新它的值。将t`值减小的CLOSE子结点标记为OPEN,并将原点指向所有其t`值减小的子结点的指针重指向n。返回步骤⑵。2.2.3并行区域分割技术 并行区域技术指采用并行的方法通过对目标区域的检测来实现图象分割的技术。图象分割的目的是将感兴趣的区域提取出来,所以分割针对区域进行是最直接的方法。并行区域技术在实际分割中应用的主要有两大类:①阈值化算法;②特征空间聚类。阈值化算法是图象分割中算法数量最多的一类。从某种意义上说,象素特征空间聚类可看作是阈值化技术的推广。事实上有些多维持特征空间分类(如彩色图象分割)的问题也可转化为用多次阈值分割来解决。另外,图象阈值化或特征空间聚类的直接结果是把图象中各个区域分开,但要把其中的目标区域提取出来,还常常需要对各区域进行识别标记,这也是采用并行区域分割技术要考虑的一个问题。1.阈值化分割原理阈值化分割算法的历史可追溯到近四十年前,现已提出了大量的算法。简单说来,对灰度图象的取阈值分割就是先确定一个处于图象灰度取值范围之中的灰度阈值,然后将图象中各个象素的灰度值都与这个阈值相比较,并根据比较结果将对应的象素(分割)化为两类:象素的灰度值大于阈值的为一类,象素的灰度值小于与之的为另一类(灰度值等于与之的象素可归入这两类之一)。这两类象素一般分属图象中的两类区域,所以对象素根据阈值分类达到了区域分割的目的。由此可见,阈值化分割算法主要有两个步骤:确定需要的分割阈值;将分割阈值与象素值比较以划分象素。以上步骤中,确定阈值是分割的关键,如果能确定一个合适的阈值就可方便地将如象分割开来,而在阈值确定后,将阈值与象素值比较和划分象素可对各象素并行地进行,分割地结果直接给出图象区域。在利用取阈值方法来分割灰度图象时一般都会图象有一定的假设。换句话说,时基于一定地图象模型的。最常用的模型可描述如下:假设图象由具有单峰灰度分布的目标和背景组成,处于目标或背景内部相邻象素间的灰度值是高度相关的,但处于目标和背景交界处两边的象素在灰度值上由很大的差别。如果一幅图象满足这些条件,它的灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合构成的。进一步如果这两个分布大小(数量)接近且均值相距足够远,而且两部分的均方差也足够小,则直方图应为较明显的双峰。类似地,如果图象中由多个单峰灰度分布地目标,则直方图可变现为较明显的多峰。对这类图象常可用取阈值方法来较好的分割。要把图象中各种灰度的象素分成两个不同的类需确定一个阈值。如果要把图象中各种灰度的象素分成多个不同的类,那么需要选择一系列阈值以将每个象素分到合适的类别中去。如果只用一个阈值分割称为单阈值分割方法,如果用多个阈值分割称为多阈值分割方法。单阈值分割可看作是多阈值分割的特例,许多单阈值分割算法可推广以进行多阈值分割。反之,有时也可将多阈值分割问题转化为一系列单阈值分割问题来解决。不管用何种方法选取阈值,一幅原始图象f(x,y)取单阈值T分割后的图象可定义为:这样得到的g(x,y)是一幅二值图象,它相当于把原是图象f(x,y)用空间占有数组来进行表达。图2.4单阈值分割图示图2.4所示给出单阈值分割的一个示例。图(a)代表一幅含有多个不同灰度值区域的原始图象f(x,y);图(b)给出了它的直方图h(z),其中z代表图象灰度值,T为用于分割的阈值;图(c)代表用T为阈值分割后的结果g(x,y),其中大于阈值的象素以白色(1)显示,小于等于阈值的象素以黑色(0)显示。在一般的多阈值分割情况下,取阈值分割后的图象可表示为:g(x,y)=k如Tk-1<f(x,y)≤Tkk=0,1,2,…,K其中T0,T1,…,Tk是一系列分割阈值,k表示赋予分割后图象各区域的不同标号。图示给出多阈值分割的一个示例。图(a)仍代表一幅含有多个不同灰度值区域的原始图象f(x,y);图(b)给出分割的1-D示意图(f(x)可理解为把原始图象f(x,y)沿y为某个常数切割得到的剖面),其中用多个阈值把(连续灰度值)f(x)分成若干个灰度值段;图(c)代表分割结果g(x,y),灰度值处于不同分段的区域用不同深浅的灰度表示。图2.5多阈值分割示例这里,阈值分割的关键就是如何选取阈值,它对分割结果有着重要的影响,本文在2.3详细介绍。2.特征空间聚类根据特征进行模式分类是指将一组目标根据从它们测量的特征值将它们划分到各类中的技术。利用特征空间聚类的方法进行图象分割可看作是对阈值分割概念的推广。它将图象空间中的元素用对应的特征空间点表示,通过将特征空间的点聚集成团,然后再将它们映射回原图象空间以得到分割的效果。一般的阈值分割可看作用象素的灰度为特征,灰度直方图代表特征空间,用阈值将特征空间划分开,把得到的特征类映射回图像空间,不同灰度的象素构成不同的区域。除象素回溯外,其他图象特征也可用于聚类。与取阈值分割类似,聚类方法也是一种全局的方法,比仅基于边缘检测的方法更抗噪声。聚类方法本身还可用于选取阈值。2.2.4串行区域分割技术串行分割技术指采用串行处理的策略通过对目标的直接检测来实现图象分割的技术。串行分割方法的特点是将整个处理过程分解为顺序的多个笔者逐次进行,其中对后续步骤的处理要根据对前面已完成步骤的处理结果进行判断而确定。这里判断是要根据一定的准则来进行的。一般来说如果准则是基于图象灰度特性的,则该方法可用于灰度分割。串行区域分割中常利用图象多分辨率的表达结构,基于区域的串行分割技术由两种基本形式,一种是从单个象素出发,逐渐合并以形式所需的分割区域,另一种是从全图出发,逐渐分裂切割至所需的分割区域。1.区域生长区域生长的基本思想是将具有相似性质的象素集合起来构成区域。具体先对每个需要分割的区域着一个种子象素作为生长的起点,然后将种子象素周围邻域中与种子象素有相同或相似性质的象素合并到种子象素所在的区域中。将这些新象素当做新的种子象素继续进行上面的过程,直到再没有满足条件的象素可被包括进来。这样一个区域就长成了。再实际应用区域生长法时需要解决3个问题:⑴选择或确定一组能正确代表所需区域的种子象素;⑵确定再生长过程中能将相邻象素包括进来的准则;⑶制定让生长停止的条件或规则。生长准则的选取不仅依赖于具体问题本身,也和所用图象数据的种类有关。例如当图象是彩色的,仅用单色的准则,效果就会受到影响。另外还需考虑象素间的连通性和领近性,否则有时会出现无意义的结果。一般生长过程在进行到没有满足生长需要的象素时停止。但常用的基于灰度,纹理,彩色的准则大都基于图象中局部性质,并没有充分考虑生长的“历史”。为增加区域生长的能力常需考虑一些与尺寸,形状等图象全局性质有关的准则。在这种情况下常需对分割结果建立一定的模型。2.分裂合并区域分裂合并方法先从整幅图象开始通过不断分裂得到各个区域。实际中常先把图象分成任意大小且不重叠的区域,然后再合并或分裂这些区域以满足分割的要求。图象四叉树是一种简单分裂合并算法。令R代表整个正方形图象区域,P代表逻辑谓词。我们可把R连续地分裂成越来越小的1/4的正方形区域Ri,并且始终P(Ri)=TRUE。换句话说,如果P(R)=FALSE,那么就将图象分成4等分。如果P(Ri)=FALSE,那么就将Ri分成4等分。如此类推,直到Ri为单个象素。RRR1R2R3R4R41R42R43R440层1层2层RR1R2R3R41R42R44R43图2.6图象的四叉树表示法如果仅仅允许使用分裂,最后有可能出现相邻的2个区域具有相同的性质但并没有合成一体的情况。为解决这个问题,在每次分裂后我们允许其后继续分裂和或合并。这里合并只合并那些相邻且合并后组成的新区域满足逻辑谓词P的区域。换句话说,如果能满足。则将Ri和Rj合并起来。由上总结出基本分裂合并法步骤如下:设R代表整个正方形区域,P代表检验准则。⑴对任意一个区域Ri,如果P(Ri)=FALSE就将其分裂成不重叠的四等份;⑵对相邻的两个区域Ri和Rj(它们也可以大小相同,即不在同一层),如果条件P(Ri∪Rj)=TRUE满足,就将它们合并起来;⑶如果进一步的分裂或合并都不可能了,则结束。2.3阈值分割方法一副图象包含了很多的信息,基本分为前景和背景两大部分,图象分割就是将二者分离开来,一种好的方法能把图象中蕴含的绝大多数信息反映出来,能保留有用的信息。如下图所示:图2.7(a)原始图象图2.7(b)合适阈值分割图2.7(c)阈值过高图2.7(d)阈值过低由以上四图可看到,如果阈值选择过高,则过多的目标区域将被划分为背景,相反,如果阈值选择过低,则过多的背景区域象素被划分到目标区域,形成虚假的目标。因此,选取合适的分割阈值是阈值化算法的关键问题,如果能确定一个合适的阈值就可方便地将图象目标区域与背景区域分割开来。而在阈值确定后,将阈值与象素值比较和划分象素可对各象素并行地进行,分割的结果直接给出图象区域。阈值一般可写成如下的形式:T=T[x,y,f(x,y),p(x,y)]其中f(x,y)代表象素点(x,y)处的灰度值,p(x,y)代表在该点邻域的某种局部性质。换句话说,阈值T在一般情况下可以是(x,y),f(x,y),p(x,y)的函数。如果f(x,y)﹥T,则点(x,y)记作物体点,反之则记作背景点。根据对T的不同限制,可将取阈值分割方法分成如下三类,其中的阈值分别称为:①基于各象素值的阈值。阈值仅根据f(x,y)来选取,所得到的阈值仅于全图各象素的本身性质(象素值)有关;(确定这类阈值的技术有时称为点相关技术)②基于区域性质的阈值。阈值是根据f(x,y)和p(x,y)来选取,所得到的阈值于区域性质(区域内各象素的值,相邻象素值的关系等)有关;(确定这类阈值的技术有时称为区域相关技术)③基于坐标位置的阈值。阈值进一步(除根据f(x,y)和p(x,y)来选取外),还与x,y有关,即阈值要考虑位置(x,y)来确定,则所得到的阈值是与象素空间坐标有关的。(确定第三类阈值的技术有时称为点动态阈值技术)2.3.1基于各象素值的阈值1.极小值点阈值如果将直方图的包络看作一条曲线,则选取直方图的谷可借助求曲线极小值的方法。设用h(z)代表直方图,那么极小值点应同时满足:和和这些极小值点对应的灰度值就可用作分割阈值。实际图象的直方图由于图象噪声等原因经常有很多起伏,使得按上式计算出的极小值点有可能对应虚假的谷。解决的方法之一是先对直方图进行平滑处理,例如可用高斯函数过g(z,)和直方图h(z)进行卷积以得到平滑直方图h(z,):其中为高斯函数的标准差。2.最优阈值图象中的背景和目标往往是有部分交错的,用一个阈值不能把二者完全分开,此时更希望的是选择合适的阈值使得划分出来的目标和背景的错误分割概率为最小。设1幅图象仅包含2类主要的灰度值区域(目标和背景),它的直方图可看成灰度概率密度函数p(z)的一个近似。这个密度函数实际上是目标和背景的2个单峰密度函数之和。如果已知密度函数的形式,那么就有可能选取一个最优阈值把图象分成2类区域而使误差最小。设有这样一幅混有加性高斯噪声的图象,它的混合概率密度是:其中V1和V2分别是背景和目标区域的平均灰度值,1和2分别是关于均值的均方差,P1和P2分别是背景和目标区域灰度值的先验概率。根据概率定义P1+P2=1,所以混合概率密度中有5个未知的参数。如果能求得这些参数就可以确定混合概率密度。假设U1<U2,我们定义一个阈值T使得灰度值小于T的象素分割为背景而使得大于T的象素分割为目标。这时错误地将一个目标象素划分为背景地概率和将1个背景象素错误地划分为目标的概率分别是:总的误差概率是为求得使该误差最小地阈值可将E(T)对T求导并令导数为零,这样得到:将这个结果用于高斯密度可得到二次式:该二次式在一般情况下有2个解。如果2个区域的方差相等,则只有1个最优阈值:进一步,如果2种灰度值的先验概率相等(或方差为零),则最优阈值就是2个区域中平均灰度值的中值。一幅图象的混合概率密度函数P(z)的参数可根据最小均方误差的方法借助直方图得到。3.迭代阈值阈值也可以通过迭代计算得到,首先取图象灰度范围的中值作为初始阈值(设共有个灰度),然后按下式进行迭代:其中是灰度为值的象素个数,迭代一直进行到结束,取结束时的为分割阈值。上述分割方法可用下土所示流程来解释和实现。首先根据初始开关函数将输入图逐象素分成前景和背景,在第一遍对图象扫描结束后,平均两个积分器的值以确定一个阈值。用这个阈值控制开关再次将输入图分成前景和背景,并用作新的开关函数。如此将迭代反复进行直到开关函数不再发生变化,此时得到的前景和背景即为最终分割结果。比较器比较器输入图象开关函数开关前景积分器背景积分器阈值平均图2.8迭代选择法的流程和实现从直方图上直观地看,上述方法得到的阈值处在与两个灰度区域的重心成反比的位置,所以从路径规划的角度看于是一种最优阈值。直方图凹性分析对含有目标和背景两类区域地图象,其直方图并不一定总是呈现双峰形式。例如当目标和背景区域的主要灰度比较接近而部分重叠时,其间的谷可能不存在。又如当图象中目标和背景面积相差较大时,直方图的一个峰会淹没在另一个峰旁边的缓坡里,直方图基本成为单峰形式。从这样的直方图中确定阈值的一种方法是分析直方图的凹凸性。据土就是把直方图看作平面上的区域,计算其凸包并求出取最大的凸残差,以对应最大凸残差的灰度值作为阈值来分割图象。这里最大的凸残差是用一种称为凹性测度的指标来衡量的。与一般的方法不同,这里要求凹残差的计算是沿与灰度轴垂直的直线进行的。时刻存储法在时刻存储中,图象被分割的时刻被存储在分割后的二值图象中,第i时刻mi的定义为式中M――图象的象素点的总数目;h(g)――灰度级为g的象素点的数目,即灰度直方图中灰度级g的高度。最优阈值t’由面积法可得,,一维直方图熵法把信息论中的“熵”的概念用于图象分割,最早是由Pun提出来的,Kapur对Pun提出的熵法进行了改进,重新定义了物体O与背景B的概率分布相关的熵。一般来讲,一维Kapur熵法优于其它一维灰度直方图熵法,因此它的到了广泛的应用。设分割阈值为t,则物体O与背景B的概念分布为:定义与这两个概率分布相关的熵为式中,,Kapur定义准则函数为H(O),H(B)之和使最大的灰度级t即是所求出的最优阈值t’,2.3.2基于区域性质的阈值基于区域性质地阈值不仅考虑了各象素本身灰度值而且利用了各象素邻域内象素灰度值相互关系等性质。比起仅基于象素值来确定阈值地方法,一方面由于考虑地因素增多使算法的复杂度有所增加,另一方面由于开来了区域性质,抗噪声能力和工作鲁棒性叶一般有所增强。不过所确定的阈值(对多阈值分割是阈值序列)仍作用于整幅图象的每个象素,因而仍对目标和背景的灰度有梯度变化的图象效果较差或失效。基于区域性质的阈值选取方法很多,其中包括:1.直方图变换直方图变换的基本思想就是利用一些象素邻域的局部性质变换原始的直方图为一个新的直方图。这个新的直方图与原直方图相比,或者峰之间的谷更深了,或者谷转变成峰从而更易检测了。这里常用的象素邻域局部性质是象素的梯度值,它可借助前文中的各种梯度算子作用于象素邻域而等到。新直方图根据特点可分为2类:①具有梯度值象素的直方图,其中峰之间的谷比原直方图深;②具有高梯度值象素的直方图,其中的峰是由原直方图的谷转化而来。先看第一类。根据前面描述的图象模型,目标和背景内部的象素具有较低的梯度值,而它们边界上的象素具有较高的梯度值。如果做出仅具有低梯度值的象素的直方图,那么这个新直方图中对应内部点的峰基本不变,但因为减少了一些边界点所以谷应该比原直方图要深。更一般地,可计算1个加权地直方图,其中赋给具有低梯度值地象素权重大一些。例如1个象素点的梯度值为g,则在统计直方图时可给它加权。这样一来,他如果象素的梯度值为零,则他得到最大的权重“1”;如果象素具有很大的梯度值,则他得到的权重就变得微乎其微。在这样加权的直方图中,峰基本不变而谷更深,所以峰谷差距加大。这个方法的一个变型是对图象中每一种灰度的象素计算它们的平金边缘值,根据这个值来对象素的灰度值进行加权以得到变换的直方图。第二类直方图与第一类直方图相反,新的加权直方图在对应目标和背景的边界象素灰度级处会有一个峰。这个峰主要由具有较高梯度值的边界象素构成,这个峰的灰度值对应边界象素的灰度期望值,可选作分割用的阈值。更一般地,叶可计算一个加权地直方图,不过这里赋给具有该梯度值象素的权重要大一些。例如可用每个象素的梯度值g作为赋给该象素的权值。这样在统计直方图时梯度值为零的象素就不必考虑,而具有较大梯度值的象素将得到较大的权重。上述方法也等效于将对应每个灰度级的梯度值加起来,如果对应目标和背景边界处的象素的梯度大,则在这个梯度直方图中对应目标象素和背景象素之间的灰度级处会出现一个峰。这种方法可能会遇到的一个问题是如果目标和背景的面积比较大但边界象素相对比较少,则由于许多个效梯度值的和可能会大于少量大梯度值的和而使原来预期的峰呈现不出来。为解决这个问题可以对美洲灰度级象素的梯度以求平均值来代替求和。这个梯度平均值对边界象素点来说一定比内部象素点要大。2.灰度值和平均灰度值散射图常见的2-D直方图除灰度值对梯度值的散射图外还有灰度值对平均值散射图,灰度共生矩阵等。在灰度值对贫军灰度值散射图中,目标或背景的内部象素会集中于散射图的主对角线,因为这些象素单个的值和小邻域的平均值很接近;而边界象素则会远离主对角线,因为这些象素单个的值和小邻域的平均值可能相差较大。如果以一定的比例设定边界象素的总量,可以得到以内部象素为主的或以边界象素为主的1-D直方图。而在灰度值对平均灰度值散射图中,最佳的分割曲线是二次曲线。另外如果用散射图主对角线附近统计量的二阶熵来表征目标和背景内部的均匀度,也可求得最大熵之和的最大化,则可对小目标图象也有较好的分割效果。灰度共生矩阵与灰度值对平均灰度值散射图有共同的地方,就是目标或背景的北部象素集中于散射图的主对角线附近,而边界象素则远离主对角线。下面是一种在灰度值对平均灰度值散射图的基础上利用随进最大期望(SEM)算法的分割技术。定义原始图象为离散随机场,S为象素集合,,fs是象素s的灰度,gs是象素s的邻域平均灰度值。定义分割图象为,,是第i类的标识,共有K个不同类。现在按贝叶斯公式计算象素s属于类的后验概率:①这里的x,y是随机场在象素处的观测值。计算上式时需要s在类中分布的条件概率,如果选择常用的正态分布,即假设各类的灰度和平均灰度服从二维正态分布,则②这样对每一个类有六个参数待估计:先验概率Pi,均值,方差,以及相关系数。估计正态分布参数可接触图象的直方图,另外也可采用鲁棒性好、收敛速度快的随进最大期望(SEM)算法来估计正态分布的参数,整个算法流程如下:⑴初始化利用上面提到的迭代阈值化算法做初始分类;⑵用随机最大期望估计正态分布模型参数假设第n差迭代将所有象素分类至类,每类的象素总和为。设各相关系数为零,则可按下列各式依次估计另外五个参数:⑶最大后验聚类将步骤(2)中求得的参数代入式②计算象素s在各类中的条件概率,然后再代入式①求取s属于各类的后验概率,按照最大后验概率准则重新聚类。⑷判断停止判断前后两次迭代的聚类结果是否有变化,有变化转到步骤(2)继续进行,否则停止。类后类内象素的灰度紧致性,能使结果中目标的完整性较好。对若干种质量较差的图象,包括目标有阴影,轮廓较模糊,目标占图象面积较小,目标与背景灰度对比度较低,相干斑点噪声较多,背景均匀性不好等问题图象的分割实验表明该算法有较好的效果。基于坐标位置的阈值当图象中有如下一些情况:有阴影,照度不均匀,各处的对比度不同,突发噪声,背景灰度变化等,如果只用一个固定的全局阈值对整幅图象进行分割,则由于不能兼顾图象各处的情况而使分割效果受到影响。有一种解决办法使用与坐标相关的一组阈值(即阈值是坐标的函数)来对图象各部分分别进行分割。这种与坐标相关的阈值也叫动态阈值,这种取阈值分割方法也叫变化阈值法(又称直适应阈值法的)。这类算法的时间复杂度和空间复杂度常比较大,但抗噪声能力强,对一些用全局阈值法不易分割的图象有较好的效果。下面是阈值插值法:首先将图象分解成一系列子图象,这些子图象可以互相重叠叶可以只相接。如果图象比较小,则由阴影和对比度空间变化等带来的问题就会比较小。然后可对每个子图象计算一个阈值,此时阈值可用任一种固定阈值法选取。通过对这些子图象所得阈值的插值就可得到对图象中每个曲面,也可较阈值曲面。具体步骤如下:将整幅图象分成一系列相互之间有50%重叠的子图象;作出每个子图象的直方图;检测各个子图象的子图象是否为双峰的,若是用最优阈值法确定一个阈值,否则就不进行处理;根据对直方图为双峰的子图象得到的阈值,通过插值得到所有子图象的阈值;根据各子图象的阈值,再通过插值得到所有象素的阈值,然后对图象进行分割。2.3.4基于过渡区的过渡区是介于图象中目标和背景间的一类区域,过渡区可借助对图象有效平均梯度(EAG)的计算和对图象灰度的剪切操作来确定。设以f(x,y)代表2-D空间的数字图象函数,其中i,j表示象素空间坐标,f表示象素的函数值,它们都属于集合Z。再设g(i,j)代表f(i,j)的梯度图。则:EAG可定义为:其中,为梯度图的总梯度图值;而为非零梯度象素的总数。这里,。为了减少各种干扰的影响,需要一种特殊的剪切变换,即灰度剪切。根据剪切部分的灰度值与全图灰度值的关系,这类剪切可分为高端剪切与低端剪切两种,剪切后的图可分别表示为:,0LhighLmaxL0LhighLmaxL图2.9(a)典型的和曲线都是单峰曲线,即它们各有一个极值,设和曲线的极值点分别为和,0Lhigh0LhighLmaxL图2.9(b)过渡区的范围,边界的灰度值分别为和。两个极值点的三个重要性质:①对于每个过渡区,和总是存在并且各只存在一个。②和所对应的灰度值都是具有明显的象素特性区别能力。③对同一个过渡区,不会比小,再实际图象中总大于。因此,选取阈值可用根据过渡区象素的平均灰度值或过渡区内象素的直方图的极值来确定。由前面关于EAG的计算公式可知,这里只用到具有非零梯度的象素,且综合利用了灰度值不同的象素的梯度值,所以抗干扰能力较强。另外和曲线都比较光滑(如上图所示),计算和比较容易,搜噪声影响较小。这里过渡区的确定是完全自动的,不需预先设定任何参数,它与目标和背景的相对灰度值变化没有关系,对目标的形状尺寸也没有要求。由于过渡区的确定都保证了真实的边界范围,所以分割偏差太大的可能性很小,换句话说这种方法的稳定性较好。多门限的分割方法3.1多门限分割的必要性取阈值是最常见的并行的直接检测区域的分割方法,其他同类方法如象素特征空间分类可看作是取阈值技术的推广。假设图象由具有单峰灰度分布的目标和背景组成,在目标或背景内部的相邻象素间的灰度值是高度相关的,但在目标和背景交界处两边的象素在灰度值上有很大的差别。如果一副图象满足这些条件,它的回溯直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合而成。此时,如果这两个分布大小(数量)接近且均值相距足够远,而且均方差也足够小,则直方图应是双峰的。对这类图象可用上述介绍取阈值法来较好的分割。但实际的灰度图象往往由于图象中象素的属性、性能、灰度值等的不同,含有多个目标和背景区域,这时,用单阈值分割就很难将含有多个不同灰度值的原始图象分割开来,不能完全显示图象信息,达不到人们预想的分割效果,此时,就需要设立多个阈值将原始图象进行分割,将连续的灰度值分成若干的灰度段,从而将原始图象中的多个目标和背景区域分割开,能达到令人满意的效果。这种方法就是多门限分割方法。多门限分割方法实际上是以上单门限阈值法的一个推广,它是基于单门限方法派生的一个新方法。因此,多门限分割方法也是有很多种的,基本可以分成三大类:第一类是将实际图象的灰度直方图假设为由一组高斯分布构成,在这类方法中,如果实际图象的直方图与假设的模型之间存在误差,往往会得到不合适的阈值;第二类是基于一些准则,如类间方差法,熵法选取阈值,但这类方法很难自动确定分割类数,需要人为事先确定,如果类数选择不合适时,效果很差;第三类时通过对直方图中峰值和谷值的分析直接确定阈值,这类方法对于存在多个峰值或谷值(多个目标和背景区)的图象效果不是很好,不能较为准确的确定阈值。下面就介绍几种典型的多门限分割方法。3.2基于模糊测度的自动多门限图象分割模糊测度的自动多门限分割就是在图象的模糊特征上介绍一种基于模糊隶属度和模糊测度的图象。为了研究图象分割,先给出模糊隶属度、模糊特征域概念。设X是一个具有L级灰度的M*N图象,则根据模糊隶属度的特性,可记做是象素点(i,j)的灰度,是的模糊隶属度,通常也记.的定义如下:,其中为X的灰度最大值,分别称作指数型和倒数型模糊因子。定义1:全体,i=1,2,…,M;j=1,2,…,N组成的平面,称作模糊特征域(平面)。U域的性质:(1)当时,>1.因此是与接近程度的刻划量。(2)是的单调增加的函数(当Fe>0时)(3)当=0时,这也就是模糊隶属度的特征之一。(4)与Fd,Fe的取值有很大的关系,在实际中应根据情况调整。1.模糊测度与模糊熵定义2:设g是从P(X)(X的冥集)到[0,1]的映射,如果满足:(1)g(s)=0,g(X)=1;(2)对于任,若有A包含于B,则有。(3)若有,且单调,则有:那么称g是P(X)上的一个模糊测度。定义3:模糊集A的模糊熵定义为:,其中,①对于二维图象X,则有。其中②m=0,1,2,3,4…,M;n=1,2,3,…,N.显然,。基于图象分割的模糊隶属度和模糊测度记h(g)表示灰度为g的象素点发生的次数,令X的灰度最小值为Xmin,最大值为Xmax;则将区间[Xmin,Xmax]划分为K分,即Xmin=t0<t1<…tk=Xmax;作:,③当时,令,显然时第i个灰度段的平均灰度值。特别当k=2时就可分别看成背景与目标的平均灰度值。先我们将点的属度改为:④Fd1,Fei都是固定的常数,这个函数反应了对每个灰度区间的隶属关系。关于X模糊测度,经过简单的计算,有如下的计算公式:,⑤其中是灰度为g的点数。上的整数;这个函数有如下性质:⑴⑵在[0,0.5]区间上单调增加,在[0.5,1]上单调减小;⑶当=0或1时,取最小0;⑷当=0.5时,取值为1;⑸满足模糊测度的性质;⑹上公式说明了可转用直方图的信息来做。关于X的分割图与之间有如下关系:定理:是X的最优分割的必要条件是存在此分割:,使得取得最小值,此时在每个分割区间上X是一常数。3.图象的度目标自动门限分割步骤:通过直方图的独立峰谷的位置和个数可知,最有划分一定是在某一个独谷的附近,因此当在寻找最优时,只需证在谷的附近变化,从而确定最优划分即可。分割的步骤如下:STEP1:初始化。输入图象X,对图象进行预处理,给出Fd1,Fei,设置最大迭代次数K及允许误差B,峰谷比等。STEP2:作图象的直方图,确定峰谷数及确定峰谷大概位置。STEP3:求出的值,根据谷大概位置,初步给出的初始值;STEP4:由公式③计算;s为循环次数。STEP5:由公式④计算u及由公式⑤计算;STEP6:按一定的策略改变关于分割的的值,分割或者已满足某种条件,则转STEP7,否则转STEP4。STEP7:对进行排序,求出最小值的;并找出对应的分割的值;则此分割就是最优分割。STEP8:显示最优的分割图象目标。3.3基于目标特征的多门限图象分割方法 1.基本思想的提出大多数图像处理系统都采用了“自底向上”的处理流程,即信息经前端底层处理后逐级向后端高层处理部分传递,各处理环节之间没有约束和反馈。这种工作模式的缺陷在于:由前级处理造成的误差会逐级积累,因此,当某种因素使得处理系统中某个靠前的环节的性能恶化时,则可能导致整个系统性能迅速下降,甚至崩溃。为了避免出现上述情况,一批采用“自上而下”的及高、底层处理相结合的图像处理方法和系统应运而生。这些方法的高层知识对底层处理的约束符合人类观察现实世界的感知过程,处理结果优于传统方法在这种处理模式中,如何选定各处理层次间的有效约束、约束应当在哪些环节起作用、高层的知识如何在底层表达等问题,不但影响着系统处理结果的优劣,而且决定了算法所需的运算量,是目前人们研究的热点问题。Bhattachariya等通过建立起物体的形状、尺寸、位置和旋转等参数对图像中目标的个数。灰度、分割区域标号、区域边界及其位置的约束关系,构造了一个目标函数,并通过优化求解目标函数的方法完成图像分割、灰度估计、目标辩识,并取得了很好的实验结果但由于选择的约束条件太多,该处理方法所需的运算量非常大.过多的具有较强相关性的约束变量的选取及用模板配准的方法将高层信息与底层处理联系的方法是使得处理算法效率低的主要原因我们认为,高层知识对图像的区域分割和边缘提取这一处理环节提供约束较为合适,而高层的关于景物中物体的描述可以采用傅立叶描述了、轮廓不变矩等特征量,因为,一方面图像的同质区域和边缘与实际景物具有良好的对应性,其物理意义是直观明了的,另一方面,高层知识的表达采用具有不变性的特征量,可减小问题的复杂程度,减少计算量.根据上述思想,我们提出了图3.6,所示的处理流程.初始化分割区域数s和取门限次数k为0初始化分割区域数s和取门限次数k为0拷贝图象函数f(x,y)到f’(x,y)标记f’(x,y)中非0区域,并根据得到的分割区域更新总分割区域数s,k=k+1k=m+1?结束否是多门限分割根据期望的目标特征约束条件合并子块输入图象图象子块分割结果处理方法数据流数据流图3.6基于目标特征的多门限图象分割处理框架图3.7多门限分割流程2.算法:用图2所示的计算多门限分割处理方法,令具有256个灰度级的n*n像元的静态图象为,它的直方图可表示为:其中,是单位冲击函数。为便于处理,先对直方图做平滑滤波,以得到滤除毛刺后的直方图,其中为低通滤波器。取直方图的m个谷点及灰度g的取值区间的端点(和)作为图象的分割门限,具体的处理过程见图3.7。3.4基于类别方差的自动多门限分割方法在这些方法中还共同存在着一个问题:自动确定门限的能力较差,需要人为参与。为此,我综合上述三种方法,对类别方差法进行改进,增强了自动确定门限的能力,真正实现自动多门限分割方法。此方法从模式识别的分类理论出发,对基于类别方差的自动单门限图象分割方法进行了扩展,给出了一种适合于灰度图象的自动多门限图象分割方法,对灰度图象能够自动寻找最优的门限值(一个或多个),与人类的视觉分割过程一致。3.4基于类别方差的自动门限图象分割方法,通过优化目标函数来获得最佳的全局门限值。设待分割的图象f(x,y)共有L个灰度级,图象的灰度范围为{0,1,……L-1}。门限值t将图象中的象素划分为两类:C0={0,1,……t}C1={t+1,t+2,……L-1}若f(x,y)≤t,则(x,y)∈C0,若f(x,y)>t,则(x,y)∈C1。对图象的直方图进行归一化便得到灰度级的概率分布:pi=ni/N,pi≥0,=1。其中,ni是灰度为i的象素数,N为图象的总象素数N=,pi为灰度级出现的概率。C0和C1类的出现概率分别为:=prC0==t)=prC1==1-t)C0和C1类的类均值分别为:µ0==t)/t)µ1==(-t))/(-t))/(1-t))令为整个图象的均值,故==,对[0,L-1]间的任何t值,以下两式均成立:=µ0+µ1+=1C0和C1类的方差分别为:==按照模式识别理论,这两类的类内方差,类间方差和总体方差分别为:类内方差=+类间方差=µ0-+µ1-=µ0-µ1总体方差=三者关系为:+=,其中和是门限t的函数,与t无关。将这些类方差组合,构成统计量作为目标函数,通过最大化这些目标函数,就可以得到优化的门限。可以选用的统计量有:λ=/,k=/,η=/。用这三个统计量作为类可分离性测度的功能是等效的。文章选用统计量η作为目标函数,极大化η的过程就是确定门限t的过程,所以最佳门限为:=。选用统计量η作为目标函数是基于以下考虑:①由于基于二阶统计特性,而是基于一阶统计特性,所以选用统量η作为目标函数,计算最简单;②在上述三个统计量中,仅η在[0,1]范围内被唯一确定,η=0,当且仅当所要分割的图具有单一的灰度;η=1,当且仅当所给图象为二值图。这一特性可作为判断类别是否可分的依据,用于多级门值的选择。3.4上述基于类别方差的二级门限分割方法对含有目标和背景的一类图象具有较好的分割效果,求出的最佳门限可有效地将图象f分为两类C0和C1,所以原图象f=C0∪C1。但当图象中含有多个目标或者目标和背景分别含有不同的层次时就无能为力了,此时需要用多级门限对图象进行分割,设t1,t2,……tc,是一系列门限值,则多级门限值分割满足:f(x,y)∈[ti,ti+1](i=0,1,……C-1)的象素点被划归为第i类的区域Ci(其中t0=0,tC=L-1,L为灰度级),所以原图象f=C0∪……∪CC-1。基于上述类别方差自动门限法,将求多门限的过程看作是对灰度级依据类别方差进行多级分类的过程,就可以得到基于类别方差的多门限图象分割方法。对C1求多门限MultiThreshold(hist,t*+1,highgraylevel)返回根据列别方差自动门限法求出的t*,将图象分为Co和C1两区域,各自灰度级范围为:[lowgraylevel,t*],[t*+1,highgraylevel]对Co求多门限MultiThreshold(hist,lowgraylevel,t*)c﹥m检测图象级为[lowgraylevel,highgraylevel]图象的直方图的独立峰和独立谷的个数m,并确定门限分割次数cMultiThreshold(hist,lowgraylevel,highgraylevel)图3.1多门限分割算法流程图NOYES设经过上述二级门限分割,求得图象f在灰度级[0,L-1],中的全局门限值,原图中的灰度级为[0,-1],的区域被划分为背景C0,而原图中的灰度级为[,L-1]的区域被划分为目标C1。为实现多级分割,再将原图中的目标和背景区域继续递归地进行分割,即分别将原图中灰度级属于[0,-1]的区域C0和灰度级属于[,L-1]的区域C1看作给定的待分割的新图象,分别进行二级门限值分割,C0被分割为C00和C01即C0=C00∪C01,C对C1求多门限MultiThreshold(hist,t*+1,highgraylevel)返回根据列别方差自动门限法求出的t*,将图象分为Co和C1两区域,各自灰度级范围为:[lowgraylevel,t*],[t*+1,highgraylevel]对Co求多门限MultiThreshold(hist,lowgraylevel,t*)c﹥m检测图象级为[lowgraylevel,highgraylevel]图象的直方图的独立峰和独立谷的个数m,并确定门限分割次数cMultiThreshold(hist,lowgraylevel,highgraylevel)图3.1多门限分割算法流程图NOYES那么如何确定图象的分割次数M,这是需要解决的问题。利用图象灰度直方图实现图象分割是一种简单可行的方法,但实际图象的直方图并不是理想的峰谷分明的,这时就不能直接凭借直方图的峰谷来确定分割次数。由于噪声等因素的干扰,在直方图上可能出现虚峰虚谷,此时应该用小波变换对图象进行去噪处理后,作原图象的直方图,确定直方图中的峰谷的全部个数及峰谷的大概位置。如果相对于峰谷之间有一定的面积,有一定的灰度范围,有一定的峰谷比,则我们就把这样的峰叫“独立峰”,同样可确定独立谷。最后确定独立峰谷的大概位置和个数,则独立峰的个数就是我们要求求的目标个数(如果需要的目标数少于“独立峰”的个数,则去取峰谷比较大者,当然这里又存在选取恰当峰谷比。),也就是确定分割次数M。在基于类别方差的单门限图象分割方法中,门限将图象f划分为C0和C1两个区域,即两类,统计量η=/,其范围在[0,1]中被唯一确定。两极端情况:η=0表明两类间方差为0,故两类具有相同的均匀性,故表明所给图象具有单一的灰度值,不能被分割,反之亦然;η=1表明两类各自的类内方差为0,而两类间的方差与总体方差相等,故所给的图象为二值图,反之亦然。由此可见,随着η值的增大,两类间的可分离性增大,所以选择统计量η作为可分离性的一个度量,即图象的可分离性因子。所寻找的最佳门限能使η达最大值,仅当η大于给定的阈值时该最佳门限才有意义,说明图象f能被划分为C0和C1两个区域。选择统计量η的最大值作为C0和C1的可分离性因子,记为SP=Maxη。即若SP﹥给定的阈值,则f可被分为C0和C1两类。综上所述,基于类别方差的自动多门限图象分割算法MultiThreshold如下:Step1:初始化,输入图象f,对图象进行预处理(去噪等)设最大迭代次数T及允许误差B,峰谷比等。Step2:求待分割图象f的灰度级直方图hist,确定峰谷数M及确定峰谷大概位置;Step3:求图象f的多级分割门限值:MultiThreshold(hist,0,256);Step4:用求得的门限值对原图象进行分割。求图象f的多级分割门限值的算法MultiThreshold为一递归算法,参数一为hist,即待分割原始图象的灰度直方图,参数二和三指明在原图象的[lowgraylevel,highgraylevel]灰度级范围内求多级分割门限值。下面给出了MultiThreshold的算法流程图。说明:可以通过对图象进行训练以确定SP0,假设要对图象进行M级分割(共需M-1个门限值),分割过程由以下两步构成:Step1:训练阶段:目的是确定能用于实现M级分割的SP0。用上面所给图的算法对原图进行分割,SP0值选[0.5,1)的数,找出分割过程中最大的M-1个η值,η1,η2,…ηm-1,取其中的最小值作为SP0,即SP0=Min{η1,η2,…ηm-1}.Step2:分割阶段:使用所求得的SP0值求原图象的M-1个门限值,并对原图进行分割。3.4.31.单门限分割:C=imread('E:\Photo\000.jpg');figure;subplot(1,2,1);imshow(C);title('原始灰度图象');count=imhist(C);[r,t]=size(C);N=r*t; L=256;count=count/N;fori=2:Lifcount(i)~=0;st=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论