第九章典型分割算法ppt课件_第1页
第九章典型分割算法ppt课件_第2页
第九章典型分割算法ppt课件_第3页
第九章典型分割算法ppt课件_第4页
第九章典型分割算法ppt课件_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章 典型图像分割算法,数字图像分析与处理,图像分割,定义,将图像分成各具特性的区域,并提取出感兴趣目标的技术和过程,灰度、颜色、纹理,对应单个区域和多个区域,图像处理过渡到图像分析的关键步骤,也是一种基本的计算机视觉技术,一个典型的图像分析和理解的系统如图所示。该系统分为图像输入、预处理、图像分割(image segment)、图像识别、结构句法分析,图像分析主要包括以下几部分内容: (1)把图像分割成不同的区域,或把不同的东西分开(分割)。 (2)找出各个区域的特征(特征提取)。 (3)识别图像中的内容,或对图像进行分类(识别与分类)。 (4)给出结论(描述、分类或其他的结论,对于给定的

2、一幅含有多个物体的数字图像,模式识别的过程由三个阶段组成,如图所示,检测出各种物体,并把他们的图像和其余景物分离,对物体进行度量,即对物体进行定量分析估计,输出仅仅是一种决策,确定每个物体应该归属的类别,图像数据的模糊和噪声干扰。 图像分割需要目标的特征值,而特征值又往往是分割之后才可以计算得到,因此这是一个矛盾的问题。(解决方法:先验知识,样本等) 分割结果的好坏没有统一的评价标准。(标准图像,或者计算统计误差,图像分割的困难,人们积累了很多经典的图像分割方法: 根据像素的不连续性得到边界分割; 根据相同目标有相似灰度得到区域分割,基于阈值的分割通过阈值对不同物体进行分割 基于边缘的分割先确

3、定边缘象素,并把它们连接在一起,以构成所需的边界 基于区域的分割把各象素划归到各个物体或区域中 基于运动的分割通过视频物体运动进行分割,图像分割方法分类,基于阈值的分割,图像阈值分割是一种广泛应用的分割技术,利用图像中要提取的目标物与其背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域(目标和背景)的组合,选取一个合适的阈值,以确定图像中每个象素点应该属于目标还是背景区域,从而产生相应的二值图像,可以大量压缩数据,减少存储容量,而且能大大简化其后的分析和处理步骤,但是,它对物体与背景具有较强对比的景物的分割很有效,而且总能用封闭连通的边界定义不交叠的区域,设原始图像f(x,y),以一定

4、的准则在f(x,y)中找出一个合适的灰度值,作为阈值t,则分割后的图像g(x,y),可由下式表示,或,另外,还可以将阈值设置为一个灰度范围t1,t2,凡是灰度在范围内的象素都变为1,否则皆变为0,即,某种特殊情况下,高于阈值t的象素保持原灰度级,其它象素都变为0,称为半阈值法,分割后的图像可表示为,阈值分割图像的基本原理,可用下式表示,阈值,阈值的选取时阈值分割技术得关键,如果过高,则过多的目标点被误归为背景;如果阈值过低,则会出现相反的情况,由此可见,阈值化分割算法主要有两个步骤: 1、确定需要的分割阈值 2、将分割阈值与象素值比较以划分象素,在利用阈值方法来分割灰度图像时一般都对图像有一定

5、的假设。基于一定的图像模型的。 最常用的模型: 假设图像由具有单峰灰度分布的目标和背景组成,处于目标或背景内部相邻象素间的灰度值是高度相关的,但处于目标和背景交界处两边的象素在灰度值上有很大的差别。 如果一幅图像满足这些条件,它的灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合构成的,A=imread(rice.png); level=graythresh(A); level=0.5137;p=132。 B=im2bw(A,level); figure,imshow(B,比如在110和132之间选择两个参数,分别为117和124。得到下面的结果,阈值选取方法,直方图阈值分割法

6、类间方差阈值分割法 二维最大熵值分割法 模糊阈值分割法,直方图阈值分割,简单直方图分割法 最佳阈值,简单直方图分割法,图像的灰度级范围为0,1,l-1,设灰度级i的象素数为ni,则一幅图像的总象素N为,N=i=0l-1ni,灰度级i出现的概率定义为,pi=ni/N,灰度图像的直方图,反映一幅图像上灰度分布的统计特性,成为利用象素灰度作属性的分割方法的基础,60年代中期,Prewitt提出了直方图双峰法,即如果灰度级直方图呈明显的双峰状,则选取两峰之间的谷底所对应的灰度级作为阈值,Level=80,该方法适用于目标和背景的灰度差较大,直方图有明显谷底的情况,注意:应用灰度直方图双峰法来分割图像,

7、也需要一定的图像先验知识,因为同一个直方图可以对应若干个不同的图像,直方图只表明图像中各个灰度级上有多少个象素,并不描述这些象素的任何位置信息,该方法不适合直方图中双峰间的谷比较宽广而平坦的图像,以及单峰直方图的情况,70年代初,研究工作集中在直方图变换,但无论是直方图还是直方图变换法都仅仅考虑了直方图灰度信息而忽略了图像的空间信息,最佳阈值,所谓最佳阈值是指图像中目标物与背景的分割错误最小的阈值,设一幅图像只由目标物和背景组成,已知其灰度级分布概率密度分布为P1(Z)和P2(Z),且已知目标物象素占全图象素数比为,因此,该图像总的灰度级概率密度分布P(Z)可用下式表示,P(Z)= P1(Z)

8、+(1-)P2(Z,假定阈值为Z,认为图像由亮背景上的暗物体所组成,即灰度小于Z的为目标物,大于Z的为背景,如图所示,如选定Zt为分割阈值,则将背景象素错认为是目标物象素的概率为,E1(Zt)=-ZtP2(Z)dZ,E2(Zt)=zt P1(Z)dZ,将目标物象素错认为是背景象素的概率为,因此,总的错误概率E(Z)为,E(Zt)=(1-)E1(Zt)+ E2(Zt,这表示在曲线p2(z)下方位于阈值左边区域的面积,最佳阈值就是使E(Zt)为最小值时的Zt,将E(Zt)对Zt求导,并令其等于0,解出其结果为,P1(Zt)=(1- )P2(Zt,设P1(Zt)和P2(Zt)均为正态分布函数,其灰度

9、均值分别为1和2,对灰度均值得标准偏差分别为1和2,即,将上两式代入,且对两边求对数,得到,简化为,AZt2+BZt+C=0,上式是Zt的一个二次方程式,有两个解,因此,要使分割误差最小,需要设置两个阈值,即上式的两个解。如果设2= 12 = 22,即方差相等,则上式方程存在唯一解,即,如果设=1- ,即1/2时,从前面可以看出,假如图像的目标物和背景象素灰度级概率呈正态分布,且偏差相等(12 = 22),背景和目标物象素总数也相等(1/2),则这个图像的最佳分割阈值就是目标物和背景象素灰度级两个均值得平均,迭代阈值选取方法,利用程序自动搜寻出比较合适的阈值。此阈值选取方法首先选取图像灰度范围

10、的中值作为初始值T,把原始图像中全部像素分成前景、背景两大类,然后分别对其进行积分并将结果取平均以获取一新的阈值,并按此阈值将图像分成前景、背景。如此反复迭代下去,当阈值不再发生变化,即迭代已经收敛于某个稳定的阈值时,此刻的阈值即作为最终的结果并用于图像的分割,数学描述,类间方差阈值分割,这是由Ostu提出的最大类间方差法,又称为大津阈值分割法,是在判决分析最小二乘法原理的基础上推导得出的,具体算法,设原始灰度图像灰度级为L,灰度级为i的象素点数为ni,则图像的全部象素数为,N=n0+n1+nL-1,归一化直方图,则,pi=ni/N,i=0L-1pi=1,按灰度级用阈值t划分为两类:C0=(0

11、,1,.t)和C1=(t+1,t+2,L-1),因此,C0和C1类的类出现概率及均值层分别由下列各式给出,其中,可以看出,对任何t值,下式都能成立,C0和C1类的方差可由下式求得,定义类内方差为,类间方差为,总体方差为,引入关于t的等价判决准则,类间/类内,三个准则是等效的,把使C0,C1两类得到最佳分离的t值作为最佳阈值,因此,将(t)、(t)、(t)定义为最大判决准则,由于w2是基于二阶统计特性,而B2是基于一阶统计特性,它们都是阈值t的函数,而T2与t值无关,因此三个准则中(t)最为简单,因此选其作为准则,可得到最佳阈值t,二维最大熵阈值分割,一维最大熵阈值分割 二维最大熵阈值分割,一维

12、最大熵阈值分割,熵是平均信息量的表征 原理,根据信息论,熵的定义为,H=-+ p(x)lgp(x)dx,所谓灰度的一维熵最大,就是选择一个阈值,使图像用这个阈值分割出的两部分的一阶灰度统计的信息量最大,设ni为数字图像中灰度级i的象素点数,pi为灰度级i出现的概率,则,pi=ni/(NN), i=1,2L,图像灰度直方图如图所示,o区概率分布,pi/pt i =1,2t,B区概率分布,pi/(1-pt) i =t+ 1,t+2L,pt=i=1tpi,其中,对于数字图像,目标区域和背景区域的熵分别定义为,熵函数定义为,当熵函数取最大值时对应的灰度值t*就是所求的最佳阈值,即选取使HO+HB最大的

13、灰度级作为分割图像的阈值,这就是一维最大熵阈值图像分割法,一维最大熵方法的缺点是仅考虑了像素点的灰度信息,没有考虑空间信息,所以当图像的信噪比降低时分割效果不理想。为此,在分割图像时可以再考虑图像的区域信息,区域灰度特征包含了图像的部分空间信息,且对噪声的敏感程度要低于点灰度特征。综合利用图像的这两个特征就产生了二维最大熵阈值分割方法,二维最大熵阈值分割,一维最大熵,直方图,灰度信息,没有利用空间信息,基于,分割效果差,信噪比降低,在图像特征中,点灰度是最基本的特征,但它对噪声敏感,区域灰度特征包含了部分空间信息,且对噪声的敏感程度低于点灰度特征,综合利用点灰度特征和区域灰度特征,可以较好的表

14、征图像的信息,利用图像点灰度和区域灰度均值得二维最大熵阈值法,具体方法如下,首先以原始灰度图像(L个灰度级)中各象素及其4邻域的4个象素为一个区域,计算出区域灰度均值图像(L个灰度级),这样原始图像中的每个象素都对应一个点灰度-区域灰度均值对,这样的数据对存在LL种可能的取值,设ni,j为图像中点灰度为i及其区域灰度均值为j的象素点数,pi,j为点灰度-区域灰度均值对(i,j)发生的概率,则,pi,j=ni,j/(NN,pi,j就是该图像关于点灰度-区域灰度均值得的二维直方图,点灰度-区域灰度均值对(i,j)的概率高峰主要分布在XOY平面的对角线附件,并且在总体上呈现双峰和一谷状态,这是由于图

15、像的所有象素中,目标点和背景点所占比例最大,而目标区域和背景区域内部象素灰度级比较均匀,点灰度及其区域灰度均值相差不大,所以都集中在对角线附近,两个峰分别对应于目标和背景,远离XOY平面对角线的坐标处,峰的高度急剧下降,这部分所反映的是图像中的噪声点、边缘点和杂散点,二维直方图的XOY平面图,目标,背景,边界,噪声,在A区和B区上用点灰度-区域灰度均值二维最大熵法确定最佳阈值,使真正代表目标和背景的信息量最大,设A区和B区各自具有不同的概率分布,用A区和B区的后验概率对各区域的概率pi,j进行归一化处理,以使分区熵之间具有可加性。如果阈值设在(s,t),则,PA=ijpi,j,i=1,2s,j

16、=1,2t,PB=ijpi,j,i=s+1,s+2L,j=t+1,t+2L,定义离散二维熵为,H=-ijpi,jlgpi,j,则A区和B区的二维熵分别为,其中,由于C区和D区包含的是关于噪声和边缘的信息,所以将其忽略不计,即假设C区和D区的pi,j0。C区: i=s+1,s+2,L;j=1,2t。D区:i=1,2,s;j=t+1,t+2L,可以得到,PB=1-PA HB=HL-HA,HL=-ijpi,jlgpi,j i=1,2L,j=1,2,L,则,H(B)=lg(1-PA)+(HL-HA)/(1-PA,选取的最佳阈值向量(s*,t*)满足,熵的判别函数定义为,a)标准lena图像 (b)一维

17、最大熵 (c) 二维最大熵 图 二值图像,模糊阈值分割,思路:先将一幅图像看作一个模糊阵列,然后通过计算图像的模糊概率或模糊熵来确定阈值,按照模糊子集的概率,可以将一幅M行,N列,且具有L个灰度级的数字图像X看作为一个模糊点阵,是定义在该L个灰度级上的资格函数,象素(m,n)灰度值为xm,n。根据信息论的基本理论,可得到图像X的模糊率V(x)和模糊熵E(x,模糊率V(x)从数量上定义了图像X在资格函数下所呈现的模糊性的大小。直观的看,当(xm,n)=0.5时,V(x)和E(x)都取得了最大值,偏离该值时,V(x)和E(x)将下降,若直接从数字图像的直方图考虑,前两式可改写为,f(l)表示灰度值

18、取l的象素点之和,下面我们通过模糊率V(x)进行阈值选择,同样采用模糊熵E(x)也能得到同样的结论,在模糊阈值算法中,资格函数对分割结果影响较大,常见的资格函数主要有以下几种,1)Zadeh标准S函数,如图所示,其中:q=(p+r)/2;q=r-q=q-p;定义c=r-p=2 q,2)具有升半柯西分布形式的资格函数,如图所示,其中:K0,3)线性资格函数,如图所示,资格函数使原始图像模糊化,如选用S函数作为资格函数,对每一个q值,通过资格函数计算出相应的图像模糊率V(q)。图像的模糊率反映了该图像与一二值图像的相似性,对于原始图像目标,背景呈现双峰分布的直方图,对应的V(x)图形也具有双峰,这

19、时总存在一个q0值,其对应的模糊率V(q0)值,即为图像分割的最佳阈值,一般情况下,图像的直方图较为复杂,峰谷不明显,相应的V(q)图可能有多个谷底,这时可选取V(q)所有极小值中的最小值所对应的q作为阈值,分水岭阈值算法的时间和空间复杂性比较大,但抗噪声能力强,对一些用全局阈值不易分割的图像有较好的分割效果。 基本概念 分水岭概念是以对图像进行三维可视化处理为基础的。其中两个是坐标,另一个是灰度级,即2-D的地基(对应图象空间)加上第3维的高度(对应图象灰度)。对于这样一种“地形学”的解释,需考虑三点: (a)属于局部性最小值的点; (b)当一滴水放在某点的位置上的时候,水一定会下落到一个单

20、一的最小值点; (c)当水处在某个点的位置时,水会等概率地流向不止一个这样的最小值点,分水岭阈值算法,对一个特定区域最小值,满足条件(b)的点的集合称为这个最小值的“汇水盆地”或“分水岭”。 满足条件(c)的点的集合组成地形表面的峰线,称为“分水线”或“分割线”。 分水岭阈值算法和直接在最佳阈值处分割不同,它是一种特殊的自适应迭代阈值分割算法。算法的主要目标是找出分水线,基本思想: 假设在每个区域最小值的位置上打一个洞,并且让水以均匀的上升速率从洞中涌出,从低到高淹没整个地形。当处在不同的汇聚盆地中的水将要聚合在一起时,修建的大坝将阻止聚合。水将只能到达大坝的顶部处与水线之上的程度。这些大坝的

21、边界对应于分水岭的分割线,分水岭 建立不同目标间的分水岭,可借助地形学概念进行讨论,要阻止水汇合,就需在山峰上修筑水坝,且水坝的高度要随水位的上升而增高,分水岭计算的思路 即逐渐增加一个灰度阈值,每当它大于一个局部极大值时,就把当时的二值图像(只区分陆地和水域,即大于灰度阈值和小于灰度阈值两部分)与前一个时刻(即灰度阈值上一个值的时刻)的二值图像进行逻辑异或(XOR)操作,从而确定出灰度局部极大值的位置。根据所有灰度局部极大值的位置集合就可确定分水岭,分水岭计算步骤 待分割图象 f (x, y),其梯度图象为g(x, y) 用M1, M2, , MR表示g(x, y)中各局部极小值的象素位置,

22、C(Mi)为与Mi对应的区域中的象素坐标集合。 用n表示当前灰度阈值,Tn代表记为(u, v)的象素集合,g(u, v) n, 对Mi所在的区域,其中满足条件的坐标集合Cn(Mi)可看作一幅二值图象,分水岭计算步骤,分水岭计算步骤 用Cn代表在灰度阈值为n时图象中所有满足条件的象素 Cmax + 1将是所有区域的并集 Cn 1是Cn的子集,Cn是Tn的子集,所以Cn 1又是Tn的子集,令 S 代表Tn中的连通组元集合,对每个连通组元s Sn,有3种可能性: (1)s Cn 1是1个空集 (2)s Cn 1里包含Cn 1中的一个连通组元 (3)s Cn 1里包含Cn 1中一个以上的连通组元 分别

23、处理: (1)Cn可由把连通组元 s 加到Cn 1中得到 (2)Cn可由把连通组元 s 加到Cn 1中得到 (3)需要在 s 中建分水岭,原始图 阈值分割 分水岭 叠加轮廓,利用标记控制分割 过分割(over-segmentation) 受图象中噪声和其它不规则结构影响 利用标记(marker) 图象中的一个连通组元 内部标记:对应目标 外部标记:对应背景(分水岭,分水岭算法的改进与扩展,利用标记控制分割 流程框图,示例 (a) 表示部分覆盖的两个区域 (b) 表示经过距离变换的结果(两个局部极小值) (c) 检测出的分水线,分水岭算法的扩展 特征域算法示例 (1)选择合适的颜色空间,做出3-

24、D颜色直方图 (2)将3-D颜色直方图进行反转变换 (3)在不同的颜色聚类之间建立分水岭 (4)将聚类结果映射回图象域中 (5)后处理得到最终分割图象,SUSAN边缘检测,原理 USAN: Univalue Segment Assimilating Nucleus 核同值区:相对于模板的核,模板中有一定的区域与它有相同的灰度,USAN原理 检测模板的中心称为“核” 利用USAN面积的变化可检测边缘或角点 USAN面积较大(超过一半)时表明核像素处在图像中的灰度一致区域,在模板核接近边缘时该面积减少,而在接近角点时减少得更多,即在角点处面积取得最小值,USAN的面积携带了关于图象中核象素处结构的主要信息。 当核象素处在图象中的灰度一致区域,USAN的面积会达到最大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论