图像分析与识别_课件_6_第1页
图像分析与识别_课件_6_第2页
图像分析与识别_课件_6_第3页
图像分析与识别_课件_6_第4页
图像分析与识别_课件_6_第5页
已阅读5页,还剩194页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、123前一章着重于介绍图像分割的方法和怎样构造均匀的图像区域及其边界。图像区域的识别是理解图像数据的重要步骤,它需要的是一种准确的适合于分类器的区域描述。 4这种描述应该生成表现区域属性(例如,形状)的数字特征向量或非数字的句法描述词语。区域描述是第3章中介绍的4层中的第3层,意味着这种描述已经包含了某种抽象。 51.第一层是最底层的表示,称为图标图像,由含有原始数据的图像组成,原始数据也就是像素亮度数据的整数矩阵,往往需要进行预处理;2.第二层的表示是分割图像,图像被分割为可能属于同一物体的区域;63.第三层是几何表示,保存2D和3D形状知识;4.第四层的图像数据表示是关系模型。关系模型使我

2、们能更有效地、并且在更高的抽象层次上处理数据。7在以下几节中,我们将把讨论限制在二维形状特征,并且假设物体的描述来自图像的分割结果。定义物体的形状其实是非常困难的。 形状通常以言辞来表述或以图形来描绘。8在计算机时代,有必要对即便是非常复杂的形状进行精确的描述,尽管存在着许多实际的形状描述方法,但并没有被认可的统一的形状描述的方法学。甚至我们都不知道形状中什么是重要的。9尽管如此,也有可能找到大多数形状描述方法的共同特点。这些特点可以从不同的角度来刻画: 1.输入的表示形式:物体的描述可以是基于边界的,或者是基于整个区域的更复杂的知识的。 102.物体重建的能力:即是否可以从描述来重建物体的形

3、状。3.非完整形状的识别能力:即如果物体被遮挡而只有部分形状信息可以得到的话,根据该描述,物体的形状可以被识别到什么程度。 114.局部/全局描述的特征:q全局描述子只能在整个物体的数据可以用来分析时才可使用;q局部描述子使用物体的部分信息来描述物体的局部特征,这样局部描述子可用来描述遮挡物体。 125.数学的和启发式的方法:q一个典型的数学方法是基于傅立叶变换的形状描述;q一个具有代表性的启发式方法可以是细长形。 6.统计的或句法的物体描述。137.描述所具有的对平移、旋转、尺度变换的鲁棒性。8.形状描述在不同分辨率下的属性。 14如果要描述形状,那么需要考虑尺度(分辨率)问题,因为形状可能

4、会随着图像分辨率的变化而发生很大的变化。在高分辨率下轮廓的检测可能会受到噪声的影响,而在低分辨率下小的细节又可能会丢失。 15a)原 始 图 像 6 4 0 像 素480像素b)a的轮廓c)原 始 图 像 1 6 0 像 素120像素d)c的轮廓e)原始图像64像素48像素f)e的轮廓 16在多数情况下,描绘形状属性的类别很重要,形状类别应该充分表现属于同一类别的物体的一般形状。很明显,形状类别应该强调类间的不同点,而类内形状变化的影响不会在类的描述中有所反映。171.尽管我们在处理二维形状及其描述,但物体是三维的。如果从不同角度观看,会形成非常不同的二维透视投影。q理想的情况应该是一个具有克

5、服这些变化的通用的形状描述能力既设计具有透视投影不变性的描述子。 182.物体遮挡是形状识别中的另外一个困难问题。q在这里形状描述子的选择必须是基于其描述局部物体特征的能力。19本章介绍描述子的分类是根据它们是否基于边界信息或者基于物体区域的信息。这种形状描述方法的分类对应于以前描述的基于边界的和基于区域的分割方法。2021对于区域描述,区域标识是必需的。区域标识是给每个区域(或边界)标志一个唯一的数字,这样的标识称为标注(labeling)或着色(coloring),或称为连通分量标注。而最大的整数标号通常也就给出了图像中区域的数目。 22假设分割后的图像R由m个不相交的区域Ri组成。图像R

6、常常由若干物体和一个背景组成。其中RC是集合的补,Rb为背景,其它区域是物体。imbiiCbRR, 123标注算法的输入通常是二值图像或多亮度级别的图像。多亮度级图像常常用于表示标注的结果,背景用零值表示,区域用它们的非零标号表示。 下面是一个标注分割后图像的算法。24算法:4-邻域和8-邻域区域标识1.第一遍扫描:一行一行地搜索整个图像R,对每个非零像素R(i,j)赋一个非零的值v。根据邻域像素的标号来选择v值,其中邻域的性质由下图定义。(不考虑在图像R外面的“邻域”)。25 区域标识的掩模: (a) 在4-连通下 (b) 在8-连通下 (c) 标号冲突26q如果所有的邻域都是背景像素(其像

7、素值为零),则R(i,j)被赋予一个新的(到目前为止)没使用过的标号。q如果仅仅只有一个邻域像素有非零标号,那么就把这个标号赋予像素R(i,j)。27q如果邻域中有不止一个非零像素,则把这些像素中的任意一个的标号赋予要标注的像素。q如果邻域的标号有不同的(标号冲突)。则将标号对作为等价对保存起来。等价对被保存在单独的数据结构中等价表。282.第二遍扫描:所有的区域像素在第一遍扫描时被标注了,但是一些区域存在具有不同标号的像素(由于标号冲突)。再一遍扫描图像,使用等价表的信息重新标注像素(例如,用等价类中的最小值)。 29q标号冲突经常发生发生这种现象的图像形状的例子包括U形物体、E的镜像形物体

8、,等等。q等价表是一个出现在图像中的所有标号对的列表;所有的等价标号在第二步中被用一个唯一的标号代替。30q算法在4-连通和8-连通下基本相同,不同点仅在邻域掩模的形状上。q为了便于在第二遍扫描中对区域进行简单计数,给区域赋予递增的标号是有用的。 31(a)32(b) 经过步骤(b)后的等价表:2-5,5-6,2-433(c)3435区域边界必须以某种数学形式来表示:1.直角坐标最常见。2.极坐标,在极坐标下,边界元素以角度和距离r的数对来表示。3.切线坐标,作为路径长度n的函数,它对曲线上点的切线方向(xn)进行编码。36(a) 直角坐标; (b) 极坐标; (c) 切线坐标37链码通过带有

9、给定方向的单位长度的线段序列来描述物体。为了可以重建区域,该序列的第一个元素必须带有其位置的信息。处理过程产生了一个数字序列。为了利用链码的位置不变性,忽略其包含位置信息的第一个元素。这样的链码定义就是Freeman码。384向链码8向链码39一个模4或模8的差分码,称为链码的导数,它表示区域边界元素的相对方向的另一个数字序列,以逆时针计数的90或45的倍数来度量。链码对噪声非常敏感,而且如果要用于识别,尺度和旋转的任意变化都可能会引起问题。40链码:3,0,0,3,0,1,1,2,1,2,3,2导数:1,0,3,1,1,0,1,3,1,1,3,141a)叠加在数字化边界上的重取样网格b)重取

10、样的结果c)4向链码d)8向链码42以下的描述子大部分基于被描述区域的几何属性。由于数字图像的离散特点,它们都对图像的分辨率敏感。 431.边界长度:边界长度是基本的区域属性,可以简单地从链码表示中得到。垂直的和水平的步幅为单位长度,在8-连通下的对角步幅的长度为 。这可以说明在4-连通下边界会更长些,其中对角步幅包含两个直角步,总长度为2。244边界长度随着图像光栅分辨率的增加而增加。区域面积不受更高分辨率的影响而收敛于某个限度值。数字化边界可以用多边形进行任意精确性的近似。45a)被单元包围的对象边界b)最小周长多边形(a)(b)462.曲率:在连续的情况下,曲率被定义为斜率的变化率。在离

11、散空间,曲率的描述必须稍做修改以克服因曲线不具有平滑性所造成的困难。47曲率标量描述子(也称为边界平直度)是边界像素的总数目(长度)和边界方向有显著变化的边界像素的数目的比率。方向改变的数目越少,边界越平直。48对它的估算算法是基于检测存在于从待估计的边界像素出发到在任两个方向上各b个边界像素位置处的两条线段间的角度的方法。这个角度不必以数字形式表示。参数b决定了对边界方向局部变化的敏感度。49曲率503.弯曲能量:边界(曲线)的弯曲能量(BE)可以理解为把一个杆弯曲成所要求的形状所需的能量,可以计算为边界曲率c(k)的平方和除以边界长度L。LkkcLBE12)(151为了表示边界,可以使用F

12、reeman链码或它的平滑形式,参见下图。弯曲能量没有形状重建能力。52a)链码 0,0,2,0,1,0,7,6,0,0;b)曲率 0,2,-2,1,-1,-1,-1,2,0;c)平方和给出了弯曲能量;d)平滑型534.签名:区域的签名可以由法线轮廓距离的序列得到。对每一个边界元素,法线轮廓距离为路径长度的函数。对每一个边界点A,到对面边界点B的最近距离的道路为垂直于点A边界切线的方向,参见下图。对面不是一个对称关系。54签名对噪声敏感,因而使用平滑后的签名或平滑后的轮廓的签名来降低对噪声的敏感性。签名可以用于对有重叠的物体的识别,或每当只有部分轮廓可以获得的情况下的识别。55(a) 构造 (

13、b) 圆和三角形的签名 565.弦的分布:连接区域边界上任两点的直线就是弦,而在轮廓上所有弦的长度和角度的分布可以用于形状描述。 57弦的分布58假设C是复平面上的封闭曲线(边界)。以逆时针方向沿着这个曲线保持恒定速度移动,得到一个复函数Z(t),这里t是时间变量。速度应该选择为使得环绕边界一周的时间为2;然后沿曲线做多次遍历得到一个周期为2的周期函数。这就允许了z(t)的傅立叶表示。 59系数Tn称为曲线C的傅立叶描述子。相对于时间t,考虑曲线距离s会更有用,其中L是曲线长度。 nneTtzint)(Lst260傅立叶描述子Tn由下式给出。描述子受曲线形状及曲线初始点的影响。 dseszLT

14、LnnsLi0)2()(161对于数字图像数据,边界坐标是离散的而函数z(t)不是连续的。假定z(k)是z(s)的离散型,其中为了得到不变的采样间隔使用4-连通;傅立叶描述子Tn可以从z(k)的离散傅立叶变换中计算出来:nTDFTkZ)(62一个封闭边界可以表示为切线间的角度相对于其在边界上的点之间的距离的函数。令k为在第k个边界点测量的角度,令lk为起始边界点和第k个边界点的距离。一个周期函数可以被定义为:63描述子集合则为:kkkula)(Llukk220)(21dueuaSinun64(a) 描述符Tn (b) 描述符 Sn65傅立叶描述子的优点是仅使用少数低阶系数就得到了高质量的边界形

15、状表示。我们可以比较使用描述子Sn和Tn的结果:由于切线角度的变化相对比较显著,描述子Sn有更多的高频成分出现在边界函数中,结果使它们不如描述子Tn那样快地衰减。66另外,由于常常导致不封闭的边界,Sn描述子不适合于边界重建。描述子Tn的值对于更高的频率会非常快地衰减,而它们的重建常常会产生封闭的边界。Sn描述子不能用于正方形和正三角形等情况。67傅立叶描述子也可以用于计算区域面积、质心的定位以及二次矩。傅立叶描述子是一种通用的技术,但是在描述局部信息时存在问题。传统的傅立叶描述子不能用于遮挡物体的识别。68边界(以及曲线)描述的另一种选择是使用具有特定属性的片段来表示边界。如果对于所有的片段

16、其类型都是已知的,则边界可以描述为片段类型的一个链,码字由代表类型的字母组成。这种描述适合于句法识别。69多边形表示通过一个多边形来近似区域,区域由它的顶点来表示。多边形表示可以作为对边界的一个简单分割的结果。边界可以用各种精度来近似,如果需要一个更精确的描述,就可能需要使用更多的线段。70任意两个边界点x1和x2定义了一条线段,点x1、x2和x3的序列表示了一个线段链从点x1到点x2,从x2到x3。如果x1=x3,则为一个封闭的边界。 71有很多类型的线片段的边界表示。问题在于边界顶点位置的确定,一个解决方法是使用分裂归并算法。归并的步骤为检查边界点的集合,只要满足了一个片段的平直性标准,就

17、把它们加到这个片段中。72如果失去了片段的平直性,最后连接的点就被标记为顶点,并开始构建一个新的片段。通过使用曲率(边界平直率)标准,当边界点在边界方向上有显著变化时,就可以检测到边界顶点。当边界拥有直的边界片段时,这个方法很有效。73把边界分割成更小片段的分裂方法有时会有帮助。如果使用了分裂方法,片段通常被分成两段更小的新片段直到新的片段达到最后的要求。 74一个分裂的简单过程从一条曲线的终点x1和x2开始,两终点被一条线段连接起来。下一个步骤是在所有的曲线点中找到距离线段最远的曲线点x3。75如果被确定的点在预设的它和线段间的距离范围内,片段x1-x2就是最后的片段,而所有的曲线顶点都找到

18、了,顶点x1和x2就是曲线的多边形表示。否则点x3作为新的顶点,并且将这个过程在两个结果片断x1-x3和x3-x2上递归地调用。 76 递归的边界分裂77把边界分割成常数曲率的片段是边界表示的另一个可能性。边界也可以被分割成能用多项式来表示的片段,通常是二阶的,例如圆形的、椭圆形的或抛物线形的线段。78对于句法形状识别过程,片段被作为基元看待。一个典型的例子是染色体的句法描述和识别,其中边界片段被分类为较大曲率的凸片段、较大曲率的凹片段、直线片段,等等。79 边界片段链形式的染色体结构描述码字:d, b, a, b, c, b, a, b, d, b, a, b, c, b, a, b80我们

19、已经提到过形状描述子对尺度(图像分辨率)的敏感性是大多数描述子的一个不受欢迎的的特征。换句话说,形状描述随着尺度的变化而变化,在不同分辨率下会得到不同的结果。 81如果曲线要被分成片段,这个问题仍然很突出。曲线的一些分割点在某一分辨率下存在。在其它分辨率下会消失因而没有任何直接的对应。 82考虑到这个问题,曲线分割的一个保证分割点位置连续变化的尺度空间方法就是一个显著的成就。这个方法中,新的分割点只能在更高分辨率下出现,且已经存在的分割点不会消失。 83这种技术是基于把单独的高斯平滑核在一定的尺度范围内应用于一维信号(例如,曲率函数),并将其结果微分两次。通过检测二阶导数的过零点来确定曲率的峰

20、值,过零点的位置给出了曲线分割点的位置。84在不同分辨率(不同的高斯核尺寸)下获得分割点的不同位置。高斯核的一个重要性质是分割点的位置随着分辨率的变化而连续变化,这可以从曲线的尺度空间图像中看出。85曲线的细微细节在高斯平滑核尺寸的增大下成对地消失,并且总是两个分割点合并起来而形成一个封闭的轮廓。说明了在粗分辨率下存在的任意分割点一定也在细的分辨率下存在。86此外,分割点的位置在最精细的分辨率下是最精确的。而且可以对它的位置通过使用尺度空间图像从粗分辨率到细分辨率进行跟踪。 87一个多尺度的曲线描述可以通过区间树表示出来。每一对过零点的位置被表示成一个矩形,它的位置对应于分割点在曲线上的位置,

21、它的高度表示分割点可以被检测到的最低分辨率。88区间树可以用于不同尺度下的曲线分解,同时保持了使用较高分辨率做片段描述的可能性。89(a) 作为尺度函数的曲线分割点的数目和位置的变化(b) 曲线表示的区间树形式 90在图形学中,使用分段多项式插值来得到平滑曲线的这种曲线表示方法是十分普遍的。B样条是分段多项式曲线,其形状与它的控制多边形紧密相关曲线的多边形表示由一个顶点的链给出。 91三次B样条是最常见的,因为这是包含曲率变化的最低阶次。样条有非常好的表示特性并且容易计算:第一,它们的形状改变要小于其控制多边形,并且它们不会像很多其它表示那样在采样点间振荡。 92此外,对于n次B样条,样条曲线

22、总是位于n+1个顶点的多边形内。第二,插值在特性上是局部的。如果一个控制多边形的顶点改变了它的位置,所造成的样条曲线的变化仅仅在那个顶点的一个小的邻域内发生。 93第三,把由样条表示的区域边界与图像数据相匹配的方法是基于对原始图像数据的直接搜索。 94(a, b, c) n次B样条的n+1个顶点的多边形(d) 3次样条95令xi,i=l, , n为B样条插值曲线的点,称此插值曲线为x(s)。参数s在点xi间线性变化,即xi=x(i)。三次B样条曲线的每一个部分都是三次多项式,这意味着它以及它的一阶和二阶导数都是连续的。B样条由下式给出:9610)()(niiisBvsx其中vi为表示样条曲线的

23、系数,Bi(s)是基函数,其形状由样条的阶次给出。97系数vi具有的信息对偶于样条曲线点的信息vi的值可以从xi中得出,反之亦然。系数vi代表了控制多边形的顶点,而且如果有n个点xi,则必须有n+2个点vi。两个端点v0和vn+1由边界条件确定。 98样条生成的曲线通常是令人满意的。它们提供了一个好的曲线近似,在图像分析的曲线表示问题中也很容易使用。样条对于尺度的变化非常敏感。99还有很多可以用来描述二维曲线和轮廓的其它方法和途径。 Hough变换拥有极好的形状描述能力。使用统计矩的基于区域的形状描述。对形状的分形的研究方法,在图像形状的描述中正在受到越来越多的关注。 100数学形态学可以用于

24、形状描述,特别是在与区域骨架重建相关的方面上。神经网络可以直接用于识别以原始边界表示的形状。用无噪声的参考形状的轮廓序列来训练,且为了提高鲁棒性在训练的后期阶段使用带有噪声的数据。101形状不变量是当前机器视觉领域的一个非常活跃的研究方向。 即便在机器视觉中形状不变性是一个新的方法,但不变量理论并不是新的,它的很多原理早在19世纪就出现了。102正如多次所提到那样,物体描述对于物体识别来说是必要的。不幸的是,目前所讨论过的所有形状描述子都依赖于视点,这意味着由于物体或观察者的位置变化,使得识别物体常常是不可能的。103相同的矩形截面在图像平面中被表示为不同的多边形 104形状描述不变性的作用是

25、显然的。形状不变量表示了一种几何结构的属性,它在一个适当的变换类下保持不变。机器视觉特别关心透视变换类。 105共线性是透视不变性图像特征的最简单的例子。在任意的透视变换下任何直线都被投影为直线。类似地,透视不变性形状描述的基本思想是找到这样的形状特征,它不受物体和图像平面间的变换的影响。 106一种标准的透视不变性描述技术是:假设知道物体的姿态(位置和方向),把它变换到特定的坐标系统中,然后在这个坐标系统中测量形状特征,形成一个不变的描述。然而对每一个物体和每一幅图,都必须假设知道姿态,这使得该方法困难而不可靠。 107不变量理论的应用提供了另一个途径,其中不变量描述子可以直接从图像数据中计

26、算出来而不需要专门的坐标系统。 现在将给出几个不变量的例子。108首先给出交比的定义。交比是代表了透视线的一个经典的不变量。就像前面提到的,一条直线总是投影为一条直线。109任意四个共线点A, B, C, D可以用交比不变量描述为: 其中(A-C)表示点A和点C间的距离。交比依赖于被标注的四个共线点的顺序。CBDADBCAI110交比:四个共线点形成一个透视不变数 111 一个四条共面共点的直线(交于同一点)的系统对偶于一个四个共线点的系统并且交比是它的不变量。 112一个五条共面直线的系统产生两个不变量。5314215214311MMMMI 5214325324312MMMMI 113其中M

27、ijk=(1i, lj, lk)。li=(li1, li2, li3)T是一条直线li1x+li2y+li3=0的表示,其中i1, 5,并且|M|是矩阵M的行列式。如果生成矩阵Mijk的三条直线是共点的,则矩阵变为奇异的而不变量就没有定义。 114一个五个共面点的系统对偶于一个五条直线的系统,并且可以生成同样的的两个不变量。这两个独立作用的不变量也可由两组共面共点的四条直线的两个交比来产生,参见下图。115注意即使产生了除了下图中给出的组合之外,也仅有两个已介绍的独立作用的不变量存在。116 (a) 共面点(b) 五点形成一个四条共点直线的系统(c) 相同的五点形成另一个四条共点直线的系统 1

28、17 一条平面二次曲线可以由一个方程表示: 对于X=(x, y, 1)T, 则二次曲线也可由矩阵C来定义,022feydxcybxyaxfedecbdbaC222222118以及对任意的由矩阵C表示的二次曲线,以及两条不切于二次曲线的共面直线,可以定义一个不变量: 0CXXT2121112211lCllCllClITTT119对于一条二次曲线和两个共面点,可以形成同样的不变量。 对于两条由它们的归一化矩阵C1和C2 (|Ci|=1)表示的二次曲线,可以确定两个不变量。 2111CCTraceI1122CCTraceI120矩阵的迹(Trace)是主对角线元素的和。 对于非归一化的二次曲线,所关

29、联的二次型的不变量为:31212111CCCCTraceI31121122CCCCTraceI121以及二次曲线的两个真正的不变量为:2121122111CCCCTraceCCTraceI1222111122CCCCTraceCCTraceI122两条平面二次曲线唯一地确定了四个相交点,而任意选择一个非相交点和四个相交点都可成一个五点系统。因此,对于这一对二次曲线,像五点系统一样,存在两个不变量。123很多人造物体由圆和直线组成,这些不变量可用于它们的描述。然而,如果物体具有不能用代数曲线表示的轮廓,情况就非常困难了。 124在机器观觉应用中,设计新的不变量是不变量理论的一个重要部分。最简单的

30、方法是组合基本的不变量,从这些组合中形成新的不变量。下图给出了一个这样的物体识别的例子。 125 (a)从一个任意视点拍摄的重叠物体的原始图像(b)基于直线和二次曲线不变量的物体识别126127我们可以使用边界信息来描述区域,也可以从区域自身来描述形状。 由启发式方法表示的一大类形状描述技术,在简单形状的描述中可产生能够接受的结果。例如,区域的面积、矩形度、细长度、方向、紧致度等等。128但是它们不能用于区域重建且对于较复杂的形状也不起作用。对于更复杂的区域的描述,必须基于其它的把区域分解成更小和更简单的子区域的方法,然后这些子区域可以分别地用启发式方法来描述。 129物体用平面图来表示,其节

31、点代表由区域分解产生的子区域,而区域形状由图的属性来描述。有两种一般的途径来得到子区域的图:1301.第一种是区域细化,它导致可以用图来描述区域骨架。2.第二种可选的方法从区域分解成子区域开始,然后子区域由节点来表示,节点的弧表示了子区域的相邻关系。通常规定子区域是凸的。131区域的图表示有很多优点所产生的图具有以下特点: q它是平移和旋转的不变量,位置和旋转可以被包括在图的定义中。q它对形状的微小改变不敏感。q相对区域的尺寸是很好的不变量。132q它生成的是可理解的表示。q它很容易被用来获得图的具有一定信息的特征。q它适合于句法识别。133另一方面,这种形式的形状表示可能是很难得到的,而且分

32、类器的学习阶段也不是容易的。然而,如果我们贴近计算机视觉的现实的话,为了理解复杂图像,别无选择。134存在许多简单的启发式形状描述子,它与统计特征描述有关。这些方法是基本的,它们用在复杂区域的子区域的描述中,而且也可用于定义图节点的分类。135 最简单的且最自然的区域属性是它的面积,由区域包含的像素个数给出。 如果图像被表示为一个矩形光栅,那么区域像素的简单计数就会提供其面积。136 欧拉数描述了物体的一个简单的拓扑不变的属性。它基于物体的连通部分的数目S以及物体中孔的数目N(一个物体可以包含不止一个区域,否则连通部分的数目等于1)。于是有:=S-N 137定义水平的和垂直的区域投影ph(i)

33、和pv(j)为:根据投影的区域描述通常和二值图像处理相关。投影可以被当作定义相关区域描述子的一个基础。ivjhjifjpjifip),()(),()(138垂直投影宽度水平投影高度139 最简单的离心率特征是最长弦A和垂直于A的最长弦B的长度比(一个物体的主次轴的比)。另一个近似的离心率的度量是基于主区域惯量轴的比。 140 细长度是区域外接矩形的长宽比。这是一个包围形状的最小面积的矩形,它是通过以离散步幅旋转直到达到最小值来确定的。这个准则在弯曲的区域下达不到(参见图b),对于这种区域的细长度的估计必须基于最大区域厚度。141(a) 外接矩形给出了可接受的结果(b) 外接矩形不能表示细长度1

34、42 令Fk为区域面积和外接矩形面积的比,矩形具有方向k。矩形的方向像前面一样以离散步幅旋转,矩形度度量为这个比率Fk的最大矩形值:)(maxkkF矩形度143方向仅需旋转一个象限。矩形度设定的数值在区间(0,1中,1代表一个完美的矩形区域。 144 方向是仅在细长区域下有意义的属性。如果区域是细长的,方向就是最小外接矩形的最长边的方向。 145 紧致度是独立于线性变换的一个通用的形状描述特征,由下式给出:在欧氏空间里最紧致的区域是圆。 arealengthborderregion2)_(紧致度146(a) 紧致的 (b) 非紧致的147区域的矩表示把一个归一化的灰度级图像函数理解为一个2维随

35、机变量的概率密度。随机变量的属性用统计特征矩来描述。 通过假设非零的像素值表示区域,矩可以用于二值或灰度级的区域描述。 148(p+q)阶矩依赖于尺度、平移、旋转、甚至灰度级上的变换,由下式给出:在数字图像中,我们计算求和式: dxdyyxfyxmqppq),( ijqppqjifjim),(149其中x, y, i, j是区域点的坐标。如果使用中心矩,可以获得平移不变性。在数字图像中: dxdyyxfyyxxqcpcpq),()()( ijqcpcpqjifyjxi),()()(150其中Xc和Yc是区域重心(质心)的坐标,它可以由下面的关系来得到:00010010mmYcmmXc151一个

36、区域R是凸的,当且仅当对于任意两点x1, x2R,由它的端点x1和x2定义的整个直线段x1x2在区域R的内部。区域的凸包是满足条件RH的最小凸区域H,参见下图。 152153凸包在数字数据中具有一些特殊性质。例如,凹的部分在数字数据中由于旋转会出现或消失,因此凸包在数字空间中不是旋转不变量。凸包可以用来描述区域形状属性而且可以用于建立区域凹状的树型结构。 154离散凸包的构建算法 1.找到具有最小行坐标的区域R的所有像素,在它们中间,找到具有最小列坐标的像素P1。赋值Rk=P1,v=(0, -1),向量v表示凸包的前一直线段的方向。 1552.以逆时针方向搜索区域边界并且对每一个位于点P1后(

37、在边界搜索方向上见上图)的边界点Pn计算方向角n。方向角n是向量PkPn的角度。满足条件q=minnn的点Pq是区域凸包的一个元素(顶点)。1563.赋值v=PkPq, Pk=Pq。4.重复执行步骤2和3直到Pk=P1。 1571.令待检测凸包的多边形为简单多边形P=v1, v2, , vn。并且令顶点以这个顺序来处理。2.序列P中的前三个顶点A, B, C形成一个三角形(如果不共线),而这个三角形表示了这前三个点的凸包(见图a)。Melkman的凸包检测算法1583.然后在序列中测试下一个顶点D是否位于当前凸包的内部或外部。4.如果D位于内部,则当前的凸包不改变(见图b)。5.如果D位于当前

38、凸包的外部,它就必须成为一个新的凸包顶点(见图c)。1596.而基于当前的凸包形状,或者没有、或者一个或几个顶点必须从当前的凸包中去掉(见图c和d)。7.对序列P中所有剩下的顶点重复这个过程。160a)前三个顶点A, B, C形成一个三角形;b)如果下一个顶点D位于当前凸包ABC的内部, 则当前凸包不变;c)如果下一个顶点D位于当前凸包的外部,则它成为当前新的凸包ABCDA的一个新顶点;d)在这种情况下,必须从当前的凸包中支掉顶点B而新的凸包为ADCA。161 a)被处理的区域-多边形ABCDEAb)输入和处理顶点Dc)顶点D成为当前凸包ADC的一个新顶点d)输入和处理顶点E,E没有成为当前凸

39、包的一个新的顶点e)结果凸包DCAD162区域图是基于区域骨架的,第一步是骨架构建。数学形态学是一个可用来获得区域骨架的有力工具。大多数的细化过程重复地去除边界元素直至找到最大厚度为1或2的像素集合。 163构建骨架有四种基本的途径:q细化迭代地去除区域边界像素;q从边界开始的波传播;q在区域的距离变换图像中检测局部最大值;q分析的方法。164算法:通过细化提取骨架 1.令R为区域像素的集合,Hi(R)为它的内部边界,而HO(R)为它的外部边界。令S(R)为区域R中的部分像素的集合,这些像素在8-连通下的所有邻居或者来自内部边界Hi(R)或者来自背景R的余集。赋值Rold=R。1652.构建一

40、个新的区域Rnew为如下的进一步细化的结果:3.如果Rnew=Rold,结束迭代并转步骤4。否则赋值Rold=Rnew,重复步骤2。 4.Rnew是骨架像素的集合(即区域R的骨架)。)()()(oldoldooldioldoldnewRRSHRHRRSR166细化过程常常使用中轴变换来构建区域骨架。在中轴的定义下,骨架是满足以下条件的所有区域点的集合:它至少与两个分开的边界点具有相同的到区域边界的最小距离。由这个条件产生的骨架的例子参见下图。 167使用一个距离变换给每个区域像素赋予其到区域边界的(最小)距离值,这样就可以构建骨架。可以认为骨架是到区域边界的距离取得局部最大值的像素的集合。 1

41、68每一个骨架的元素可以附有它到边界距离的信息,这提供了一个重建区域的方法:以骨架元素为中心点,以所保存的距离值为半径,所有这样的圆盘所形成的包络曲线就构成区域的边界。 169区域骨架:边界的小变化在骨架上有显著的影响170 (a) 原始图像 (b) 区域骨架(为了显 示而加粗了)171 (a) 原始图像 (b) 区域骨架(为了显 示而加粗了)172分解方法是基于形状识别,是一个分级过程的想法。形状基元是在较低的级别上定义的,基元是形成区域的最简单的元素。图是在较高的级别上构建的节点由基元产生,弧描述了基元的相互关系。173分解问题的解决包含两个主要步骤:q第一步是把区域分割为简单的子区域(基

42、元);q第二步是基元的分析。基元要足够的简单以至于可以使用简单的标量形状属性来有效地描述。 174分解的一般思想参见下图,其中给出了原始区域、一种可能的分解以及所产生的图。初等凸子区域被标注为初等子区域或核。核(在图中以阴影表示)是属于几个初等凸子区域的子区域。175如果子区域由多边形来表示,则图的节点具有如下的信息:q节点类型表示初等子区域或核。q子区域顶点的个数由节点表示。q子区域的面积由节点表示。q子区域的主轴方向由节点表示。q子区域的重心由节点表示。176a)区域b)初等区域c)初等子区域以及核d)分解图177区域分解为子区域或图像分解为区域后,区域或图像就可以表示为区域邻近图。区域邻近图把一个区域表示为一个图节点,而邻近区域的节点以边连接起来。178179形状类别的表示被认为是形状描述的具有挑战性的问题。我们期望形状类别能很好地表示属于这个类别的物体的一般形状,并且能够突出类别间的形状差别,而类别内允许的形状变化不应该

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论