数字图像处理-第六章图像分割与分析_第1页
数字图像处理-第六章图像分割与分析_第2页
数字图像处理-第六章图像分割与分析_第3页
数字图像处理-第六章图像分割与分析_第4页
数字图像处理-第六章图像分割与分析_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章图像分割和分析

图像增强和图像复原是对整幅图像的质量进行改善,输入输出均为图像。 图像分析研究并描述组成一幅图像的各个不同部分的特征及其相互关系,输入为图像、输出为从这些图像中提取出来的属性。 图像分析的结果不是一幅完美的图像,而是用数字、文字、符号、几何图形或其组合表示的图像内容和特征,对图像景物的详尽描述和解释。知识库特征表示与描述预处理分割低级处理高级处理中级处理识别与解释结果图像获取问题6.1图像分割(ImageSegmentation)在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣,这些部分一般称为目标或前景。为了辨识和分析目标,需要将有关区域分离提取出来,在此基础上对目标进一步利用,如进行特征提取和测量。图像分割是把图像分成各具特性的区域,并提取出感兴趣目标的技术和过程。这里特性可以是灰度、颜色、纹理等,目标可以对应单个区域,也可以对应多个区域。图像分割基本策略:基于灰度值的两个基本特性基于边界的算法:基于灰度的不连续性检测边界间断分割(非连续性分割)边缘连接法基于区域的算法:基于灰度的相似性进行聚类 阈值分割法基于区域的分割1、间断分割(非连续性分割)

根据图像像素灰度值的不连续性,找到图像中的点、线(宽度为1)、边(不定宽度)点检测线检测边缘检测1)点检测(PointDetection)R=(-1*8*8+128*8)/9=(120*8)/9=960/9=106设:阈值:T=64R>T88881288888图像-1-1-1-18-1-1-1-1模板基本思想:如果一个孤立点(此点的灰度级别和其背景的差别相当大,并且其所在的区域是一个均匀的或近似均匀的区域)与周围的点不同,用模板检测。模板响应记为:输出响应R>T时对应孤立点。可以指定模板为:

线检测比点检测稍微复杂,其基本思想一致。使用模板(注意确定模板的条件或者基本假设)对输出响应决策,需要合适的决策方法。2)线检测(LineDetection)-1-1-1222-1-1-1水平模板-1-12-12-12-1-145度模板-12-1-12-1-12-1垂直模板2-1-1-12-1-1-12135度模板依次计算4个方向的典型检测模板,得到Rii=1,2,3,4如果|Ri|>|Rj|,j≠i,则该点更接近模板i所代表的线。当只对某一检测方向上的线感兴趣时,使用特定模板给出输出响应,通过域值法将响应最强烈的点提取出来。设计任意方向的检测模板可能大于33模板系数和为0感兴趣的方向的系数大。用4种模板分别计算

R水平

=-6+30=24 R45度

=-14+14=0 R垂直

=-14+14=0 R135度

=-14+14=01115551111115551111115551113)边缘检测(EdgeDetection)

边缘检测首先检出图像局部特性的不连续性,然后再将这些不连续的边缘像素连接成完整的边界。 边缘的特性是沿边缘走向的像素变化平缓,而垂直于边缘方向的像素变化剧烈。 所以,从这个意义上说,检测边缘的算法就是检出符合边缘特性的边缘像素的数学算子,目前,边缘检测常采用边缘算子法和模板匹配法等。 3)边缘检测(EdgeDetection)

边缘:图像中灰度发生突变或不连续的微小区域(一组相连的像素集合),即两个具有相对不同灰度值特性的区域的边界线。 在一幅图像中,边缘有方向和幅度两个特性。一般认为沿边缘走向的灰度变化较为平缓,而垂直于边缘走向的灰度变化剧烈。即灰度梯度指向边缘的垂直方向。

边缘检测基本思想:计算局部微分算子。截面图边缘a)局部微分算子:一阶微分,用梯度算子计算特点:常数部分为零;左图中左侧的边是正的(由暗到亮),右侧的边是负的(由亮到暗);右图结论相反。用途:用于检测图像中边的存在。梯度算子(Gradientoperators)函数f(x,y)在(x,y)处的梯度为一个向量:f=[f/x,f/y]T计算这个向量的大小为:|f|=mag(f)=[(f/x)2+(f/y)2]1/2近似为:|f||Gx|+|Gy|梯度的方向角为:(x,y)=arctan(Gy/Gx)Roberts交叉梯度算子

|Gx|=|z5-z9||Gy|=|z6-z8|

梯度值:

|

f||Gx|+|Gy|z2z8z5z3z9z6z1z7z401-10-1001Prewitt梯度算子——3x3的梯度模板Gx=|(z7+z8+z9)

-(z1+z2+z3)

|Gy=|(z3+z6+z9)

-(z1+z4+z7)

|梯度值:|f||Gx|+|Gy|z2z8z5z3z9z6z1z7z4-110-110-110000-1-1-1111Gx-220-110-110000-1-1-2112Gyz2z8z5z3z9z6z1z7z4Sobel算子:

Gx=(z7+2z8+z9)-(z1+2z2+z3)Gy=(z3+2z6+z9)-(z1+2z4+z7)梯度值:|f||Gx|+|Gy|b)局部微分算子:二阶微分,用拉普拉斯算子计算特点:常数部分为零;拉普拉斯算子的结果在亮的一边是正的,在暗的一边是负的。用途:二次导数的符号用于确定像素是在亮的一边,还是暗的一边;0跨越(零交叉),确定边的准确位置。0-1-140-10-10z2z8z5z3z9z6z1z7z4

二维函数f(x,y)的拉普拉斯算子定义为:

2f=2f/x2+2f/y2

对33区域,经验上被推荐最多的形式是:

2f=4z5

–(z2+z4+z6+z8)

马尔(Marr)算子▽2h

:定义2-D高斯函数h(x,y):

其中σ是高斯分布的均方差。如果令r2=x2+y2,那么根据求拉普拉斯的定义式,有马尔(Marr)算子▽2h通常称为高斯型的拉普拉斯算子(LaplacianofaGaussian,LoG)。是一个轴对称函数:

由图可见,这个函数在r=±σ处有过零点,在│r│<σ时为正,在│r│>σ时为负。0σ-σr

由于图像的形状,马尔算子有时被称为墨西哥草帽函数。 用▽2h对图像做卷积,等价于先对图像做高斯平滑,然后再用▽2对图像做卷积。因为▽2h的平滑性质能减少噪声的影响,所以当边缘模糊或噪声较大时,利用▽2h检测过零点能提供较可靠的边缘位置。

如图是一个与▽2h近似的55模板。这种近似不是唯一的。 其目的是得到▽2h本质的形状:一个正的中心项;周围被一个相邻的负值区域围绕(这个负值区域从原点开始作为距离的函数在值上是增加的);并被一个零值的外部区域所包围;系数的总和必须为零,以便在灰度级不变的区域中模板的响应为零。-2-1-216-1-10-1-20-10-1-20000-10000-102、边缘连接(EdgeLinking)在边缘图像的基础上,需要通过平滑、形态学等处理去除噪声点、毛刺、空洞等不需要的部分,再通过细化、边缘连接和跟踪等方法获得物体的轮廓边界。将检测的边缘点连接成线就是边缘跟踪。线是图像分析中一个基本而重要的内容,它是图像的一种中层符号描述。局部连接处理(边界闭合)Hough变换1)局部连接处理(边界闭合)

针对边缘图像,目的是连接间断的边。原理:1)分析每个边缘点(x,y)邻域内像素。

2)分析在一个小的邻域(33或55)中进行。

3)比较梯度算子的响应强度和梯度方向确定两个点是否同属一条边。点(x,y)点(x′,y′)

比较梯度:点(x′,y’)与邻域内的点(x,y)相似,当||f(x,y)|–|f(x’,y’)||T,其中T是一个非负的阈值。 比较梯度向量的方向角:点(x’,y’)与邻域内的点(x,y)的方向角相似,当|(x,y)–(x’,y’)|<A,其中A是一个角度阈值。 当梯度值和方向角都是相似的,则点(x’,y’),与边点界(x,y)是连接的。点(x,y)点(x′,y′)2)Hough变换

对于图像中某些符合参数模型的主导特征,如直线、圆、椭圆等,可以通过对其参数进行聚类的方法,抽取相应的特征。在参数空间不超过二维的情况下,有较理想的效果。y=kx+q(x0,y0)xykq(k,q)例:检测任意方向和位置的直线。该直线在原始图像空间(x,y)的直线方程为:y=kx+q(斜截式),它与参数空间上的一个点(k,q)相对应。过(x0,y0)的一组直线,在参数空间中可用一条直线q=(-x0)k+y0表示。

由于图像中的一条直线对应参数空间的一个点,在参数空间找到这个点,就可以找到在x-y空间对应直线的两个参数。点(xi,yi)在直线y=kx+b上;过第i个点的一组线对应k,q坐标中直线q=b=-(xi)k+yi;过n个点的直线对应k,q坐标中直线族这些直线交于一点(k0,q0),k0,q0值就是点(xi,yi)所在直线的参数,即这n个点在直线y=k0x+q0

上。xykq(k0,q0)q=b=-(x1)k+y1……q=b=-(xi)k+yi……q=b=-(xn)k+yn

对分布在两条直线上的点,可以在参数空间中找到两个聚类点。xyABCDEFkq76年由Duda和Hart作了改进,基于斜率和截距的表示变成用法线和法线与X轴的夹角表示。即:=xcos+ysinyx(x,y)(x0,y0)如果这条直线通过图像上的点(x0,y0),则:=

x0cos+y0sin而这条直线上的点在极坐标系中所对应的点(ρ、θ)构成图(c)中的一条正弦曲线(取02或-)。反之,在极坐标系中位于这条正弦曲线上的点,对应直角坐标系中过点(x0,y0)的一条直线,如图(d)所示。设平面上有若干点,过每点的直线族分别对应于极坐标上的一条正弦曲线。若这些正弦曲线有共同的交点(ρ′,θ′),如图(e),则这些点共线,且对应的直线方程为ρ′=xcosθ′+ysinθ′

这就是Hough变换检测直线的原理。yx6012060ABCDEFGx-y空间的边缘点1200-120/2ABCDEFG-空间的轨迹

程序实现时,对-空间定义二维数组,计算得到-空间一条曲线,相应数组元素值加1,所有边缘点计算完成后,具有较大值的数组元素就是边缘。 即使图像中的边缘是不连续的,Hough变换也能有效地检测出直线,抗噪声性能较好。Hough变换不只对直线,也可以用于圆:

(x–c1)2+(y-c2)2=c32

这时需要三个参数的参数空间。3、阈值分割法(相似性分割)根据图像像素灰度值的相似性通过选择阈值,找到灰度值相似的区域区域的外轮廓就是对象的边

阈值分割法(thresholding)的基本思想:确定一个合适的阈值T(阈值选定的好坏是此方法成败的关键)。将大于等于阈值的像素作为物体或背景,生成一个二值图像。灰度值f(x0,y0)T阈值分割法的特点:适用于物体与背景有较强对比的情况,重要的是背景或物体的灰度比较单一。这种方法总可以得到封闭且连通区域的边界。两个问题: 阈值选定:交互方式、灰度直方图、局部特征 图像阈值化1)阈值选定a)交互方式基本思想:以交互方式获取对象的灰度值(也称样点值)f(x0,y0),满足下式的像素(x,y)组成对象区域:

|f(x,y)–f(x0,y0)|R其中R是容忍度,可通过试探获得。b)利用灰度直方图选阈值A.状态法(themodemethod)(双峰法)基本思想:边界点的灰度值出现次数较少。取值的方法:取直方图谷底(最小值)的灰度值为阈值T。T设灰度直方图为RHST(z),0zN-1(1)在0N-1的范围内变化z,对于每一个灰度值z,在比z小的灰度范围NL内,求RHST(z1’)-RHST(z)(0z1'<z),其中的最大值为L;(2)同理,在比z大的灰度范围NH内,对于每一个灰度值z,求RHST(z2')-RHST(z)(z<z2’N-1),其中的最大值为

H;(3)当

L和

H的积为最大时的灰度Z即为所求阈值Zm。

ZmN-1RHSTz缺点:易受到噪声干扰偏离期望的值。改进:取两个峰值之间某个固定位置,如中间位置上。由于峰值代表的是区域内外的典型值,一般情况下,比选谷底更可靠,可排除噪声的干扰。ZmN-1RHSTzB.最佳阈值(OptimalThreshoding):使图像中目标物和背景分割错误最小的阈值。有时目标和背景的灰度值有部分交错,用一个全局阈值并不能将它们绝对分开。这时常希望能减小误分割的概率,选取最优阈值是一种常用的方法。设一幅图像仅包含两类主要的灰度值区域(目标和背景),它的直方图可看成灰度值概率密度函数p(z)的一个近似。这个密度函数实际上是目标和背景的两个单峰密度函数的混合。

设一幅图像中,背景和目标物的灰度级分布概率密度p1(z)和p2(z)均为高斯函数,它的混合概率密度是:

其中µ1和σ12

分别是某一类像素(如背景)的高斯密度的均值和方差,µ2和σ22分别是另一类的均值和方差,P1和P2分别是背景和目标区域两类像素出现的概率。 根据概率定义有P1+P2=1,所以混合概率密度中有5个未知的参数。如果能求得这些参数就可以确定混合概率密度。0p(z)p1(z)p2(z)E2(T)E1(T)z总的误差概率是最优阈值就是E(T)最小时的T。如图假设µ1<

µ2,定义一个阈值T使得灰度值小于T的像素分割为背景,而使得灰度值大于T的像素分割为目标。这时错误地将目标像素划分为背景的概率和将背景像素错误地划分为目标的概率分别是:

为求得使该误差最小的阈值可将E(T)对T求微分,并令微分式等于零,结果是P1p1(T)=P2p2(T)

将这个结果用于高斯密度,可得到解一元二次方程的根判别式的系数:

该二次式在一般情况下有2个解,如果2个区域的方差相等,则只有一个最优阈值:c)利用局部特征自动选阈值通过边界特性(BoundaryCharacteristics)选择阈值基本思想:直方图的各个波峰很高、很窄、对称,且被很深的波谷分开时,有利于选择阈值。为了改善直方图的波峰形状,只把区域边缘的像素绘入直方图,而不考虑区域中间的像素。用微分算子处理图像,使图像只剩下边缘中心两边的像素的值。优点:1)在前景和背景所占区域面积差别很大时,不会造成一个灰度级的波峰过高,而另一个过低。2)边缘上的点在区域内还是区域外的概率是相等的,因此可以增加波峰的对称性。算法的实现:1)对图像进行梯度计算,得到梯度图像。2)计算梯度值最大的部分像素(如10%)的直方图。3)基于直方图的谷底,得到阈值T。2)图像阈值化a)简单全局阈值分割基本思想:基于获得的阈值T产生一个二值图,区分出前景对象和背景。算法实现:逐行扫描图像。凡灰度级大于T的,灰度置为较大(或0)的值(如255);凡灰度级小于T的,灰度置为0(或较大的值)。适用场合:亮度图像可控的情况,例如工业监测系统。b)可变阈值法(动态阈值处理)

对不均匀光照图像,单一阈值无法兼顾亮区与暗区,需要可变阈值。阈值的选择: 将图像分成许多小块,先对每个小块定一个阈值,各小块的阈值可以不同,然后进行适当的平滑,以消除块间阈值的突变。 如果某小块包含两类的像素(从直方图有双峰,直方图方差较大等判断),则用前面的任一种方法定阈值。 如果某小块只包含一类像素,其直方图较集中,呈单峰状,仅从该小块的信息难于确定阈值。基于其四周直方图呈双峰小块的阈值,通过内插来求得该块的阈值。为了使阈值变化缓慢,不出现假轮廓线,可以对阈值进行平滑处理等。c)基于多变量的阈值分割(ThresholdsBasedonSeveralVariables)彩色图像的分割基本思想:把前面的方法扩展到多维空间,则寻找波谷的过程,变为寻找点簇的过程。应用场合:有多个分量的颜色模型,如RGB模型、CMYK模型、HSI模型。

分割策略:①测量空间聚类法 建立一个“3-D直方图”,用一个3-D网格表示。这个3-D网格中的每个元素代表具有给定3个分量值的像素的个数。 阈值分割的概念可以扩展为在3-D搜索像素的聚类,并根据聚类来分割图像。高S区域低S区域②对彩色图像不同分量进行序列分割当对彩色图像的分割在HSI空间进行时,由于H、S、I三个分量是相互独立的,所以有可能将这个3-D搜索问题转化为三个1-D搜索问题。下面是一种对不同分量进行序列分割的方法:原始图像RGB→HSI用S分割用H分割用I分割H分割图I分割图合并结果后处理分割图像

图像灰度阈值分割技术没有考虑像素空间的连通性。 区域增长把图像分割成特征相同的若干小区域,比较相邻小区域特征的相似性,若足够相似则作为同一区域合并,以此方式将特征相似的小区域不断合并,直到不能合并为止,最后形成特征不同的各区域。这种分割方式也称区域扩张法。 区域内像素的相似性度量可以包括平均灰度值、纹理、颜色等信息。

区域增长要解决三个问题:①确定区域的数目;②选择有意义的特征;③确定相似性准则。4、基于区域的分割(Region-BasedSegmentation,相似性分割)1)基本概念目标:将区域R划分为若干个子区域R1,R2,…,Rn,子区域满足5个条件:1)完备性:2)连通性:每个Ri都是一个连通区域3)独立性:对于任意i≠j,Ri∩Rj=Ф4)单一性:每个区域内的灰度级相等,P(Ri)=TRUE,i=1,2,…,n5)互斥性:任两个区域的灰度级不等,P(Ri∪Rj)=FALSE,i≠j2)区域生长(RegionGrowing)算法实现:1)根据图像的特点选择一个或一组种子,最亮、最暗或位于点簇中心的点。2)选择一个描述符(条件)。3)从种子开始向外扩张,首先把种子像素加入结果集合,然后不断将与结果集合中各个像素连通、且满足描述符的像素加入集合。4)以上过程进行到不再有满足条件的新结点加入集合为止。

区域A

区域B

种子像素

种子像素3)区域分裂与合并(RegionSplittingandMerging)算法实现:1)对图像中灰度级不同的区域,均分为四个子区域。2)如果相邻的子区域所有像素的灰度级相同,则将其合并。3)反复进行上两步操作,直至不再有新的分裂与合并为止(即直至将图像分割为数量最少的区域为止)。4)统计检测法(statisticaldetectionmethod)

前述方法把灰度差作为区域合并的判定标准,此外还有根据小区域内的灰度分布相似性进行区域合并的方法。

1)把图像分割成相互稀疏的、大小为nn的小矩形区域。

2)比较邻接区域的灰度直方图,如果灰度分布情况相似,就合并成一个区域。

3)反复进行2)的操作,直至区域合并完为止。设h1(z)、h1(z)为相邻的两个区域的灰度直方图,从这两个直方图求出累积灰度直方图H1(z)、H2(z),根据或求出两者之差,如果这个差值在某一阈值以下。就把两个区域合并。这里,灰度直方图h(z)的累积灰度直方图H(z)被定义为:累积灰度直方图累积像素数灰度H2(Z)H1(Z)H1(Z)H2(Z)maxH1(Z)H2(Z)分割成矩形区域

上述基于灰度分布相似性的区域扩张法,也可用于分割具有相同纹理特性的区域。以nn矩形区域作为单位时,n过大则小的对象就会漏过;n过小则可靠性减弱。实际中,n常取值5-10。分割成矩形区域6.2特征表示与描述分割(目标(边界或区域)提取)特征提取

表示---数据结构

描述---特征提取边界表示区域表示边界描述:几何区域描述:几何、灰度、纹理关系描述:边界与边界,区域与区域6.2.1特征表示特征表示要使数据变得更有利于下一步的计算工作。下一步工作是基于所选的表达方式描述这个区域,一般情况下:关注焦点是形状特性,选择边界表示链码;多边形逼近;外形特征;边界分段关注焦点是反射率特性,如颜色、纹理,选择区域表示区域骨架所选表示方式,应对尺寸、变换、旋转等变量尽可能的不敏感1、

链码(ChainCodes)

用边界的方向作为编码依据,简化边界的描述。一般描述的是边界点集。01234-链码014672358-链码4-链码:0000333333222222111100114-链码:000033333322222211110011问题1:链码过长;噪声会产生不必要的链码。改进1:加大网格空间;依据原始边界与格点的接近程度,确定新点的位置。4-链码:003332221101问题2:起点不同,编码不同;旋转角度不同,编码不同。改进2:1)通过使用链码的循环一阶差分代替链码本身,解决旋转问题。2)重新定义起点,使得到的循环差分链码对应的整数值最小。这样得到的最小循环差分链码称为形状数。循环一阶差分链码:用相邻链码的差代替链码。例如:4-链码10103322循环一阶差分为:33133030 循环一阶差分:1-2=-1(3) 3-0=3 0-1=-1(3) 3-3=0 1-0=1

2-3=-1(3) 0-1=-1(3) 2-2=0

4-链码10103322的形状数:03033133(数值最小)优点:(a)数据压缩

(b)可由链码直接计算图形的某些参数链码平滑:将原始的链码序列用较简单的序列代替虚线箭头:原始的在象素p和q之间的8-连通链码实线箭头:用来替换原始序列的新序列空心圆平滑2、

多边形逼近(PolygonalApproximations)基本思想:用一包含尽量少线段的多边形刻画边界形状的本质。寻找最小基本多边形的方法一般有两种:

1)点合并法

2)边分裂法点合并法:沿边界选相邻点对,计算首尾连接直线段与原始折线段的误差R。如果误差R小于阈值T,去掉中间点,选新点对与下一相邻点对,重复(1);否则存储线段参数置误差为0,选被存储线段的终点为起点,重复(1)、(2)。当另一个端点或第一个起点被遇到,程序结束。RR<T

存在问题:顶点可能不对应于边界的拐点(如拐角)。因为新的线段直到超过误差的阈值才开始。边分裂法:连接边界线段的两个端点(如果是封闭边界,连接最远点);如果最大垂直距离大于阈值,将边界分为两段,最大值点定位一个顶点。重复(1);如果没有超过阈值的垂直距离,结束。3、

外形特征用一维函数表达边界。质心角函数:边上的点到质心距离r,作为夹角的函数r()。Arr()2A问题:函数过分依赖于旋转和缩放变换。改进:对于旋转——两种改进:a.选择离质心最远的点作为起点。b.选择从质心到主轴上最远的点作为起点。对于缩放变换:对函数进行归一化,使函数值总是分布在相同的值域里,比如说[0,1]。4、

边界分段(BoundarySegments)基本概念:任意集合S(区域)的凸壳H是:包含S的最小凸集。H-S的集合被称为集合S的凸残差D。SSDS+D=H分段算法:标记进入和离开D的变换点来划分边界段。优点:不依赖于方向和比例的变化。算法改进:在保证产生正确骨架的同时,改进算法的效率。比较典型的是一类细化算法,它们不断删去边缘,但保证删除满足:(1)不移去端点(2)不破坏连通性(3)不引起区域的过度腐蚀5、

区域骨架(RegionSkeletons)平面区域削减成图形,即区域骨架。定义骨架的中轴变换方法。设R是一个区域,B为R的边界,对R中的点p,找p在B上“最近”的邻居。如果p有多于一个的这样的邻居,称它属于R的中轴(骨架)。pRBP’提取区域骨架的细化二值区域的算法假设区域内的点值为1,背景值为0对给定区域边界点连续进行两个基本操作(基本操作1、基本操作2),直到没有点可删除。边界点指任何值为1且至少有一个8邻域上的点为0的象素基本操作1:标记满足以下四个条件的边界点,准备删除:(a)

2N(p1)6,N(p1)是点p1邻域中1的个数,即:

N(p1)=p2+p3+…+p9(b)

S(p1)=1,S(p1)是按p2,p3,…,p9顺序,0-1转换的次数(c)

p2*p4*p6=0(p2、p4、p6至少有一个0)(d)

p4*p6*p8=0(p4、p6、p8至少有一个0)p9p2p1p8p3p4p7p6p500p1110101举例: N(p1)=4 S(p1)=3 p2*p4*p6=0 p4*p6*p8=0第2个条件不满足,不标记p9p2p1p8p3p4p7p6p5p9p2p1p8p3p4p7p6p5基本操作2条件(a)、(b)与操作1相同条件(c)、(d)改为:c’)p2*p4*p8=0d’)p2*p6*p8=0p9p2p1p8p3p4p7p6p5p9p2p1p8p3p4p7p6p51、简单描述符1)边界的周长:曲线长度或区域轮廓的周长。2)边界的直径:边界上相隔最远的两点间的距离3)边界的曲率:相邻边界线段的斜率差6.2.2边界描述符(BoundaryDescriptors)ak1k22、

傅立叶描述符(FourierDescriptors)图像空间边界点的坐标用复数表示为s(k)=x(k)+jy(k),k=0,1,…,N-1。

进行离散傅立叶变换a(u)称为边界的傅立叶描述符。y0y1x0x1jyxx(k)=xky(k)=yk选整数MN-1,进行逆傅立叶变换(重构)基于上式在重构每一个点所需要的计算项大大减少。边界点数很大时,M一般选为2的整数次幂。上述方法对u>M-1部分舍去不予计算,而傅立叶变换高频部分对应细节,因此M越小细节部分丢失越多。M=4M=61M=62N=64

1)较少的傅立叶描述符(如4个),就可以获取边界的整体轮廓。

2)使用复数作为描述符,对旋转、平移、放缩等操作和起始点的选取不十分敏感。

3)几何变换的描述符可通过对函数作简单变换来获得。下表表示傅立叶描述符的基本性质:几何变换边界傅立叶描述符原形s(k)a(u)旋转sr(k)=s(k)ejar(u)=a(u)ej平移st(k)=s(k)+xyat(u)=a(u)+xy(u)放缩ss(k)=s(k)as(u)=a(u)起点sp(k)=s(k-k0)ap(u)=a(u)e-j2k0u/N3、

矩(Moments)将描述形状的任务减化为描述一个一维函数。矩的定义:连接边界的两个端点,并将得到的线段旋转到水平方向得到函数g(r)。注意边界点的坐标旋转相同角度。rg(r)n(r)是边界的n阶矩:1、

简单描述符面积:区域内像素数。周长:区域边界点数量。复杂度:区域形状的复杂程度,常使用e=(周长)2/面积。图形形状接近圆形时e最小(为4),形状复杂时值较大。

其它用做简单区域描述符的量包括:灰度的均值和中值、最小和最大灰度级值、大于和小于均值的像素数等。6.2.3区域描述符(RegionalDescriptors)2、

拓扑描述符(TopologicalDescriptors)拓扑学研究图形不受畸变变形(不包括撕裂或粘贴)影响的性质,拓扑性质是全局性质,与距离无关。1)区域内孔洞数H2)区域内连通分量的数目C3)欧拉数:E=C-H

对一幅二值图象A,可以定义两个欧拉数

(1)4-连通欧拉数E4(A):4-连通的目标个数减去8-连通的孔数

(2)8-连通欧拉数E8(A):8-连通的目标个数减去4-连通的孔数多边形网:由直线段(包围)构成的区域集合欧拉公式

V:顶点数

B:边线数

F:面数

V=26,

B=33,

F=7,

C=3,

H=3,

E=03、

纹理

纹理是图像分析中常用的概念,但目前尚无对它正式的(或者说尚无一致的)定义,一般说,可以认为是由许多相互接近的、互相编织的元素构成,它们常富有周期性。直观来说,纹理描述可提供区域的平滑、稀疏、规则性等特性。常用的三种纹理描述方法是:①统计法;②结构法;③频谱法。1)统计法:借助区域灰度的共生矩阵描述纹理。

设S为目标区域R中具有特定空间联系的像素对的集合,则共生矩阵P定义为:

分子:具有某种空间关系、灰度值分别为g1和g2的像素对的个数,

分母:像素对的总和个数。

“#”代表数量实例:位置算子和共生矩阵纹理统计描述中,可借助位置算子计算共生矩阵。

设W是一个位置算子,A是一个kk矩阵,其中每个元素aij为具有灰度值gi的点相对于由W确定的具有灰度值gj的点出现的次数,这里有0≤i,

j≤k-1。

下图是只有3个灰度级的图像(g1=0,

g2=1,

g3=2),定义W为“向右一个像素和向下一个像素,即右下方”的位置关系,得到矩阵A如下:

如果设满足W的像素对的总个数为N,则将A的每个元素都除以N就可得到W关系的像素对出现概率的估计,并得到相应的共生矩阵。

在共生矩阵的基础上可定义几个常用的纹理描述符:

(2)熵(1)角二阶矩(3)对比度(反差)(4)逆差分矩(均匀性)WE给出一个图像内容随机性的量度;WM对应图像的均匀性或平滑性,当所有P(i,j)都相等时,WM达到最小值;WC是共生矩阵各元素灰度差的一阶矩,当P中大的元素远离矩阵的主对角线时,WC较大(表明图像中的近邻像素有较大的反差);WH在一定程度上可看作是WC的倒数(k的作用是避免分母为零,WH的大小受k值影响较大)。2)结构法:认为复杂的纹理可由一些简单的纹理基元(基本纹理元素)以一定的有规律的形式重复排列组合而成。如果我们能定义出一些排列基元的规律,就有可能将某些纹理基元按照规定的方式组织成所需的纹理方式。这里的规则和方式可用形式语言来定义。3)频谱法:借助傅立叶频谱的频率特性描述周期的或近乎周期的2-D图像模式的方向性。常用的性质有:

傅立叶频谱中突起的峰值对应纹理模式的主方向;

这些峰在频域平面的位置对应模式的基本周期;

为方便起见可把频谱转化到极坐标系中。此时频谱可用S(r,)表示,这里S是频谱函数,r和是坐标系中的变量。

对每个方向,S(r,)可以看作一维函数S(r);对每个频率r,Sr()也是一个一维函数。

对固定的值分析S(r),得到沿着自原点的辐射方向上的频谱所表现的特性(比如存在的尖峰)。

反之分析固定r值的Sr(),得到沿着以原点为圆心的圆形上的特性。一种更具有整体性的描述通过对下列函数进行积分(对于离散变量为求和)得到:和

这里R0是以原点为圆心的圆半径。也可以从S(r)和S()的曲线,计算它们最大值的位置等来作为特征。6.2.4关系描述符(RelationalDescriptors)分割出来的对象可能由多个成分(或区域)组成。需要描述各个成分之间的结构关系。常用方法:将结构关系用符号串来描述,或用一树形结构描述。提取的图元图元间的操作一组特定的图元生成一个结构(a)(b)(c)(d)1、

骨架关系编码2、

树结构关系编码

树结构中每个结点的意义和结点之间的关系(如包含关系)最为重要,例:abcd$abcdefef$6.3图像分析

图像分析是发现、辨认和理解模式的过程,这些模式都与图像数据相关。

计算机图像分析的主要目的之一是,赋予机器某种感觉能力,例如OCR。获取、发现信息:从背景中提取有关信息。学习、应用知识:抽象、归纳信息特征并应于新对象。构造、推理知识:从不完整的信息中构造推论出新知识并应用。6.3.1

模式与模式类模式的定义模式是对图像中的某个对象或某些感兴趣本质的数量或结构的描述。模式由一个或多个描述符组成,即模式是一个描述符序列(一组描述符)。模式是一组特征(名词“特征”经常被用来代指描述符)。

模式类是具有某些公共特征的模式的系列,用w1,w2,…wM表示,M是类的个数。

模式识别根据图像中对象的特征组成的模式,确定对象是属于哪一个模式类。模式:汽车的长、宽、高(L,W,H)模式类(w大,w小,w卡):

大客车:(L,W,H)大

小轿车:(L,W,H)小

卡车:(L,W,H)卡模式实例:图像中发现的一个对象(L1,W1,H1)模式识别:判断对象(L1,W1,H1),是大客车、小轿车、还是卡车。三种模式序列:

模式特征向量;模式串;模式树1、模式特征向量——描述符构成的向量x=

x1x2.xnxi代表第i个描述符,n是描述符的数量。模式特征向量常表示为列向量或(x1,x2,…,xn)T。模式特征向量用粗体小写字母表示,如x,y和z: 假设通过测量花瓣的宽度和长度描述三种蝴蝶花(多毛的、维吉尼亚、多色的)。这里涉及一个两维的模式特征向量,x1、x2分别对应花瓣的长和宽,三种模式类用w1、w2、w3表示。

x=

x1x21234567x1花瓣长0.51.01.52.02.53.0x2花瓣宽多毛的维吉尼亚多色的花瓣长宽特征成功地将多毛的蝴蝶花与其它两种分离,但对于分离维吉尼亚和多色的是失败的。

这个结论说明了分类的特征选择问题,在这个问题中,类的可区别性的程度,完全依赖于对应用的描述符的选择。模式特征的选择:①可区别性:对不同类别对象特征值差异明显。②可靠性:对同类对象特征值比较接近。③独立性:所用的各特征之间彼此统计独立。④数量少:过多的特征数,会使系统复杂度提高。一般特征向量的选择方法:尽量不选择带噪声和相关度高的特征。先选择一组直觉上合理的特征,然后逐渐减少到最佳。2、

模式串:对象特征的结构或空间关系。abaaabbb (1)S->aA (2)A->bS(3)A->b梯状的模式3、

模式树:分层有序结构。6.3.2

决策论法设:模式特征向量:x=(x1,x2,…,xn)T,

对M个模式类w1,w2,…,wM,寻找M个决策函数d1(x),d2(x),…,dM(x),

如果di(x)>dj(x)j=1,2,…,M;j≠i,那么模式实例x属于模式类wi 即如果一个未知模式对象x属于第i个模式类,把x代入所有的决策函数,di(x)的取值最大。对模式特征向量x,如果di(x)-dj(x)=0则x向量称为wi与wj的决策边界。通常用单一函数dij(x)标识两个类之间的决策边界,定义为dij(x)=di(x)-dj(x)=0

如果dij(x)>0x属于类wi

如果dij(x)<0x属于类wj1、分类器的设计和训练1)分类器一般设计方法每一模式类给出一个典型模板。计算待分类对象与不同典型模板之间的相似程度。相似值是对象的函数,函数值决定对象属于哪一模式类。2)分类器一般设计规则分类器规则转换为阈值规则;将测量空间划分成互不重叠的区域;每一个模式类对应一个区域(或多个);对象的分类函数值落在哪个区域,对象就属哪类;某些情况,某些区域为“无法确定”类。3)分类器的训练决策规则决定后,需要确定分类器的阈值;用一组已被正确表示类别的对象训练分类器,这些训练对象称为训练集;通过对这些对象确定能够将决策面划分成不同区域的合理阈值。以蝴蝶花的例子为例:(1)为多色(w1)和多毛(w2)两种蝴蝶花,确定两个原形(或称模板)m1和m2。(2)判断未知模式向量x与m1和m2的距离,如果与m1的距离小于与m2的距离,则x属于w1,否则属于w2。1234567x1花瓣长0.51.01.52.02.53.0x2花瓣宽多毛的多色的m1m2x2、最小距离分类器〈1〉计算模式类wj的原形模式特征向量:Nj是属于模式类wj的模式向量的个数。M是模式类的数目。〈2〉计算x与mi的距离dj(x)=||x–mj||j=1,2,…,M

其中||a||=(aTa)1/2是欧几里德范式 ||x–mj||=((x–mj)T(x–mj))1/2j=1,2,…,M〈3〉 如果di(x)=min(dj(x))j=1,2,…,M,则x属于wi为便于计算,改写成求最大的标准形式,决策函数为:

dj(x)=xTmj–1/2mjTmjj=1,2,…,M 如果,di(x)=max(dj(x))j=1,2,…,M 则x属于wi〈4〉用上式得到的类wi和wj之间的决策边界是:

dij(x)=di(x)-dj(x)=xT(mi–mj)–1/2(mi–mj)T(mi+

mj)=01234567x1花瓣长0.51.01.52.02.53.0x2花瓣宽多毛的多色的2.8x1+1.0x2–8.9=0m1=(4.3,1.3)Tm2=(1.5,0.3)T3、

相关匹配分类器基本思想:a.用样板子图像直接作为模式特征(不是用描述符)。b.通过子图像与原图像直接进行相关计算,把相关计算作为决策函数。c.相关计算获得最大值的位置,就被认为匹配成功。决策函数是相关函数问题1:在边界处失去准确性,误差与子图像尺寸成正比。

改进:相关函数对振幅的变化太敏感,f(x,y)加倍,c(s,t)也加倍。用相关系数函数代替相关函数

这里x=0,1,2,…M-1,y=0,1,2,…N-1。

是w中像素的平均值(只计算一次),是f中与w当前所在位置重合的子图像像素平均值,总和的值通常由f和w两者的坐标代入后求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论