




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要本文从原理和应用效果分析了边缘检测、阈值分割技术和区域生长等经典图像分割方法。对于梯度算法中的Roberts算子、Sobel算子、Prewitt算子、Laplacian算子、LoG(Laplacian-Gauss)算子、Canny算子、分割步骤、分割方法,比较分割标准,可以看出边缘根据Canny边缘算子的三个标准得到的检测结果是最令人满意的。阈值分割技术的关键是阈值的确定。只有确定了阈值,才能有效地划分物体和背景。但该方法仅适用于灰度分布明显、背景与物体差异较大的图像。分割效果明显。区域生长的基本思想是将具有相似属性的像素组合成一个新的区域。同时,本文还分析了图像分割技术的研究方向。关键词:图像处理图像分割目录(一般目录要求最多三级目录,无四级目录)TOC\o"1-4"\h\z\u第1章引言11.1数字图像处理的基本特点11.1.1数字图像处理的信息多为二维信息,处理的信息量很大(三级题有问题)11.1.2数字图像处理占用的频段更宽21.1.3数字图像中每个像素点不是独立的,相关性很大21.1.4做出适当的假设或添加新的测量值21.1.5数字图像处理后的图像受人为因素影响很大21.2数字图像处理的优势21.2.1重现性好2_1.2.2加工精度高31.2.3适用面宽31.2.4高灵活性3_1.3数字图像处理的应用41.3.1在航天航空技术中的应用41.3.2在生物医学工程中的应用51.3.3通信工程中的应用51.3.4工业和工程应用51.3.5在军队公共安全中的应用51.3.6文化艺术的应用61.4数字图像分割技术发展概况61.4.1基于分形的图像分割技术61.4.2基于神经网络的图像分割技术71.5本文主要流程图8第2章数字图像处理的处理方法92.1图像变换92.2图像编码与压缩92.3图像增强和恢复92.4图像分割92.5图片说明102.6图像分类(识别)10第三章MATLAB平台及其开发环境113.1.MATLAB11的组成3.1.1MATLAB主要有以下几个部分11一个。数值计算功能12湾。符号计算函数12C。数据分析功能12d。动态模拟功能12e.程序借口功能13F。文字处理功能133.2MATLAB13的特点3.2.1功能强大,扩展性强133.2.2界面友好,编程效率高143.2.3图像功能,灵活方便14图像处理中的MATLAB14第4章图像分割概念与算法研究164.1图像分割的基本概念164.1.1图像分割定义164.2边缘检测方法(4.1和4.2没有平行关系)174.2.1边缘检测概述174.2.2边缘检测梯度算法19一个。梯度边缘检测算法基本步骤及流程图19湾。罗伯特操作员20C。索贝尔算子21d.Prewitt算子214.2.3拉普拉斯算子22_4.2.4LoG(拉普拉斯-高斯)算子244.2.5Canny算子25_4.3灰度阈值分割274.3.1阈值分割简介28一个。阈值分割原理28湾。阈值分割算法的分类294.3.2全局阈值30一个。最低点阈值31湾。最佳阈值31C。迭代阈值分割334.3.3动态阈值34一个。阈值插值35湾。水线阈值算法354.4区域分割374.4.1区域增长的基本原理、步骤和流程图374.4.2成长标准和过程40一个。灰度差异标准40湾。灰度分布的统计标准41C。面积形状标准424.4.3拆分与合并43第5章总结455.1图像边缘检测分析455.2图像阈值分割分析455.3图像区域分割分析465.4改进意见(改进可以作为一个单独的章节,比如某些算法的几个改进等,不要放在总结一章)(总结是对整篇文章的概述,应该写成什么得出结论,一些算法间比较和其他相关问题。)46参考文献48至49附录50第一章介绍1.1数字图像处理的基本特点1.1.1数字图像处理的信息多为二维信息,处理的信息量非常大。例如,一张256×256的低分辨率黑白图像需要64kbit左右的数据量;对于高分辨率彩色512×512图像,需要768kbit的数据量;如果要处理30帧/秒的电视图像序列,每秒所需的数据量为500kbit~22.5Mbit数据量。因此,对计算机的计算速度和存储容量提出了更高的要求。1.1.2数字图像处理占用更宽频带与语言信息相比,占用的频带要大几个数量级。例如,电视图像的带宽约为5.6MHz,而语音的带宽仅为4kHz左右。因此,在实现成像、传输、存储、处理、显示等环节,技术难度相对较高,成本也较高,对频段压缩技术提出了更高的要求。1.1.3数字图像中的每个像素都不是独立的,相关性很大在一个图像屏幕上,通常有许多像素具有相同或接近的灰度。就电视画面而言,同一行或相邻两行之间的两个相邻像素之间的相关系数可以达到0.9以上,并且相邻两帧之间的相关性一般大于帧相关性。一些。因此,图像处理信息压缩的潜力是巨大的。1.1.4做出适当的假设或添加新的测量值由于图像是三维场景的二维投影,图像本身并不具备再现三维场景所有几何信息的能力。显然,三维场景背后的部分信息无法在二维图像屏幕上体现出来。因此,要分析和理解三维场景,需要做出适当的假设或添加新的测量值,例如双目图像或多视图图像。理解3D场景需要知识引导,这也是人工智能试图解决的知识工程问题。1.1.5数字图像处理后的图像受人为因素影响很大由于人类的视觉系统非常复杂,它受环境条件、视觉表现、人们的情感偏好和知识的影响很大。作为对图像质量的评价,还需要进一步的研究。另一方面,计算机视觉模仿人类视觉,人类的感知机制必然会影响计算机视觉的研究。例如,什么是感知的初始原语,原语是如何构成的,局部感知与全局感知的关系,优先敏感性的结构、属性和时间特征等,这些都是心理学和神经心理学关注的话题。1.2数字图像处理的优势1.2.1重现性好数字图像处理与模拟图像处理的根本区别在于,它不会因图像存储、传输或复制等一系列变换操作而降低图像质量。只要图像在数字化时准确地代表原件,数字图像处理过程将始终保持图像的再现性。1.2.2加工精度高按照目前的技术,几乎可以将模拟图像数字化成任意大小的二维阵列,这主要取决于图像数字化设备的能力。现代扫描仪可以将每个像素的灰度级量化到16位或更高,这意味着可以以任何应用所需的精度对图像进行数字化。对于计算机而言,无论数组的大小和每个像素的位数如何,处理过程几乎都是相同的。也就是说,原则上,无论图像的精度有多高,只要在处理过程中改变程序中的数组参数,总能做到处理。回顾图像的模拟处理,要想将处理精度提高一个数量级,就必须大幅度改进处理设备,这是极其不经济的。1.2.3适用面宽图像可以来自多种信息源,可以是可见光图像或不可见光谱图像(例如,X射线图像、射线图像、超声图像或红外图像等)。从图像所反映的客观实体的尺度上看,小到电子显微镜图像,大到航空照片、遥感图像,甚至天文望远镜图像。这些来自不同信息源的图像,只要转换成数字编码形式,都是二维数组表示的灰度图像(彩色图像也是由灰度图像组成的,例如RGB图像由红、绿、绿三色组成)蓝色图像、灰度图像),因此它们都可以由计算机处理。即只要针对不同的图像信息源采取相应的图像信息获取措施,数字图像处理方法就适用于任何一种图像。1.2.4高灵活性图像处理大致可分为图像质量提升、图像分析和图像重建三个部分,每个部分都包含丰富的内容。由于图像的光学处理原则上只能进行线性运算,这极大地限制了光学图像处理所能达到的目标。数字图像处理不仅可以完成线性运算,还可以进行非线性处理,即所有可以用数学公式或逻辑关系表达的运算都可以通过数字图像处理来实现。1.3数字图像处理的应用图像是人类获取和交换信息的主要来源。因此,图像处理的应用领域必然涉及人类生活和工作的方方面面。随着人类活动的不断扩大,图像处理的应用领域也将不断扩大。1.3.1航天航空技术应用数字图像处理技术在航天航空技术中的应用,除了上述对月球和火星照片的JPL处理外,另一个应用是在飞机遥感和卫星遥感技术上。许多国家每天都派出许多侦察机,对地球上感兴趣的区域进行大量航拍。以前需要数千人使用的最终照片的处理和分析,现在通过配备先进计算机的图像处理系统进行解释和分析,节省了人力并加快了从照片中提取人力的速度。大量有用的信息,找不到。1960年代后期以来,美国和一些国际组织发射了资源遥感卫星(如LANDSAT系列)和天空实验室(如SKYLAB)。由于成像条件受飞行器位置、姿态和环境条件的影响,因此图像质量并不总是很高。.因此,以如此昂贵的价格通过简单直观的解释获得图像并不划算,必须采用数字图像处理技术。例如,LANDSAT系列陆地卫星使用多波段扫描仪(MSS),以900km18天为周期,对地球高海拔的每个区域进行扫描和成像。100米LANDSAT-4,分辨率30m)。这些图像首先在空中被处理(数字化、编码)成数字信号并存储在磁带中。当卫星经过地面站时,它们会被高速传输,然后由处理中心进行分析和解释。无论是对这些图像进行成像、存储、传输还是分析以进行解释,都必须使用许多数字图像处理方法。现在世界各国都在利用Landsat获取的影像进行资源调查(如森林调查、海洋沉积物和渔业调查、水资源调查等)、灾害检测(如病虫害检测、水和火灾探测、环境污染探测等)、资源勘探(如石油勘探、矿产探测、地理位置勘探及大型项目分析等)、农业规划(如土壤营养、水分和作物生长等)1.3.2在生物医学工程中的应用数字图像处理在生物医学工程中的应用非常广泛,非常有效。除了上述CT技术,还有医学显微图像的处理和分析,如红细胞和白细胞分类、染色体分析、癌细胞识别等。此外,图像处理技术广泛应用于X射线肺部图像增强、超声图像处理、心电图分析、立体定向放射治疗等医学诊断中。1.3.3通信工程中的应用当前通信的主要发展方向是语音、文本、图像和数据相结合的多媒体通信。具体而言,是以三网合一、电视、计算机的方式在数字通信网络上传输。其中,图像通信最为复杂和困难,因为图像的数据量非常巨大,如彩电信号的传输速率超过100Mbit/s。为了实时传输如此高速率的数据,必须使用编码技术来压缩信息的比特量。从某种意义上说,编码压缩是这些技术成败的关键。除了广泛使用的熵编码、DPCM编码和变换编码外,国外正在大力发展分支编码、自适应网络编码、小波变换图像压缩编码等新的编码方法。1.3.4工业和工程应用图像处理技术在工业和工程中有着广泛的应用,如自动装配线中零件质量的检测和分类、印刷电路板缺陷的检测、弹性照片的应力分析、流体力学照片的拖拉和提升等。分析、邮政信件的自动分拣、在某些有毒和放射性环境中识别工件和物体的形状和排列、在先进的设计和制造技术中使用工业视觉等等。值得一提的是,具有视觉、听觉和触觉功能的智能机器人的发展,将为工农业生产带来新的动力。目前已在工业生产中的涂装、焊接、装配等方面得到有效应用。1.3.5军警应用在军事方面,图像处理和识别主要用于导弹的精确末制导、各种侦察照片的判读、具有图像传输、存储和显示功能的军事自动化指挥系统,以及飞机、坦克和军舰的模拟训练系统等。;口译分析、指纹识别、人脸识别、残缺图片还原、交通监控、事故分析等。已投入运行的高速公路不停车自动收费系统中车辆和车牌的自动识别就是其中的例子。图像处理技术的成功应用。1.3.6文化艺术应用目前,此类应用包括电视画面的数字编辑、动画制作、电子影像游戏、纺织工艺品设计、服装设计与制作、发型设计、文物照片的复制与修复、运动员动作分析与评分等。形成一门新的艺术——电脑艺术。计算机处理图像有两个目的:一是生成适合人类观察和识别的图像,二是希望图像能够被计算机自动识别和理解。不管目的是什么,图像处理中的一个关键步骤是对包含大量场景信息的图像进行分割。分割的最终结果是将图像分解成一些具有一定特征的最小分量,称为图像的图元。这样的图像基元比整个图像更容易快速处理。图像特征是指图像中可以作为标志的属性,可分为大气图像的统计特征和图像的视觉特征两大类。图像的统计特征是指通过变换得到的一些人为定义的特征,如直方图、矩、谱等、纹理或轮廓等。利用这两类特征将图像分解为一系列有意义的对象或区域称为图像分割。1.4数字图像分割技术发展概况1.4.1基于分形的图像分割技术基于特征的图像分割方法包括两个重要部分:特征提取和模式聚类。特征提取是图像分割中最重要的问题之一。能否提取出有效的特征值对分割结果影响很大。特征提取大致可分为三类,即基于特征的、基于模型的和基于结构的。基于特征的方法是寻找具有相同特征的区域或区域边界,而基于模型的方法是假设一个基本的随机过程,并将过程参数作为特征。由于模型参数也可以用作纹理特征,因此基于模型的方法可以被视为基于特征的方法的子集。结构特征是基于图像中存在可检测的基本结构元素并按照一定规则排列的假设。基于模型的方法有两种最典型的模型:分形几何模型和随机模型。近年来,分形函数受到越来越多的关注。分形是BBMandelbrot在总结自然界中的不规则几何图形后于1975年提出的第一个分形概念。Mandelbrot对分形的定义是:设Hausdorff维数为D。如果这个维数总是大于集合A的拓扑维数Dt,则集合A称为分形集,或简称分形。上述定义不需要任何其他条件。1986年,Mandelbrot给出了分形的第二个定义:成分和整体被称为形状相似的分形。这个定义突出了相似性的作用,反映了自然界中广泛的物体的基本属性;部分与部分、部分与整体在形式、功能、信息、时间和空间等方面具有统计相似性。简单地说,分形是一个维数大于拓扑维数的集合。分形维数的一个主要特征是尺度变换的不变性。分形几何在图像压缩和图像编码中得到了广泛的应用,并取得了良好的效果。同时,一些研究人员在自然纹理图像和自然场景的分割和识别中使用分形特征。分形维数特征对图像尺度变换不敏感,与物体表面粗糙度的判断有很大的相关性。由于许多自然纹理具有线性对数功率谱,因此分形维数对应于该线性对。因此,用分形维数来描述自然纹理是合理的。1.4.2基于神经网络的图像分割技术图像分割算法可以使用神经网络模型来实现。Blanz和Gish使用多层前馈神经网络进行图像分割,输入层的神经元数量取决于输入特征的数量,输出层的神经元数量等于分类的数量。由于BP网络可以完成从n维空间(输入节点数为n)到m维空间(输出节点数为m)的复杂非线性映射,因此具有拉普拉斯算子的能力,并且良好用神经网络可以得到结果,并且用神经网络处理,一旦训练完成,就完全确定了各个节点之间的互连权重,识别速度非常快。巴巴口等人。使用多层BP神经网络对图像进行阈值分割,输入为统计直方图,输出为期望阈值。使用这种方法,在神经网络的学习阶段需要大量具有已知阈值的样本图像来调整网络参数以产生合适的输出。但在实际应用中,获取大量样本图像是非常困难的。借助松弛标记技术和人工神经网络的相关理论,M.Liang提出了一种以Kohonen网络作为从网络粗分割的主从神经网络分割方法。从网络的分割结果用于确定主网络中的每个神经元。主网络的初始状态,然后主网络从这个初始状态开始,进行状态的动态演化,直到收敛到主网络的某个吸引子。此时主网的状态与分割后的图像相对应。该方法可以在低信噪比的情况下对图像进行分割。实验表明,它比最优判别式阈值分割方法和保留矩阵的阈值分割方法具有更好的效果,并且可以实现实时处理。从高度噪声破坏的场景中提取对象的类似方法也可以使用Hopfield型神经网络。1.5本文主要流程图原始图像原始图像边缘检测方法灰度阈值分割区域分割方法比较各种方法的分割效果得出比较理想的分割效果图1-1主流程图第二章数字图像处理的处理方法2.1图像变换由于图像数组非常大,直接在空间域进行处理涉及大量计算。因此,常采用各种图像变换方法,如傅里叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域的处理,不仅可以减少处理量的计算,还可以获得更高效的处理(例如傅里叶变换可以在频域进行数字滤波)。新兴的小波变换在时域和频域都具有良好的定位特性,在图像处理中也有广泛而有效的应用。2.2图像编码与压缩图像编码和压缩技术减少了描述图像的数据量(即位数),以节省图像传输、处理时间并减少占用的内存量。可以在不失真或内容失真的情况下实现压缩。编码是压缩技术中最重要的方法,是图像处理技术中最早、比较成熟的技术。2.3图像增强与恢复图像增强和恢复的目的是提高图像的质量,例如去除噪声、提高图像的清晰度等。无论图像退化的原因如何,图像增强都会突出图像中感兴趣的部分。如果图像的高频成分得到增强,图像中的物体轮廓清晰,细节明显;如果增强低频分量,可以减少图像中噪声的影响。图像恢复需要对图像退化的原因有一定的了解。一般来说,应根据退化过程建立“退化模型”,然后采用一定的滤波方法对原始图像进行恢复或重建。2.4图像分割图像分割是数字图像处理的关键技术之一。图像分割是提取图像中有意义的特征部分,其有意义的特征包括图像中的边缘、区域等,是进一步进行图像识别、分析和理解的基础。尽管已经研究了许多边缘提取和区域分割的方法,但还没有一种有效的方法可以普遍适用于各种图像。因此,对图像分割的研究还比较深入,是当前图像处理研究的热点之一。2.5图片说明图像描述是图像识别和理解的必要前提。作为最简单的二值图像,它的几何特征可以用来描述物体的特征。总则图像描述方法采用二维形状描述,有边界描述和区域描述两种方法。对于特殊纹理图像,可以使用二维纹理特征描述。随着图像处理研究的深入发展,对三维物体描述进行了研究,提出了体积描述、曲面描述、广义圆柱描述等方法。2.6图像分类(识别)图像分类(识别)属于模式识别领域,其主要内容是对图像进行一些预处理(增强、恢复、压缩)后进行图像分割和特征提取,从而进行决策分类。图像分类经常使用经典的模式识别方法,包括统计模式分类和句法(结构)模式分类。近年来,新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也受到越来越多的关注。第三章MATLAB平台及其开发环境MATLAB自1984年由美国Mathworks公司推出市场以来,经过十多年的发展,已成为国际公认的最优秀的科技应用软件。MATLAB不仅是一种直观、高效的计算机语言,而且是一种科学的计算平台。MATLAB以矩阵为基本编程单元,将数值分析、矩阵计算、科学数据可视化、非线性动力系统建模与仿真等诸多强大功能集成在一个易于使用的窗口环境中,用于科学研究、工程设计。它为许多必须进行有效数值计算的学科领域提供了简单高效的大规模编程工具,并为数据分析和数据可视化、算法和应用程序开发提供了最核心的数学和高级图形工具。根据它提供的500多个数学和工程函数,工程师和科学家可以在它的集成环境中相互交互,完成各自的计算。借助这个编程环境,任何复杂的计算问题及其解法描述都非常适合人们的逻辑思维和数学表达习惯,并且在很大程度上摆脱了传统的非交互编程语言(如C、Fortran).编程模式为自然科学和工程设计的多个领域提供综合解决方案或综合解决复杂的数值计算问题。MATLAB语言还提供了一个可以与C和Fortran语言一起使用的接口,并且可以很容易地用用C和Fortran语言编写的程序进行编译。3.1。MATLAB的组成3.1.1MATLAB主要有以下几部分矩阵语句-一种高级矩阵/数组语言,用于MATLAB核心的控制流语句、函数、数据结构、输入/输出和面向对象的编程功能。MATLAB不仅内容用户交互式计算小程序,还内容构建完整而复杂的大型应用程序。工作环境-MATLAB工作环境是与用户(作为MATLAB用户或程序员)一起工作的大量工具和功能程序的集合。MATLAB执行变量管理和函数,用于在用户工作区中导入和导出数据。MATLAB还包含一些游泳工具并提供集成开发环境。HandleGraphics-在MATLAB的图形系统上处理图形。包括用于可视化2D和3D数据、图形、图像处理、动画和显示图形的高级指令,以及内容倡导者完全控制图形外观以创建完整图形用户界面的低级指令(GUI)在用户的MATLAB应用程序中。数学函数库——MATLAB汇集了大量有价值的科学和工程计算算法,以满足复杂高科技计算任务的大量需求,从初等函数、复数运算到矩阵求逆、矩阵特征值、奇异值等复杂函数值,贝塞尔程序文件库。其功能包括从MATLAB调用C或Fortran程序,调用MATLAB作为(C或Fortran)计算引擎来读写MAT文件。MATLAB之所以成为世界顶级的科学计算和数学应用软件,是因为随着版本的升级和不断完善,它的功能越来越强大。一个。数值计算功能MATLAB优秀的数值计算功能是使其优于其他数学应用软件的决定性因素之一,尤其是流行的MATLAB6.1版本,其数值计算功能非常完善。湾。符号计算功能科学计算分为数值计算和符号计算。只有优秀的数值计算功能不能满足科学计算的全部需求。在数学科学、应用科学和工程计算领域,经常会遇到符号计算问题。1993年,MathWorks从加拿大滑铁卢大学购买了Maple的使用权,并使用Malple的“内核”作为符号计算函数的引擎,依托Maple现有的库函数,在MATLAB环境下开发了符号计算函数。系统组件。C。数据分析功能MATLAB不仅在科学计算方面具有强大的功能,而且在数值计算结果分析和数据可视化方面具有其他同类软件无法比拟的优势。在科学计算和工程应用中,技术人员经常会遇到大量需要分析的原始数据和数值计算结果,数据的分析并不容易。MATLAB可以将这些数据以图形方式显示出来,不仅使数据之间的关系清晰,而且在揭示其本质方面也起到了非常重要的作用。d。动态模拟功能MATLAB提供了一个交互式Simulink仿真动态系统,内容用户在屏幕上绘制框图来仿真系统并动态控制系统。Simulink采用鼠标驱动方式,可以处理线性、非线性、连续、离散等系统。e.程序借口功能MATLAB提供了便捷的应用程序接口(API),用户可以在MATLAB环境中直接调用编译好的CFortran子程序,并可以在MATLAB和其他应用程序之间建立客户端/服务器关系。同样,在C和Fortran程序中,也可以调用MATLAB的函数命令,使这些语言能够充分利用MATLAB强大的矩阵运算功能和方便的绘图功能。F。文字处理功能MATLABNotrbook可以成功地将MATLAB与Microsoftword字处理系统集成为一个整体。为用户进行文字处理、科学计算、工程设计等创造了一个完美统一的工作环境。用户不仅可以创建MATLAB系统手册、技术报告、命令序列、函数程序、注释文档等6种文档使用word强大的文本编辑处理功能和MATLAB相关的教材,也可以从word中访问MATLAB。MATLAB的数值计算和可视化结果可以直接用word对MATLAB生成的图形图像进行移动、缩放、裁剪、编辑等处理。3.2MATLAB的特点总的来说,MATLAB具有三大特点:3.2.1强大且可扩展MATLAB语言不仅为用户提供了科学计算、数据分析与可视化、系统仿真、数学和文本同意处理等强大的功能,而且具有独特的可扩展性特点。针对不同领域的应用,MathWorks推出了自动控制、信号处理、图像处理、模糊逻辑、神经网格、小波分析、通信、优化、数理统计、偏微分方程、金融金融等30多项特色功能。MATLAB工具箱。MATLAB支持用户自由进行二次开发。用户的应用程序可以作为新功能添加到相应的工具箱中,也可以扩展为新的工具箱。多年来,许多不同应用领域的外国专家使用MATLAB开发了相当多的应用程序。3.2.2界面友好,编程效率高MATLAB是一种以矩阵为基本变量单元的可视化设计语言。它语法结构简单,数据类型单一,指令表达方式与常用数学公式非常接近。即使对于那些不熟悉计算机编程的用户,只要有一点Windows操作经验,也能在短时间内快速掌握MATLAB的主要内容和基本操作,甚至解决大量复杂的手工难以完成的任务。MATLAB不仅让用户避免了大量频繁重复的基本数学运算,事半功倍,其编译和执行速度也远超C和Fortran语言设计的程序。可以说,MATLAB在科学计算和工程应用中的编程效率远高于其他高级语言。3.2.3图像功能,灵活方便MATLAB在程序执行期间具有灵活的2D和3D绘图功能。数值计算可以用图形、图像、声音、动画等多媒体技术直接表达,方便快捷。可以选择不同的坐标系,可以设置颜色、线型、视角,还可以在用户的word文件中嵌入图形。MATLAB的这些特点使其对应用学科(尤其是边缘学科和交叉学科)具有很强的适应性,迅速成为应用学科中计算机辅助分析、设计、教学乃至科技文字处理不可缺少的基础软件。3.3MATLAB在图像处理中的应用MATLAB的数字图像处理功能非常强大,其自带的图像处理工具箱(imageprocessingtoolbox)包含了经典图像处理的很多方面,如图像集操作、邻域和区域操作、图像变换、图像恢复、增强和分割,线性过滤器和过滤器设计、图像分析和统计、颜色、集合和形态学操作等。它集数值分析、矩阵运算、信号处理和图形显示于一体,其强大的扩展功能为各个领域的应用提供了基础。Matlab工具箱主要包括信号处理、控制系统、神经网络、图像处理、鲁棒控制、非线性系统控制设计、系统辨识(systemidentify)、小波(wavelet)等工具箱。同时,MATLAB还提供各种图像文件格式的读取、写入和显示,便于在MATLAB集成环境中实现图像处理。这些工具箱为各个领域的研究和工程应用提供了强大的工具。在图像采集操作方面,MATLAB的图像采集操作提供插值功能、图像大小调整、图像任意角度旋转,图像可以缩放、旋转、剪切。在图像滤波方面,MATLAB图像处理工具箱提供了傅里叶变换、离散余弦变换、Radon变换以及这些变换的逆变换等。同时,MATLAB的小波变换工具箱也可以用来实现图像的小波变换。在二值图像处理方面,MATLAB图像处理工具箱的二值图像运算实现了二值图像的数学形态学算法。MATLAB中预定义的形态学运算包括二值图像的腐蚀、膨胀、开闭运算等数学形态学算法,以及物体识别和测量算法。它还提供灰度图像的形态变换,包括顶帽变换、分水岭等。第四章图像分割的概念与算法研究图像分割是将图像分割成几个具有独特属性的特定区域并提取感兴趣对象的技术和过程。在图像的研究和应用中,人们往往只对图像的某些部分(物体或背景)感兴趣,这些部分一般对应于图像中具有独特属性的特定区域。为了分析和识别对象,需要对它们进行分割和提取。图像分割是从图像处理转向图像分析的关键。一方面,它是目标图像表示的基础,对特征测量具有重要影响。另一方面,图像分割和分割目标表达、特征提取和参数测量等,将原始图像转化为数学表达式,使得使用计算机进行图像分析和理解成为可能。本章主要介绍图像分割的基本概念和主要的分割方法。4.1图像分割的基本概念4.1.1图像分割定义关于图像分割有很多解释和表达。借助集合的概念,可以对图像分割给出以下更正式的定义:令集合R代表整幅图像的区域,R的分割可视为满足以下5个条件的非空子集(子区域):①;②对于所有的i和j,i≠j,Φ;③对于i=1,2,…,N,有P()=True;④对于i≠j,P()=False;⑤i=1,2,…,N,是一个连通区域。其中P(·)是集合中所有元素的逻辑谓词,Φ表示空集。下面简要说明上述每个条件。条件①指出从一幅图像得到的所有子区域的合成(并集)应该能够包含图像中的所有像素(即原始图像),或者分割应该将图像的每个像素分成一个某个地区。条件②表示分割结果中的子区域不相互重叠,或者一个像素不能同时属于分割结果中的两个区域。条件3指出每个子区域在分割结果中具有独特的特征,或者属于同一区域的像素应该具有一些相同的特征。条件4指出在分割结果中,不同的子区域有不同的特征,没有共同的元素,或者属于不同区域的像素应该有一些不同的特征。条件⑤要求分割结果中同一子区域的像素点应该是连通的,即同一子区域的两个像素点在该子区域内相互连通,或者分割区域是连通分量.此外,上述条件不仅定义了分割,而且指导了分割。图像的分割总是根据一些分割标准进行的。条件①和条件②表示正确的分割标准应该适用于所有区域和所有像素,条件③和条件④表示合理的分割标准应该能够帮助确定每个区域像素的代表性特征,条件⑤表示完整的分割Criteria应该直接或间接对区域像素的连通性有一定的要求或限制。最后需要指出的是,在实际应用中,图像分割不仅将图像划分为满足上述五个条件的具有不同特征的区域,还需要提取目标感兴趣区域。只有这样才能真正完成图像分割的任务。4.1.2图像分割算法的分类图像分割算法的研究一直受到人们的高度重视。到目前为止,已经提出了数千种分割算法。由于现有的分割算法很多,因此也提出了许多对它们进行分类的方法。例如,分割算法分为三种:①边缘检测,②阈值分割,③区域增长。但实际上,阈值分割算法的分割方法本质上也是一种区域提取方法,所以③实际上包括①。本章从实际应用的角度,详细介绍了以下几种图像分割算法:分割检测、阈值分割、区域生长等。4.2边缘检测方法4.2.1边缘检测概述边缘(Edge)是指图像局部亮度变化最显着的部分。边缘主要存在于物体、物体与背景、区域与区域(包括不同颜色)之间,是图像分割、纹理特征提取、形状特征提取等图像分析的重要依据。图像分析和理解的第一步通常是边缘检测。由于边缘检测非常重要,它已经成为机器视觉研究领域最活跃的课题之一。本节主要讨论边缘检测和定位的基本概念,并通过几种常用的边缘检测器说明边缘检测的基本问题。图像中的边缘通常与图像亮度的不连续性或图像亮度的一阶导数有关。图像亮度的不连续性可分为:①阶梯状不连续性,即图像亮度两侧的像素灰度值有显着差异:②线状不连续性,即图像亮度由一个值变化为另一个值。,保持小行程,然后恢复原值。在实践中,阶梯和线边缘图像很少见,由于大多数传感元件的低频特性,使得阶梯边缘变成斜坡型边缘,线边缘变成屋顶形边缘,亮度变化不是瞬时的,而是跨越一个一定的距离。边可以同时具有阶梯和线属性。例如,在一个曲面上,从一个平面改变到另一个具有不同法线方向的平面会产生阶梯边缘;如果表面具有镜面反射特性,且两个平面形成的棱角都比较圆,当圆角表面的方法是当一条线经过一个镜面角时,由于镜面反射分量,使得边缘看起来像叠加在阶梯边缘上的线边缘。边缘是一个重要的图像特征,因为它可能对应于场景中对象的重要属性。例如,物体的轮廓经常会产生阶梯边缘,因为物体的图像亮度与背景的亮度不同。在讨论边算子之前,先给出下列术语的定义。边缘点:图像中亮度变化显着的点。边缘段:边缘点坐标[i,j]及其方向θ的组合,边缘的方向可以是一个梯度角。边缘检测器:一种从图像中提取边缘集(边缘点或边缘段)的算法。轮廓:边列表,或边列表的曲线模型。边连接:从无序边表形成有序边表的过程。上边缘的表示习惯是顺时针排序的。边缘跟踪:用于确定轮廓图像(指过滤图像)的搜索过程。边缘点的坐标可以是边缘位置像素点的行列整数标签,也可以以亚像素分辨率级别表示。边缘坐标可以在原始图像坐标系中表示,但大多数情况下在边缘检测滤波器的输出图像坐标系中表示,因为滤波过程可能会导致图像坐标发生平移或缩放。边缘段可以定义为像素大小的小线段,也可以定义为具有方向属性的点。在实际应用中,边缘点和边缘段都称为边缘。由于边缘检测器生成的边缘集分为两种:真边缘和假边缘集。真边集对应场景中的边,假边集不是场景中的边。还有一个边集,就是场景中漏边的集合。假边集称为FalsePositives,而缺失边集称为FalseNegatives。边缘连接和边缘跟踪的区别在于:边缘连接将边缘检测器生成的无序边缘集作为输出,输入有序边缘集;边缘跟踪将图像作为输入并输出有序的边缘集。此外,边缘检测使用局部信息来确定边缘,而边缘跟踪使用整个图像信息来确定像素是否为边缘。4.2.2边缘检测梯度算法一个。梯度边缘检测算法的基本步骤和流程图梯度边缘检测算法有以下4个步骤。滤波:边缘检测算法主要基于图像强度的一阶和二阶导数,但导数的计算对噪声很敏感,因此必须使用滤波器来提高与噪声相关的边缘检测器的功能。需要指出的是,大多数滤波器在降低噪声的同时也会导致边缘强度的损失,因此需要在增强边缘和降低噪声之间进行折衷。增强:增强边缘的基础是确定图像中每个点邻域的强度变化值。增强算法可以突出显示其邻域(或局部)强度值发生显着变化的点。边缘增强通常通过计算梯度幅度来完成。检测:图像中有很多梯度幅度较大的点,而这些点在特定的应用领域中并不都是边缘,所以应该使用某种方法来确定哪些点是边缘带。最简单的边缘检测准则是梯度幅度阈值准则。定位:如果应用程序需要确定边缘位置,可以在亚像素分辨率下估计边缘位置,并且可以估计边缘方向。在边缘检测算法中,前三个步骤非常常见。这是因为在大多数情况下,边缘检测器只需要指出边缘出现在图像的某个像素附近,而无需指出边缘的精确位置或方向。本文讨论了几种常用的边缘检测器,并调用这些函数进行边缘检测以获得效果图。效果图效果图读入图像图4-1梯度边缘检测流程图Prewitt算子检测LoG算子检测Canny算子检测湾。罗伯特算子Robert交叉算子为梯度幅度计算提供了一个简单的近似:(4-1)使用卷积模板来表示方法,上式变为:(4-2)其中总和由以下模板(4-3)计算:0-10-110100-1==在计算梯度时,重要的是计算空间中相同位置(x,y)的真实偏导数。使用上述2×2邻域模板计算得到的近似梯度和并不是位于同一位置,而实际上是差点处的近似梯度,实际上是差点处的近似梯度。因此,罗伯特算子是该点的连续梯度的近似值,而不是预期点的近似值。因此,梯度值通常以3×3邻域计算。C。索贝尔算子如前所述,使用3×3邻域可避免在像素之间的插值点上计算梯度。考虑下图所示点周围的点排列。Sobel算子也是一个梯度幅值:(4-4)其中偏导数计算为:(4-5)(4-6)其中常数系数c=2。像其他梯度算子一样,可以用卷积模板表示为:-101-202-101121000-1-2-1该运算符关注靠近模板中心的像素。Sobel算子是边缘检测中最常用的算子之一。d.Prewitt算子Prewitt和Sobel算子完全相同,只是常数系数c=1。所以和可以用卷积模板表示为:-101-101-101111000-1-1-1下面使用MATLAB图像处理工具箱中的edge函数来使用上述算子进行边缘检测。Edge功能提供了许多微分算子模板,其中一些可以指定它是否对水平或垂直边缘(或两者)敏感(即主要检测水平或垂直边缘)。Edge函数在检测边缘时可以指定一个灰度阈值,只有满足这个阈值条件的点才被认为是边界点。Edge函数的基本调用格式如下:其中,I代表输入图像,type代表使用的算子类型,parameter是与具体算子相关的参数。接下来,利用Prewitt算子对图像4-2(a)进行检测,检测结果如图4-2(b)所示。程序列表在附录中,下面使用Prewitt算子检测边缘:(a)原始图像(b)Prewitt算子检测到的边缘图4-2边缘检测渲染4.2.3拉普拉斯算子上面讨论了计算一阶导数的边缘检测器。如果计算的一阶导数高于某个阈值,则可以将该点确定为边缘点,这将导致检测到的边缘点过多。更好的方法是找到梯度的局部最大值对应的点,并将它们识别为边缘点,如图4-3所示。在图4-3中,如果使用阈值进行边缘检测,则将a和b之间的所有点记录为边缘点。但是通过去除一阶导数中的非局部最大值,可以检测到更精确的边缘。一阶导数的局部最大值对应二阶导数的过零。通过这种方式,可以通过找到图像强度的二阶导数的零交叉点来找到精确的边缘点。拉普拉斯算子是常用的二阶导数算子。xx阈值baxx阈值baxx图4-3阈值边缘检测与二阶导数过零边缘检测的比较平滑阶跃边缘二阶导数是一个在边缘点过零的函数(见图4-2)。拉普拉斯算子是二阶导数的二维等价物,函数的拉普拉斯算子公式为:(4-7)x和y方向的二阶偏导数使用差分方程近似如下:(4-8)上面的近似是以点为中心的,而以点为中心的近似是:(4-9)同样有:(4-10)(4-9)和(4-10)合并为单个运算符,由近似拉普拉斯模板表示:(4-11)当拉普拉斯输出有过零点时,说明有边,但无意义的过零点(灰度值为0的区域)应去掉。4.2.4LoG(拉普拉斯高斯)算子上面介绍的梯度算子和拉普拉斯算子本质上都是微分或分数算法,所以该算法对噪声非常敏感。因此,必须在边缘检测之前滤除噪声。Mar和Hildreth将高斯滤波和拉普拉斯边缘检测结合起来,形成了LoG(拉普拉斯-高斯)算法。LoG边缘检测器的基本特点是:平滑滤波器是高斯滤波器;增强步骤取二阶导数(二维拉普拉斯函数);使用线性插值方法在亚像素分辨率级别估计边缘的位置。该方法的特点是先对图像进行高斯滤波器卷积,这一步既使图像平滑又降低噪声,孤立的噪声点和较小的结构组织将被滤除。由于平滑导致边缘扩展,边缘检测器仅将具有局部梯度最大值的点视为边缘点。这可以通过二阶导数的零交叉来实现。拉普拉斯函数被用作二维二阶近似,因为它是一个无方向的算子。为了避免检测到不重要的边缘,应选择一阶导数大于某个阈值的过零点作为边缘点。LoG算子对图像进行边缘检测,通过卷积运算得到输出,即:(4-12)滤波(或平滑)、增强和检测三个边缘检测步骤对于LoG算子边缘检测仍然有效。高斯滤波器对图像进行平滑处理,拉普拉斯算子将边缘点转化为过零点,通过检测过零点实现边缘检测。如上一节所述,平滑图像会导致边缘模糊。高斯平滑元素使图像中的边缘和其他尖锐不连续性变得模糊,其中模糊量取决于σ的值。σ值越大,噪声过滤效果越好,但同时会丢失重要的边缘信息,影响边缘检测器的性能。如果σ取小值,则有可能平滑不完整,噪声过多。当平滑两个相邻的边缘时,具有大σ值的过滤器可能会将它们捆绑在一起,以便只能检测到一个边缘。因此,在不知道物体大小和位置的情况下,很难准确确定滤波器的σ值。一般来说,使用σ值大的滤波器会产生稳健的边缘,而使用σ值小的滤波器会产生精确定位的边缘,两者结合可以检测到图像的最佳边缘。LoG算子还可以使用MATLAB中的边缘函数来检测边缘:BW=edge(I,'log',thresh,sigma)其中thresh是边缘检测的阈值,sigma是高斯滤波器的σ值,默认为2。下面使用不同σ值的LoG算子来检测图像的边缘。程序列表见附录,测试结果分别如图4-3(a)和4-3(b)所示。(a)σ=2(b)σ=3图4-4不同σ值的LoG算子边缘检测效果对比上面两张图可以发现,如果σ值小,则平滑度较轻,会出现零星的假边缘;如果σ值大,则平滑度较重,但大部分真实边缘丢失,出现边缘不连续性。4.2.5精明算子检测阶梯边缘的基本思想是在图像中找到具有局部最大梯度幅值的像素。检测阶梯边缘的大部分工作都集中在寻找可用于真实图像的梯度的数字近似值上。由于实际图像通过相机光学和电路中固有的低通滤波器(带宽受限)进行平滑处理,因此图像中的阶梯边缘不是很清晰。图像还受到相机噪声和场景中不需要的细节的干扰。图像梯度逼近必须满足两个要求:①逼近必须能够抑制噪声效应;②边缘的位置必须尽可能准确地确定。噪声抑制和精确边缘定位不能同时满足,即边缘检测算法通过图像平滑算子去除噪声,但增加了边缘定位的不确定性;反之,如果边缘检测算子提高了对边缘的敏感度,也提高了对噪声的敏感度。有一个look-ahead算子可以在抗噪性和精确定位之间选择一个最优折衷,它是高斯函数的一阶导数,对应于图像的高斯函数的平滑和梯度计算。在高斯噪声中,典型的边缘表示强度的阶跃变化。根据该模型,一个好的边缘检测算子应该具备3个指标:1)错误概率低,即尽可能少地丢失真实边缘点,尽可能避免将非边缘点检测为边缘。可能的;2)位置精度高,检测边缘应尽量接近真实边缘;3)每个边缘点都有唯一的响应,得到一个宽度为一个像素的边缘。Canny算子为边缘算子提出了以下三个标准。信噪比准则信噪比越大,提取边缘的质量越高。信噪比定义为:(4-13)其中G(x)表示边缘函数,h(x)表示宽度为W的滤波器的脉冲响应。定位精度指南边缘定位精度L定义如下:(4-14)其中和分别是和的导数。L越大,定位精度越高。单边响应准则为了保证单个边缘只有一个响应,检测算子的脉冲响应导数过零点的平均距离应满足:(4-15)是的二阶导数基于以上指标和准则,通过泛函求导的方法可以推导出Canny边缘检测器是信噪比与位置乘积的最优逼近算子,表达式近似于高斯函数的一阶导数。结合Canney的三个准则可以得到最优的检测算子。Canny边缘检测的算法步骤如下:用高斯滤波器平滑图像;利用一阶偏导数的有限差分计算梯度的大小和方向;梯度幅度的非最大抑制;使用双阈值算法检测和连接边缘。Canny算子还可以使用MATLAB中的边缘函数来检测边缘:BW1=edge(I,'canny',thresh,sigma)式中,thresh为边缘检测的阈值,sigma为高斯滤波器的σ值,默认为2。使用Canny算子检测图像的边缘4-2(a)。节目列表见附录。检测结果如图4-5所示。图4-5Canny算子边缘检测对比前面的梯度算子、LoG算子和Canny算子,从图4-2(b)、4-3、4-4和4-5可以发现,Canny算子的边缘检测结果最令人满意.4.3灰度阈值分割4.3.1阈值分割简介一个。阈值分割原理阈值分割算法是应用最广泛的图像分割类。简单来说,灰度图像的阈值分割就是先在图像的灰度值范围内确定一个灰度阈值,然后将图像中每个像素点的灰度值与这个阈值进行比较,并根据得到的结果比较将对应于阈值。将像素分为(分割)为两类:一类像素灰度大于阈值的类别,另一类像素灰度值小于阈值的类别,灰度值等于阈值的像素可归为这两类之一.分割后的两类像素一般属于图像的两个不同区域,因此通过将像素按照阈值进行分类来达到区域分割的目的。可以看出,阈值分割算法主要有两个步骤:确定需要分割的阈值;将分割阈值与像素点的灰度值进行比较,对图像的像素进行分割。在上述步骤中,确定阈值是分割的关键。如果可以确定合适的阈值,则可以准确分割图像。阈值确定后,将阈值与像素点的灰度值进行比较,可以对像素进行并行分割,分割结果直接给出图像区域。使用阈值法对灰度图像进行分割时,一般对图像的灰度分布有一定的假设,或者是基于一定的图像模型。最常用的模型可以描述如下:假设图像由目标和背景组成,灰度分布为单峰,则目标和背景中相邻像素之间的灰度值高度相关,但在交界处的两侧的目标和背景。像素的灰度值差异很大。如果一幅图像满足这些条件,则其灰度直方图基本上可以看作是分别对应于目标和背景的两个单峰直方图的混合。并且如果两个分布的大小(数量)接近并且均值相距足够远,并且两部分之间的均方差足够小,则直方图应该明显是双峰的。类似地,如果图像中有多个具有单峰灰度分布的目标,则直方图可能看起来是明显多峰的。对于这样的图像,通常可以使用阈值来更好地分割它们。要将图像中各种灰度级的像素分成两个不同的类别,需要确定一个阈值。如果要将图像中各种灰度的像素分成多个不同的类,那么就需要选择一系列的阈值来将每个像素分类到合适的类中。如果只使用一个阈值进行分割,则称为单阈值分割方法,如果使用多个阈值进行分割,则称为多阈值分割方法。单阈值分割可以看成是多阈值分割的一种特殊情况,很多单阈值分割算法可以泛化为多阈值分割。反之,有时可以将多阈值分割问题转化为一系列单阈值分割问题来解决。无论采用何种方法选择阈值,原始图像f(x,y)除以单个阈值T后的图像可以定义为:(4-16)结果是二值图像。在总则多阈值情况下,阈值分割后的图像可以表示为:(4-17)其中是一系列分割阈值,k表示分配给分割图像的每个区域的不同标签。需要指出的是,无论是单阈值分割还是多阈值分割,都可能存在不同区域在分割结果中具有相同标签或区域值的情况。这是因为在取阈值分割时只考虑像素本身的值,而没有考虑像素的空间位置。因此,根据像素值分类为同一类别的像素可能属于图像中的不连续区域。这时,往往需要借助一些场景的先验知识来进一步确定目标区域。湾。阈值分割算法分类已经提出了很多阈值分割算法,相应的分类方法也很多。例如,文档图像的阈值化技术可用于对油类进行分类:考虑分割过程是否需要人工干预,可分为交互式和自动;根据阈值的作用范围不同,可分为全局和局部;考虑到阈值选择中使用的灰度分布的统计特性,可以分为上下文相关和上下文无关,前者基于灰度分布的一阶统计,后者基于灰度的二阶统计分配;从处理策略上看,可以分为迭代式和非迭代式;根据是否选择训练像素集进行分割来估计目标或背景的特征参数,可以分为有监督和无监督。在前面关于阈值化原理的讨论中,已经指出了选择合适的分割阈值算法的关键问题,据此可以根据阈值选择本身的特点对算法进行分类。阈值一般可以写成以下形式:(4-18)其中,表示像素点处的灰度值,表示该点邻域的某种局部性质。也就是说,阈值T通常可以是(),的函数。借助上式,可以将阈值分割方法分为以下三类,分别调用对应的阈值:基于每个像素值的阈值只根据阈值进行选择,得到的阈值只与整个图像中每个像素的性质(像素值)有关;根据和选取基于区域属性的阈值,得到的阈值与区域属性(区域内每个像素的值、相邻像素值之间的关系等)有关;基于坐标位置的阈值是进一步相关的(除了根据和来选择),即要考虑位置()来确定阈值,得到的阈值与像素空间坐标有关.上述确定第一类阈值的技术有时称为点相关技术,而确定第二类阈值的技术有时称为面积相关技术,确定第三类阈值的技术有时称为动态阈值技术.前两类阈值也称为全局阈值(或固定阈值),因为此时确定的阈值用于整幅图像,或者每个像素使用相同的阈值进行分割;与此相对应,第三种阈值也有称为局部阈值或动态阈值,因为此时确定的阈值是针对图像中的一个局部区域(或单个像素)。局部阈值在某种意义上是全局阈值技术的局部特例。上述阈值分割方法的分类思路是通用的。近年来,许多阈值分割算法借用了视神经、神经网络和模糊数学等工具,但仍可归为上述三类方法。4.3.2全局阈值对于灰度图像,基于每个像素值的阈值仅通过考虑每个像素本身的灰度值来确定,因此算法一般简单,但抗噪能力不强。确定的阈值(多阈值分割的阈值序列)作用于整幅图像的每个像素点,因此目标和背景灰度发生梯度变化的图像无效或无效。图像的灰度直方图是图像中每个像素的灰度值的统计量度。许多常用的阈值选择方法都是基于直方图的。如果选择两个峰之间的谷对应的灰度值作为双峰直方图的阈值,则可以分离目标和背景(类似于多峰直方图)。谷的选择方法很多,下面介绍三种典型的方法。一个。最小点阈值将图像灰度直方图的包络线视为一条曲线,可以采用求曲线最小值的方法来选择直方图的谷值。假设使用具有代表性的直方图,那么最小值点应同时满足:(4-19)这些最小点对应的灰度值可以作为分割阈值。由于图像噪声等原因,实际图像的直方图往往有很多波动,因此根据公式(4-19)计算出的最小值点可能对应一个假谷值。解决方案之一是首先平滑直方图。湾。最佳阈值有时,图像中目标和背景的灰度值会部分交错。这时候如果用一个全阈值进行分割,总会出现一定的错误。在实践中,往往希望尽量减少错误分割的概率(包括将目标划分为背景和将背景划分为两类目标),选择最优阈值是常用的方法。这里,最佳阈值是指最小化错误分割率的分割阈值。图像的直方图可以看作是像素灰度值概率分布密度函数的近似。假设一幅图像只包含两个主要的灰度值区域(目标和背景),那么直方图表示的像素灰度值概率分布密度函数实际上是目标和背景对应的两个单峰分布密度函数之和。如果密度函数的形式已知,就可以计算出一个最优阈值,该阈值可用于将图像划分为误分割率最小的两类区域。给定这样一张混合了加性高斯噪声的图像,背景和目标的概率密度分别为和,整个图像的混合概率密度为:(4-20)其中和分别是背景和目标区域的平均灰度值,分别是关于均值的均方差,和分别是目标区域和背景的灰度值的先验概率。根据概率的定义,有+=1,所以混合概率密度公式(4-20)中只有5个未知参数。如果可以得到这些参数。如果能得到这些参数,就可以确定混合概率密度。PP(z)0z图4-6最优阈值选择示意图如图4-6所示。假设﹤,需要确定一个阈值T,使得灰度值小于T的像素被分割为背景,灰度值大于T的像素被分割为目标。此时,将目标像素错误划分为背景的概率和将背景像素错误划分为目标的概率分别为:(4-21)(4-22)总错误概率为:(4-23)要找到最小化此误差的阈值,请取T的导数并将导数设置为零,给出:(4-24)将此结果应用于高斯密度(即代入式(4-20))可以求解:(4-25)当==时:(4-26)如果先验概率相等,即,则:(4-27)这意味着如果图像的灰度值是从正态分布分布的,则可以根据上式得到最优阈值。C。迭代阈值分割阈值也可以迭代计算。首先选取图像灰度范围的中值作为初始值,然后迭代如下:(4-28)其中是灰度值为k的像素个数,总共有L个灰度级。迭代一直进行到结束,取最后的阈值。确定阈值确定阈值T读入图像是否与T相等YN是否大于TYN物体背景图4-7灰度阈值分割流程图图像4-8(a)上的阈值分割。其灰度直方图如图4-8(b)所示,阈值分割结果如图4-8(c)所示。程序列表见附录。(a)原始图像(b)原始图像的灰度直方图(c)阈值分割结果图4-8灰度阈值分割渲染4.3.3动态阈值当图像出现以下情况时:阴影、光照不均、各处对比度不同、突发噪点、背景灰度变化等,如果只用一个固定的全局阈值对整张图像进行分割,就不会考虑到分割效果受图像周围情况的影响。一种解决方案是使用一组与坐标相关的阈值(即阈值是坐标的函数)来分别分割图像的每个部分。这种与坐标相关的阈值也称为动态阈值,这种阈值分割方法也称为变化阈值法(也称为自适应阈值法)。这类算法的时间复杂度和空间复杂度都比较大,但是抗噪能力强,对一些不容易被全局阈值法分割的图像(比如带有目标和背景灰度的梯度变化)。这种动态阈值方法在二值化文档图像分割方面具有更好的性能。一个比较简单的动态阈值算法就是为每个像素点确定一个以它为中心的窗口,计算窗口的最大值和最小值,然后取它们的平均值作为该点的阈值,可以证明图像像素点的灰度。值与阈值的差值具有二阶导数的性质,因此取差值的过零点可以得到二值分割结果。下面介绍另外两种方法。一个。阈值插值可变阈值技术可以被认为是全局固定阈值技术的局部技术的局部特例。图像首先被分解为一系列子图像,这些子图像可以相互重叠,也可以相互邻接。如果子图像比较小,那么由阴影或者对比度的空间变化引起的问题就会比较小。然后可以为每个子图像计算阈值,在这种情况下,可以使用任何固定阈值方法来选择阈值。分割图像中每个像素所需的阈值是通过对从这些子图像中获得的阈值进行插值得到的。这里,将每个像素对应的阈值组合起来,形成图像上的一个面(幅度轴),也可以称为阈值面。一种方法的具体步骤如下:将整幅图像分割成一系列相互重叠50%的子图像;制作每个子图像的直方图;检测每个子图像的直方图是否为双峰,如果是,可以采用上述阈值选择方法确定子图像的阈值,否则不进行处理;根据直方图为双峰的子图像得到的阈值,通过插值得到所有子图像的阈值;根据每个子图像的阈值,通过插值得到所有像素的阈值,然后对图像进行分割。湾。水线阈值算法水线(也称为分水岭或分水岭,Watershed)阈值分割算法不是直接在最优阈值处进行分割,它是一种特殊的自适应迭代阈值分割算法。使用图4-6说明水线阈值算法的原理。x0图4-9水线阈值算法示意图x0图4-9水线阈值算法示意图图4-9显示的是图像的一部分,其中两个具有较高灰度的对象从背景总和中取出并相互分离。首先使用较大的阈值进行分割,可以将图像中的两个物体从背景中分离出来,但是它们之间的差距过大。如果然后逐渐降低阈值,随着阈值的降低,对象的边界会向彼此扩展,最终两个对象会接触(相遇),但此时两个对象不会合并,所以最后一个在它们接触之前剩余的像素该集合给出了两个对象之间的最终边界。上述过程可以在将阈值降低到背景灰度之前结束。实际的水线算法首先使用了一个相对较高的阈值,但得到的结构仍然可以隔离每个目标。然后,当阈值逐渐降低并接近最优阈值时,先前分离的对象不再合并。这样就可以解决目标非常接近时全局阈值法导致的目标合并问题。这里初始阈值的选择非常重要。只要初始阈值选择得当,就可以保证最终分割结果的正确性。如果初始阈值太大(如图4-9所示),低对比度的目标将在一开始就被拒绝。省略,然后在降低阈值的过程中被合并;反之,如果初始阈值选择得太小(如图4-9所示),则目标会在开始时被合并。此外,最终阈值的选择也很重要,它决定了最终边界与目标的重合度。使用函数watershed在MATLAB中查找分水岭,并调用格式L=watershed(A)。阈值分割的方法很多,几乎每种方法都有自己的独特点和实际应用背景。在实际应用中,阈值分割往往需要与其他方法相结合才能获得最佳或满意的分割结果。图4-10(a)使用水线阈值分割。图像高帽变换的结果如图4-10(b)所示,低帽变换的结果如图4-10(c)所示,高帽相减的结果变换和低帽变换如图4-10(d)所示,阈值分割进一步增强图像如图4-10(e)所示,最终水线阈值分割图像如图4-10所示(F)。程序列表见附录。(a)原始图像(b)礼帽变换图像(c)低帽变换图像(d)减去高帽和低帽后的图像(e)进一步增强的图像(f)水线阈值分割的图像图4-10水线阈值法分割4.4区域分割4.4.1区域增长的基本原理、步骤和流程图区域增长的基本思想是将具有相似属性的像素分组以形成区域。具体来说,首先找到一个种子像素作为每个待分割区域的生长起点,然后选择种子像素周围邻域内与种子像素具有相同或相似属性的像素(根据一些预先确定的确定的增长或类似标准)合并到种子像素所在的区域。将这些新像素作为新的种子像素继续上述过程,直到不再包含满足条件的像素为止。这样的区域增长。确定种子像素扫描是否与确定种子像素扫描是否与种子像素相似读入图像合并入区域图4-11区域分割流程图YN图4-8显示了从已知种子点生长的区域示例。图4-12(a)显示了要分割的图像。假设有两个种子像素(标记为不同深浅的灰色方块),则必须先进行区域生长。假设这里采用的判断标准为:如果考虑的像素点与子像素点灰度差的绝对值小于某个阈值T,则该像素点包含在子像素点所在的区域内。-像素位于。图4-12(b)为T=3时的区域增长结果,整幅图像很好地分为两个区域;图4-12(c)为T=1时的区域增长结果,部分像素点无法确定;图4-12(d)显示了T=6时的区域增长结果,整个图像被划分为一个区域。可见,阈值的选择非常重要。11047510477015552055522564图(a)1155511555115551155511555图(b)1157511577115552155522555图(c)1111111111111111111111111图(d)图4-12区域生长示例从上面的例子可以看出,在实际的因果区域生长方法中需要解决3个问题:如何选择一组正确代表所需区域的种子像素;如何确定在生长过程中包含相邻像素的标准;如何确定增长终止的条件和规则。第一个问题是种子像素通常可以根据具体图像的特征来选择。例如,在红外图像检测技术中,目标的辐射通常比较大,因此可以选择图像中最亮的像素作为种子像素。如果没有图像的先验知识,则可以在生长准则的帮助下相应地计算像素。如果计算结果可以看出聚类情况,则可以选择聚类中心作为种子像素。第二个问题的解决不仅取决于具体问题的特点,还取决于图像的数据类型。如果图像是RGB彩色图像,使用单色标准会影响分割结果。此外,还需要考虑像素之间的连通性是否有时会导致无意义的分割结果。通常,当不再有满足增长标准的像素时,增长过程会停止。然而,常用的基于灰度、纹理和颜色的标准大多是基于图像中的局部属性,并没有充分考虑生长的“历史”。为了增加区域的生长能力,需要考虑一些与图像的大小、形状等相关的标准以及对象的全局属性。在这种情况下,需要为分割结果建立一定的模型或补充一定的先验知识。4.4.2成长指南和流程区域增长的一个关键是选择适当的增长或类似的标准,其中大多数使用图像的局部性质。生长标准可以根据不同的原则制定,使用不同的生长标准会影响生长过程。下面描述了三种基本的生长标准和方法。一个。灰度差异准则区域生长法以像素为基本单位对图像进行操作。基于区域灰度差异的方法主要有以下步骤:逐行扫描图像,找到尚未归属的像素;以该像素为中心检查其邻域像素,即将邻域内的像素与它一一进行比较,如果灰度差小于预定阈值则合并;以新合并的像素为中心,返回步骤(2),检查新像素的邻域,直到区域不能进一步扩大;返回步骤(1),继续扫描,直到找不到无归属的像素,然后结束整个生长过程。上述方法得到的结果对区域生长起点的选择有很大的依赖性。为了克服这个问题,可以使用以下改进:将灰度差的阈值设置为零,使用上述方法扩大区域,使灰度相同的像素合并;求所有相邻区域的平均灰度差,合并灰度差最小的相邻区域;设置终止准则,重复上述步骤(2)中的操作,依次合并区域,直到满足中指准则。此外,当图像中存在缓慢变化的区域时,上述方法可能会逐渐合并不同的区域并导致错误。为了克服这个问题,不是将新像素的灰度值与相邻像素的灰度值进行比较,而是使用新像素所在区域的平均灰度值来比较每个相邻像素的灰度值。对于具有N个像素的区域R,平均值为:(4-29)像素合并的比较测试表示为:(4-30)其中T是给定的阈值。在区域增长过程中,要求图像同一区域的灰度值变化尽可能小,不同区域之间的灰度差异尽可能大。讨论两种情况:该区域设置为均匀的,每个像素的灰度值是均值m和一个零均值高斯噪声的叠加。使用式(4-30)对某个像素进行测试时,条件不成立的概率为:(4-31)这就是错误概率函数。当T取3倍方差时,误判概率为1~99.7%。这说明在考虑灰度均值时,该区域的灰度变化应尽可能小。设该区域是非均匀的,由不同物体的两部分图像像素组成。这两部分像素在R中的比例分别为和,灰度值分别为和,则区域均值为。对于灰度值为m的像素,其与区域均值的差值为:(4-32)根据公式(4-30),正确决策概率为:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江西加油罐采购合同范本
- 锡山区餐饮投资合同范本
- 物业空调安装免责协议书
- 灌溉水渠修复协议书范本
- 用工程货款买房合同范本
- 法律欠款回收协议书范本
- 腻子工工程分包合同范本
- 父母卖房给子女合同范本
- 机械厂临时工合同协议书
- 砖窑摊位转让协议书模板
- 2025届江苏省镇江市联考英语七年级第二学期期末达标测试试题含答案
- 河道采砂防洪影响评价报告
- 气候变化背景下沿海城市极端复合洪涝灾害的风险评估
- 2025年新疆维吾尔自治区事业单位教师招聘美术学科专业知识试卷
- 北森心理测评试题及答案
- 政府补助专项管理制度
- T/CECS 10064-2019绿色建材评价LED照明产品
- DB32/T 3669-2019人民调解委员会建设规范
- 2023 植入式静脉给药装置护理技术中华护理学会团体标准解读
- 药房质量管理试题及答案
- 国土空间规划试题及答案
评论
0/150
提交评论