




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 第一章 绪论 题背景及研究意义 进入 21 世纪以来,随着电子计算机和互联网的广泛应用,信息技术迅猛发展。而在日益增多的信息当中,图像成为非常重要的信息形式,越来越多的图像出现在信息世界当中 , 使得图像检索成为一个需要研究的热门课题。 通常认为,特征提取和 相似度量是图像检索的两个重要因素。特征提取和相似度量的关系是相辅相成、 互为促进的,适当的特征提取可以在提取图像特征的同时简化相似度量,而相似度量方法的应用则可以提高图像检索的效率和质量。随着现代计算机技术的发展,越来越多的人们 开始 对图像检索方法进行研究,提出了许多新的理论。其中, 灰度共生矩阵 1,2、 波器 3,4和欧氏距离相似性度量 等方法,是 图像检索 中 较为常用的 有效方法。 但是, 这些方法并不适用于数据量激增和变化的实际情况。也就是说, 当图像数量发生突然变化、图像受 到干扰或者图像本身发生变化时 ,图像检索效果会明显下降,图像检索的计算量会急剧增加。由于在实际应用中,图像的形式各种各样,图像数目数以亿计,使得图像检索具有 了极大 的 不确定性,而图像检索本身的重要性也使得更多的研究者 开始 对图像检索的理论和方法进行 更深入 的 研究。 在图像检索的理论和方法中,基于内容的图像检 索 (简称为 研究和应用最为普遍的方法。这种方法中,广泛应用了 图像所具有的纹理、形状和颜色等固有属性 进行图像检索 。纹理是物体本身所具有的一种自然属性,在图像检索技术中, 纹理是图像像素灰度级变化时所表现出来的特性,这种特性不易受外界环境影响而变化,也不易随图像本身的平移等变化而改变,因此对于特定的图像,其纹理特征具有唯一性 。纹理特征的唯一性使其成为图像识别领域研究的重点问题之一。本文 基于模糊 单类支持向量机的图像检索 就是对纹理图像进行研究。 脉冲耦合神经网络 (5,6是一种基于动物的视觉原理提出的简化神经网络模型。自提出以来,迅速得到研究者们的认可,可以说是发展最快的第三代人工神经网络模型之一。 具有的相似神经元同步点火等特性,非常适合用于图像的不变特征提取,使其在图像处理中得到了广泛的应用。单类支持向量机 (7早由 人 在 支持向量机 基础上提出 ,是一种较为优秀的学 习方法,能够兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 解决小样本和维数灾 难 等问题,在图像处理领域 得到了 一定的研究和应用 102002 年, 人以及 人提出了模糊支持向量机 (这种方法后来与单类支持向量机结合产生了模糊 单 类 支 持 向 量 机 (这里简称 模糊单类支持向量机 自 提出以来,在图像检索领域得到了认可和发展,随着模糊技术的发展和纹理检索等理论的不断 完善,模糊单类支持向量机在基于内容的图像检索中得到了应用。本文在研究中,首先用 行特征提取,然后用 模糊 单类 支持向量机对提取出的纹理特征进行分类检索,最后对所提出的方法进行分析和探讨。 像检索简介 图像检索的研究始于二十世纪 70 年代,是在图像集中检索含有某种特征的特定图像的一种技术。图像检索可以分成两大类,即基于文本的图像检索 (即基于内容 的图像检索 (即 早期的 图像检索技术是基于文本的图像检索,基于文本的图像检索利用文本方式描述图像特征来进行检索,这些描述主要是人工建立的文本标题和关键词等。基于文本的图像检索主要是利用人工对图像进行的标引来进行检索,由于人工标引比较主观,因此在描述图像特征时比较容易产生偏差,而且人工标引需要耗费大量的人力和时间,因此,这种基于人工的检索方式,不能准确反映图像信息,效率也难以保证,很难适用于高速发展的信息时代对于图像检索的需求。 基于内容的图像检索技术是在提取图像视觉内容特征作为特征向量的前提下,通过将所检索图像的特征向量与图像库中 图像的特征向量进行相似性匹配,从而进行图像检索的一种方法。特征向量作为描述图像内容的关键元素,是通过采取一定的特征提取方法自动完成的,这个过程不需要人工标引,能够反映图像的真实内容,同时效率也得到提高。因此,基于内容的图像检索比基于文本的图像检索方法更加有效。特征向量主要是视觉内容特征,包括图像的颜色、纹理、形状以及这些特征之间的空间关系等。 (1) 基于 颜色特征的图像检索 颜色是一种光的现象,是人们对物体进行区分的一种视觉现象或知觉。颜色作为一种光学现象与物体特性的产物,是物体本身所具有的特征。对于一个固 有的物体,其颜色 不随物体大小或旋转角度变化而变化。这个特性同样适用于图像当中, 颜色特征在图像检索中,对图像大小等变化具有较好的鲁棒性。虽然颜色兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 特征提取方法已经得到了不少研究,但是,由于对光照强度比较敏感、缺少像素位置信息等原因, 这种提取方法 具有一定的局限性。在实际应用中,为取得更好的 检索效果,需要与其他内容特征提取方法相结合。 (2) 基于 形状特征的图像检索 形状是物质的一种存在或表现形式,通常表现为物质的形态和状貌。同颜色一样,形状特征也是图像的重要视觉内容特征。在二维空间中,图像的形状表现为一个由一条 或者多条线所围成的区域。在数学上对形状可以描述为形状的轮廓边界 和 其边界 所包围区域两部分,自然而然图像检索中对形状特征的描述就主要有基于 形状的轮廓特征和区域特征 两种方法。在现有的研究中,通常用样条拟合曲线的方法或者傅里叶方法来对图像的形状轮廓进行描述;而对图像形状区域通常采用形状的区域面积以及形状的无关矩等方法进行描述。通常在实际应用中,需要将图像的轮廓特征和区域特征相结合, 以 达到对形状特征进行描述的目的。与颜色特征检索一样,基于形状的图像检索方法,需要与其他内容特征相结合,以达到更好 的 检索效果。 (3) 基 于纹理特征 的图像检索 纹理的本义是指物体表面所呈现出的线形纹路。纹理作为物体的一种 固有属性,在物体不发生外 力等变化时,不易发生变化,尤其不随着光照、亮度等条件变化而改变,因此在图像检索中,纹理特征具有一定的不变性。但是纹理与颜色一样,比较容易受个人主观性的影响,因此对于纹理的定义,目前还没有明确而公认的说法。在现代计算机图形学当中,对于二维平面或者光滑物体表面所具 有的纹理特征称为花纹,而对于三维空间物体具有的凹凸不平的纹理特征称为沟纹。图形学中对于纹理特征的量化主要分为基于结构的纹理量化方法和基于统计的纹理 量化方法两种。基于结构的量化方法主要是分析图像中纹理的结构信息规律,而基于统计的量化方法则是通过统计来分析图像中纹理的空间分布信息。 基于内容的图像检索系统按照图像检索的目的不同,可以分为基于目标的检索系统、基于相关内容的检索系统和基于分类的检索系统。基于目标的检索系统的目的是为用户检索找出某个图像目标,这个图像根据所设定目标的不同而不同,如果检索目标是特定的一个图像,则检索结果就是这个图像本身;如果检索目标是与给定事物在不同角度或者背景下的图像,则检索结果就是在不同情况下的同一事物的不同图像。基于相关内容 的检索系统,其目的是在没有给定检索目标的情况下,检索某一类具有共同特性或者关联的图像。基于分类的检索系统是检索与某一图像 同类别属性的图像,因为类的范围已经给定,所以检索结果是图像库中 同类的一个或者多个图像。在实际当中,由于图像数量巨大,而且对于同一事物,当角度、大小、距离等外界条件发生变化时,表现出来的图像形式也会兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 发生变化,检索目标就会发生变化。不变特征检索系统就是为了实现 目标图像 在某些条件发生变化时仍然能够提取图像特征进行检索的一种方法。 在图像检索技术中,不变特征是指图像的这样一种特征,它 既 不随图像摄取工具 、 光照强弱等外在条件的改变而改变,也不随图像的尺寸、方向等内在因素的变化而变化。例如图像的颜色、形状和纹理等特征,虽然很大程度上是 人眼 的视觉特性,但是具有几何不变性,代表着图像的本质内容。采用不变特征来进行图像检索,是不变特征检索系统与其他图像检索系统的主要区别,也是其先进之处。图像 的颜色、形状和纹理这些特征,所具有的平移、旋转和尺度等不变性,称 为几何不变性,这些特征也称为几何不变特征。在图像检索中 , 如何提取图像的不变特征成为研究的主要问题。由于图像可能在特征提取时发生平移、旋转等变化,因而使得检索无法 有效进行,因此在检索过程中选取的提取方法应该对图像的特征信息具有几何不变性。而在相似度量问题上,也应该选择对平移、尺寸变化等几何变化具有较好鲁棒性的技术。基于不变特征的检索系统就是基于以上思路而产生的:这种方法首先选取图像的 几何特征例如 颜色、纹理和形状等, 接着 寻 找 对这些几何特征具有不变性的特征提取方法和具有较强鲁棒性的相似度量技术,最后选择合适的识别方法,达到图像检索的目的。 不变特征图像检索是本实验室研究工作的重要部分, 从中取得了显著的成果 6,13,14,26,365,例如将脉冲耦合神经网络用 于纹理特征不变性的图像检索中以及 脉冲发放皮层模型(提出等等。 本论文的研究工作是实验室图像纹理检索研究小组研究成果的一部分,小组的研究工作由马义德教授进行指导,小组成员中,田乐和刘丽主要负责图像纹理检索过程中算法的研 究,绽琨和李小军主要负责算法的应用和推广。本小组的研究工作已数次被国内外期刊和国际会议收录 ,并 在继续 进行新的论文撰写。 刘丽在文献 13,14中采用超平面法解决单类问题,提出了将单类支持向量机与 取技术相结合的图 像检索系统,从不变特征检索和抗噪性实验两方面说明了 统的优越性。本文参考这一模型 , 寻找出 采用超球法解决 模糊 单类问题 的方法 ,提出了基于 模糊单类支持向量机的图像检索系统,通过和其它检索系统的实验对比, 表明 了该系统良好的检索效果和鲁棒性。 像特征提取技术及现状 关于图像特征提取方法的研究已经有三十多年的历史,随着现代计算机技术的发展,研究者们在图像检索领域做了大量的研究工作,并取得了 丰富 的研究成果,尤其是在基于图像检索的特征提取技术领域,近年来有不少理论出现。文献15对图像检索 中的特征提取技术进行了探讨,对其研究方法进行了概括性地分兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 析,指出了各种方法的优点和不足。现有的不变性纹理特征提取方法可以分为坐标变换、统计分析等四大类。其中,坐标系统变换方法是一种较为常用的方法,它通过变换坐标系,采用极坐标 提取旋转不变性纹理特征。统计分析方法 是通过研究人眼视觉系统的特性提出的,通过不同阶的统计量对图像的纹理特征建立数学描述,进行特征提取。在模型分析法中,所用的 模型 主要有高斯 机场 16、同步自回归模型 17、 型 18、可控金字塔滤波器 19、小波变换 20和 通道 波器 21等多种。结构分析法的原理是利用图像纹理特征的结构属性 进行特征提取 ,较为常用的主要有直方图、形态学分解和拓扑结构描述等等。 在众多的特征提取方法中,常用于 的纹理特征提取方法主要有灰度共生矩阵、小波变换等。灰度共生矩阵是图像纹理特征提取的重要方法之一,最早由 人提出 。灰度共生矩阵是对图像上具有某特定距离和方向的 两个像素的灰度状况进行统计,来反映图像灰度的空间相关特性,从而描述图像的纹理信息。由于灰度共生矩阵法的原理和纹理空间位置上的灰度分布反复出现的特性相一 致,因此,这种方法特别适合于特征提取。小波变换法也是纹理分析的常用方法,小波变换采用小波基函数对参考图像进行小波变换来提取尺度、方向等信息,实现提取图像中信息的目的,是一种空间域和频率域的局部变换。在纹理分析中,通常选用小波系数作为图像的特征。小波变换方法提出以来,数字信号分析得到迅速发展,在图像处理领域尤其是图像纹理分析领域也得到了广泛应用。 神经网络方法自提出以来,迅速成为图像特征提取研究中的热点方法 22,而型所具有的不变性特征等优点,为图像的纹理特征分析提供了一个较为有效而简单的方法,因 此 图像识别和图像的纹理检索中取得了广泛 的应用 23。文献 23详细介绍了 原理和各种改进模型,在总结各种方法和模型的基础上,对 图像分割和去噪、模式识别和特征提取等应用进行了探讨,并对未来的发展方向进行了展望,是本文 究的重要依据。在基于 图像检索方面,文献 24对 模型进行研究,提出了一种图像旋转和尺寸不变性 纹理检索系统。文献 25定义了一种 赋时矩阵重心不变特征,提出一种改进的自适应模型,并将其用于图像的特征提取和目标识别中,用实验证明了 提出方法的几何不变性及抗噪性。文献 26将 耦合神经网络相结合,提出了一种脉冲发放皮层模型 (实验证明这种方法在不变性纹理检索中有良好的效果。 目前已有的分析和研究方法还比较分散,没有形成一定的体系。如何寻找出一种通用而高效的特征提取方法,依然是需要我们继续努力的方向。例如在研究中重视对模型的改进和放射变换等方法的引入,以及如何处理三维特征等问题都兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 需要更多的关注。随着越来越多新的算法被应用到图像检索当中,如何寻求一种更为高效的特征提取技术仍然 需要更多的关注和研究。 像识别技术及现状 图像识别技术始于上世纪八十年代,自从计算机技术被广泛应用以来,图像识别技术迅速发展,如在医学、空间技术及人脸识别等方面的应用更是为人们所常见。通常认为,图像识别技术是指通过计算机技术,采用相关的数学模型,对特定图像进行相关处理的一种技术。可以说 , 图像识别是人类视觉感官图像识别的延伸和图像“再认”。图像识别主要就是要利用现代先进的计算技术,来处理目前数量庞大的图像问题。图像识别技术属于模式识别的范畴。 传统的进行图像识别的方法是采用欧氏距离来进行特征之间的相似性匹配的,通过计算两幅图像特征点之间的相似性距离即欧氏距离来对图像进行识别,是最初 的一种图像识别方法。文献 27中讲述采用 型来进行模式识别 ,这种方法的优势是可以在较为复杂的情况下,当样本发生畸变时,仍然能够实现模式识别,具有较高的自适应性能,而且运行速度较快。 文献 28中 人将统计学理论应用在图像检索 领域 ,提出了一种新的机器学习方法 支持向量机,支持向量机 (即 立在统计学理论基础上,是一种新的机器学习算法, 也是一种有着坚实理论基础 的小样本学习方法,研究的是有限样本下的学习问题,期望得到有限信息下的最优解。 随着统计学习理论的完善, 支持向量机 以其越来越 出色 的学习性能, 迅速发展并 已成功应用于人脸识别、图像检索等许多领域。文献 29提出的 基于二叉树 多类分类算法是一种新型的二叉树生成算法,它 将聚类思想应用在分类计算中,有效 的 提高了该算法的抗噪能力和推广性能。 最小二乘支持向量机采用最小二乘线性系统代替传统的支持向量机 , 采用二次规划方法解决模式识别问题 。 自从 出支持向量机的概念以来,支持向量机尤其是单类支持向量机已经在许多领 域得到应用。 单类支持向量 (称 法 10由 人提出,单类支持向量机通过估计目标类样本在特征空间中的密度分布来估计包含样本的最小区域,即支撑区域,使得在支撑区域之外样本出现 的 概率很小。 通过计算和分析得到样本在特征空间的概率密度分布,来估计样本的区域,这种方法不用对非目标的样本进行完整描述,可以使运算得到简化。由于其优越的性能,单类支持向量机在图像识别领域得到了许多学者和专家们的研究。 文献 30中 人提出的模糊支持向量机( 将模糊隶属度引入支持向量机,在支持向量机的基础上对每个样本分别分配一个模糊兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 隶属度,对不同的样本采用不同的惩罚权重系数,在构造目标函数时,使不同的样本有不同的贡献,对噪声点和孤立点赋予很小的模糊隶属度,达到图像检索时抑制噪声和孤立点的目的。模糊单类支持向量机方法结合单类支持向量机理论和模糊理论的特点,能够完美的解决单类模糊问题,文献 31中用实例详细说明了这种检索技术的优点,为本文采用模糊 单类 支持向量机进行图像检索和抗噪分析奠定了良好的基础 。 文研究内容安排 本文主要是通过以下几个部分来对图像检索技术进行探索,研究的重点在于利用 模糊单类支持向量机进行图像纹理检索。 第一章 介绍了选题背景和研究现状 。 通过对图像检索技术的论述,详细介绍了图像特征提取技术以及图像识别技术的基本原理和研究现状。对基于内容的图像检索技术尤其是基于不变特征的图像检索进行了介绍,对不变特征图像检索的研究现状进行了概述。最后对论文的整体结构进行了介绍。 第二章介绍脉冲耦合神经网络的基本原理和数学模型。本章的重点是介绍和分析 基本原理,给出 数学模型 ,并对 特征提取中的应用进行分析,最后介绍了 简化模型 交叉皮层模型。 第三章主要介绍模糊单类支持向量机和单类支持向量机的基本原理和方法。在对单类支持向量机的原理和基本特点研究的基础上,对其应用进行了探讨,分析了其优缺点。接着本章介绍了模糊原理,在单类支持向量机的基础上引入了模糊单类支持向量机, 对其数学模型和隶属度 函数进行了介绍和分析。 第四章在前三章的基础上,提出了 一种 基于 纹理检索系统。 为了进一步分析 研究 ,选取 适当的图像库 和实验 参数 进行了实验,对不同情况下的不变性 检索结果进行分析,得出了结论。通过实验对比,表明了基于 几何不变性纹理检索系统的优势。 第五章对本文提出的方法进行了抗噪性实验并进行了实验分析。通过对图像加入不同的噪声进行试验和对比分析可以看出,基于 纹理检索系统对各种噪声具有较强的鲁棒性。 第 六 章 对本文所做的工作进行了回顾和 总结 ,在本文研究的基础上,对未来的研究方向进行了 展望。 论文得到了国家自然科学基金( 教育部科技项目博士点基金( 20110211110026),中央高校基金( 省自然科学研究基金( 1208支持。 兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 第二章 脉冲耦合神经网络 脉冲神经网络 (模拟动物视觉皮层视觉神经细胞活动而产生的一种算法模型。 通过神经元特有的线性相加和非线性相乘调制耦合特性 形成的一种反馈型神经网络 5。 相对于传统的多层神经网络模型, 一种单层神经网络模型,算法以迭代算法为主,并且不需要提前进行训练,具有自监督和自学习的特性, 这使得 实际的生物神经网络更为接近,对信 号的处理能力更强,更加适合于实时图像处理。 提出以来,在图像处理中得到了广泛应用 32 介 最早的 型是 经元模型, 据研究中发现的猫的大脑皮层同步脉冲发放现象,提出了展示脉冲发放现象的连接模型 6,这就是早期的 型。 由于参数较多,这种神经元模型较为复杂,在实际应用中很难进行参数设定。随着 现代人工智能技术的发展和统计学理论的进步 ,越来越多的研究者对原始的神经元模型进行简化 37使其迅速发展并得到了较为广泛的应用。 型的基本 神经元 单元如图 2示 5,6。 图 2经元模型 神经元即神经细胞,是高等动物神经系统的结构和功能单位。神经元由细胞体和细胞突起组成,细胞突起又可分为树突和轴突。 型中,神经元也分为类似的三个部分。第一部分是接受域,接受域是接受输入信号的部分,通过 连接通道 L 接受系统外部信号,通过反馈通道 F 接受系统内部其它信号,反馈通Y W 1*L L U F 接受域 调制域 信号产生域 Y E S 兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 道反映的是系统内其它神经元对该神经元的影响。其次是调制域,调制域的功能是将接受域 接受到的信号经过非线性调制,输出到信号产生域。系统的最后是信号产生域, 当调制域输出的信号 U 大于某一时间的动态阈值 E, 信号产生域的 阈值信号发生器就会被激活而产生一个脉冲。 型可以用以下离散数学方程表述 5,6,34: ( ) ( 1 ) ( 1 )j i j F i j k l k l i n e F n V M Y n S (2( ) ( 1 ) ( 1 )j i j L i j k l k n e L n V W Y n (2( ) ( ) 1 ( ) i j i j i jU n F n L n (2( ) ( 1 ) ( )j i j E i jE n e E n V Y n (21 , ( ) ( )()0, i j i f U n E 其 它(2其中, F( ) (i, j)个神经元所接 受到的反馈输入信号, ()i, j)个神经元所接受的外部输入信号 (即连接输入 )。()系统的输出此 10ij 或 。 M 和 W 为反馈输入与连接输入的连接权矩阵,本文中取 。可以看出,连接输入和动态阈值都受到 F、 L 和 E 等衰减系数的影响。在式(2, 成为连接系数,表征 ()t 为时间常数, 幅度常数。可以看出,在 每次迭代过程中,当 调制域的输出信号()输出脉冲。 在图像处理当中,用神经元模型来表征图像的像素。在给定一个连接权矩阵后,认为每个神经元对应于图像的一个像素。当神经元接受到外部输入的信号时,会受到激励,通过神经元各系统单元的作用而产生一个脉冲,这个脉冲可以作为外部信号,继续激发其它相邻的神经元发放脉冲,这就是 经元的 同步脉冲发放特性。 学模型表达是可以看出,某一时间内的动态阈值 ()间衰减的,这是因为 每 个神经元具有不同的点火周期。从式 (2以看出, 当 调制域的输出信号)放同步脉冲。在这个过程中, 第 (i, j)个神经元 的 反馈输入 F( )一步输入到系统中,发放同步脉冲。 由此可见, 法不仅考虑了神经元的脉冲特性,还考虑了该神经元周围其它 具有相似特性的神经元对其输入信号的影响。 兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 于特征提取 由于 经元具有点火捕获特性,而且相似神经元具有同步脉冲发放特性,使其 在图像处理尤其特征提取领域得到了许多学者的探索和研究。由于法在图像特征提取时,不易受到图像平移、旋转等变化的影响 40,41, 使其非常适合 不变特征提取,并且对噪声具有较好的鲁棒性。 1993 年首次将 法 应用于 图像检索当中,发现这种方法在 图像特征提取 时具有较好的性能 42,43。不久后, 人也 将这种 方法应用于图像检索当中,并证实了这种方法的优越性 44,45。 随着越来越多的学者对 法在特征提取中的应用进行探索, 特征提取领域得到了推广 。 输出是一些二值图像序列,其中包含着 纹理等 原始图像的 许多特征信息, 这些特征信息是图像的不变性特征,但是,这些信息比较混杂,具有很大的数据量,并不利于实际的数据处理,无法直接用来对图像进行识别,因此最初的 法具有一定的 局限性。如何对 出的二值图像序列进行变换以减少数据量,并且作为原始图像的唯一性特征是一个需要解决的问题。 为了解 决上述问题, 出了一种时间序列的变换方法 46,47,通过对次迭代输出的结果进行 变换, 然后进行 求和运算,得到 这样一个 时间序列: G(n) = (n)。在这个时间序列中, Y(n)是 n 次迭代输出的二值图像, )为求和函数。这个变换将图像的多维特征成功转化为一维特征,使运算量大幅度减少。通过实验, 实验结果进行分析得出,对于每一个输入,都可以得到一个时间序列,而且这个时间序列具有唯一性。也就是说,每个图像与所输出的时间序列是一一对应的。同时 发现输出的时间序列具有一定的周期性。 出的时间序列变换方法计算简单,可以减少计算量并且易于实现,但是仍有一定的局限性, 这种方法由于考虑的是二值图像中 1的个数,并不能全面反映图像的信息,比较容易发生较大的偏差。 熵特征序列方法 是在 理论的基础上产生的 。 信息 熵 最早表示随机变量的概率分布函数,在图像检索中,熵可以反映 图像 的 统计特性 。 根据 以将二值图像的熵表示为: H(P) = 1) 0)。 在这个表达式中 ,0 和 1 出现的概率。通过 计算 E(n)= (n)41, ()其中, Y(n)为 第 n 次迭代输出的二值图像, )是求解输入图像的熵函数。通过二值熵序列的表达式可以看出, 出 的 二值熵序列方法同时考虑了二值图像中的 1 和 0,因此比 间 序列更加全面地反映了检索图像的信息。很多学者对于这种方法进行了研究实验,结果证明在参数选择适当兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 时,对大多数图像而言,其熵序列具有唯一性,不同图像之间的熵序列具有明显差异 6。同时, 熵特征序列方法 同时间序列 变换方法一样,具有 不变性 特征,适用于图像检索 。 通过以上论述,由于熵特征序列提取具有唯一性,而且适合于不变性特征提取,因此本文在研究中选用熵特征序列方法。 叉皮层模型 交叉皮层模型 (一种 简化模型,最早由 5等人提出。交叉皮层模型是由生物视觉神经元模型演化而来的,因此与实际的生物神经元更为接近。 个神经元的基本模型如图 2示 6,型由于其结构简单,运算较为简单,使其在图像处理中具有一定的优势。通过对比 型图与 本模型图可以看出, 为 简化模型, 传统 经元模型中的 外部输入信号 ()反馈输入 F( )直接作为内部活动项的一部分,这样 型就大为简化,而原有的功能并没有减弱。在图像检索时,当一个神经元产生脉冲,这个脉冲可以“捕获”或者通过刺激使得周围的同性质的神经元也发放一个或者多个同步脉冲。通过对得到的同步脉冲进行熵特征序列变换,就可以达到提取图像的不变性特征的目的。 图 2单个 神经元 的基本 模型 交叉皮层 模型 可以用 以下 离散 数学 方程式表述 6,35 ( ) = ( 1 ) ( 1 )i j i j i j k l k l i n f F n M Y n S (2( ) ( 1 ) ( )i j i j i jE n g E n h Y n (2h g S Y E F W Y f 兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 1 , ( ) ( 1 )()0, i j i f F n E 其 它(2其中, n)表示 第 (i, j)个神经元的第 n 次反馈输入 , 外部输入 的 激 励 信号; n)是 输出脉冲 ; 同 型不同的是, ( 1)前一时刻该神经元 所产生的动态阈值, 它 的大小 决定 了 这一时刻神经元所接受到的 反馈输入F( ) 否 可以 激发脉冲 。 连接矩阵 M 仍然 表示第 (i, j)个神经元 周围其它神经元对其影响程度。 f 和 g 分别为 F 和 E 的衰减系数 ,通常取 y 为 类支持向量机的应用 法利用核函数将低维空间的样本数据映射到高维 特征空间 ,并在高维空间中 构造最优 包围球, 使样本数据 尽可能的全部包围在球的内部,球面外的即为噪音样本和异常点。这一特点非常适合解决单类问题,现在已经广泛应用于各种图像检索领域中。 8和 7等人对单类支持向量机进行研究并将其用于文本分类问题,取得了良好的效果。 1等人对单类支持向量机进行改进,将其应用在基于内容的图像检索当中。不少学者还将 法应用 于其它方面,文献 52用 法对类条件概率密度进行分析,提出了一种基于 贝叶斯分类算法。在遥感图像目标检索中, 法可以改善传统支持向量机分类方法在处理正负样本数目极不对称情况下的误检率问题 53。 在对 法的研究和探索中,随着研究的不断深入,涌现出了一些改进的 法,越来越多的学者开始对它们进行了关注和应用。 4等人提出了邻近单类支持向量机方法, 5等人提出了一种加权单类支持向量机,这些方法都得到了实现。 6等人首次将模 糊集理论引入到 法中,提出了一种模糊单类支持向量机。这种方法的思想是通过对每一个输入样本引入模糊隶属度,来重新构成一个特殊的单类支持向量机,新构成的样本点对最优分类面有不同的贡献,这样所得到的支持向量机方法同时兼备模糊集理论与支持向量机理论的优点,推广能力得到增强。随着模糊集理论的引入,一些学者开始研究不确定性理论与支持向量机结合应用问题,加权支持向量机、模糊支持向量机和粗糙集支持向量机等理论被不断提出,并取得了一定的研究成果。 糊单类支持向量机 模糊单类支持向量机( 7)是指在单类支持向量机中应用模糊技术,对不同样本添加不同程度的惩罚权系兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 数,从而使不同样本在所构造的目标函数中具有不同程度的贡献,对含有异常点和噪声的样本赋予较小的惩罚权系数值,这样可以有效地消除异常点和噪声对样本的影响。 传统单类支持向量机在训练过程中对所有的样本数据采用统一的惩罚因子C,这种分类模型对异常点和噪声十分敏感。模糊单类支持向量机 ( 训练时根据惩罚权系数的大小区 分不同样本的贡献,惩罚权系数越大,说明该样本 在 构造分类模型时的贡献越大,因此为了减小噪声和异常点对分类模型的影响,提高分类方法的泛化性,对其赋予较小的权值 ( 即 模 糊 隶 属 度 ) 。 模 糊 支 持 向 量 机 中 训 练 样 本 集 可 以 表 示 为1 1 1, , ) , , ( , , ) n n nX y x y x=( K,其中, , 1, ,i 通过在单类支持向量机中添加模糊隶属度而形成的模糊单 类支持向量机,有效地解决了样本中存在噪音和异常点的问题,将其运用在图像检索的过程中能更好 地 提高检索率。 糊理论 “模糊”即英文“ 的直译,英文中不仅有模糊的意思,还包含“不分明”等意。模糊问题就是指现实中存在的许多界限不分明的问题,也指那些不能确定事物本身是否符合这个概念的问题。实际中通常运用模糊数学来解决模糊问题。因为概念的外延而造成 的不确定性也称为模糊 性 ,这与概率论中的不确定性是严格区分开的, 即不规律事件出现的规律性。 1965 年, 8教授在模糊集合论中采用“隶 属函数”这一新的概念来描述存在差异的事物之间的中间过渡,超越了古典集合论中事物之间绝对的属于或者不属于关系,这一开创性工作标志了模糊数学的诞生。模糊集合理论的出现使数学能够形象的描述复杂事物 , 使模糊的对象确切化,它将确定性对象的数学研究和不确定性对象的数学研究沟通起来,解决了精确数学和随机数学中对事物描述的不足。 模糊理论还处于不断的发展和完善过程中,但作为一门新兴的学科已经初步应用于各种领域,例如:模糊控制、模糊识别、图像识别、聚类分析、信息检索、生物、医学等,本文中主要将模糊理论知识应用在图像检索中。 糊隶属度的确定 在模糊单类支持向量机理论中,模糊隶属度的设计是实现 关键,隶属度函数的选取直接决定着算法的选择和算法的实现,隶属度函数选择不当会使得算法实现困难,计算量增大。 兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 现阶段构造隶属度函数的方法多种多样,但是还没有形成统一的准则,仍旧需要 根据经验和 实际情况来选择 或者 构造 适合的 隶属度函数 , 隶属度大小 是由该隶属度所对应的样本在样本集中的贡献来确定的。 常见的隶属度函数 59,60主要有以下几种: (1) 线性隶属度函数 在构造线性隶属度函数时需要将样本与其所在类中心之 间的距离进行线性约束。采用线性函数描述为:特征空间中样本到类中心之间的距离即是隶属度的大小,这样构造的隶属度函数即是基于线性距离的隶属度函数 61。样本距离类中心越近时,得到的隶属度值越大,反之得到的隶属度值越小。首先引入样本类中 心点的描述 : 将 的一类点记为12 , , nx x x, 其中0 r 代表类半径 , 则有 : 0m a xi x x (3依据距离确定隶属度函数时 , 类中各样本的隶属度表示为模糊隶属度 (): 0 11 (3( ) 1 ii r (3为了避免 式 (3 ( ) 0这一 情况 的出现 , 取 01。 (2) 将样本与其 所在类中心之间距离进行非线性描述,即采用 62来描述的 隶属度函数 被称为 这种非线性关系表示为一种连续的从 0到 1单调增长的 通常用 a、 b、 由 义的标准型 : 220 ( )()2 ( )( ; , , ) ()1 2 ( ) / ( ) ( )1 ( )x bx a b c c c a b x (3式中: ( ) / 2b a c ,且在隶属度大小等于 (3) 球型隶属度函数 将样本的隶属度看作样本与 最小 包围 球中心 的距离和 最小 包围 球半径之间兰州大学硕士研究生学位论文 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 的函数, 采用这种方法构造出的函数被称为球型 隶属度函数 63。 分别采取两种不同的方式计算基于半径内、外的样本隶属度,则基于球型隶属度的计算公式表示为: 1 ( ) /0 . 6 * 0 . 4 , ( )1 ( ) /()10 . 4 * , ( )1 ( ( ) )x Rd x Rd x x Rd x R (3中,样本集中的样本到包围其大多数样本的最小包围球球心之间的距离用()示,最小包围球的半径用 ()计算公式如下: ( ) , 1, ,x x a i n (3从定义的基于球型的隶属度函数中可以看出: ()大,则该样本集中样本的隶属度值就越小;反之, ()属度值越大,样本位于最小包围球中的可能性越大,对构造最小包围球所起的贡献 越 大。考虑在特征空间中样本的分布,在上式中,当隶属度值大于 本分布于包围球内部;当隶属度值小于 本分布在包围球外边;当隶属度值等于 本分布在包围球的球面上。 糊单类支持向量机 方法 作为 一种特殊的单类支持向量机方法, 模糊单类支持向量机是根据样本集中不同样本的贡 献, 通过添加模糊隶属度, 来 构造基于不同隶属度 的单类支持向量机。 它能更好地解决单类问题,从而更准确地检测出异常点和噪音,提高图像的检索效率。 图 3模糊单类支持向量机 本文 采用超球法解决模糊单类问题, 选择 球型隶属度函数, 实现含有球型隶属度 的模糊单类支持向量机 ,如图 3示 。设可以将训练样本集表示为1 1 1, , ) , , ( , , )n n ny x y x( K,其中 , , 1, ,i 映样本 基于脉冲耦合神经网络和模糊单类支持向量机的图像检索 在类中的重要程度 ,01i, 1, 1表示类标识 , 示每个样本的特征。设 () 为从模式空间 高维特征空间 z 的映射,则模糊单类支持向量机方法即是采用二次规划方法求解下面带约束条件的目标函数的最小值: 21( , , ) ( )n a R C (3约束条件为: 2 2 , 1 , ,i i ix a R i n K (30 , 1, ,i K (3其中 C 为惩罚因子,通常取正常数;i为松
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业职业经理人的素质与能力要求试题及答案
- 深入探讨农业经理人考试的知识框架试题及答案
- 营口事业编面试题及答案
- 仓库出让合同样本样本
- 临淄区劳务派遣合同样本
- 解决班级矛盾的有效策略计划
- 儿童支气管炎护理方法
- 社区科技创新活动的推动计划
- 共同投资合伙合同样本
- 生产工序操作培训教材
- 西方文论概览(第二版)-第六章课件
- 初中语文教材常见问题答疑(八年级)
- 英语漫话天府新村智慧树知到答案2024年四川工商职业技术学院
- 广东省深圳市龙岗区春蕾小学2023-2024学年数学五年级第二学期期末复习检测模拟试题含解析
- 2024年4月自考经济学真题完整试卷
- 成人门急诊急性呼吸道感染诊治与防控专家共识解读
- AIGC基础与应用全套教学课件
- 《建筑排水塑料管道工程技术规程 CJJT29-2010》
- 2024-2034年中国燕麦草行业市场深度分析及投资策略咨询报告
- 1.1 昆虫主要特征的识别
- 外科手术备皮范围
评论
0/150
提交评论