(计算机软件与理论专业论文)基于动态基的三维表面纹理分类及光照方向判断.pdf_第1页
(计算机软件与理论专业论文)基于动态基的三维表面纹理分类及光照方向判断.pdf_第2页
(计算机软件与理论专业论文)基于动态基的三维表面纹理分类及光照方向判断.pdf_第3页
(计算机软件与理论专业论文)基于动态基的三维表面纹理分类及光照方向判断.pdf_第4页
(计算机软件与理论专业论文)基于动态基的三维表面纹理分类及光照方向判断.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于动态基的三维表面纹理分类及光照方向判断 摘要 纹理分类是模式识别领域中的一个重要的分支,它的目的是识别出具有不 同纹理特征的物体的各种表现形式。纹理分类在计算机视觉、图像处理及计算 机图形学领域和工程技术方面有着非常广泛的应用背景。目前三维表面纹理分 类技术的研究是图像处理领域的前沿方向,有着广阔的研究前景。三维表面纹 理的数据采集、分析、分类已成为纹理分析领域新兴的热点之一。 一般来说,在分类之前要有一些关于纹理图像的先验知识。通过这些先验 知识,建立起一个分析模型,从而找到某种具体有效的分类方法,以获得更高 的分类识别率。其中主要工作涉及到三个部分:纹理模型的建立、特征参数的 提取与选择和分类器的设计。 本文的研究目的在于通过多类纹理的训练集,判断出一幅未知纹理图像的 类别,并且根据同类纹理光照方向的训练集,进一步判断出此纹理的光照方向。 本文首先介绍了模式识别领域中特征提取和分类的几种方法和相关背景研究, 进而展开对三维表面纹理的分类和光照方向研究。针对小波包分解法提取出的 特征能够准确的体现三维表面纹理的特性,本文实现了两种三维表面纹理分类 的算法,分别为基于s v m 和a d a b o o s t 的两种分类器。在得知某种纹理类别之 后,本文采用了一种新的方向特征提取方法:改进的动态基( a c t i v eb a s i s ) 特 征。由于动态基方法可以很好提取图像的方向特征,所以每个基的直方图信息 就可以作为每个光照角度的训练特征。基于动态基的建模方法,本文实现了一 种新的判断光照的算法,并进行了大量的实验。实验结果证明本文提出的三维 表面纹理分类和光照方向判断算法是行之有效的,并为今后进一步的研究打下 了一定的基础。最后,列举了本文的一些不足和改进之处。 关键词:三维表面纹理;纹理分类;动态基;光照方向 t h r e e d i m e n s i o n a ls u r f a c et e x t u r ec l a s s i f i c a t i o na n d i l l u m i n a t i o ne s t i m a t i o nb a s e do na c t i v eb a s i s l l l u m m a t l o na s e oo n a s l s a b s t r a c t t e x t u r ec l a s s i f i c a t i o ni sav e r yi m p o r t a n tb r a n c hi np a a e mr e c o g n i t i o nf i e l d , a n di t sp u r p o s ei st od i s t i n g u i s ht h ed i f f e r e n c eo fa l lk i n d so fo b j e c t s i ti sw i d e l y u s e di nc o m p u t e rv i s i o n ,i m a g ep r o c e s s i n ga n dc o m p u t e rg r a p h w o r kr e l a t e dw i t h 3 ds u r f a c et e x t u r es u c ha sd a t ac o l l e c t i o n ,a n a l y s i sa n dc l a s s i f i c a t i o nb e c o m ea l l a c t i v er e s e a r c h t o p i c i nt h ef i e l d n o wt e c h n o l o g yo f3 ds u r f a c et e x t u r e e l a s s i 丘c a t i o ni sa l la d v a n c e do r i e n t a t i o ni nf u r t h e rr e s e a r c h g e n e r a l l ys p e a k i n g , s o m ep r i o rk n o w l e d g e s h o u l d b e a c q u i r e d b e f o r e c l a s s i f i c a t i o n , a n dt h e nam o d e ls h o u l d b ee s t a b l i s h e da c c o r d i n gt o t h ep r i o r k n o w l e d g e f u r t h e r m o r e ,c e r t a i ne f f e c t i v em e t h o d sn e e dt ob eu s e dt o i n c r e a s e c l a s s i f i c a t i o nr a t e t h e r ea r et h r e em a i np a r t si n t h i sw o r k :m o d e le s t a b l i s h m e n t , f e a t u r ep a r a m e t e re x t r a c t i o na n ds e l e c t i o n , a n dc l a s s i f i e rd e s i g n i nt h i st h e s i s ,s e v e r a lm e t h o d sa b o u tf e a t u r es e l e c t i o na n dc l a s s i f i c a t i o ni nt h i s f i e l da r ef i r s ti n t r o d u c e d ,i n c l u d i n gs o m eb a c k g r o u n dk n o w l e d g e ,a n dt h e3 ds u r f a c e t e x t u r ec l a s s i f i c a t i o na n dd i r e c t i o n a l i t yr e s e a r c hi sf u r t h e rd i s c u s s e d d u et ot h ef a c t t h a tf e a t u r ee x t r a c t e db a s e do nw a v e l e t - p a c k e td e c o m p o s i t i o nc a ne f f e c t i v e l yd e t e c t c h a r a c t e r i s t i c so fd i f f e r e n tt e x t u r e s ,t w oa l g o r i t h m sa r ed i s c u s s e dt oa c c o m p l i s h3 d s u r f a c et e x t u r ec l a s s i f i c a t i o n :s v ma n da d a b o o s t n e x t ,an e wm e t h o dc a l l e da c t i v e b a s i si se m p l o y e dt oe x t r a c ti l l u m i n a t i o nd i r e c t i o nf e a t u r e ,f o rb a s i sg e n e r a t e df r o m t h em o d e l 伽s h o wd i r e c t i o n so fa ni m a g ee x a c t l yt h e na na l g o r i t h ma b o u t i l l u m i n a t i o ne s t i m a t i o ni sp r o p o s e db a s e do ne a c hb a s e sh i s t o g r a m a c c o r d i n gt o t h ee x p e r i m e n t a lr e s u l t ,t h ep r o p o s e dm e t h o dc a ns u c c e s s f u l l yc l a s s i f i e sm u l t i p l e d i f f e r e n tt e x t u r e sa n dd i s t i n g u i s ht h ei l l u m i n a t i o nd i r e c t i o n s i ti sn o n t r i v i a lt o d e v e l o pa na p p l i c a t i o na b o u t3 ds u r f a c et e x t u r eb a s e d o nt h i st h ef r a m e w o r k f u t u r e w o r kw i l lf o c u so ni n v e n t i n gn e wp a r a m e t e r st oi n c r e a s ec l a s s i f i c a t i o na c c u r a c ya n d m o r ew i d e l ys e r v e df o rv a r i o u sk i n d so ft e x t u r e s k e yw o r d s :3 ds u r f a c et e x t u r e :t e x t u r ec l a s s i f i c a t i o n ;a c t i v eb a s i s :i l l u m i n a t i o n d i r e c t i o n s i i i 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含未获得 ( 洼! 垫遗直墓他霞蔓挂剔直明的:奎拦亘窒2 或其他教育机构的学位或证书 使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示谢意。 学位论文作者签名:被芬恤签字日期:训o 年参月f 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留 并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。 本人授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可 以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学 技术信息研究所将本学位论文收录到l :中国学位论文全文数据库,并通过网络 向社会公众提供信息服务。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:钕蓉础 劭p 刁年6 目f 曰 导师签字鞠 杪明备名| 9 驴 基于动态基的三维表面纹理升共厦光照方向判断 1 绪论 本章简要介绍了课题的研究背景、三维表面纹理分类的研究现状和存在的问 题以及进一步研究的必要性,并阐明了本课题所做的主要工作。 1 1 课题研究背景及现状 纹理m x t c ) 是一种普遍存在的视觉现象,是表征图像的一个重要特征。我 们可以去感受纹理,却很难对纹理的精确定义形成统一的认识,目前主要根据应 用需要做出不同定义: 定义1 按一定规则对元素( c l c m c n t s ) 或基元( p r i m i t i v e s ) 进行排列所形 成的重复模式。 定义2 如果图像函数的一组局部属性是恒定的,或者是缓变的,或者是近 似周期性的,则图像中的对应区域具有恒定的纹理。纹理具有重复性、规则性、 方向性等等,如图1 - 1 。 图1 - 1 纹理 目前,纹理的研究已经渗透到日常生话的方方面面: 在遥感方面,纹理分析技术在遥感图像处理过程中,显示出根强的适用性。 在卫星遥感图像中,利用纹理特征,可以识别出森林、湖泊和城市等。使用 灰度麸生矩阵来描述遥感圈像,还可以得到较高的分类精度。 在气象方面,通过对卫星云图的分析,可以精确地预测未来的天气情况,并 对海浪强度做出准确的预报。卫星云图中云层的厚度、移动方向和气压的高低, 反映到图像上都是纹理的变化。同时,浪高信息也可以从纹理分析中获得。图像 纹理方向还与波浪走向密切相关。 基于动态基的三维表面纹理分类及光照方向判断 在地质研究中,细微纹理结构一般代表流域、细微粒状沉积岩;粗糙纹理结 构一般代表粗糙沉积岩;块状纹理所代表的区域一般有皱纹;而蜂巢状纹理一般 代表火山岩。同时,可以通过纹理分析得到有走向的地质构造的定量结果。 在生物医学图像分析方面,c t ( 断层摄影) 图像、m r ( 核磁共振) 图像、 b 型超声图像、p e t ( 正子发射断层摄影) 图像、x 光投射图像和细胞的显微图 像等都有很强的纹理结构特性。在区分正常组织与病变组织、检查人体内部结构、 诊断疾病和判断染色体的分裂状况等方面,纹理分析己获得大量应用。 生物学研究也表明:人类的视觉认知过程可以分为预视和注视两种模式。在 预视模式中,有许多结构的纹理可以得到鉴别和分割,也就是说,纹理差异是可 以自然感知的。对预视模式的进一步研究表明,纹理的局部和全局统计特性可以 帮助人类视觉系统鉴别纹理,这是纹理分析的生物学基础。 通过上面的介绍可以看出,纹理分析己经成为许多实际应用领域不可缺少的 组成部分,对它的深入研究将给人类的生产、生活带来可观的效益。而目前对纹 理的研究大体集中在以下几个方面: 纹理映射 1 ( t e x t u r em a p p i n g ) 是绘制复杂场景真实感图形最为常用的技术, 是通过将数字化的纹理图像覆盖或投射到物体表面,而为物体表面增加表面细节 的过程。但纹理映射只能在纹理空间和表面参数空间内进行一对一的映射。由于 采样区域的局限性,所获取的纹理样本通常为小块纹理,若将小块纹理映射到大 的空间表面上,势必造成映射后表面纹理模糊不清,而采取多次重复映射技术, 则会表现出表面纹理接缝走样等问题。 纹理合成【2 1 f 3 】( t e x t u r es y n t h e s i s ) 的研究在计算机视觉、图像处理及计算 机图形学领域都占有重要的地位。一个主要原因在于纹理合成有着非常广阔的应 用背景。比如在布料产品、软体家具包装、各种台面纹理、汽车内饰等产品表面 设计的过程中,以及影视特效制作、电子游戏等行业,都需要对大量的表面纹理 图像进行合成。通过纹理合成,可以产生在一幅比与原输入图像大,但是却与其 具有相同纹理特征的新图像。使用合成后的大图像作场景渲染,可以避免纹理映 射时由重复拼接小图像产生的接缝效应,取得很好的设计效果。 纹理分类【4 】【5 】【6 】忉【8 】为纹理研究领域中另外一个较新的分支,国外的许多 学者在纹理分析方面做了大量的研究工作,并取得了许多研究成果,但仍然有许 2 基于动态基的三维表面纹理分类及光照方向判断 多问题等待研究人员的探索。目前,纹理分析研究面临着三个重要的挑战: ( 1 ) 尽管纹理分析方法种类繁多,但至今还没有一个特别有效的方法,在 纹理分类方面取得令人满意的性能,众多的学者仍然在探索新的思路和途径,试 图找到一个非常有效的纹理描述方法。 ( 2 ) 尽管现实中的场景都是彩色的,但目前有关纹理的研究大部分都集中 在灰度纹理领域。彩色纹理研究很少有人关注,目前对彩色纹理分析还处于探索 阶段,还没有一个非常有效的彩色纹理描述方法。 ( 3 ) 纹理分析方法尽管在理论探索方面有很多成果,然而这些方法由于理 论性较高,不容易被其他领域的研究人员以及工程技术人员所理解和接受,造成 了很多方法不能够成功地应用到其他领域。 1 2 论文主要内容安排 本文的主要内容安排如下: 第一章:绪论。介绍了本文的研究背景和应用方向,研究动态以及存在的主 要问题等,说明了本文研究工作的必要性和理论价值。同时,提出本文的创新点, 说明论题的实用性、新颖性和前沿性。 第二章:文献综述。本章主要介绍了论文中所用到的一些背景知识,为后面 章节的展开论述做准备。 第三章:三维表面纹理表示。本章介绍了三维表面纹理的表示方法及实验中 的数据获取方式。 第四章:基于s v m 和a d a b o o s t 的三维表面纹理分类。本章设计了两种纹理 分类的算法,详细描述了这两种方法在三维表面纹理方面的应用,并介绍了基于 这两种分类器的特征提取算法一小波包分解法。 第五章:光照方向判断。本章将动态基作为特征引入三维表面纹理,进而提 出了一种新的判断光照角度的算法,并给出了相应的实验结果。 第六章:总结及展望。对本文所做工作作了总结,并提出了今后进一步研究 的方向。 3 基于动态基的三维表面纹理分类及光照方向判断 1 3 论文主要创新点 本文的创新点主要有两个g 第一,本文设计了基于s v m 和a d a b o o s t 的两种三维表面纹理分类的方法。 第二,将动态基作为特征引入到三维表面纹理中,并在光照方向的判断方面 展开了一定的探索。 4 基于动态基的三维表面纹理分类及光照方向判断 2 文献综述 纹理分类是近年来计算机视觉领域中备受关注的前沿方向。它涉及到图像处 理、机器学习、模式识别等多门学科的内容。本章对本文后面用到的技术的相关 背景及文献进行初步介绍,探讨了纹理研究的主要方法和思路。 2 1 纹理的分析方法 纹理分析是指通过一定的图像处理技术,获取图像的纹理特征,从而获得纹 理的定量或定性描述的处理过程。因此,纹理分析应包括两个方面的内容: ( 1 ) 检测出纹理基元; ( 2 ) 获得有关纹理基元排列分布方式的信息。 对于纹理图像的分析通常包括纹理图像的预处理、特征获取以及对纹理图像 分类、分割和理解。不管是纹理分类、分割或理解,纹理特征可以用模型参数表 示,也可以按照人的视觉感知特性获取相应的有明确意义的特征度量,如粒度、 对比度、方向性、线状程度、规则性、粗糙度等。 纹理分析【9 】包括纹理特征的提取以及在此基础上进行的纹理分类及纹理分 割。纹理分割、纹理分类主要研究的问题是如果一幅图像由两种或两种以上的纹 理构成,如何通过适当的数学方法将它们分开。首先是要分析纹理特征空间,然 后再提取特征一致性区域。因此纹理特征的成功提取是纹理分割、分类成功的关 键。在长期的研究中产生了各种各样的纹理分析算法,主要包括:基于算子的方 法、基于统计的方法、基于模型的方法、基于结构特征的方法以及基于频谱特征 的方法( 即滤波器法) 等。基于频谱特征的方法常采用多通道滤波,包括g a b o r 滤波器以及小波变换等。在各种方法中,研究比较多的是基于统计的纹理特征提 取方法,它包括灰度共生矩阵法和随机场模型方法,如分形维模型方法、马尔可 夫随机场模型法。其中,随机场模型方法试图以概率模型来描述纹理的随机过程, 常见的模型有m r f 和g r f 模型两种。此外,还有在此基础上发展起来的隐马尔 可夫模型( h m m ) 的方法。基于多通道滤波的特征识别方法也是采用较多的方法。 多通道滤波器法因具有符合人类视觉特性的优点,引起了广泛的关注。9 0 年代 5 基于动态基的三维表面纹理分类及光照方向判断 中后期,采用g a b o r 滤波器方向滤波进行纹理分割是一个研究热点。但是这种基 于多通道滤波的分类方法,以多通道信息为特征,如多通道能量、方差等,并根 据距离准则来实现纹理的分类,计算复杂,不利于获得理想的分类结果。因此近 些年来,小波变换的方法成为纹理多尺度分析的主要方法。 对纹理分析的方法有很多种,归纳起来可以分为以下几种:分别为统计法、 结构法和频域法。 统计的方法充分利用像素灰度的概率密度函数( p d f ) ,p d f 通常通过局部区 域内像素灰度的条件联合概率密度函数,具体方法有:灰度共生矩阵的方法和马 尔科夫模型。 结构的方法是利用一个纹理原型的概念,这类方法都是通过提取一系列表征 这个原型的特征来描述纹理原型,然后在指定的图像纹理范围区域与这些原型之 间指定一个距离规则。 频率域分析方法 2 2 1 是基于傅里叶变换的基础上。在频域里进行分析主要是 基于图像的光谱,在此基础上发展了许多的方法来区分不同的纹理。 在对这些方法进行大量研究的基础上,研究者广泛认为空间信息对于特征分 类是比较重要的。针对哪种方法更能够提供更好的特征空间,研究者们也做了大 量的对比分析试验,用灰度共生矩阵的一次统计量和二次统计量与频域的方法进 行对比研究发现:空间域的方法比频域的方法分类精度更高。 2 2 相似性度量 我们在纹理分析的过程中,怎样才能判断邻域是否匹配昵? 这就需要找到一 种衡量方法来表示两个纹理在模式上差别有多大,换言之,这两个纹理究竟多大 程度上是相似的,这就是相似性的概念。 在纹理相似性评价中【1 0 】,基于人类视觉模型,寻找一组与人类视觉感知特 性有明确对应关系的纹理特征是适宜的,而从提高系统个性化、人性化以及交互 能力的方面来说也是必要的。纹理特征按照其与人类视觉感知特性的对应关系大 致有以下几种:稀疏度、对比度、方向性、线状性、规则性、粗糙性、周期性( 重 复性) 、随机性( 复杂性) 、繁忙性以及纹理力度等。此外,还有一些不常用的或与 人类视觉特性对应不明确的特征:如一致性( u n i f o r m i t y ) 、同质性( h o m o g e n e o u s ) 6 基于动态基的三维表面纹理分类及光照方向判断 等等。有了由多个特征构成的纹理特征向量,就可以通过计算两个向量的欧式距 离来量化这两个纹理的相似性。 在纹理计算中,通常将各像素点的灰度值作为特征参数。假设两个纹理图像 具有相同的大小,都是n n 像素的正方形,度量这两个纹理相似性可以通过累 积各个对应像素点之间欧氏距离来完成。 将图像中各点的亮度值计为i 一1 ,i 2 ,:) ,其中的t 表示纹理图像中刀一 个像素中的第k 个像素的亮度,即灰度。则下面的式子表示了图像x 与图像y 之间的欧氏距离: 蜃一 d ,) ,) 。1 荟( f t k ) 2 2 j ) 式( 2 1 ) 中和f 晴分别表示图像x 和图像y 中第k 个像素点的亮度( 灰度) , a ( x ,y ) 表示两个图像之间的距离,即差异。为简单起见,我们去掉平方根运算, 而直接计算欧氏距离的平方值( s u mo f s q u a r e dd i f f e r e n c e 2 ,s s d ) ,即 - 2 s s d ( x ,) ,) 一乏( f t 一) 2 ( 2 2 ) 我们用式( 2 2 ) 这个平方后的累积作为图像之间相似度的衡量。显然如果 两个纹理图像相同,其s s d 值为0 。 在纹理图像中,并不是所有点的匹配对于认识这两个纹理的相似性都有相同 的影响作用,因此有时有必要对图像中的点进行加权,于是需要一个权重向量 g 一( g 。,9 2 ,g 。:) ,其中& 表示第k 个像素对应的权值,1 七刀2 ,g k o r 2 - 1 。则加权后的s s d 值表示为 _ 2 s s d ,o ,y ) - 芝g 七( f 吐一) 2 ( 2 3 ) 2 3 机器学习 机器学习的目的是期望能从数据中自动地获得相应知识的理论,通过采用如 推理、模型拟合及从样本中学习的方法,尤其适用于缺乏一般性的理论。因此, 7 基于动态基的三维表面纹理分类及光照方向判断 机器学习形成了与常规方法互补的可行的方法。 机器学习 1 1 1 根据给定的训练样本求对某系统输入输出之间依赖关系的估 计,使它能够对未知输出做出尽可能准确的预测。一般地表示为:变量y 与x 存 在一定的未知依赖关系,即遵循某一未知的联合概率f ,y ) ,x 和y 之间的确定 性关系可以看作是其特例。机器学习问题就是根据n 个独立同分布观测样本 b 。,y 。j g :,y :l ,k ,y 。) ( 2 4 ) 在一组函数厂b ,w ) 中求一个最优的函数,g ,) 对依赖关系进行估计,使期望风 险 尺b ) 一弘( ) ,b ,w ) 如g ,y ) ( 2 5 ) 达到最小。其中, ,g ,w 汁称作预测函数集,l ( y ,厂b ,w ) ) 为用( x ,w ) 对) ,进行预 测而造成的损失,不同类型的学习问题有不同形式的损失函数。预测函数也称作 学习函数、学习模型或学习机器。 机器学习问题主要包括三个基本方面:模式识别、函数逼近和概率密度估计。 对模式识别问题,输出) ,是类别标号。两类情况下y 一 0 ,q 或【一1 ,1 ,预测函数 称做指示函数,损失函数可以定义为 如胞训;氍f ,i t ) ,y 讥- 1 ( x 川, w ) ( 2 6 ) 在函数逼近问题中,y 是连续变量( 这里假设为单值函数) ,损失函数可定 义为 l b , ,厂g ,w ) ) - 一,g ,w ) ) 2 ( 2 7 ) 即采用最小平方误差准则。而对概率密度估计问题,学习的目的是根据训练 样本确定x 的概率密度。将估计的密度函数记为p g ,w ) ,则损失函数可以定义为 工( p g ,w ) ) 一一l o g p ( x ,w ) ( 2 8 ) 在上面的问题表述中,学习的目标在于使期望风险最小化,但是由于我们可 以利用的信息只有样本式( 2 4 ) ,式( 2 5 ) 的期望风险无法计算,因此传统的学 习方法中采用了所谓经验风险最小化( e r m ) 准则,即用样本定义经验风险 基于动态基的三维表面纹理分类及光照方向判断 r 婶似) - 芝( y ;,厂k ,w ” ( 2 9 ) 作为对式( 2 5 ) 式的估计,设计学习算法使它最小化。对损失函数式( 2 6 ) ,经 验风险就是训练样本错误率;对式( 2 7 ) 式的损失函数,经验风险就是平方训 练误差;而采用式( 2 8 ) 式损失函数的e r m 准则就等价于最大似然方法。 由此可看出,有限样本情况下,经验风险最小并不一定意味着期望风险最小; 学习机器的复杂性不但与所研究的系统有关,而且要和有限数目的样本相适应。 我们需要一种能够在小样本情况下建立有效的学习和推广方法的理论。 2 4 模式识别 模式识别【1 2 】是上世纪6 0 年代发展起来的- - f - j 新兴学科,其研究目的是为 使计算机能够自动地完成对事物的辨别分类。在过去的几十年里,该学科理论获 得了长足的发展,形成了统计模式识别和句法模式识别等重要分支。随着理论的 日臻完善,模式识别应用也得到了广泛而深入的拓展。由最初的光学字符识别, 扩展到如今的工业产品分拣、医学图像诊断、语音识别、信息检索、数据挖掘、 图像理解和信号处理等领域。 模式在通常意义下讲,就是通过对具体的个别事物进行观测所得到的具有时 间和空间分布的信息,而模式所属的类别或同一类中模式的总体则称为模式类。 模式识别就是根据观测到的时间和空间分布的信息,将具体的个别事物划分到正 确的模式类当中去。 统计模式识别逐步形成了较为完善的理论体系,尤其是统计学习理论【1 3 】的 出现,开创了有限样本情况下模式识别研究的新途径。与此相对应的模式识别系 统都有两个过程所组成:设计和实现。设计是指用一定数量的样本,即通常的训 练样本,进行分类器的设计。实现是指用所设计的分类器对待识别样本进行分类。 统计判决中,在一些分类识别的准则下严格地按照概率统计理论导出各种判决规 则,这些判决规则可以产生某种意义上的最优分类识别结果,这些判决规则要用 到各类概率密度函数、先验概率或后验概率。这可以通过训练样本对未知概率密 度函数中的参数进行估计,或对未知的概率密度函数等进行逼近而估计它们。 基于统计的模式识别系统主要有四个组成部分,如图2 - 1 所示: 9 基于动态基的三维表面纹理分类及光照方向判断 图2 - 1 模式分类的主要步骤 在这四个部分中,特征提取和选择及分类决策是模式分类的重点及难点,是 问题最突出的关键部分。 2 4 1 特征提取和选择 目前,获取图像特征需要经历两个过程:特征提取和特征选择。它们的根本 任务就是如何从许多特征中找出最有效的特征来区分不同的类别。 一般来说,图像特征的提取可以大体上分为以下几种: 图像的视觉特征:例如图像的边缘、轮廓、形状、纹理和区域等。它们的物 理意义明确,提取比较容易。 图像的统计特征:例如灰度直方图特征、矩特征,其中矩特征包括均值、方 差、及熵特征等。 变换系数特征:对图像进行各种数学变换,如傅立叶变换、离散余弦变换、 小波变换等,可以将变换后的系数作为图像的一种特征。 从一组特征中挑选出一些最有效的特征,以达到降低特征空间维数的目的, 这个过程叫做特征选择。在统计模式识别中,一个模式对象由一组特征构成的样 本向量表示。对于一个以训练样本向量学习为基础的分类算法,其计算复杂度显 然要受到样本特征维数及样本数量的影响。通常特征维数越高,样本个数越多, 算法的计算复杂度越高,执行速度也越慢。目前,现有的分类算法大多适用于处 理低维、小训练集问题,若直接利用它们分析处理高维和海量数据,则往往由于 计算时间和存储空间等客观条件的限制而陷于困难。而且,在实际应用中,人们 还发现当特征的个数增加到某一个临界点后,继续增加反而会导致分类器性能变 差。 特征选择的方法 1 4 2 3 1 主要有主成分分析( p c a ) 、线性s g 舅j , j 分析( u ) a ) 、独 1 0 基于动态基的三维表面纹理分类及光照方向判断 立分量分析、因子分析、典型相关分析和非负矩阵分解等。最近还发展了流形学 习,如投影法、生成式模型、正则主流形、谱方法、拉普拉斯特征映射和互信息 等。 2 4 2 分类器 模式识别系统中,分类决策的作用是建立决策规则,实现对被测试对象的判 别分类。其基本做法是在训练样本集基础上确定某个判决规则,使得按照这种判 决规则对被测试对象进行分类所造成的错误识别率最小或引起的损失最小。 至今已提出了多种分类器【4 】【6 】 4 1 】设计思想,主要有决策树、关联规则、神 经网络、贝叶斯、遗传算法、粗糙集以及模糊逻辑技术等。大部分技术都是使用 学习算法确定分类模型,拟合输入数据中样本类别和属性集之间的联系,进而预 测未知样本的类别。其中,图像处理领域主要采用以下几种方法: ( 1 ) 贝叶斯决策论 贝叶斯分类是统计学分类方法,它是利用概率统计知识进行分类的算法。朴 素贝叶斯算法是贝叶斯分类算法中的经典,它是一种简单而高效的分类算法。但 是它的属性独立性假设使其无法表示现实世界属性之间的依赖关系,影响了它的 分类性能,后来很多研究者利用一些技术,将朴素贝叶斯加以改进并研究出新的 贝叶斯算法模型。 贝叶斯决策理论【1 2 】【1 5 】是主观贝叶斯派归纳理论的重要组成部分,它的基 本思想非常简单。为了最小化风险,总是选择那些能够最小化条件风险的行为, 尤其是为了最小化分类问题中的误差概率,总是选择那些使后验概率最大的类 别。贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后 用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决 策。 人们最初可以根据主观猜测来确定世界状态的概率分布,但是,随着对于世 界状态的客观知识的增加,人们应根据这些新知识并借助贝叶斯概率公式不断地 修正主观概率,以使主观概率逐渐地转化为客观概率,从而使人们的决策更为可 靠。概括起来即: 1 、己知条件概率密度参数表达式和先验概率。 基于动态基的三维表面纹理分类及光照方向判断 2 、利用贝叶斯公式转换成后验概率。 3 、根据后验概率大小进行决策分类。 贝叶斯决策理论方法是统计模式识别中的一个基本方法。贝叶斯决策判断依 据既考虑了各类参考总体出现的概率大小,又考虑了因误判造成的损失大小,判 别能力较强。 ( 2 ) 人工神经网络 人工神经网络 1 6 ( a r t i f i c i a ln e u r a ln e t w o r k ) 是2 0 世纪8 0 年代后期迅速发展 起来的人工智能技术。它对噪声数据具有高的承受能力,对未经训练的数据具有 分类的能力。在结构上,神经网络是由大量简单的基本单元神经元( n e u r o n ) 相互连接而构成的非线性动态系统,每个神经网元结构和功能比较简单,而由其 组成的系统却可以非常复杂,具有生物神经网络的某些特性,在自学习、自组织、 联想及容错等方面具有较强的能力,能用于联想、识别和决策。与统计方法相比, 具有几个明显的优势:( 1 ) 神经网络具有很强的自适应学习能力:( 2 ) 具有并行 分布式信息存储与处理能力,识别速度快;( 3 ) 可以把识别过程和若干预处理融 为一体进行。神经网络的特性和能力主要取决于网络拓扑结构及学习方法,前向 多层感知器是最为常见和应用广泛的网络模型。 人工神经网络分类算法的重点是构造闭值逻辑单元,一个闭值逻辑单元是一 个对象,它可以输入一组加权系数的量,对它们进行求和,如果达到或者超过了 某个闭值则输出相关值。神经网络是基于经验风险最小化原则的学习算法,人工 神经网络有一些固有的缺陷,比如层数和神经元个数难以确定,容易陷入局部极 小,还有过学习现象等等。 ( 3 ) 聚类: 所谓聚类,是对数据集中的数据应用某种方法进行分组,使得每组内部的数 据尽可能相似而不同组之间的数据尽可能不同,即“物以类聚,从而发现数据 集内在的结构。 从机器学习的观点来看,聚类是一种无监督的学习,因为它没有关于分类的 先验知识,这也是聚类与分类的根本不同。分类问题中我们知道训练集的分类属 性,而聚类问题则需要我们从数据集中找这个分类属性。 聚类分析【1 7 】就是在没有任何可供学习的样本情况下,将对象集自动分组的 基于动态基的三维表面纹理分类及光照方向判断 一种分析方法。聚类分析在探测型数据分析领域中是一个重要的技术,它被广泛 应用在工程和科学研究领域中。聚类分析通过提取潜在的结构将对象组织成类或 簇( c l u s t e r ) 。 聚类分析的核心是聚类,使得同一簇内的对象相似,而不同簇间的对象相异。 聚类的输入是己经表示成多维特征向量的对象集或对象矩阵。聚类与分类的不同 之处在于:在进行分类学习前,必须有己经标好类标签的对象集,分类在此对象 集上进行学习得到类的概念后再对新的数据进行分类;而聚类在一个完全陌生的 对象集上运行,它没有已经分好类的对象集来供它学习。所以聚类是一种非监督 式学习,而分类是监督式学习。 实际应用中,聚类分析在科学数据探测、图像处理、模式识别、计算生物学、 文档检索等领域起着非常重要的作用,它己经成为当前数据挖掘领域中一个非常 活跃的研究课题。同时,聚类分析作为数据挖掘中的一个模块,它既可以用作独 立的数据挖掘工具,来获得数据分布的情况,观察每个簇的特点,集中对特定的 某些簇做进一步的分析,也可以作为其它数据挖掘算法( 如特征和分类等) 的预 处理步骤。 下面给出聚类分析的数学模型【18 】 在数据空间4 中,数据集x 由数据对象毛i i “。,五2 ,) 彳,i - l 2 , 组成,毛的每个属性或特征毛,既可以是数值型的,也可以是枚举型的。数据 集x 相当于是一个宰d 矩阵。聚类分析就是分析数据集x 中的个样本所对应 的数据空间距离及分散情况,按照各样本间的距离远近关系把而,x 2 ,h 划分成 k 个不相交的模式子集c _ ,m - l 2 , k ,1 七sn 。也可能有些对象不属于任何一 个分割,这些就是孤立点。所有这些分割与孤立点的并集就是数据集z ,并 且这些分割之间没有交集,可以用下列条件表示: x - q u c zu u qu c 0 ,其中qn q1 垂 ( 2 1 0 ) 根据我们所查阅的文献资料,目前对二维纹理的相关研究比较广泛,相关技 术也较为成熟;而三维表面纹理的研究较少,尤其是光照方向方面的工作更少有 文献所查,故本文的研究具有很强的前沿性新颖性。 基于动态基的三维衰面垃理分类及光愚方自判断 3 三维表面纹理表示 现实世界中,同一纹理在不同的光照角度下表现出来的特征是不同的,与用 单幅图像表示的二维纹理不同,现实生活中的各种表面,如纺织布料、墙纸、岩 石、各种台面等表面从细微结构上看并非是绝对平坦的,具有三维几何特征,这 些三维表面在来自不同方向的光照条件及不同的观测角度下呈现出不同的图像 ( 图3 1 ) ,因此对于三维表面纹理,二维纹理合成技术无法提供其他光照角度和 视觉角度下所需要的表现信息,这就无法实现虚拟现实中的现实表现,因此对于 三维表面纹理合成的研究也就有其必要性和重要性。 嘲雠 图3 - 1 同一纹理在不同光照方向下的图像 图3 - 2 三维表面纹理高度圈 1 9 】 基于动态基的三维表面纹理分类及光照方向判断 对三维表面纹理进行描述要比二维纹理复杂得多,由此也造成了三维表面纹 理分类比二维的情形更为复杂。三维表面纹理分类研究的目的正是研究出一种能 够分辨出三维表面纹理的类别以及能够判断其光照的角度的算法。分类的结果应 该具有较高的准确率和较快的计算速度。 3 1 朗伯模型和光度立体 我们可以用朗伯模型来描述物体的三维高度: 在一幅图像一个象素的位置上,朗伯反射公式表示为: f o ,) ,) - a a n f ( 3 1 ) 其中,f 似y ) 表示坐标为 ,) ,) 的像素点的亮度,或灰度 a 是一个附加亮度信息 口是根据朗伯模型得到的反照率值 以是点 ,) ,) 处的单位表面法向量,即 刀毗) r - ( - + p 覆,万- 雨q ,南r ( 3 2 ) 这其中p 和日是表面高度图关于x 和y 的偏导数,即 p ,) ,) _ o s ( x , y ) ,鼋 ,) ,) _ a s ( x , y ) ( 3 3 ) 魄咖 而s o ,) ,) 就是表面高度函数。 z 是点 ,y ) 处的单位光照向量,即 z 一( 乞,乞,) r = ( c o s t - s i n a ,s i n z :s i n a ,c o s o f 在这里,仃是光源的翘角s l a n t ,而f 是倾斜角m t 。 由于假设附加的亮度a 信息是一个常量,因此完全可以将它合并在反照率 口。为避免混淆,我们用p 来表示这两个量的乘积a 口。这样图像数据可以表示 为 ,a n l ( 3 4 ) 1 6 基于动态基的三维表面纹理分类及光照方向判断 其中, a p l 0 p z 0 p m 就是表面的反照率矩阵( a l b c d om a t r i x ) ; 一( 一,咒2 ,l 一) r 一 ,n , 刀l , 厅k 厅2 暑 刀2 , 以2 0 n 眦忍聊以w ( 3 5 ) q ,乞,乙,。【l 三;三;兰】 c 3 6 , 我们进一步定义一个新的矩阵l 来表示表面法向量矩阵和反照率矩阵的 虬- a n ( 3 7 ) 那么这个矩阵中包含了一系列的“比例法向量 【2 0 。 i 一4 工 ( 3 8 ) 3 2 三维表面纹理数据获取 3 1 节中介绍的朗伯模型是最常用三维纹理建模方法之一,本文的实验中, 我们采用了另外一种三维表面纹理表示方法,将同一纹理的各个光照角度的样本 图像集中在一块,构成一种纹理的样品集合,这样便能够大体上模拟出具有真实 高度的三维表面纹理。通过实验证明,这种方法是行之有效的,它可以不依赖于 一个具体的模型,既大大的减少了计算量,又能够满足实验中的要求。图3 3 和 图3 4 分别为p r o t c x 5 0 数据库中a a b 和a a f 的样本集的示例,它们涵盖了翘角 s l a n t 和倾斜角t i l t 的每个角度。 1 7 基于动吝基的三维衰纹分类盈光照方向判断 图3 _ 4 纹理a a f 的样本集 基于动态基的三维表面纹理分类及光照方向判断 4 基于s v m 和a d a b o o s t 的三维表面纹理分类 第三章中我们介绍了三维表面纹理图像获取的方法和手段,本章将讨论一种 特征提取的方法,小波包分解法( w a v e l e t p a c k e t ) 及算法的实现,基于这种特 征提取方法,我们设计了两种分类器进行三维表面纹理的分类i 分别为支持向量 机( s ) 和a d a b o o s t 。 4 1 基于小波包分解的特征提取 纹理特征的选取和特征值的计算是影响分类算法性能和准确性的两个重要 方面,通过研究发现,经过小波包变换所提取的特征能够很好的反映出纹理样本 的某些细节特征,能够很好的区分出不同的纹理类别。 4 1 1 小波变换 小波变换的基本思想是将原始信号通过伸缩和平移后,分解为一系列具有不 同空间分辨率和不同频率特性和方向特性的子带信号。这些子带信号具有良好的 时域、频域等局部特征。这些特征可用来表示原始信号的局部特征,进而实现对 信号时间和频率的局部化分析,从而克服了傅立叶分析在处理非平稳信号和复杂 图像时所存在的局限性。小波变换提出了变化的时间窗,当需要精确的低频信息 时,采用长的时间窗,当需要精确的高频信息时,采用短的时间窗。小波变换用 的不是时间一频率域,而是时间尺度域。尺度越大,采用越大的时间窗,尺度越 小,采用越短的时间窗,即尺度与频率成反比。它提供的“自适应变化一的时频 窗结构,推动了时频分析方法的不断深入发展。 对连续小波变换的认识要首先从母小波开始。选定一个母小波以后,通过伸 缩和平移变换处理,派生出一系列的小波基函数,将小波基函数作用于待分析信 号,就形成了小波分析或小波变换。这就是小波分析的基本流程。 母小波也成为基本小波或小波母函数,伸缩和平移产生的小波成为子小波或 者小波基函数。定义如下: 设妒o ) r 僻) ,其傅立叶变换为妒( 刃,如果妒( ) 满足允许条件( 完全重 1 9 基于动态基的三维表面纹理分类及光照方向判断 构条件或恒等分辨条件) q 一攒抓 1 ) 那么妒o ) 为一个基本小波或母小波。将母函数妒( f ) 经伸缩和平移后得 删。硝1 学啪戢删 他2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论