




已阅读5页,还剩107页未读, 继续免费阅读
(光学工程专业论文)独立成份分析及在视觉图像处理中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘 要 一幅图像加上 ( 减去) 不同灰度值后的图像集分布在同一条直线上。另外,照 明变化下某一对象同一姿势的人脸图像集在归一化的 任意 3维独立成份子空间 中分布也有一定的规律, 尤其是在照明 角度不太大 ( 4 5度)时, 这些图像和 照明变化下的其它物体的图像是可以分开的。 再次,本文对图像中的人眼注视的识别作了研究。 人眼注视可直接用作非 接触人机交互的控制信号, 也可以 作为判断语音和手势是否有意的辅助信号从 而消除噪声和无意手势的 干扰。 人眼注视探测技术的重点和难点 在于判断眼球 在眼窝里的位置。 现有的 对人眼注视方向的研究大多数工作集中 在利用各种辅 助装置 ( 例如:红外照明、可变焦摄像机或者多台摄像机等)测量人眼的注视 方向, 它们与人眼对注视的探知方式还相差较远。 本文对数据库( 8 个人共 1 2 1 6 幅图 像, 其中每人的注视和不注视 样本分别为2 4 和1 2 8 个)中 某一个人的1 5 2 幅眼睛图像进行独立成份分析后, 研究其注视角度和独立成份组合系数的关系。 发现其中有些独立基能够很容易地反映出此人的注视与否。另外,我们把其他 人的眼睛图像投影到这些独立成份基上并利用支持向量机进行注视与否的判 断, 发现利用很少维数 ( 6 维) 的 输入就能得到很高的识别率 ( 9 6 %强) 。其中, 我们发现有些独立基比其它的独立基更能反映注视与否,这些独立基被认为是 与人眼对注视的探知方式有相似之处。 最后,本文研究了特殊分类问 题下的支持向量机的算法优化.对于一些特 殊情况下的分类问题,例如在注视响应的自动控制系统中,我们宁愿机器对我 们的一些模糊动作不响应,但决不能对一些无意识动作进行响应。但是传统的 支持向量机算法并没有考虑两类样本分类时的期望正确概率可能是不同的,也 就是说它默认两类样本是同等概率时的分类,因而某些实际问 题中具有一定的 局限性。为了克服上述缺点,我们做了一个对支持向量机学习算法的推广,可 以改变约束条件的值从而改变最优分类面的位置,最终得到了 一个可变分类面 的支持向量机,很大限 度的避免了 某一类 ( 重要) 样本出 现错误的概率。 关键词:独立成分分析 照明变化 注视探测 支持向 量机 ab s t r a c t ab s t r a c t t o e x p l o re a n i m a g e p r o c e s s i n g a p p r o a c h t h a t c l o s e t o h u m a n v i s u a l m e c h a n i s m i s t h e d i r e c t i o n a n d a i m o f i n t e l l i g e n t im a g e p r o c e s s i n g . a re v e l a t o ry w o r k o f p r o c e s s i n g m o d e o f m a m m a l s e y e s i s t h a t : b y u s in g i n d e p e n d e n t c o m p o n e n t a n a l y s i s ( i c a ) b a s e d o n m a x i m i z e d e n t r o p y o u t p u t , t h e f a m o u s w o r k b a s o , w h i c h i s n a m e d a f t e r b e l l , s e j n o w s k i , a m e r i a n d o j a , s u c c e s s f u l l y r e c u r r e d t h e p s e u d 。 一 。 r th o g o n a l a n d o r i e n t e d e d g e m a p f o u n d b y h u b e l a n d wi e s e l i n c a t s v i s i o n , w h i c h w o n t h e 1 9 6 5 s b i o l o g y n o b e l p r i z e . t h i s w o r k , w h i c h i s t h o u g h t t o b e t h e g r e a t e s t s u c c e s s o f t h e l a t t e r - d a y a r t i fi c i a l n e u r a l n e t w o r k , m a k e s u s p o n d e r t h e r e l a t i o n s h i p o f i c a a n d t h e i m a g e p r o c e s s i n g m e c h a n i s m i n h u m a n e y e s . i c a i s a h i g h - o r d e r s ta t i s t i c a l m e t h o d , a n d t h e b a s e s e x t r a c t e d b y i t h a v e t h e s i m i l a r i t y o f p r i m a t e s p s e u d o - o r t h o g o n a l , s p a r s e a n d o r i e n t e d g a b o r fi l t e r , w h i c h h a s t h e f u n c t i o n o f e x t r u d in g e d g e s a n d g e tt i n g r i d o f u n re l a t e d i n f o r m a t i o n . t h e a i m o f o u r t h e s i s i s t o u s e i c a u p o n i m a g e s a s a p r e - f i l t e r s o a s t o re s o l v e p r o b l e m s o f i d e n t i f y i n g h u m a n f a c e u n d e r v a ry i n g i l l u m i n a t i o n a n d d e t e c t in g g a z e o r n o t fr o m a n e y e i m a g e w i t h a l o w r e s o l v i n g p o w e r . f i r s t l y , i c a w a s c a r r i e d u p o n i m a g e s u n d e r v a ryi n g i l l u m i n a t i o n a n d o n e u n i q u e i c a b a s i s w a s d i s c u s s e d . t h e r e l a t i o n s h i p o f t h i s b a s i s a n d t h e m e a n i m a g e g r e y v a l u e h a s b e e n i n v e s t i g a t e 氏a n d t h e re s u lt h a s s h o w e d t h a t t h e y h a v e a f in e l i n e a r c o r r e l a t i o n . t o f u r t h e r i n v e s t i g a t e t h e i c a b a s i s , t h e c o n c e p t i o n o f i c a i n p r i n c i p a l c o m p o n e n t a n a l y s i s ( p c a ) re s i d u a l s u b s p a c e a l g o r it h m w a s i n t r o d u c e d . b y u s i n g t h i s a l g o r i t h m , w e f o u n d t h a t t h i s b a s i s c o u l d b e r e p r e s e n t e d a s a l i n e a r c o m b i n a t i o n o f t h e i l l u m i n a t i o n b a s i s , w h i c h i s e x t r a c t e d fr o m e a c h p c a n d r e p r e s e n t s t h e i l l u m i n a t i o n d i r e c t i o n . a s t h e re s u l t , w e c a n d r a w a c o n c l u s i o n t h a t t h i s b a s i s re p re s e n t s t h e i l l u m i n a t i o n c h a n g e s . a c c o r d i n g t o t h i s , w e c a n e a s i l y e x p l a i n t h e r o b u s t re c o g n i t i o n u n d e r v a r y i n g i l l u m i n a t i o n i n i c a re s i d u al s u b s p a c e . mo r e o v e r , t h e il l u m i n a t i o n b a s i s w a s u s e d t o l i n e a r l y r e p r e s e n t t h e i l l u m i n a t i o n v a r i a t i o n in t h e i m a g e s , a n d t h e r e s u lt s h o w s t h a t a t le a s t a 1 5 - d i l l u m i n a t i o n b a s i s i s n e e d e d . i i i ab s t r a c t t h i s i s q u i t e d i ff e re n t fr o m i n v o l v e d f o r m e r w o r k s . s e c o n d l y , f a c e i m a g e s u n d e r v a ry i n g i ll u m in a t i o n h a v e b e e n i n v e s t i g a t e d . f a c e r e c o g n i t i o n h a s i m p o r ta n t a p p l ic a t i o n s i n t h e a r e a s a s h u m a n - m a c h i n e i n t e r a c t i o n a n d in f o r m a t i o n s e c u r it y , a n d t h e m o s t w i d e l y u s e d a p p r o a c h e s a r e b a s e d o n a p p e a r a n c e m o d e l . b u t t h e s e a p p r o a c h e s a r e a lm o s t a ll s e n s i t i v e t o i ll u m i n a t i o n v a r i a t i o n a l t h o u g h t h e t e c h n i q u e o f r e s i d u a l s u b s p a c e c a n p a rt i a l l y e l i m i n a t e t h e e ff e c t o f i l l u m i n a t i o n , t h e i ll u m i n a t i o n s ti l l e x i s t s i n t h e w h o l e s u b s p a c e . i n t h i s t h e s i s , i m a g e s o f t h e s a m e o b j e c t w i th t h e s a m e p o s e h a v e b e e n i n v e s ti g a t e d u n d e r g e n e r a l i z e d 3 d i c a s u b s p a c e . t h e i m a g e s o r i g i n a t e d fr o m t h e s a m e i m a g e b u t m u l t i p l i e d b y d i ff e r e n t c o e f fi c i e n t s w e r e f o u n d t o b e l o c a t e d a t t h e s a m e p o i n t . t h e i m a g e s o r i g i n a t e d fr o m t h e s a m e i m a g e b u t a d d e d o r s u b t r a c t e d b y d i ff e r e n t g r a y v a l u e s w e re f o u n d t o b e l o c a t e d a l o n g a d e t e r m i n e d s t r a i 咖 l i n e . m o r e o v e r , t h e i m a g e s t h a t o r i g i n a t e d fr o m t h e s a m e o b j e c t w i t h t h e s a m e p o s e b u t u n d e r v a ry i n g i l l u m i n a t i o n d i r e c t i o n s w e re a l s o f o u n d t o h a v e a re s t r i c t iv e d i s t r i b u t i o n e s p e c i a l l y , u n d e r t h e i l l u m in a t i o n a n g l e t h a t i s n o l a r g e r t h a n 4 5 d e g r e e s t h e i m a g e s a r e s e p a r a b l e t o i m a g e s o f o t h e r o b j e c t s u n d e r v a ry i n g i l l u m i n a t i o n . t h i r d l y , g a z e o r n o t i n t h e e y e i m a g e s h a s b e e n i n v e s t i g a t e d . e y e - g a z e c a n b e d i r e c t l y u s e d a s a c o n tr o l s i g n a l t o a t o u c h - fr e e h u m a n - m a c h i n e in t e r a c t i o n a n d a l s o s e r v e d a s a n a s s i s t a n t t o h e l p j u d g i n g t h e i n t e n t i o n o f v o i c e o r g e s t u r e s i g n a l s s o a s t o a v o i d t h e i n t e r f e r e n c e o f u n c o n s c i o u s n e s s . t h e d i ff i c u lt y o f e y e g a z e d e t e c t i o n i s t o j u d g e t h e l o c a t i o n o f e y e b a l l in t h e e y e s o c k e t , a n d m o s t o f t h e f o r m e r w o r k s w e r e f o c u s o n u s i n g v a ry i n g a s s i s t a n t a p p a r a t u s , i .e . i n f r a r e d l i g h t , f o c u s a d j u s t a b l e l e n s , a n d s o o n , t o m e a s u r e t h e d i re c t i o n o f e y e - g a z e . u n f o r tu n a t e l y , t h e s e m e t h o d s a r e f a r fr o m t h e d e t e c t i n g m o d e o f h u m a n e y e s . i n t h i s t h e s i s , w e c a r r i e d o n i c a o n 1 5 2 i m a g e s o f o n e p e r s o n fr o m o u r d a t a b a s e , w h i c h i s c o m p o s e d w i t h 8 o b j e c t s a n d e a c h h a s 2 4 g a z e a n d 1 2 8 u n - g a z e s a m p l e i m a g e s , a n d a n a l y z e d t h e re l a t i o n s h i p b e t w e e n t h e g a z e a n g l e s a n d c o m b i n a t io n c o e f f i c i e n t s . f r o m t h e a n a ly s i s w e c a n e a s i l y j u d g e t h e e y e g a z e fr o m c e r ta i n i c s . m o re o v e r , t h e s e i c s a r e u s e d t o j u d g e t h e e y e - g a z e fr o m im a g e s o f t h e o t h e r p e o p l e c o m b i n e d w i t h s u p p o rt v e c t o r m a c h i n e ( s v m ) . a h i g h r e c o g n i t i o n r a t e a s 9 6 .0 5 % h a s b e e n a c h i e v e d b y u s i n g 帅u t s a s f e w a s 6 d . i n t h e e x p e r i m e n t , s o m e i c b a s e s a r e f o u n d t o re fl e c t t h e g a z e - o r - n o t e a s i e r t h a n t h e i v ab s tr a c t o t h e r s , a n d t h e y a r e b e li e v e d b y u s t o h a v e s i m i l a r i t y w i t h t h e g a z e d e t e c t i o n m o d e o f h u m a n e y e s . f i n a l l y , t h e o p t i m i z e d a l g o r i t h m o f s v m u n d e r s p e c i a l c l a s s i f y i n g c a s e s h a s b e e n d i s c u s s e d . i n a s y s t e m l i k e g a z e - r e s p o n s e c o n t r o l , t h e s y s t e m i s w i s h e d t o b e s t o o d s t i l l i f a b l u r r e d s i g n a l i s d e t e c t e d . t h a t i s t o s a y i t m u s tn t re s p o n s e u p o n a n y u n c o n s c i o u s a c t i o n . b u t u n f o r t u n a t e l y , t h e t r a d i t i o n a l s v m a l g o r i t h m h a s n o t t a k e n t h e v a ry i n g e x p e c t i n g c o r r e c t n e s s i n t o a c c o u n t . i n o t h e r w o r d , i t d e f a u l t s t h e s a m e e x p e c t in g c o r r e c t n e s s o f t w o c l a s s e s o f s a m p l e s . s o , t o o v e r c o m e t h e s h o r t c o m i n g s m e n t i o n e d a b o v e , w e h a v e e x t e n d e d t h e a l g o r it h m o f s v m. c o n c r e t e l y , w e h a v e f o u n d a w a y t o c h a n g e t h e v a l u e o f r e s t r i c t i o n s o a s t o c h a n g e t h e l o c a t i o n o f th e o p t i m i z e d c l a s s if y i n g p la n e . a s a r e s u l t , w e h a v e a c h i e v e d a p l a n e - a l t e r a b l e s v m , w h i c h c a n a v o i d t h e m i s c l a s s i f i e d p r o b a b i l i t y o f i m p o r ta n t s a m p l e s i n a g r e a t e x t e n d . k e y w o r d s : i n d e p e n d e n t c o m p o n e n t a n a l y s i s , s u p p o r t v e c t o r m a c h i n e v a r i a t i o n , g a z e d e t e c t i o n , 南开大学学位论文版权使用授权书 本人完全了 解南开大学关于收集、保存、 使用学位论文的规定, 同意如下各项内容: 按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学 位论文的印 刷本和电 子版,并采用影印、缩印、 扫描、 数字化或其它手段保存论文; 学校有权提供目 录检索以 及提供 本学位论文全文或 者部分的阅览服务; 学校有权 按有关规定向国家有 关部门或者机构送交论文的复印 件和电 子版; 在不以赢利为目 的的 前 提下,学校可以 适当复制论文的部分或全部内 容用于学术活动。 学位论文作者签名 乡 曰 年 怀 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: t 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 内部 5 年 最长h 年,可少于5 年) 秘密1 0 年 机密*2 0 年 ( 最长 1 0年,可少于l u 年) ( 最长 2 0年,可少于 2 0 年) 南开大学学位论文原创性声明 本人郑重声明: 所呈交的学位论文, 是本人在导师指导下, 进行 研究工作 所取得的成果。 除文中己 经注明引 用的内容外, 本学位论文 的研究成果不包含任何他人创作的、 已公开发表或者没有公开发表的 作品的内 容。 对本论文所涉及的 研究工作做出贡献的其他个人和集 体, 均己 在文中以明确方式标明。 本学位论文原创性声明 的法律责任 由 本人承担。 学 位 论 文 作 者 签 名 : 毖 扮 沙 年午 月 z 6 i 日 第一章 引言 第一章 引言 第一节 研究背景 探索接近视觉机制的图像处理方法是智能图像处理的发展方向和研究目 标。人眼对人脸的定位和识别是很特殊的:人眼能极其快速地找到并识别人脸, 即使在很大的照明变化下也很少出错。然而,这对于计算机图像处理来说却是 一件很困难的事情。对于人眼注视的识别也有相似的问题:尽管大脑信息处理 的单元速度和计算机相比很慢,但视觉对注视与否的探知却可以在一瞥之间完 成,并且具有几乎无限的泛化能力。机器学习能否像人眼一样对人脸及注视有 接近或同样好的识别及泛化能力呢? 对于哺乳动物眼睛的图像处理方式,一个启发性的工作是上个世纪末国际 上几 个 研究 小组 ( 代表人物b e l l , s e j n o w s k i , a m e ri 和o j a ) 采 用神经网 络 最大输 出 嫡的 独立 成分 分析方法, 成功 地重现了h u b e l 和 w i e s e l 6 2 1 在猫 眼视 觉中 用实 验发现的伪正交的和有方向的边缘图 ( 该发现获得了 1 9 “ 年的生物学诺贝尔 奖) 。 这个 工 作被 认为是近 代人工神经网 络理 论 上最大的 成功 ; 1 , 它启 发 我们联 想到独立成份分析和人眼对图像处理机制可能具有某种联系。可以设想:如果 采用独立成份分析作为图像预处理的方法,那么对于照明变化情况下的 人脸识 别以 及人眼注视方向的识别可能会得到更好的识别效果和泛化能力。下 面,对 若干相关的研究领域作一个简单的综述。 1 . 1 . 1人脸识别 人脸识别有很多重要的应用,如罪犯鉴定、信用卡确认、保安系统和场景 监视等。随 着人们在人机交互和公共安全等方面要求的提高,人脸识别的作用 日 趋重要。 近几年来,人脸识别的研究和 报道显著增加,大致可以分为以 下几 类: ( 1 ) 、 基于 知识的方法 ( k n o w l e d g e - b a s e d m e t h o d ) 第一章 引言 它 将典 型的 人脸形成 规 则 库 对人脸 进行编码 1 4 1 。 通 常, 通过面 部 特征之间 的关系进行人脸定位。基于知识的方法是基于规则的人脸检测方法,规则来源 于研究者关于人脸的先验知识。一般比较容易提出简单的规则来描述人脸特征 和它们的 相互关系,如在一幅图像中出现的人脸,通常具有互相对称的两只眼 睛、一个鼻子和一张嘴。 特征之间的相互关系可以通过它们的相对距离和位置 来描述。在输入图像中首先提取面部特征,确定基于编码规则的人脸候选区域。 这种方法存在的问题是很难将人类知识转换为明确定义的规则。如果规则过于 详细 ( 严格),有时会由 于不能通过所有的规则检测而检测失败;如果规则太 概括 ( 通用),可能会有较高的错误接收率。此外,很难将这种方法扩展到在 不同的 位姿下检测人脸,因为列举所有的情况是一项很困 难的工作。 ( 2 ) 、 特 征 不 变 方 法( f e a t u re in v a r ia n t a p p r o a c h ) 该算法的目的是在姿态、视角或光照条件改变的情况下找到存在的结构特 征,然后使用这些特征确定人脸。基于特征的方法不仅可以 依据己 有的面部特 征而且可以依据它们的几何关系进行人脸检测。与基于知识的方法相反,它是 寻找人脸的不变特征用于人脸检测。人们已经提出了许多先检测人脸面部特征, 然后推断人脸是否存在的方法。一般利用边缘检测器提取面部特征,如眉毛、 眼睛、鼻子、嘴和发际等,然后根据所提取的特征,建立统计模型描述特征之 间的 关 系 并 确定人脸的 存 在 s -a 。 人 脸的 肤色也被作为 一 个 很 重 要 稳 定 的 人脸 特 征9 - 1 0 。 基于特征的算法存在的问 题是,由 于光照、 噪声 和遮挡等使图 像 特征被 严重地破坏,人脸的特征边界被弱化,阴影可能引起很强的边缘,而这些边缘 可能使得算法难以使用。 ( 3 ) 、 模 板匹 配方法 ( t e m p l a te m a tc h m e t h o d ) 存储几种标准的人脸模式,用来分别描述整个人脸和面部特征:计算输入 图 像和 存 储的 模式间的 相 互关系 并 用于 检测。典型方 法的 有: s a k a i 等 人 i i 使用 眼睛、 鼻子、嘴和人脸轮廓等子模板建模,检测照片中的正面人脸。计算子图 像和轮廓模板之间的相互关系去检测人脸的候选区域,然后再用其它子模板在 候选区 域 进行匹 配。 c r a w 等 人【 1 2 1提出了 一 种基于正面 人 脸的 形 状 模板 定 位方法。 用s o b e l 滤波器提取边缘,将边缘组织在一起,根据几个约束条件去搜索存在人 脸模板的位置.在头部轮廓定位以后,用相同的过程以不同的尺度重复定位眼 睛、 眼 眉 和 嘴 唇 等 特征 。 g o v in d a r a j u 等 人 13 】提出 两 个 阶 段 的 人 脸 检 测 方 法 。 ma o 第一章 引言 等人洲提出了 用于人 脸检测的 层次 模 板匹 配方法。 ( 4 ) 、 基于外观的 方法( a p p e a r a n c e - b a s e d m e t h o d ) 基于外观方法中的 “ 模板”是从图像中的样本学习而得到的。通常,基于 外观的方法依靠统计分析或机器学习技术找到相应的人脸和非人脸图像的特 征。学习的特征由分布模型或判别函数形成,用于人脸检测.许多基于外观的 方法可以被理解为概率结构,其中典型的有基于主成份分析 ( p c a)的特征脸 ( e i g e n f a c e ) 方法 1 5 , 线 性 判 别 式( l d a ) 方法 【1 ) , f i s h e r f a c e 方 法 17 1 , 独立成 份 分 析( ic a ) 方 法 18,19 等 。 人脸识别普遍采用基于外观的方法,但这些方法几乎都对光线变化敏感。 a d i n i 等发 现2 0 : 同 一 个人脸图 像在 不同 光 线照明 下的 变 化甚 至 要 大于不同的人 脸图像之间特征的变化。因此,照明变化成为人脸识别的最大挑战之一。为了 解决照明变化下基于外观方法人脸识别的困难,已经提出了很多的解决办法。 其中 有 基于用低维线性子空间 代表 照明 变化2 1 ,2 2 而提出 的 照明 锥( i l l u m i n a t i o n c o n e ) 方 法 2 3 和 剩 余 空 间( r e s id u a l s p a c e ) 方法 2 4 ,2 5 1 。 由 特 征 脸( e i g e n f a c e ) 发 展 而 来的 脸 部细 节 子 空 间( f a c e - s p e c ifi c s u b s p a c e ) 方 法 2 6 1, 商 图 像( q u o t i e n t i m a g e ) 技 术 n , 对 称 阴 影 形 状( s y m m e t ri c a l s h a p e - fr o m - s h a d i n g ) 技 术 【2 8 1 测 地 学( g e o d e s i c ) 照明 模型 2 9 。 但这些 方法中 很多都是基 于理想 模型 , 离实际应用 还有一定的距离。 1 . 1 . 2注视探测 眼睛除了可以作为人脸识别的重要特征以外,其注视方向的 研究与应用一 直以来吸引着很多科研人员的注意。注视与否在个体之间的自 然交互中有重要 意义,它通常能够部分反映交互双方的意向。对人来说,知道他们的同伴是否 在看他或者看哪里都是很重要的。 从商业交易到求爱都极大地依赖眼睛接触, 人的注意、兴趣程度与精神状态在很大程度上可以通过观察其眼 睛推断出来。 经过漫长进化形成的人的视觉对注视和面部表情的探知能力是非常奇妙和独特 的。尽管大脑信息处理的单元速度和计算机相比很慢, 但视觉对注视与否的探 知却可以 在一瞥之间完成,并且其 泛化能力几乎是无限的。 但是,对这一机制 的研究至今仍是视觉科学的前沿课题。 第一章 引言 对注视与否的探知不但有科学意义,而且也是一个急待解决的应用课题。 现在的人机交互被限 制在利用鼠 标、 键盘、 触摸屏和控制杆等接触性器件上。 这 些器件不仅易于病菌传染, 而且长时间使用还会对人体产生不利的影响。 随着机 器人和人机交互技术的发展, 采用自 然语言和手势的非接触人机交互技术已经提 到日 程。 非接触的人机交互系统力求像人和人之间的交互那样利用语音或手势来 控制机器, 但目 前由 于自 然语言的复杂性和受到环境噪声、 无意识信号的干扰而 难以推广应用。 人眼注视探测技术的出现对解决现有的困境有很大的帮助, 它不 仅可以作为判断语音和手势是否有意的辅助信号从而消除噪声和无意手势的干 扰,而且也可直接用作非接触人 机交互的控制信号。它的研究也将为虚拟现实, 视频会议和人机界面/ 控制提供可能。 人眼注视探测的 一个重要课题是探知眼球在眼窝里的 位置。 相应的报道很多 3 0- 5 6 1应当 指出, 以 前 对人眼注 视 方向的 研究 大多 数工 作 集中 在 利 用各种辅助装 置( 例如: 红外照明、 可变焦摄像 机或者多台摄像机等) 测量人眼的 注视方向 , 而 且一般对眼睛图像质量要求很高, 可称为 “ 注视测量 ( g a z e m e a s u r e m e n t ) 。 与此 相对, “ 注视探知 ( g a z e d e t e c t i o n ) ” 是指除成像之外 不 用 其它辅 助 装置的 无接触注 视方向的判定, 其对成像分辨率 和测量精度要求较 低,且具有较好的 泛化能力。 后者更接近人眼对注视的探知方式.目 前关于注视探知的研究报道还较少, 或者 方 法上 还不 够完 善( 如 算 法的 复 杂 性、 实时性 和 泛 化 能 力 等 ) 0- i-4 3 1 . 1 . 1 . 3独立成份分析 独立成份分析( i n d e p e n d e n t c o m p o n e n t a n a l y s i s , i c a ) 首次 提出 是在8 0 年 代 早期, 并在9 0 年代中 期成功地提出 了 一些新的函 数 1 s . 尤其是 从混合信号中 发 现了个人语音波形 ( 鸡尾酒会问 题) 后, 独立成份分析变成神经网络 ( 尤其是无 监督学习) 、高级统计和信号处理的热门课题。其在生物医学信号处理,音频信 号分离, 通信, 特征提取和金融时间序列分析等方面应用研究的报道也陆续出现。 本世纪 初, 独立成份 分析被应用 到图 像处理和识别中 1 1 9 , 实 验 发 现15 7 -6 0 1 独立成 份分析在很多情况下优于经典的主成份分析 ( p r in c ip a l c o m p o n e n t a n a l y s i s p c a ) 。 独立成份分 析可以 看作 是 主 成份分析和因 素分 析 ( f a c t o r a n a l y s i s , f a ) 的延伸,但是它能够在经典方法失效的情况下找到潜在的因素。 独立成份分析是一种基于高阶统计方法,它提取的独立基如同高等动物视 第一章 引言 觉的伪正交的、稀疏的和有方向性的g a b o r 滤波器并有突出边缘信息和去除无关 信 息的 作 用。 上 世 纪 末 b e ll 和s e j n o w s k i 6 1 1等 人 用 独 立 成 份 分 析曾 成功地 重 现 了 休贝 尔 ( h u b e l) 和 威 瑟 尔 ( w ie s e l) 16 2 1 在猫 眼 视 觉中 用 实 验 发 现的 伪正交的 和 有 方向的边缘图 ( 后者获1 9 6 5 年的生物学诺贝尔奖) 。这一重大发现给我们理解视 觉机制和寻找智能图像处理方法很大启示。 第二节 本论文的工作 1 . 2 . 1主要工作内容 本文出发点是基于图像处理方法探寻人脸识别的方法,其中对人脸识别中 的照明问题以及人眼注视探知进行了着重研究。虽然己 经有很多探测注视的方 法,但是它们和人的视觉对注视探知的能力相比,仍然存在着差距。我们力图 通过独立成份分析前处理和基于统计学习理论的支持向量机( s u p p o r t v e c t o r m a c h in e , s v m ) 1 1分 类 对 低像 素 人眼图 像, 实 现高 识 别 率 和 高 的 识别推广性。 意 图在和人眼视觉的对比中,探索视觉的某些机制。与此同时,我们也对独立成 份基所代表的意义,独立成份分析对图像照明变化的削减及照明变化下的图像 在独立成份分析子空间中的分布都作了研究.另外,我们对着眼于推广性风险 最小化的支持向量机分类方法也作了研究,并对支持向量机在特殊分类问题上 的算法进行了改进和优化. 1 .2 . 1 . 1独立成份分析及独立成份基 b a r t l e tt等1 1 9 1 首先将独 立 成 份分析应用 于人脸图 像的 特征 提取并得到了 很好 的识别结果。她假设每一人脸图像是由一些基本脸线性混合而成的,并提出了 两种不同的模型:一种是图像间独立模型,另一种是像素间独立模型。这两种 模型都是以独立为核心,不过前一种模型是求图像间的独立,它求的基图像是 独立的:后一种模型则是求像素间的独立,其实是空间上的 独立。 本文基于y a l e f a c e d a t a b a s e b数据库164 1 , 利用 独 立成 份分析的图像间 独立 模型来提取人脸特征,并研究了人脸图像的独立成份基,发现其中某一个独立 成份与图像的平均灰度有线性关系。我们引入了 主成份剩余空间中的独立成份 第一章 引言 算法,研究了 这个独立成份基与照明方向的关系,发现这个独立成份基可以 用 主成份空间中 表示照明 方向 变化因素的线性叠加来表示 ( 见论文第三章) 。图像 信息和照明有密不可分的关系,这些工作深化了我们对照明因素对图像的影响 的认识。 1 .工 1 . 2人脸图 像中 照明变 化的低维子空间表示 理论上, 即 使是在 远 距 照明 下的l a m b e rt i a n 物体也 需 要无限维的 系数6 5 1 但实 验6 6 -7 2 1证明 前 几 个主 成 份的图 像形 成 一 个 稳定的 子 空间, 对于很离散的 物 体, 其几个主成份便解释了大部图像变化。 实验证明: 用很低维的子空间 ( 3 维 6 6 ,7 2 1 . 5 维6 7 或9 维 7 0 ,7 1 1 ) 就 可以 很好地表示 照明 变 化的 图 像。 用前几个主成份近似照明变化的图像是考虑它们与原始图像的方差比, 其 中并没有把主成份中的照明变化和特征区分开来。如果考虑照明变化在主成份 分析空间中的分布时,我们就不能用主成份来近似。我们可以用从主成份剩余 空间中的独立成份算法得到的表示照明方向的基来模拟图像中的照明变化,得 出了在主成份子空间要表示图 像的照明变化至少需要 巧 维以上。( 见论文第三 章第二节) 1 .2 . 1 .3照明变化下的 人脸图像在独立成份分 析子空间的 分 布 图像的照明问题一直都是图像识别的难题。对于只是强度变化的图像,虽 然是源于同一幅图像,但是其在空间的欧氏距离相差很大。为了解决照明变化 的问 题提出了 很多的 解决 办 法(2 1 -29 1 , 文献 7 3 】 中 应用了 高 维空间 概念来解决 这个 问题取得了一定的效果。 对于照明方向变化下的人脸,实验发现同一个人脸在 不同光线照明 下图像的变化甚至要大于不同的人脸图像特征间的变化。为了 解 决照明 变化下人脸 识别的 困 难提出了很多的 解决办 法2 1 -2 9 1 , 而且论文第三章也 从理论上证明了独立成份剩余空间有利于照明方向 变化的削弱,但是照明变化 在剩余独立成份子空间中还是存在,并且对识别结果还是有一定的影响. 本文中 我们利用独立 成份分析子空间 7 4 ,7 5 1 表示了 照明 变化下同一姿势 物体 的图像。在归一化独立成份的组合系数后,我们发现强 度不同但是源于同 一幅 图像的图像集在任意三维子空间中是很
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年绵阳货运上岗证考试题
- 2025年碳碳复合材料刹车片项目发展计划
- 2025年湘潭c1货运从业资格证考试题下载
- 2025年石家庄货运驾驶员从业资格证考试
- 2025年湖南货运从业资格考试题
- 神外护理培训
- 索道行业微笑服务
- 2025年超高速切削机床项目合作计划书
- 2025年功能母粒项目建议书
- 2025年游艺用品及室内游艺器材项目建议书
- 学前儿童游戏自考复习资料考纲
- 儿童抽动症的诊断与治疗
- 《村居》获奖版 教学课件
- 无菌技术操作PPT
- 周版正身图动作详解定稿201503剖析
- 第6章工厂布局设计课件
- 叉车定期检验研究分析报告
- 雷达生命探测仪培训-PPT课件
- 光缆和管道的施工规范标准
- (高清版)建筑工程裂缝防治技术规程JGJ_T 317-2014
- 陕西沉积钒矿勘查规范(1)
评论
0/150
提交评论