(物理电子学专业论文)人脸自动定位的图像视觉控制策略及其实现.pdf_第1页
(物理电子学专业论文)人脸自动定位的图像视觉控制策略及其实现.pdf_第2页
(物理电子学专业论文)人脸自动定位的图像视觉控制策略及其实现.pdf_第3页
(物理电子学专业论文)人脸自动定位的图像视觉控制策略及其实现.pdf_第4页
(物理电子学专业论文)人脸自动定位的图像视觉控制策略及其实现.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

廿凳l k l 川蛳j ? l l 【) ( : :竹地: l j 睁o 0 9 0 im 学位论 文 人脸自动定位的图像视傲 控制策略及实现 襄j 督 措拧触师她帛:于明 艇授 ;可北工业大学 巾请学他强肌j硕 士1 j 科o l p 名讯物理电子学 皓:盘提定1 圳:三蛐蔓! l l j i 一:亡符蚪【j 川i 卵! i 土:止l 俐量千巾忡: 型! 三:些盘堂 a “二- j :。 l ; 州 河北工业大学硕士学位论文 人脸自动定位的图像视觉控制策略及其实现 摘要 人脸的自动定位是应用视觉研究领域的一个重要课题。它首先需要检n 至- i j 人脸的位置 和特征点,然后采用一定的控制策略控制摄像机运动将人脸定位到图像的中心。人脸自动 定位属于人脸跟踪的范畴。在人脸识别、人机交互、智能视频通信、监视和安全以及娱乐 等领域有着广泛的应用,发展前景巨大。但是目前的人脸定位算法一般是根据人脸的信息 结合目标跟踪的方法,如帧问变化检测法、运动矢量法等,都需要利用帧问相关信息,需 要进行摄像机标定,计算量大,实现难度高。而偏移量法虽然算法简单,但精度低,拓展 性差。这些方法或算法复杂、或实用性差,都不适合人脸自动定位系统的实现。 鉴于此,同样是在结合人脸相关信息的基础上,作者提出了一种新的基于人工神经网 络的目标定位图像中心的控制策略。该方法克服了传统跟踪算法中需要利用帧问相关信息 和需要标定摄像机的缺点,只需通过目标检测程序给出目标特征点在计算机图像中的坐 标,就可直接得出摄像机水平调整量和垂直调整量,根据调整量控制摄像机运动即可将目 标自动定位在图像中心。 人脸自动定位的具体过程可以描述为:首先根据现有人脸检测的方法,提出了一种基 于k l 肤色的人脸初定位、用积分投影法和小袄度僮聚娄法确定眼球中心的人脸检测和特 征点获取的方法。该方法逐步缩小图像处理的区域,检测速度快,能够满足实时性的要求。 然后提出了一种新的基于人工神经网络反向传播算法的目标定位图像中心的控制策赂,甩 来控制摄像机快速定位人脸到图像中心区域。最后通过v c + + 编稷实现该系统。该系统主要 针对简单背景下单个静止正面人脸的定位,但是对于其它较为复杂的情况,也有很好的拓 展性。在本系统基础上加以改进,即可完成复杂情况下的人脸自动定位。 该课题在人脸定位系统中采用了传统的入脸检测和新的基于人工神经网络的目标定 位图像中心相结合的方法,利用面向对象的方法实现了系统,弗且取得了满意的效果,具 有较强的实际应用价值。 关键词:人脸定位,人脸检测,神经网络,云台控制 人脸赶动定位的翟像幌觉控制策略及其实现 v i s i o nc o n t r o ls t r d i e l g yf o 巍垂陵c ea u t o - l o c a t i o n a n ds y s t e mi m p l e m e n t a 可i o n a b s t r a c t f a c ea u t o - l o c a t i o ni so n eo ft h ei m p o r t a n ts u b j e c t so fa p p l i e dv i s i o nr e s e a r c hb e f o r e l o c a t i n gaf a c ei nt h ei m a g ec e n t e r , t h es y s t e mm u s td e t e c tt h ef a c ei o c a t i o na n dg e ti t sf e a t u r e p o i n tc o o r d i n a t e f a c ea u t o l o c a t i o nb e l o n g st ot h ec a t e g o r yo ff a c et r a c k i n g :i th a sb e e nw i d e l y u s e di nf a c er e c o g n i t i o n ,h u m a n c o m p u t e ri n t e r a c t i o n ,i n t e l l i g e n tv i d e oc o m m u n i c a t i o n , s u r v e i l l a n c ea n de n t e r t a i n m e n t u pt on o w , p o p u l a ra l g o r i t h m sa r ef r a m ec h a n g ed e t e c t i o n , m o t i o ne s t i m a t i o na n ds h i f t c o o r d i n a t e t 1 l ef i r s tt w oa l g o r i t h m sn e e dm u c hi n f o r m a t i o no f c o r r e l a t i v ef r a m e sa n dh a v eh i g hc o m p u t a t i o n a lm q u i r e m e n t sa n dt h et h i r do n eh a sp o o r p r e c i s i o n t h e r e f o r e ,a l t h o u g ht h et e c h n o l o g yi sp r o m i s i n g ,i ti sn o ta p p r o p r i a t ef o rs y s t e m i m p l e m e n t a t i o n h e r e i n t h ei d e a ,w h i c hi sb a s e do na r t i f i c i a ln e u r a ln e t w o r kf o rt h ec o n t r o ls t r a t e g yo ff a c e a u t o 1 0 c a t i o n i sp r o p o s e dn e i t h e rr e q u i r i n gt h ei n f o r m a t i o no fc o r r e l a t i v ef l a m e sn o rc a m e r a c a l i b r a t i o n ,t h i sa l g o r i t h mc a nl o c a t et h ef e a t u r ep o i n ti nt h ei m a g ec e n t e rq u i c k l y i tc a nc o m p u t e b o t ht h ev e r t i c a la n dt h eh o r i z o n t a lr o t a t i o na n g l e st h ep a n - t i l tc a m e r an e e d st oa d j u s tw h e nt h e c o o r d i n a t eo f f e a t u r ep o i n ti nt h ei m a g ei sr e q u i r e d t h ef o l l o w i n gi st h ew h o l ep r o c e s so ff a c ea u t o l o c a t i o n t ob e g i nw i t h t h ep a p e rp r e s e n t s af a c ed e t e c t i o na n df e a t u r ep o i n ta c q u i s i t i o nm e t h o d ,w h i c hi sb a s e do nk ls k i n c o l o r , i n t e g r a t i o np r o j e c t i o na n ds m a l l g r a y - l e v e l - c l u s t e r i tr e c l u c e st h ei m a g e - p r o c e s s i n gr e g i o n g r a d u a l l y , a n dh a sf a s td e t e c t i o ns p e , d s e c o n d l y , p r o p o s e sac o n t r o ls t r a t e g yb a s e d o na r t i f i c i a l n e u r a lo e t w o r kt oc e n t r e lt h ep a n - t i l tc a m e r at ol o c a t et h ef a c ei nt h ei m a g ec e n t e r f i n a l l y , t h e s y s t e mi sr e a l i z e db yv c + + p r o g r a m m i n g a l t h o u g ht h es y s t e ma i m sa taf r o n t - v i e wf a c e a u t o 1 0 c a t i o nf ns i m p l eb a c k g r o u n d i te x p a n d sw e l li no t h e rc o n d i t i o n s t r a d i t i o n a lf a c ed e t e c t i o nc o m b i n i n gw i mt h en e wc o n t r o ls t r a t e g yb a s e do na r t i f i c i a ln e u r a l n e t w o r ki sa p p l i e dt of a c ea u t o - l o c a t i o ni nt i f f sp a p e r t h es y s t e mb a s e do nt h i si d e aw o r k sf i n e a n dh a sp r a c t i c a lv a l u e k e yw o r d s :f a c el o c a t i o n ,f a c ed e t e c t i o n ,n e u r a ln e t w o r k ,p a n t i l tc o n t r o 洲北工业大学硕:l 学位论文 第一章绪论 i - i 课题的意义 迄今为止,机器视觉技术的发展已经经历了一个较为漫长的旅程。它最初只是应_ h ;j 。 二生产流水线, 简单的模拟人的视觉来执行一些繁琐、重复性的任务。经过研究者邯j 的不懈努力,今天我们已经可以利 用它实现更有效、友好、自由的人机交互界面,并且随着人脸研究的进一步发展,更可以、止计算机实现 通过观察一个人以及这个人的表情变化等做出相应的反映。近儿年电子商务的蓬勃发展对安全性提出更 高要求,这也推进了人脸研究的发展和应用,最终将促使人类进入一个全新的人机世界“。 人脸是人类视觉中的常见模式。人脸研究,主要包括人脸检测( f a c ed e t e c t i o n ) 技术和人脸识圳 ( f a c er e c o g n i t i o n ) 技术的研究。人脸检测是人脸识别的前提条件,是指对于任意一幅给定的图像,采 用一定的策略对其进行搜索以确定其中是否含有人脸,如果是则返同人脸的位置、大小和姿态。人脸识 别技术就是指使用计算机技术对人脸图像进行处理和分析,从中提取出有效的识别信息,用于“辨别” 身份的一种生物认证技术。人脸识别技术跨越了图像处理、模式识别、计算机视觉、生物学、神经生理 学和神经网络等诸多学科,是一个典型的多学科交叉的边缘应用”“。人脸识别技术应用前景广泛,在 国家安全、军事安全和公共安全领域,智能门禁、智能视频监控、公安布控、海关身份验证、司机驾照 验证等是典型的应用;在民事和经济领域各类银行管、金融卡、信用膏、储蓄卡的持卡入的身份验证 社会保险人的身份验证等具有重要的应用价值;在家庭娱乐等领域,人脸识别也具有一些有趣有黼的应 用,比如能够识别主人身份的智能玩具、家政机器人,具有真实面像的虚拟游戏玩家等等。 人脸定位则是人脸识别的个重要前提条件。对于输入的任意一幅人脸图像,人脸定位所要解决的 问题就是确定此图像中人脸所在的位置与大小,同时定位出人脸的特征点。人脸自动定协的图像视觉控 制策略就是采用摄像机对人脸图像进行实时采集,在人脸定位的基础上,控制摄像机运动将人脸自动定 位到图像中心的技术。 人脸自动定位系统有着广泛的应用它应用的领域主要有:人脸识别,人机交互,监视和安全,智 能视频通信以及娱乐等。例如在安全监控虑用中,需要对人的各项特征进行有针对性的监视。对丁监拄 对象的身高,衣着等特征,可以在较模糊图像中获得,但是对人脸部分的特征,却必须要清晰的图像才 能获得。因此需要对人脸作针对性的监控。人脸自动定位是这一监控方法的第步,具有重要意义。 1 - 2 研究现状 随着世界范围网络经济的发展,对基于生物特征的身份识别需求明显,人脸识别技术显示出诱人的 应用前景,正吸引越来越多的学者投入研究,近年来国内外研究机构已经投入大壤资金和人力进行该方 面的研究和麻用项目的开发。自上世纪9 0 年代以来i e e e 的相关汇刊、p a t t e r nr e c o g n i t i o n 等国际 知名刊物每年都有大量研究成果论文发表。这方面的研究大都集中在单一特征识别的理论和算法上,对 r 人脸目标的自动定能,直到近几年才引起人们的注意,而这方面的实川系统尚不多见,所以只能参考 人脸跟踪的一些方法。 人脸自动定位的围像视觉控制策略及其实现 人脸自动定位系统首先要求能够快速的检测到人脸并且获取人脸特征点的坐标位置,然屙控制摄像 机实时的将人脸特征点定位到图像中心。虽然人脸跟踪不要求将人脸时刻定位在图像中心,但从广义的 角度讲,人脸自动定位仍属于人脸跟踪的范畴,是人脸信息处理的第一个环节。目前的相关算法大致可 分为两类:基于目标跟踪的方法,人脸检测和跟踪冀法相结合的方法。基于目标跟踪的方法完全依赖于 好的运动目标跟踪算法,从运动目标中找出人脸,没有充分利用人脸的特征,阂此在人脸跟踪中根少单 独使用。人脸检测和跟踪算法相结合的方法是在基于目标跟踪的方法上,利用人脸的相关信息( 例如肤 色、器官分布等) 达到快速跟踪的目的。在一些典型的约柬环境一f ( 如背景简单静i t 的视频、i :作台前 的人脸或头肩部人脸视频等) 可以取得很好的人脸跟踪效果。需要说明的是,这些方法一般建立在人脸 初始位置大致已知的基础上,需要使用其它方法解决起始帧中人脸的检测问题,这就增加了系统实现的 难度。 人脸的检测是近年来图像处理领域的热点问题乏一很多学者己经提出各种备样的算法,如基于边 缘、灰度、颜色、运动等的低层分析法,特征搜索法,聚类分析法,蛇形算法,变形模版法,神经网络 的方法以及统计模型的方法等等。精度和速度是一个人脸检测系统的两个重要方面,一般都希望一个系 统既能有很高的精度叉能达到实时的速度。但是实际研究中这两方面又常常存在矛盾,一般是在精度不 能满足的条件f ,牺牲速度来满足精度。面早期的研究多是以检测精度的提高和各种视角的人脸检测为 主要内容,速度问题的考虑相对较少。近期的研究都对人脸检测中的速度问题进行了较多的考虑,使系 统向实际应用要求的速度逐步靠拢。目前快速检测人脸的热点是基于b o o s t i n g 和c a s c a d e 算法的系 统,在速度方面具有很火的优越性。它是在提出的一系列h a a r 一1 i k e 特征的基础上,通过b o o s t i n g 葬 法学习一些弱分类器,再组合成一个强分器。但一般一个强分类器还不足以圆满完成任务,还要级联一 系列这样的强分类器。但是要进一步提高检测精度,就需要级联更多的强分类器,但是这样又会降低检 测速度。它的优点是速度较快,缺点是算法较复杂,实现起来难度较大。目前主流的算法大多是基于统 计的,因此受学习样本的影响较大,不同的样本各制方法会使同一个算法的性能具有很大的区别。 目标跟踪的实现算法主要有三类:帧间变化检测法、运动矢攘法和偏移量法。其中帧间变化检测法 主要适用于静止背景下的运动目标检测,利用相关帧间的信息恢复背景并进行运动目标的提取。运动矢 量法主要是用于运动背景f 的运动目标的检测,一般配合卡尔曼滤波器使用。首先建立适动模型,然后 根据运动模型得出目标点在图像平面上的位置、速度和加速度的相关信息,再利用卡尔曼滤波器根据这 些信息预测下一帧图像中目标点的位黄、速度和加速度等相关信息,最后将这些预测信息反馈给控制设 备驱动摄像机运动,从而将运动目标定位在图像中心。以上两种方法主要针对运动目标的跟踪,都需要 利用帧间信息,计算量偏大。而偏移鬣法则是首先通过图像预处理方法检测目标位置距图像中心的偏蔫 ( x ,y ) ,然后计算摄像机的水平调整量a 和垂巍调整量b ,根据调整量控制摄像机运动,从而将目 标定位在图像中心。偏移量法的优点是算法非常简单,缺点是精度低,可拓展性差,不利丁今后进一步 的研究。另外以上儿种方法均需要对摄像机进行标定。标定内容包括摄像机焦距、计算机图像中心坐 标、像平面单位距离上的象素数等,标定的精度直接影响算法的精度。目前的标定方法虽然多种多样, 但是大部分方法都是利用成像几何性质,首先建立一定的模型形式,然后将需要标定的各个参数分解, 分别进行计算。由于摄像机镜头存在着多种非线性失真,所以要得到较高的标定精度,计算方法复杂而 且计算量大。 总体来说,目前的人脸跟踪的方法一般都需要利用帧间相关信息。需要对摄像机进行标定。这些方 法计算量偏大,。实现起来难度较大尤其对简单背景卜- 单个静止正面人脸的自动定位图像中心系统的实 现,方法过于复杂。所以针对本课题的特点同时兼顾今后进一步的研究,本论文提出了一种新的基于 肤色的人脸初定位结合基于人工神经网络的目标自动定位图像中心方法,用来自动定位人脸到图像中 心,并且以之为理论基础进行了系统实现。 2 一 ! ! 些! 些奎兰曼主兰堡兰兰 卜3 本论文的工作及内容安排 通过分薪有关的研究报告和科研论文,可以认识到该谋题在目前已有方法的应用中部不甚理想尤 其是在系统实现的复杂度和实时性方面。臻于此,本文提出r 一种基于人丁神经网绍的目标自动定似图 像中心的控制策略,结合基于肤色的人脸检测方法,快速的定位人脸到醋像中心。 本文首先介绍r 人丁神经嘲络的基本原理和相关典型模型,阐述了视觉控制策略中采j = i 的反向传播 算法及其改进算法的基本原理。然后研究了快述人脸检测的方法,提出了基于肤色特征的人脸初定忙和 积分投影祛和小灰度值聚类法确定眼球中心的人脸特征点的获取方法。接着提出了基丁人r 神经丽鲳反 向传播算法的目标定位图像中心的控制策略,用来柱伟蝽l 像机自动定位凡脸到图像中心区域。虽_ l 罱编群 实现该系统。 本论文的内容安排如f 第一章绪论; 第二章介绍了用于人脸自动定位系统控制策略的理论基础一人f 神经网络。首先简单讲述了人l 神 经网络的相苯基本概念以及一些典型的神经网络模型,盛后着重对反向传播算法及其故进算法作了介 绍。 第三章首先概述了- 当前人脸检测的一些方法,然后对 脸图像进行r 预处理接着j _ j 基于k l 肤t 皇 的方法对入脸进彳j 了初定位。最后用积分投影法和小灰度值聚类法确定眼球中心作为特征点,进而得到 了人脸的重心点。 第四章提出了基于人工神经网络的目标定位图像中心的控制策略,在检测到人脸爿且获得其重心点 后,用米控制摄像机自动定位人脸到图像中心。 第五章设计了系统的算法流程和编程实现,并对实现过捌中的两个墓耍问题一云台的拄制和神终嘲 络的训练作了介绍。 第a 章为论文的结论部分。 第六章为论文的结论部分。 一一 些皂垫塞堡塑塑堡塑塞墼型茎堕墨基塞翌 第二章控制策略的理论基础人工神经网络 系统主要采用基于人工神经网络的算法控制摄像机的运动,在检测到人脸并且获得其重心点之后, 将人脸定位到图像中心。所以,在系统阐述本课题之前,有必要先了解一下人工神经网络的相关知识。 2 1 人工神经网络概述 人工神经网络具有模拟人类部分形象思维的能力,是模拟人工智能的一条途径,特别是可以利刚人 j :神经网络解决人一i :智能研究中遇到的一些难题。人l :神经网络理论的应用已经渗透到多个领域,在计 算机视觉、模式识别、智能控制、非线性优化、自适应滤波、信息处理、机器人等方面取得了可喜的进 展。 2 - 1 1 人t 神经网络研究的起源 人1 :神经网络研究的先锋l t c c u l l o c h 和p i t t s 曾于1 9 4 3 年提出一种叫做“似脑机器”( m i n d l i k e m a c h i n e ) 的思想,这种机器可由基于生物神经元特性的互连模型来制造,这就是神经网络的概念。他们 构造,一个表示大脑基本组分的神经元模型,对逻辑操作系统表现出通用性。随着大脑和计算机研究的 进展,研究目标己从“似脑机器”变为“学习机器”,为此一妻关心神经系统适应律的h e b b 提出了学 习模型。r o s e n b l a t t 首次引进了感知器( p e r c e p i r o n ) 的概念,并设计一个引人注目的结构,它由闽值 性神经元组成,试图模拟动物和人脑的感知和学习能力。到6 0 年代初期,关于学习系统的专用殴计指南 有w i d r o w 等提出的a d a l i n e ( a d a p t i v e1 i n e a re l e m e n t ,即自适应线性元) 以及s t e i n b u c h 等提出的学 习矩阵。由于感知器的概念简单,因而在开始介绍时对它寄托很大希望。然而,不久之后m i n s k y 和p a p e r t 从数学上证明了感知器不能实现复杂逻辑功能。 到了7 0 年代,g r o s s b e r g 和k o h o n e n 对人一:神经网络的研究做出了重要贡献。以生物学和心理学 证据为基础,g r o s s b e r g 提出了,l 种具有新颖特性的非线性动态系统结构。该系统的网络动力学由一阶 微分方程建模,而网络结构为模式聚集算法的自组织神经实现。基于神经元组织自己来调接各种各样的 模式的思想,k o h o n e n 发展了他在自组织映射方匠的研究一r :作。w e r b o s 在7 0 年代开发出一种反向传橘 算法。h o p f i e l d 在神经元交互作用的基础上引入一种递归型神经网络,这种网络就是有名的h o p f i e l d 网络。在8 0 年代中叶,作为一种前馈神经网络的学习算法,p a r k e r 和r u m e l h a r t 等重新发现了反向传 播算法。近年来,神经网络已在从家用电器到工业对象的j j 泛领域找到了它的用武之地。 2 - 1 2 人:1 :神经网络的特性 人l :神经网络趋由大量称为神经处理单元的自律要素以及这些自律要素相互作用形成的网络。它是 在多年来对神经科学研究的基础之上,经过一定的抽象、简化与模拟的人:l :信息处理模型。它反映了人 脑功能的某些基本特性,却又不是人脑的真实写照,形成了一个具有高度非线性的大规模非线性动力学 系统。必须指出,人工神经网络绝对不是任何意义的人脑的神经网络或其它生物脑。 4 河北工业大学碗士学位论文 人j 二神经网络系统基础功能有 1 学习能力:通过实践进行学习: 2 自适应能力:系统能适应外界的变化保持良好的性能: 3 自组织能力:依据外部环境的变化进行自组织自适应是通过自组织实现的; 4 容错和自修复能力:对不完整的信息给出正确的解答。或者系统内部发生某些故障时仍能达到 庭好的状态; 5 输入输出能力; 6 知识表示能力: 7 模式存储、检索能力。 从数学的角度可以归纳为咀f j l 个基础属性: 1 非线性:人工神经元可以表述为激活和抑制两种基本状态,这就是一种非线性关系。 2 非局域性:人工神经网络系统是以人l 神经元之问的相互作用表现信息的处理和存储能力。系 统的整体行为不仅取决于单个神经元的状态,而且取决于它们之间的相互作州,刚此米模拟人 脑的非局域性。 3 非凸性:非凸性是指人一r :神经网络的演化过程在满足一定条件f 取决于某特定幽数而且该函 数具有多个稳定点,这将导致在不同边界条件f 得到不同的结果,这就是系统演变的多样性。 4 非定常性:表现在人工神经网络具有自组织、自适应和自学习能力。 显然,人1 l 神经网络由于其学习和适应、自组织、函数逼近和夫规模并行处理等能力,冈而具有用 于智能控制系统的潜力。神经网络在模式识别、信号处理、系统辨识和优化等方面的应用,已有j 泛研 究。 2 一l 一3 人r 神经网络的结构 人r 神经网络的结构是由基本处理单元( 神经元) 及其互连方式决定的。每个构造起网络的神经元 模型模拟一个生物神经元,如图2 。1 所示。该神经元单元由多个输入和一个输出组成,输出为: 口= f ( w p + 6 、 ( 2 1 ) 式( 2 1 ) 中,8 为神经元输出b 为神经元单元的偏置( 闽值) ,w 为连接权系数矩阵,p 为输入信号矩 阵,f 0 为传输函数( 或称作激励函数) 。常用的传输函数有硬极限传输函数( 式2 2 ) 、线牲传输函 数( 式2 3 ) 和l o g - s i g m o i d 函数( 式2 4 ) ,这三种函数都是连续和非线性的。 ( 2 2 ) h x x k 眈 r,、l 1 1 ) x (厂 , 墼旦垫塞竺塑鬯整塑堂丝型茎堕墨些塞翌 ,( x ) = x ,( x ) = y a + p 0 ,( 小:l ( 2 3 ) ( 2 4 ) 在实际应用中需要有多个并行操作的神经元,这些并行操作的神经元称为“层”。如果某层的输出 是网络的输出,那么称该层为输出层,与输入层相对,其它层叫作隐含层。多层网络的功能要比单层网 络强大的多。比如一个第一层具有s 型传输函数、第二层具有线性传输函数的网络,经过训练可对大 多数函数达到任意精度的逼近。 输入 第一层 f = 参 r f a = f o n p + b ) 醒2 1 神经元模型 f i g 2 1n e u r a ln e t w o r km o d e l 2 - 1 4 人j l :神经网络的主要学习算法 人 :神经网络主要通过两种学习算法进行训练,即指导式( 有师) 学习算法和非指导式( 无师) 学 习算法。此外,还存在第三种学习算法,即强化学习算法也可把它看做有师学习的一种特例。 2 3 有师学习:有师学习算法能够根据期望的和实际的网络输出( 对应于给定输入) 间的差来调整神经元 问连接的强度或权。因此,有师学习需要有教师来提供期望或目标输出信号。有师学习算法的例子 包括d 规则、广义6 规则或反向传播算法以及l y q 算法笛。 无师学习:无师学习算法不需要知道期望输出。在训练过程中,只要向神经阚络提供输入模式,神 经网络就能够自动地适应连接权,以便按相似特征把输入模式分组聚集。无师学习算法的例子包括 k o h o n e n 算法和c a r p e n t e r g r o s s b e r g 自适廊谐振理论( a r t ) 等。 强化学习:如前所述,强化学习是有师学习的特例。它不需要老师给出目标输出。强化学习算法采 用一个“评论员”来评价与给定输入相对应的神经网络输出的优度( 质量因数) 。强化学习算法的 一个例子是遗传算法( g a s ) 。 2 - 1 - 5 典型的人工神经网络模型 迄今为止,已经约有3 0 多种人工神经网络模型被开发和应用。f 蟊是它们之中有代表性的一些模 型。 6 溯北工业大学颂 一学位论文 1 自适应谐振理论( a r t ) :由g r o s s b e r g 提出的,是一个根据可选参数对输入数据进行粗略分类的网 络。a r t 一1 用于二值输入,而a r t 一2 厢于连续值输入。a r t 的不足之处在于过分敏感,当输入有小 的变化时,输出变化就很大。 2 双向联想存储器( b 删) :由k o s k o 开发的,是一种单状态互连网络,具有学习能力。b a m 的缺点为 存储密度鞍低,且易于振荡。 3 ,b o l t z m a n n 机( b m ) :由h i n t o n 等提出的。是建立在h o p f i e l d 潮基础上的,具有学习能力,能够通 过一个模拟退火过程寻求解答。不过,其训练时间比b p 网络要长。 4 反向传播( b p ) 网络:最初由w e r b o s 开发的反向传播训练算法是一种迭代梯度算法,用_ 求解前馈 网络的实际输出与期望输出间的最小均方差值。b p 网是一种反向传递并能修正谡筹的多联映射网 络。当参数适当时,此网络能够收敛到较小的均方差,是目前应用最广的网络之一。b p 网的短处 是训练时间较长,且易陷于局部极小。 5 对流传攒网络( c p n ) :由h e c h t n i e l s o n 提出的,是一个通常由五层组成的连接网。c p n 习j h _ r 联 想存储,其缺点是要求较多的处理单元。 6 h o p f i e l d 网:由h o p f i e l d 提出的,是一类不具有学习能力的单层臼联想网络。f t o p f je l d 网模型由 一组可使某个能蹩函数悬小的微分方程组成。其短处为计算代价较高,而且需要对称连接。 7 m a d a l i n e 算法:是a d a l i n e 算法的一种发展,是一组具有最小均方差线性网络的组台,能够调整 权值使得期望信号与输出间的误差最小。此算法是自适应信号处理和自适应控制的得力r 具,员;有 较强的学习能力,但是输入输出之间必须满足线性关系。 8 认知机( n e o c o g n t i o n ) :由f u k u s h i m a 提出的,是至今为止结构上最为复杂的多层网络。通过无师 学习,认知机具有选择能力,对样品的平移和旋转不敏感。不过,认知机所羽钳点及其互连较多, 参数也多且较难选取。 9 感知器( p e r c e p t r o n ) :由r o s e n b l a t t 开发的,是一组可训练的分类器,为最占老的人l :神经网络 之一,现已很少使用。 l o 自组织映射网( s o m ) :由k o h o n e n 提出的,是以神经元岛行组织以校正各种具体模式的概念为基础 的。s o m 能够形成簇与簇之间的连续映射,起到矢量量化器的作用。 一些较为典型的ann 模型( 算法) 及其学习规划和应用领域如表2 1 所示。 2 - 2 反向传播算法 自从4 0 年代h e b b 提出学习规则以来,人们相继提出了各种各样的学习算法。其中蚍在1 9 8 6 年 r u m e l h a r t 等提出的误差反向传播法,即b p ( e r r o rb a e k p r o p a g a t i o n ) 算法影晌最为广泛。直到今犬。b p 算法仍然是自动控制上最重要、应用最多的有效算法。 2 - - 2 1 反向传播算法 b p 算法是用于前馈多层网络的学习冀法,前馈多联网络的结构一般如图2 2 所示。它禽有输入层、 输出层以及处于输入输出层之间的中间层。中间层有单层或多层,由于它们和外界没有直接的联系,敞 也称为隐含层。在隐含层中的神经元也称隐单元。隐含层虽然和外界不连接,但是,它们的状态却影l 恂 输入和输出之间的关系。这也就是说,改变隐禽层的彀系数,可以改变整个多层神经网络的性能。 反向传播算法分两步进行,即正向传播和反向传播。这两个过程的【做简述如f ”1 。 1 止向传播 人脸自动定位的图像视觉控制策略及其实现 输入的样本从输入层经过隐单元一层一层进行处理,通过所有的隐含层之后,则传向输出层;在逐 层处理的过程中,每一层神经元的状态只对r 一层神经元的状态产生影响。在输出层把现行输出和期望 输出进行比较,如果现行输出不等于期望输出,则进入反向传播过程。 8 表2 1 人工神经网络的典型模型 t a b l e2 1r e p r e s e n t a t i v em o d e l so f n e u r a ln e t w o r k 有师或 模型名称学习规则止向或反向传播应用领域 无师 a g无h e b b 律反向 数据分类 s g 无h e b b 律反向信息处理 a r t - i 无竞争律 反向模式分类 d h 无h e b b 律反向语音处理 c h无h e b b 竞争律反向组合优化 b a m 无h e b b 竞争律反向图像处理 a m 无h e b b 律 反向 模式存储 a b a m无h e b b 律反向信号处理 c a b a m 无h e b b 律反向组合优化 f c m 无 h e b b 律 反向 组合优化 l m 有h e b b 律正向过程监控 d r 有 h e b b 律正向过程预测,控制 l h m 有 h e b b 搜正向系统控制 o l a m 有h e b b 律 正向信号处理 f a m有h e b b 律止向知识处理 b s b 有误差修正 正向实时分类 p e r c e p t r o n 有误差修正正向线性分类,预测 a d a li n e m a d a li n e 有误蔫修正 反向分类,噪声抑制 b p 有 误差修正反向分类 a v q有误差修正反向 数据臼组织 c p n有h e b b 律反向自组织映射 b m 有h e b b 模拟退火反向组合优化 c m 有h e b b 模拟退火反向 组合优化 a h c 有误差修正 反向控制 a r p有随机增大反向模式匹配,控制 s 瑚f 有 h e b b 律 反向语音图像处理 y f y f y 未 0k y 2 n 1 0 j y 图2 2 一个三层的前向神经网络 f _ 避2 2at h r e e - t a y e rb a c kp r o p a g a t i o nn e t w o r k 一一 塑苎:些盔兰堡主鲎焦芝兰 2 反向传播 反向传播时把误差信号按原来正向传播的通路反向传回,并对每个隐含层的各个神经元的权系数 进行修改,以期望误差信号趋向最小。 圈23 剪示是一个两层的反向传播网络,其中,p 为输入样本向量,r 指其k = 度;a 指每层的输入 向量;传输函数f 的形式根据需要采用线性、l o g s i g m o i d 或t a n - s i g m o i d 形式;w 指权值矩阵:b 指 偏置值向量。字母a 、f 、b 的上标指示层数。学习算法如下: 第一步通过网络将输入正向传播,输入信息由输入层经由隐含层处理后传向输出层,每屡神经元 的状态只影响一f 一层神经元的状态: 播 d o = p ( 2 5 ) 口”= f ”+ 1 ( w “口“+ 6 ”+ 1 ) ,m = 0 , 1 ,m 一1 ( 26 ) d = a “ 输 第一屡 r n 1 ;一( w l p + b ) 第j 层 ( 2 7 ) , 掣砧 产 1 彤8 川 _ k r ( pr ( w 1 p + b ) 十b 2 ) 图2 3 两层b p 网络 f i g 2 3at w o - l a y e rb pn e u r a ln e 撕o r k 第二步假若正向传播至输出馁得不到期望的输出,则将误差信号沿原来的神经元连接通路反向传 这里 盯 s = _ 2 f ( 开 ,) ( f 一口) s ”= f ”积”x 缈“) 7 j “,i = m 一1 ,2 , 1 ( 2 8 ) ( 2 9 ) 9 查丝窒垫塞苎整翌堡堡整篓塑苎堕丝苎壅銎 f0 ”) = f ( 疗? ) 0 0 0 f ( 以? ) 00 o 0 m f ( n f ) ( 2 1 0 ) 厂”( 玎,) = a ”( 矽) 锄, ( 2 1 1 ) 其中,s 称为敏感因子,t 指网络的输出矩阵。 第三步按误差平方最小原则逐一修正网络备层神经元间的权值和偏置值: w ”( k + 1 ) = w ”( j ) 一。溶“( 口”1 ) 7 ( 2 1 2 ) 6 “( + 1 ) = 6 ”( ”一j ” ( 2 1 3 ) 其中,a 称为学习速度,k 为迭代次数。 对所有的学习样本,反复进行上述的学习过程,直至网络的实际输出与期望输出在允许的误差范阐 内,网络的学习即告结束。 多层前向b p 网络的优点为: 1 网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂1 f 线 性映射的功能。这使得它特别适合于求解内部机制复杂的问题; 2 网络能通过学习带正确答案的实例集自动提取“台理的”求解规则。即具有自学习能力 3 网络具有一定的推广、概括能力。 2 - 2 2 反向传播改进算法 虽然多层前向b p 网络是目前应用最多的一种神经弼络形式,但它也不是非常完美的,一个主要的 问题是训练时间长。针对该缺点,有许多提高算法收敛性能的改进算法被提出,主要有两类:标准的数 值优化方法和启发式方法。标准的数值优化方法主要有共轭梯度法( c g b p ) 和l e v e n b e r g - m a r q u a r d t 算法,f 面主要介绍启发式方法。 1 动量方法( m o b p ) :在反向传播的基础上,在每一个权值的变化上加上一项正比予前次投值变化的 值y ,并根据反向传播算法来产生新的权值变化。该算法可以在维持算法稳定的前提f 使用更高的 学习速度,并且当收敛轨迹进入某个一致的方向后,加速收敛。反向传播的动鬣改进公式为: a w ( k ) = w ”( k 一1 ) 一( 1 一y ) o 博( ”“) 7 a b “( 七) = 6 “( 七一1 ) 一( 1 - 7 ) a s ” ( 2 1 4 ) ( 2 1 5 ) 2 可变学习速度的方法( v l b p ) :根据均方误差的变化情况,调菇学习速度。规则如f l o ( i ) 如果均方误差( 在整个训练集上) 在权值更新后增加了,且超过了某个设定的百分数e ( 典 型值为1 至5 ) ,则权值更新被取消,学习速度被乘以一个因子p ( o p 1 ) ,如果y 被设为零,则同复到以前的值。 ( 3 )如果平方误差的增长小丁i ,则权值更新被接收,但学习速度保持不变。如果y 过去被殴 为零,则恢复到以前的值。 v l b p 方法比m o b p 方法快,但因为只能用批处理的方式,所以需要更多的存储空间。而且它还需要 选择5 个参数,参数的选择影响收敛速度。 2 3 小结 本章简单介绍了一些人工神经网络的基本理论,这是本系统自动控制策略的理论基础。在介蜊r 神 经网络的起源、特点和几种典型的模型之后,重点介绍了反向传播算法( b p 算法) ,为第四章中基丁神 经网络的目标定位图像中心方法做了理论上的铺垫。 些旦翌星堡墼望堡堡堂丝型矍堕墨苎壅望 第三章人脸的检测 人脸的检测及重心的获取是人脸自动定位的前提和必要步骤,因为只有检测到人脸并且计算出人 脸重心,才能将该重心坐标值传给控制系统进行定位。同时人脸检测也是智能人机接口的芙键技术之 , 它在人脸识别、表情识别、人脸台成和人脸编码等领域具有重要的应用价值”9 。因此,本章在火概介 绍人脸检测的一些方法之后,重点介绍了本系统中采用的人脸检测以及重心获取的方法。 3 - 1 人脸检测方法概述 人脸研究,主要包括人脸识别技术( f a c er e c o g n i t i o n ) 和人脸检测( f a c ed e t e c t i o n ) 技术的研究。 最初人脸研究主要集中在人脸识别领域,而且早期的人脸识别算法都是在认为已经得到了一个正面人脸 或者人脸很容易获得的前提f 进行的“8 ”1 。但是随着人脸应用范围的不断扩大和开发实际系统需求的 不断提高这种假设f 的研究不再能满足需求”3 “。人脸检测开始作为独立的研究内容发展起米。目 前,国内外的文献中所涉及的人脸检测算法已经有很多种,许多重要的国际会议幂j 期刊都也都涉及到人 脸检测这一研究论题。人脸检测开始j i 泛应用到全新人机界面、基于内容的检索、数字视频处理、视觉 监测等许多领域。 人脸检测( f a c ed e t e c t i o n ) 是指对于任意一幅给定的图像采用一定的策略对其进行搜索以确定其 中是否含有人脸,如果是则返回人脸的位置、大小和姿态”1 。它是一个复杂的具有挑战性的模式检测问 题,其主要的难点有两方面,一方面是由于人脸内在的变化所引起: ( 1 )人脸具有相当复杂的细节变化不同的外貌如脸形、肤色等,不同的表情如眼、嘴f | 勺开与 闭等; ( 2 ) 人脸的遮挡如眼镜、头发和头部饰物以及其它外部物体等。 另一方面由于外在条件变化所引起 ( 1 ) 由于成像角度的不同造成人脸的多姿态,如平面内旋转、深度旋转以及上r 旋转,其中深 度旋转影响较大; ( 2 ) 光照的影响,如图像中的亮度、对比度的变化和阴影等; ( 3 ) 图像的成像条件,如摄像设备的焦距、成像距离、图像获得的途径等等这些剧难都为解 决人脸检测问题造成了难度。 由于人脸是受到多种因素影响的复杂模式找到一种有效的方法提取人脸的共性特征来描述人脸模 式( 即人脸的建模) ,是人脸检测的关键。概括而言,目前的技术可分为基于特征的方法( f e a t u r e b a s e d ) 和基于模板的方法( t e m p l a t e b a s e d ) 两大类”。川。基于特征的方法将人脸视为显著器官的组合,它酋 先提取一些重要的特征:眼、鼻、嘴唇等,然后通过特征的位置和它们之间的几何荚系来检测人脸”2 “。这主要包括低层

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论