(生物医学工程专业论文)基于动态感受野的视觉不变性和频率效应研究.pdf_第1页
(生物医学工程专业论文)基于动态感受野的视觉不变性和频率效应研究.pdf_第2页
(生物医学工程专业论文)基于动态感受野的视觉不变性和频率效应研究.pdf_第3页
(生物医学工程专业论文)基于动态感受野的视觉不变性和频率效应研究.pdf_第4页
(生物医学工程专业论文)基于动态感受野的视觉不变性和频率效应研究.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(生物医学工程专业论文)基于动态感受野的视觉不变性和频率效应研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a b s t r a c t t h er e s e a r c ho nc o g n i t i v ep r o c e s so fh u m a nv i s u a ls y s t e mh a sg r e a ts i g n i f i c a n c e i nm a c h i n ev i s i o na n dc o g n i t i v es c i e n c e ,e s p e c i a l l yn o wt h a tt h et w of a m o u st h e o r i e s i nt h i sf i e l d ,w h i c hc a l l e dr e s p e c t i v e l yt h et h e o r yo fe a r l yc h a r a c t e r i s t i c sa n a l y s i sa n d t h et h e o r yo fe a r l yg l o b a lp e r c e p t i o n ,a r es t i l lt o t a l l yd i f f e r e n t i nt h i st h e s i sr e s e a r c h w a sc o n d u c t e db yf o c u s i n go nv i s u a lr e c e p t i v ef i e l d st os t u d yc o r r e s p o n d i n gv i s u a l p h e n o m e n aw i t ht h em e t h o do fd y n a m i cr e c e p t i v ef i e l d sm o d e lb a s e do ng a b o r f u n c t i o n t h em a i nw o r ka n ds o m eh i g h l i g h t so ft h i st h e s i sw e r es u m m a r i z e da s f o l l o w s : 1 ad y n a m i cr e c e p t i v ef i e l d sm o d e lw a sp r o p o s e db a s e do ng a b o rf u n c t i o n ,t h e n i l l u s t r a t e dt h eo p e r a t i o nm e c h a n i s mo fd y n a m i cr e c e p t i v ef i e l d sa n ds i m u l a t e d d i f f e r e n tp a t t e r n so f v i s u a lr e c e p t i v ef i e l d su s i n gt h em o d e l t h er e s u l t so ft h e s i m u l a t i o ns h o w e dt h a tt h ed y n a m i cr e c e p t i v ef i e l d sm o d e lb a s e do ng a b o rf u n c t i o n w a sag o o dd e s c r i b e ro ft h et r a n s f e rf u n c t i o no fv i s u a ls y s t e ma n dw a sa b l et o s i m u l a t ed i f f e r e n tp a t t e r n so fv i s u a lr e c e p t i v ef i e l d si n c l u d i n gs o m eu n c o r r o b o r a t e d p a t t e r n s 2 t h ee x p e r i m e n t so ni n v a r i a n c eo fr o t a t i o n ,s c a l e ,t r a n s l a t i o na n di l l u m i n a t i o n p r o v e dt h a tt h er e c e p t i v ef i e l d sc o u l dc h a n g et h ep a r a m e t e r so fi t s e l ft oa c h i e v et h e p u r p o s eo fi n v a r i a n tr e c o g n i t i o na n de x p l a i n e dt h eg e t t i n gm e c h a n i s mo fi n v a r i a n t i n f o r m a t i o nf r o md y n a m i cp e r s p e c t i v e a h y p o t h e s i s w h i c hm e a n st h ev i s u a l i n v a r i a n c ew a so b t a i n e di nt h ee a r l ys t a g eo fv i s u a lp r o c e s s ,w a sp r o p o s e d 3 i tw a sd i s c u s s e dw h e t h e rt h ec o n t r a s te f f e c to ff r e q u e n c ye x i s tu n d e rt h e c o n d i t i o nt h a tt h ec o n t r a s te f f e c to fg r a yl e v e le x i s t e do b v i o u s l ya n dd e s i g n e dt h e i m a g ee x p e r i m e n ti ns o m eo fw h i c hc o n t r a s te f f e c to ff r e q u e n c yc o u l db eo b s e r v e d o b v i o u s l y f o rt h ec o n c l u s i o no ft h ee x p e r i m e n tr e s u l t ,d y n a m i cr e c e p t i v ef i e l d s m o d e lw a su s e dt oe x p l a i nt h ec o n t r a s te f f e c to ff r e q u e n c y ,w h i c hs h o w st h a tt h e p r a c t i c a lp h e n o m e n aw e r ea c c o r dw i t ht h et h e o r y f u r t h e r m o r es o m es p a t i a li l l u s i o n p h e n o m e n ac o u l db ee x p l a i n e db yt h es a m em e t h o d 4 t h ed y n a m i cr e c e p t i v ef i e l d sm o d e lw a sm o d i f i e db ya d d i n gat i m ep a r a m e t e r t od e s c r i b et h ep r o c e s sw h i c ht h er e c e p t i v ef i e l d sd e c l i n e d t h e nt h ee s t a b l i s h i n g p r o c e s so ft h er e c e p t i v ef i e l d sw a sc o n s i d e r e dt ob eo p p o s i t et ow h i c hi td e c l i n e d b y t h i sc o n c l u s i o nt h er e s u l t so ft o p o l o g i c a lp e r c e p t u a le x p e r i m e n t sw e r ee x p l a i n e di nt h e e f f e c t i v ea n de f f i c i e n tw a y i ti s v e r ys i g n i f i c a n t t h a tt h er e s u l t sm i g h tm a k ea c o n n e c t i o nb e t w e e nt w oc o n f l i c t i v et h e o r i e si nt h ev i s u a lc o g n i t i o nf i e l d i naw o r d ,r e s e a r c ho nv i s u a ls y s t e mw a sac o m p l e xi s s u e t h ed y n a m i c r e c e p t i v ef i e l d sm o d e lp r o p o s e di n t h i st h e s i st h e o r e t i c a l l yn o to n l yc o n f o r m e dt o r e l a t e dc h a r a c t e r i s t i c so fr e c e p t i v ef i e l d sb u ta l s oc o u l da c t u a l l ye x p l a i ns o m er e l a t e d v i s u a lp h e n o m e n a ,e s p e c i a l l ym a d eag o o de f f e c to nd e s c r i b i n gr e c e p t i v ef i e l d sa n d s i m u l a t i n gh u m a nv i s u a lc h a r a c t e r i s t i c s ,w h i c hw o u l dh a v et h ep o s s i b i l i t yt ou n i f yt h e t h e o r yo fe a r l yc h a r a c t e r i s t i c sa n a l y s i sa n dt h et h e o r yo fe a r l yg l o b a lp e r c e p t i o ni n f u r t h e rr e s e a r c h k e yw o r d s :d y n a m i cr e c e p t i v ef i e l d s ,g a b o rf u n c t i o n ,v i s u a li n v a r i a n c e ,e f f e c t o ff r e q u e n c y ,v i s u a lc o g n i t i o n 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得苤盗盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:南哺和 签字日期:h 4 p 年矿月哆日 学位论文版权使用授权书 本学位论文作者完全了解苤盗盘堂有关保留、使用学位论文的规定。 特授权丕鲞盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 南嘞萄 签字日期:如,e 年孑月y 7 日 导师毓奠,松j 签字日期:o l 叩占年 p 月z7 日 第一章绪论 第一章绪论 1 1 课题的背景、意义与目的 感知是人类智能的基础,在日常的工作和生活之中,人们通过感觉器官从周 围环境中获取信息,并用来指导自己的行动。其中视觉获取信息最为重要,相关 研究结论表明:人的认识与器官的关系是味觉1 、触觉1 1 5 、嗅觉3 1 5 、 听觉1 1 、视觉8 3 。从记忆的角度来看,人们能记住自己阅读到的1 0 ,自 己听到的2 0 ,自己看到的3 0 。以信息论研究人的信道特征表明,假定触觉 信道宽为1 时,则听觉信道宽为1 0 0 ,视觉信道宽为1 0 0 0 0 。由此可见,视觉是 人类获取外界信息的最为主要的途径,视觉研究在所有感知研究中占有极为重要 的地位,研究视觉形成的机制,有助于提高人的认知能力,并且能够在机器视觉 和生物视觉之间建立起很好的对应联系。由于视觉的重要性,有关视觉系统的研 究始终是科学界关注的问题之一,其中有关生物视觉机制与机器视觉早就引起了 神经病学、眼科学、生理学、解剖学以及电子、计算机领域专家们的极大兴趣, 近年来,世界各国对视觉系统的研究越来越多,许多著名科研机构或大学都设有 专门的视觉系统研究部门【l j 。 我们对视觉系统的直观认识,就像摄像机一样,人眼把外界景象聚焦到眼后 一个特殊的视网膜屏幕上,上面的光感受器对进入眼睛的光子进行响应,然后图 像就被整合出来,这就是我们看东西的过程。但真实的情况要远比想象的复杂, 视觉系统是一种复杂的自动控制系统,可以从控制论的角度来研究它,但它不仅 涉及眼的活动,也与脑干、小脑、大脑等神经活动有关,即使从医学上讲也是一 个跨学科的复杂系统。哺乳动物的视觉系统结构十分复杂,功能异常精巧,人是 哺乳动物中大脑皮质最为发达的一个物种,据研究6 0 以上的皮质与视觉系统有 关。复杂的视觉系统是与复杂的视觉功能相适应的,尽管人们对其中的一些性质 有了一定的认识,还有很多地方不被人们了解,一些视觉现象仍未被很好的解释, 视觉系统的整体特性也缺少足够清晰、科学的解释。 对于人类视觉系统的研究,具有以下两个方面的意义。 首先它涉及神经科学及脑认知科学,是研究人的神经结构和模式的有效途 径,是认识人类智能的基础。2 0 世纪7 0 年代末,m a r r 提出了视觉计算理论,成 为计算机视觉领域其后数十年的主导思想,此理论立足于计算机科学,系统地概 第一章绪论 括了心理物理学、神经生理学、临床神经病理学等方面已取得的所有重要成果, 到目前为止仍然是最为系统的视觉理论。m a r r 在视觉计算理论中指出,视觉系 统具有三个层次:第一个层次是信息处理的计算理论,在这个层次研究的是对什 么信息进行计算和为什么要进行这些计算,实际上是一种信息到另一种信息的映 射,第二个层次是算法在这个层次研究的是如何进行所要求的计算,也就是要设 计特定的算法,对相关的表象进行转换,第三个层次是实现算法的机制或硬件, 在这个层次上研究完成某一特定算法的计算机构。在计算过程中m a r r 将表象的 获得分为三个阶段:首先获得图像变化和结构的表象,其中包括灰度的变化和表 示、局部的几何结构以及照明效果,这一步得到的结果称为初始简图。第二步对 初始简图进行一系列运算得到能反映可见表面几何特征的表象,这种表象被称为 二维半简图,这些运算中包括由立体视觉运算提取深度信息,根据灰度影调、纹 理等信息恢复表面方向,由运动视觉运算获取表面形状和空间关系信息等。第三 步获得具有物体种类位置形状的具体描述的三维模型,这一最终模型适用于物体 的识别【2 】。视觉计算理论的核心思想就是由低到高不同表象层次之间的逐级运 算,通过计算得到最终的识别结果,由于计算的过程要从图像的细节信息开始, 被称为初期特征分析理论。与此同时,相关的视觉实验证明人类视觉系统具有在 低层处理中获取图像拓扑特性的能力,其中典型的例子就是陈霖的拓扑知觉实 验,其研究结果于1 9 8 2 年首先发表在( ( s c i e n c e ) ) 上,实验中在观察者面前陆续 呈现不同的图形组,结果在极短的时间内( 5 m s ) 拓扑结构相异的图形具有较高的 辨别率1 3 ,这种实验结果表明相比于其他图形特征拓扑性质是最先被感知的特 性,拓扑性质知觉优先于局部特征性质知觉,从而得出大范围的整体性质被首先 感知的结论,被称为初期整体知觉理论【4 】。很明显,拓扑知觉实验与视觉计算理 论在一些地方是矛盾的,图像的视觉信息,一方面在视觉计算理论中被逐层的计 算以得到最终结果,另一方面在拓扑知觉实验中5 m s 内就已被感知出拓扑性质, 而这5 m s 的时间不足以在视觉系统内发生较高层次的运算。视觉信息究竟是逐 层计算得到的还是最先就已被感知的,至今仍然争论不止,以上两条路线均有充 分的理论或实验依据,可见人类视觉系统具有相当复杂的运行机制,从目前的研 究现状来看,还有很大的研究空间和未知的领域。 其次,人类视觉系统的研究对人工智能的发展起着重要作用,可以为人工智 能的研究提供相关的启示和生物原型,并且使机器视觉能够结合人类的视觉习惯 从而更好的为人类服务。目前机器视觉已经得到广泛的应用,主要用途包括定位、 测量、识别和缺陷检测。机器视觉在识别这一方面目前仍然存在很多问题,物体 的图像在计算机中不具有人类视觉的不变性和其他特性,因此识别的结果会与人 眼观察到的结果有所差异,其中视觉不变性包括旋转、尺度、平移和亮度不变性, 第章绪娩 具体的分析将在后面的内容中进行,人类视觉的其他特性不但涉及视觉过程,而 且涉及视觉心理学的理解问题,图1i 在机器视觉中仅是三个不完整的圆,而在 人眼的观察下中间空白的地方为一个白色三角形,这个三角形没有轮廓,这是机 器视觉目前尚且不具各的能力。 圈1 1 人类视觉特性举例 迄今为止,很多视觉特性的机制还没有被研究清楚,特别是视觉错觉现象的 机制。人类自生物诞生以来进化直到现在的状况,能够形成或保留的种种功能, 一定具有它们的合理性,而不是毫无用处的。 在很多情况下,机器视觉在没有人眼识别参与的环境中工作,比如月球探测 车、自动目标识别等工作会面临很高的识别要求,一些在人眼观察的条件下能够 识别出来的情况也要由机器识别出来特别是与人类视觉特性相关的情况。如 图1 2 ,两幅图像代表高空中拍摄的地面建筑。白色椭圆中的建筑为识别目标, 在人眼的观察下饭容易就能识别出两图中圈定的建筑是同一个,但由于目标在两 幅图像中方向、尺度和能置上均有差异在机器视觉中要做到看似很轻松的不变 性识别却是比较困难的。要在机器视觉的程序设计和算法上尽量接近人粪视觉系 统,有必要先搞清楚人类视觉系统的运行过程与机制。 图 - 2 机器视觉遥川实例 第一章绪论 总的来说,视觉研究能够在经历了不断进化的人类视觉和正在飞速发展的计 算机科学之间建立一条有效的沟通途径。2 0 世纪的视觉研究,在颜色视觉、侧 抑制网络和感受野等方面有许多重大突破,五位相关的研究者获得诺贝尔奖,由 于各种新型仪器和新兴方法都被应用到其中,视觉研究已发展成一门交叉性很 强、引起多方面兴趣的学科,今后也会完全融入到学科大交叉的发展趋势中,既 可以从其他学科获取营养i 工具和方法,也将为其他学科的发展起到积极的推动 作用。 目前对于视觉系统的研究,主要以视皮层和感受野为出发点,本文的目的是 以感受野的研究为基础,揭示更加深层的视觉机制和特性,解释更多的尚未被很 好解释的视觉现象。 1 2 相关研究的发展历史 视觉系统是一个有层次的复杂的信息加工系统,电生理技术发明以后,可以 引出单一或一团神经细胞的电活动。如果把电极插到视觉系统某一层次的某个神 经元上,在视网膜上用光点搜索,可以发现在某区域内给予光刺激可以引起神经 细胞发放的变化,把这个区域称为这个神经细胞的感受野( r e c e p t i v ef i e l d ,r f ) 。 视觉系统感受野的研究最初由h a r t l i n e 在青蛙的项盖上进行的,他用小光点 探索发现有的地方给光时神经细胞上可以引出密集发放,称为o n 反应,有的地 方在撤光时有反应,称为o f f 反应,有的地方对给光和撤光都有反应,称为o n o f f 反应【引。因此,发现有三类不同的感受野:第一类称为给光中心感受野( o n r f ) , 它对感受野中心位置的给光有密集发放,对外周部位的撤光有反应;第二类称为 撤光中心感受野,它的兴奋和抑制区的分布与第一类相反( o f f - r f ) ;第三类则对 整个感受野内的给光和撤光刺激都有反应,称为给一撤光感受野( o n o f f r f ) 。 k u f f l e r 在猫的视网膜上发现感受野分成三个区,o n r f 的中央部分是o n 反 应区,稍外一圈是o n o f f 区,最外一圈是o f f 区。而o f f - r f 的安排正好与此相反: 中央是o f f 区,稍外是o n o f f 区,最外是o n 区。k u f f l e r 还发现,先用两个小光 点分别放置于感受野的中央和外周部分,调节这两个点的相对强度,可以在同时 刺激下引出o n 反应、o f f 反应和o n o f f 反应,可见感受野各部分之间存在相互作 用【6 】o b a r l o w 用光点放置在感受野中央,然后逐步扩大光点的直径,发现随着光 点直径的扩大,开始时感受野对刺激进行线性总和,然后进入不完全总和区,最 后进入抑制区。如果用相同强度的小光点沿着穿过中心的轴线移动,可测出感受 野各处敏感性高低以及o i l 反应或o f f 反应的大小。一般敏感性在中央特别高, “ 第一章绪论 越往外周敏感性越低,这条敏感性曲线,称为感受野剖线图【7 j 。 d e m o n a s t e r i o 和g o u r a s 用色光研究了猴视网膜神经节细胞感受野的性质, 大体分为6 组,分别为色拮抗同心圆状、色拮抗非同心圆状、宽带非色结抗、宽 带色结抗、非同心圆状瞬变和非同心圆运动选择性的感受野。在各组细胞中,对 于颜色的信息处理有重要作用的是第一组和第二组的色拮抗细胞1 8 】。 w i e s e l 和h u b e l 根据猴感受野的性质,把猴的外侧膝状体的神经元分成i 一 四个类型【9 】。i 型与视网膜神经节细胞色拮抗同心圆状感受野相同,并且从锥 状细胞和杆状细胞同时接受信号,信号的极性相同。i i 型与视网膜神经节细胞色 拮抗非同心圆状感受野相同,对于白色光刺激,由于两种拮抗输入相互抵消,因 此几乎没有反应。型具有同心圆状的o n 中心型或o f f 中心型的感受野,其反 应的性质不随刺激光波长的改变而改变。型则与视网膜神经节细胞宽带色结抗 感受野的性质相似。在猴的视网膜和外侧膝状体上,都没有双拮抗色细胞,只有 到了大脑视区才开始出现,相反的在金鱼等的视网膜神经节细胞中就已经见到了 双拮抗色细胞,总之,比较低等的脊椎动物,在接近外周的部分就已经对颜色的 信息进行了处理。 由于光点刺激在动物的自然生态环境中很少出现,人们想出一些更接近动物 的生态环境以引发动物行为反应的图形,作为刺激源来研究动物视觉系统的反 应。l e t t v i n 等在其研究中报道了蛙视项盖中存在几类图像特征检察器【l0 1 。第一 类称为边界检察器,对感受野内任何朝向的有反差的边界均有反应,反差越大, 反应越大,对于移动的边界反应增加。第二类称为移动黑凸边检察器,对移动的 黑而凸形边界物体有反应,这种反应与背景光照无关。第三类移动或变化反差检 察器,对阴影以常速移动过感受野有不变的反应,刺激物边线越清晰,移动速度 越快,反应越大。第四类变暗检察器,对整个感受野范围内的亮度变暗有反应, 而亮度的边界不起作用。第五类绝对光强检察器,它的反应与光强水平成正比。 m a t u r a n a 等后来在鸽子的视网膜上发现六类检察器:垂直边检察器、水平边 检察器、一般边检察器、方向运动检察器、凸边检察器和照度检察器。 沿着特征检察器的思路发展,g r o s s 等人在高等动物如猴子的视觉系统中发 现,在颞叶有一些细胞,对复杂图形,如人脸正面像,十分敏尉。针对于神经 元对应的检察刺激图像中的特定性质,b a r l o w 提出了一种视觉识别的神经还原 论,他认为视觉系统中神经元对应着图像中的某些特性,神经元层次越高,对应 的图形特征越复杂,抽象程度越高【l 引。 h u b e l 和w i e s e l 最初在猫或猴视皮层上插入电极,沿用传统的方法在视网膜 上用小光点刺激,希望引出神经元发放,绘制感受野发放图。但是,结果令人失 望,却在一个偶然的机会发现用有裂缝的图形作为刺激源引起视皮层细胞的强烈 第一章绪论 反应,从而发现猫、猴等动物的初级视皮层v 1 区上的神经元的感受野几乎都对 边形或条形刺激物有强烈反应。每个神经元对边形或条形刺激的朝向敏感,适宜 的刺激引起反应最大,刺激物转动一个朝向,反应就下降,所以这些神经元的反 应对刺激物的朝向有一个调制度。h u b e l 和w i e s e l 把这些细胞称为简单细胞,它 们与视网膜和侧膝体上发现的同心圆式对称感受野不同,它们兴奋区与抑制区的 空问构型是不对称的,从特征检察器的观点考虑,可把它们称为条形检察器,或 边形检察器。 h u b e l 和w i e s e l 在猫和猴视皮层上发现一些更复杂的神经元,它们对刺激的 时空模式有更高的要求,称为复杂细胞、低级超复杂细胞和高级超复杂细胞等。 因为这些细胞的敏感性质需要用一大段文章描述,而且不同的实验者难以完全重 复,所以它们的分类方法和试验结果在随后的文章中很少引用。但是,简单细胞 的一些特性已作为经典结果被记入视觉科学发展史。 1 3 本文的主要内容和结构 人们对于视觉系统的认知,目前仍然将焦点集中在视觉感受野之上,但目前 还存在很多未能解释的问题,如视觉不变性的具体机制以及一些视觉心理学现象 的产生原因等,这些问题上的长期空白使得对“知觉是从哪里开始的? ”这一问 题的研究停滞不前,初期特征分析理论与初期整体知觉理论之间的冲突仍然很激 烈。鉴于此,本文针对目前比较流行的研究方向,提出了基于g a b o r 函数的动态 感受野模型,以动态的角度描述视觉感受野,并尝试用此模型解释相应的视觉不 变性问题以及一些视觉心理学现象,本文大体结构如下: 第一章讲述课题的背景、研究的意义与目的,其中包括理论研究和实际应用 上的意义,以及相关研究的发展历史。 第二章对本课题的相关理论进行了全面的概述,其中包括视觉的神经机制、 感受野概念的提出、感受野的数学描述、g a b o r 函数的提出及发展、g a b o r 函数 的基本性质以及视觉不变性现象和视觉心理学现象。 第三章提出了基于g a b o r 函数的动态感受野模型,对动态感受野的运行机制 进行了一定的解释,并对视觉感受野的不同模式进行模拟,模拟的结果表明基于 g a b o r 函数的动态感受野模型与视觉系统传递函数较为接近,不同模式的感受野 均可以由此模型表示。在此基础之上,视觉不变性研究出现在本本的后半部分, 其中包括旋转、尺度、平移和亮度不变性,数学的推导和实验结果表明动态感受 野模型能够解释视觉不变性问题,并针对实验结果对视觉不变性的具体机制进行 了分析,提出了一个较为合理的假说。 第一章绪论 第四章首先从视觉的灰度对比效应推断在频率空间也会存在同样的效应,设 计了相应的实验图形来证实此效应的存在,并得出相应结论,继而从动态感受野 的角度来解释这些现象。最后一节以动态感受野的时间因素为出发点,从时间的 角度研究拓扑知觉实验的结果,为拓扑不变性的实现做出了尝试性的解释。 第一章相荑基本理论概述 2 1 视觉的神经机制 第二章相关基本理论概述 人的视网膜由大约一亿个神经细胞组成,粗略的说排列成三层,如图2 一k a ) 所示:第一层由感光细胞构成,感光细胞分成结构和功能不同的两类,一类是锥 状细胞( 图( a ) 中c ) ,个体较小,对颜色敏感,一类叫杆状细胞( 图( a ) 中r ) ,个 体较大,对应于明暗视觉。第二层统称中间联系细胞,分三类:双极细胞( 图( 对 中m b 、f b 、r b ) ,水平细胞( h ) 和无足细胞( a ) 。第三层是神经节细胞( 图 ( 曲中m g 、d g ) ,它的神经纤维形成视束,向侧膝体延伸,所阻神经节细胞是视 网膜的输出端。估计人的神经节细胞大约1 0 6 个,从数量上考虑,视网膜绝非一 对一的简单线性关系,而是十比一的大量压缩。 来自于不同眼球的视神经在视交叉发生交汇。视交叉位于大脑额叶的底部。 来自于取眼的信息在这一点进行交汇并根据视野进行划分。右侧及左例视野的信 息被分别传递到对侧( 左侧和右侧) 的大脑半球进行处理,如图2 一l ( b ) 所示。 外侧膝状体核( l g n ) 是丘脑的一个感觉中继核团。人类和灵长类动物的l g n 有六层。其中第1 、4 、6 层接收一只眼的信息而第2 、3 、5 层接收另一只眼的信 息。l g n 的六层结构与信用卡类似,但是厚度有信用卡的三倍它向上卷起形 成两个椭球面,大小和外形类似于两个小鸟蛋。 忡彻 匿2 - 1 视呵膜结构( 曲薷i 视觉系统解剖m - 8 - 第二章相关基本理论概述 信息在视网膜上经过初步3 nq - 后,主要沿着神经纤维经视交叉到达侧膝体, 外侧膝状体细胞发出的纤维经视放射投射至大脑皮层的初级视皮层( v d ,继而与 二级( v 2 ) 、三级( v 3 ) 和四级( v 4 ) 等次级视皮层发生联系。v 1 区与简单视感觉有 关,v 2 区与图形或客体的轮廓或运动感知有关,v 4 区主要与颜色感觉有关1 1 4 | 。 基本视觉信息包括亮度、形状、运动、颜色和立体视觉等,不同视觉信息的 处理是在视皮层的不同区域平行进行的。视觉信息在视细胞内形成后传给双极细 胞,继而再传给视神经细胞,在这两种细胞之间还插入有双向输出、输入的水平 细胞和无足细胞,起着双向反馈调节作用。视细胞送出的是与光照有关的连续电 位,双极细胞和水平细胞的输入输出也是连续电位,而视神经细胞输出却是具有 “有”、“无”两种状态的脉冲电位。脉冲的幅度一定,但频率则随所受光刺激的 强度变化而变化。视神经细胞以后的视觉信息都变成了电脉冲的形式,在大脑中 枢神经中通过积分作用再将传来的密度调制脉冲信号变成模拟信号。 从解剖学结构中的视通路可以看到,视网膜、外膝体与视皮层构成了对视道 信息处理的三个基本层次。进一步的分析表明,不同视觉信息的信束从视网膜平 行地投射到丘脑外膝体不同的层,然后再投射到视皮层的不同区域。外膝状体与 视皮层,尤其是视皮层还有更为复杂的分块分层结构,分块表明了视觉信息处理 的并行性质,不同区域的神经细胞具有不同的功能;分层表明了视觉信息处理的 串行性质。因此,生物视觉系统是一个串行与并行处理相结合的复杂系统。 2 2 感受野的模型和描述 2 0 世纪6 0 年代视觉研究中把光学传递函数的一些概念引入,获得一批研究 成果。所谓光学传递函数,就是把电子和声学中的时间频率方法延伸到空间维上 面去,对系统给予一定幅度的频率刺激,记录输出相应的频率、相位和幅度,然 后改换另一频率作为刺激,再记录幅值和相位差,如此可以得到输入输出的幅值 一频率关系图及输入输出的相位差一频率关系图。如果系统是线性的,可以根据 这两张图写出传递函数,知道了传递函数t ( s ) ,可以知道任意输入下系统的反应: j r ( s ) = t ( s ) j ( 5 ) ( 2 - 1 ) 其中尺( s ) 是系统相应的拉氏变换,( j ) 是输入的拉氏变换,公式( 2 1 ) 在时域 内表达为 第二章相关基本理论概述 ,( f ) = p ( 卜f ) f ( f ) d f ( 2 2 ) 其中,( f ) 是输入f ( f ) 作用下系统的响应,t ( t ) 是系统的脉冲响应函数,它的 拉氏变换就是系统的传递函数。 早期的传递函数概念是建立在时间变量的基础上的,要把这一概念应用于光 学系统或视觉系统就要把时间变量改换成空间变量。对于空间变量系统公式( 2 1 ) 同样成立,只是把时间频率换成空间频率,也就是单位视角内明暗条纹的数目, 条纹越密集表示空间频率越高。f o u r i e r 理论指出,任何一幅图像可以由不同强 度的不同空间频率的明暗条纹叠加而成,这种分解过程是基于线性分析的基础上 的物理过程,与图像的生理含义无关,因此被认为是一种比较客观的光刺激模式。 m a f f e i 和f i o r e n t i n i 用不同空间频率的亮暗条纹作为刺激光模式,记录猫视 觉系统中视网膜、侧膝体和视皮层上单细胞的反应,得到如下结果:视网膜神经 节细胞的反应类似低通或带宽滤波器,它们随着刺激条纹的空间频率的增加而反 应减弱,截止频率随细胞而异,侧膝体层次上的细胞反应带宽变窄,低通特性减 少,而视皮层简单细胞的反应带宽更窄低通消失。实验结果表明,随着视觉系统 中层次的提高,空间频率的感受范围越来越窄,反应越来越专一i l5 1 。 人们希望以某种数学模型来对感受野进行模拟,以实现对视觉功能的数学语 言概括。经过不断的研究,不同的模型先后被用于模拟感受野,常见的模型包括 d o g 模型、神经网络模型和g a b o r 函数模型。 d o g 模型由r o d i e c k 于1 9 6 5 年提出,适合于同心圆结构的感受野的空间性 质,它的生物学背景是用小光点作为刺激模式的感受野性质,其表达式: g ( x ) = a e j 27 砰一b e j 2 7 西 ( 2 3 ) 其中工为空间变量,a 和曰分别代表兴奋性和抑制性成分的振幅,1 7 。和正代 表兴奋性和抑制性成分的空间散布程度。公式( 2 3 ) 是两个高斯分布( d i s t r i b u t i o n o fg a u s s ) 的差,所以简称d o g 函数。第一项代表兴奋分布,第二项代表抑制分 布,调节这两个分布的参数,可以得到0 1 1 中心感受野的特征曲线和o f f 中心感 受野的特征曲线,i a ,b ,q 仃,时代表o n r f ,a 盯2 时代表o f f - r f 。 由公式( 2 3 ) 很容易推广n - 维情况: g ( 工) = a e 一( x 2 - i - y 2 ) 7 砰一b 已一j 2 + y 2 ) 7 一 ( 2 4 ) 第一章相关基本理论概述 9 r t | f | | : i = 黼g 潞幕m ,= 制品赣貅m 圈2 - 2 感受野d o g 函数的图形表不 图2 2 给出了d o g 函数的三维图形和剖线图,其形状与同心圆结构的感受 野分布相吻合。 d o g 函数模型用非常简单的公式描述了感受野的空间性质,特别是哺乳动 物视网膜和侧膝体上同心圆结构的空间性质。但d o g 模型仅从信息的输入输出 角度描述空间信息的变换过程,所以只是一个功能模型,与感受野的具体神经结 构无直接联系,因此很难对它要求符合感受野的其他空间性质,如中心区与外周 区的相互抑制等,同时,d o g 模型由于其过于简单,无法描述感受野时间性质, 也无法说明哺乳动物视皮层上发现的各向异性感受野性质“。 为了能够更好的描述神经系统处理信息的过程,人们提出了神经网络模型。 人工神经网络( a r t i f i c i a ln e u t r a ln e t w o r k s ,简称a n n ) 是由大量简单的基本元件 神经元相互连接,模拟人的大脑神经处理信息的方式,进行信息并行处理和 非线性转换的复杂网络系统。 神经网络近来越来越受到人们的关注,因为它为解决大复杂度问题提供了一 种相对来说比较有效的简单方法。对于不甚了解机理的问题或不能用数学模型表 示的系统,如故障诊断、特征提取和预测等问题,神经网络往往是最有力的工具。 另一方面,神经阿络对处理大量原始数据而不能用规则或公式描述的问题表现 出极大的灵活性和自适应性。神经嘲络可以很容易的解决具有上百个参数的问 题。 人工神经网络的实质反映了输入转化为输出的一种数学表达式,这种数学关 系是由网络的结构确定的。 第三童塑茎董奎堡笙塑堕 一一 在结构上,可以把一个神经网络划分为输入层、输出层和隐含层。竺全譬竺 翥磊盖薹之高耋隐含层,这对神经网络使用者来说是不可见的,隐含层的层数和 每层黧篇焉鬻慧怒糊新凇元拣止与同层 在传统神经网络中同层神经元之间禁止互相学刊。母| 、甲毪兀百p 米上l 司h 压 耋譬其他鬻嚣制籍兽茎,嚣茎署磊亨淼薹燃3 节点- 5 为隐含层,节点6 为输出层,隐含层柙经兀- ,削撇硒任厦例? :i _ 。:! 喜磊强度相关。勺激活程度产生发送到其他节点的抑制信号j 沿着这些翼孥望 缀主鬈鬟蓄嚣暑莴瓣霈嚣套, l b 燃h l ;- j 翼 中每个单元对全部其他单元产生抑制,侧抑制恻络与硎制冗,宇日_ 孑 制反1 区一八 轰。概念上侧抑制模型只是在一层抑制的神经元构成。在这种模拟方式可以用由 三层构成的神经网络来组成输入层、抑制神经元的中间层和输出层口 抑制层 图2 - 3 侧抑制神经网络模型示例 喊舀釜黧懋黧鬈器徽芸搿燃淼羹徽茎 譬莩篙霍冀掣篙薹蓑鋈鍪鐾季羹霎凳窖萎! 鬣嘉莩篡茎言 野可以解释多种视觉现象,此模型是位于神经兀等级上的傲龇抽您刘3 苍又到 的宏黧渊淼霎鬈燃鬻鬻嚣槲来gbao r 函数最初用于小波变换,后来逐渐用于播还感毙野。地竺平不竺_ _ 越多的研究衾啊,g a b 。r 函数与人眼的生物作用相仿,是描述感受野性质的最佳 第二章相关基本理论概述 2 3g a b o r 函数 2 3 1g a b o r 函数的提出和应用 1 9 6 4 年,匈牙利科学家g a b o r 提出一对信息函数,这对函数在实域和频域 上达到不确定性下限,称为信息函数。激光技术的发明,使得光学上实现了全息 技术,g a b o r 由此获得了1 9 7 1 年诺贝尔物理学奖。g a b o r 最初提出的信息函数如 下: p _ x 2 1 f r 2s i n 且 p j 2 ,盯2c 。s a ( 2 5 ) 上式中x 为自变量,可为时间变量,也可为空间变量,仃为方差,为频率。 g a b o r 函数实际上是正弦函数( 余弦函数) 乘以正态分布,或者说,在正态分布函 数包络下的正弦( 余弦) 曲线。一对信息函数中e 。7 ,c o s 彦是奇函数,另一个是 偶函数。实际上正弦和余弦之间只有一个相位差( z t 2 ) ,所以这一对信息函数可 以用一个公式表达: e r7 旷c o s ( # + o 、 ( 2 - 6 ) 上式中0 = 0 即为余弦函数,0 = n 2 时为正弦函数。一维g a b o r 函数形状如 图2 4 所示,( a ) 为余弦函数,( b ) 为正弦函数。 图2 - 4 一维g a b o r 函数图形 ( b ) 1 9 8 0 年,澳大利亚科学家m a r e e l j a 首先用一维g a b o r 函数描述非对称型感 第二章相差基本理论概述 受野的剖线圈,这类感受野普遍存在于视皮层从而太大的扩展了模型存在的生 理学范围”q 。h u b e l w i e s d 在猫和猴子的是皮层上发现的感受野大都是非同心 圆式的感受野,g a b o r 函数中的正弦函数起的作用就是反对称的,与皮层上“边” 检察器的反应特征类似。而余弦函数是对称的,加入正态分布衰减足够快,把“波 动的余波”压抑足够快,可以近似的看作d o g 函数。因此用余弦表达的g a b o r 函数不仅可以描述感受野同心圆结构的空间性质,也可以描述非同心圆感受野的 空间性质。 图2 - 5 二维g a b o r 函数示意匿 d a u g m a n 把g a b o r 函数中的空间变量从一维推广到二维,如图2 5 所示,用 它来刻画感受野的空间性质。d a u g m a n 从信息理论角度对空间视觉进行了一系 列的计算分析、模拟研究和心理物理实验。1 9 8 0 年他分析了四种感受野模型, 提出绝大多数感受野的二维空间频率与朝向调制函数之间关系是不可分离的 t m l 。1 9 8 4 年d a u g r a a n 在人视觉的心理物理实验中证实了这点,并认为人的空间 视觉接近g a b o r 函数达到的最小不确定性下限。1 9 8 5 年他明确地指出哺乳动物 视皮层细胞的感觉野可用二维g a b o r 函数很好地描述,并从理论上证明二维 g a b o r 函数迭i 崆问域和额率域的下限。1 9 8 7 年j o n e s 等人用电生理实验测量了 视皮层1 7 区简单细胞空间及空间频谱的响应特性,在统计意义下,这些响应特 性可以用二维g a b o r 函数做相当好的拟台。他们指出二维g a b o r 函数不仅可对简 单细胞感受野的结构做出统一的数学描述,而且它们在两个互异空间上可以达到 最佳视觉滤波。从理论上解决了“特征检测”和“空间频率滤波器”的争论。 2 3 2 广义g a b o r 函数 汪云九、齐翔林和潘卓华于1 9 8 4 年第八届国际生物物理学会( b f i s t o l ,o k ) 上 第二章相关基本理论概述 分组报告中提出用一族广义g a b o r ( e x t e n d e dg a b o r , e g ) 函数描述视觉系统各层次 上感受野时空性质的数学模型。次年( 1 9 8 5 ) ,在生物物理学报上连续发表两篇论 文,详细阐述了这一模型内容。模型在两个主要点上不同于其他模型:一是用一 族函数( e g l ,e g 2 等) 来刻画视觉系统不同层次上感受野的时空性质【19 】;二是引 人时间变量t 以及相应的参数厂f 等,从而可描述感受野的许多时间性质【2 0 】。 广义g a b o r 函数( e g ) 模型,是一族函数,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论