(发展与教育心理学专业论文)场景图片中不同认知方式的视觉加工方式的眼动研究.pdf_第1页
(发展与教育心理学专业论文)场景图片中不同认知方式的视觉加工方式的眼动研究.pdf_第2页
(发展与教育心理学专业论文)场景图片中不同认知方式的视觉加工方式的眼动研究.pdf_第3页
(发展与教育心理学专业论文)场景图片中不同认知方式的视觉加工方式的眼动研究.pdf_第4页
(发展与教育心理学专业论文)场景图片中不同认知方式的视觉加工方式的眼动研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 删圳舢舢 y 2 14 9 2 7 2 本研究采用镶嵌图形测验筛选出3 0 名被试,场独立场依存型被 试各1 5 名,使用眼动仪对这3 0 名被试在不同任务中观察场景图像的 眼动过程进行了记录。实验一为自由观看图片实验,和实验二为目标 搜索实验。实验结果表明: ( 1 ) 不同场认知方式个体在对场景图片加工时,眼动模式确实 存在显著差异。 ( 2 ) 自由观看图片条件下,不同场认知方式个体的眼动轨迹和 注视事件存在着显著差异。场依存型个体对图片中的突显信息表现出 了更多的注视。 ( 3 ) 不同认知方式个体在自由观看图片的条件下,在一半的图 片的兴趣区内的兴趣区注视时间百分比和兴趣区注视次数酉分比上 存在着显著差异。另一半则不存在差异。通过进一步对两类图片的兴 趣区面积大小进行单因素方差分析之后,发现出现眼动指标显著差异 的图片的兴趣区面积大小要显著大于未出现眼动指标差异的图片。 关键词:场景认知;场认知方式;眼动;突显模型 a b s t r a c t 3 0o b s e e r s ( 1 8 2 6y e a r so l dw i t hn o r m a la e u i t y ) w e r es e l e c t e db y t h ee m b e d d e df i g u r et e s t 行o m7 5p a r t i c i p a n t 灿lo fs u b j e c t sa n t i c i p a t e d i nt h et w oe x p e r i m e n t so fd i 妇e r e n tt a s k sw h e ns c a n n i n gt h es c e n e i m a g e s ,t h e i re y em o v e m e n tt r a j e c t o r yw e r er e c o r d e db yt h ee y e l i n k i i e 汉p e r i m e n t1i s t h e 行e ev i e we x p e r i m e n t ,a n de x p e r i m e n t2i st h e o b j e qd e t e c t i o n 邸p e r i m e n t t h es t a t i s t i c ss h o w s : ( 1 ) t 1 1 e r e i s s i g n i 丘c a n td i 骶r e n c eb e 呐e e n t h ed i 虢r e n tf i e l d c o g n i t i o ni n d i v i d u a l sw h e nt h e ys c a nt h es c e n ei m a g e s ( 1 ) i ne x p e r i m e n t 1 ,m e r ei ss i g n i f i c a n t d i f e r e n tb e t w e e nt h e f i e l d d e p e n d e n c ea n df i e l d - i n d 印e n d e n c ei nt h e i r f i x a t i o ne v e n t s t h e f i e l d - d e p e n d e n c ea h o c a t e sm o r ea t t e n t i o nt ot h es a l i e n c eo ft h ei m a g e r e g i o n s ( 2 ) i ne x p e r i m e n t1 ,t h e r e i s s i g i l i f i c a n td i 骶r e n c eb e 俩e e nt h et h e f i e l d - d e p e n d e n c ea n df i e l d - i n d e p e n d e n c ei nt h e i rf b 【a t i o ne v e n t si nh a l f o ft h ep r e s e n t e di m a g e ,t h e r ei sn od i f b f e n ti nt h eo t h e rh a l fp r e s e n t e d i m a g e a e t e rt h ed i s c u s s i n go ft h es i z eo ft h e 心e ao fi n t e r e s t ( 趟) ,i tw o r k s o u tt h a tt h e r ei ss i g n i f i c a n td i 虢r e n c eb e 铆e e nt h es i z eo f 趟,s oi tc a nb e a s s u m e dt h a tt h e r em i g h tb ea c o r r e l a t i o n s h i pb e t w e e nt h ef i x a t i o ne v e n t s a n dt h es i z eo fa j t h u s ,w ec a n td e n yt h es i g n i f i c a n td i f f 色r e n c et h e d i 饪e r e n tf i e l dc o g n i t i o ns t y l e ss h o ww h e nt h e yw a t c hi m a g e s k e y w r o r d s :s c e n ec o g n i t i o n ;f i e l dc o g n i t i o n ;e y em o v e m e n t ; s a l i e n c em o d e l i i 场景图片中不同认知方式的视觉加工方式的眼动研究 引言 随着研究工具的进步和研究的深入,越来越多的研究者开始关注 人是如何知觉和加工周围真实的场景环境的。场景知觉的加工方式是 场景知觉研究中最基本的问题,对不同加工方式的探讨是研究关注的 核心之一。目前,在场景知觉的加工:方式研究中,自上而下( t o p d o w n ) 和自下而上( b o t t o m u p ) 的加工方式是研究者主要采用的解释场景知 觉中信息的提取与加工的方式。自上而下,即受任务的驱使,自下而 上则是指受图片特征刺激的驱使。没有清晰的证据表明在对视觉搜索 的加工中是哪一种加工方式占了绝对的主导地位,一些实验结果表明 视觉知觉受到刺激特征的影响,而另一些实验又显示白上向下的加工 机制可以超越自下向上的加工机制产生视觉知觉。 目前国外对场景知觉的加工方式的研究主要问题集中于建立可 以用于预测个体观看场景图片眼动轨迹的模型,观看场景图片时的眼 动轨迹与人在真实世界中眼动轨迹的差异,以及对突显地图神经机制 的研究。预测眼动轨迹的模型建立是目前的研究热点之一,现有认可 度较高的模型有,刺激驱动,目标驱动,和背景驱动模型三种,但是 目前并没有确切的实验结果可以证明是哪种机制发挥了主导作用。本 研究从自下而上的刺激驱动的理论基础出发,使用了自下而上的加工 方式中的重要的概念“突显地图”。“突显地图”最早由k o c h 和 u 1 1 m a n 在1 9 8 5 提出来的,并建立了完善的数学模型( 2 0 0 6 ) 。国内 对于场景知觉的研究尚处于起步阶段,王福兴等人对场景知觉及其研 究范式进行了介绍,王李艳、隋光远等人的视觉选择注意中性别差 异的眼动研究,理论和实证方面的研究均很缺乏,是一个亟待开发 的研究领域。 本研究从场认知方式的角度出发,以i t t i ,k o c h 的突显地图模型 为理论基础,讨论图片中突显区域对于不同认知方式的个体在处理图 片信息过程中的影响程度。实验假设,场依存风格的被试在观看图片 的过程中更倾向于为突显区域所干扰,会对突显区域表现出更多的注 视。理论上,讨论了可能的影响不同个体在面对场景图片时呈现出不 同眼动轨迹的因素,同时也增加了场认知方式在视觉知觉方面的研 究,加深对场认知内涵的理解,;实践上,可以针对不同场认知风格 的个体在实际生活和工作中如何更好地认识自身的特点,在视觉加工 的任务中扬长避短。 场景图片中不同认知方式的视觉加工方式的眼动研究 1 1 场认知方式 1 1 1 认知方式的基本概念 1 文献综述 认知方式是指个体在获得知识( 认知) 和加工信息( 概念化) 的 方式。认知方式与心理行为有关,是个体习惯性地用于问题解决,通 常是信息获得、分类和使用的方式。 认知方式的研究最早可以追溯到荣格( 1 9 2 3 ) 提出的心理类型理 论。l p o r t ( 1 9 3 7 ) 最早使用认知方式这一术语。最早采用实验方法 研究认知方式的是美国心理学家w i t k i n ,二十世纪3 0 年代w i t k i n 在 进行空间定向和垂直知觉的经典实验研究中发现了场依存场独立性 的这一维度,为认知方式的研究提供了开拓性的贡献。认知方式的研 究在6 0 年代十分盛行,而关于场认知的研究成果又尤为丰富。7 0 年 代到达顶峰后,一度研究的热潮衰退。9 0 年代后由于认知方式在教 育领域内的应用,其研究再度引起了重视。 认知方式的研究范围广泛,研究角度的差异很大,几十年间,研 究者提出了大量的认知方式类型,心m s t r o n g ( 1 9 9 8 ) 就曾列出了5 4 中认知风格的划分。心理学家在认知方式类型的整合工作做出过大量 尝试,其中比较有代表性的是以下两个分类模型: 一 一是r i c h a r c hj r i d i n g 等人概括的“认知方式两家族( 整体分 析和言语- 形象维度分类) ;二是g r i g o r e n k o 和s t e m b e 玛( 1 9 9 7 ) 将诸 多的认知方式理论分为三类,即以认知方式为中心、以人格为中心的 观点、以活动为中心的观点,以及s t e m b e r g 的心理自我控制理论。 场景图片中不同认知方式的视觉加工方式的眼动研究 对于认知方式概念及类型的梳理,使我们对认知方式的实质有了 更清晰的认识,从而能更深层次地理解不同认知方式的个体在认知活 动中表现出来的差异。 国内在二十世纪8 0 年代,谢斯骏、张厚粲等心理学者最早开始 了在认知方式问题的研究,主要研究不同性别、年龄的认知风格差异, 以及具有不同的认知风格在学业和职业上表现出来的倾向和差异等。 1 1 2 场认知方式的研究概况 在迄今确定的认知方式中,场依存一独立维度是研究的最为广泛 的,且在教育问题上有最广阔的应用t k i n ,d y k ,f a t e r s o n , g o o d e n o u 曲,k a r p ,1 9 6 2 1 9 7 4 ;w i t k i n ,l e w i s ,h e r t z m a n ,m a c h o v e r , m e i s s n e r ,w a p n e r ,1 9 5 4 1 9 7 2 ;w i t k i n ,1 9 7 6 ) ”。w i t k i n 等人认为“相 对场依存或场独立的方式,是个体认知机能的一个高度稳定的特征 。 虽然场依存场独立被看做是一个适应性的中性的风格维度,但是很 明显处于场依存场独立这个连续体两个相反的极端的儿童,在不同 的学业任务中的表现存在着差异。有关认知方式和学业成就之间关系 的研究显示了在所有的知识领域里,场独立被试始终能取得优于场依 存被试的结果。w i t k i n 提到场依存( 整体的) 和场独立( 链接的) 认 知方式之间对比的差异。w i t k i n 认为“场依存独立维度是一个连续 的量,大多数人处于这两个极端之间”,并且“在一个场依存的感知 模式中,场的组织看做一个整体支配其部分的感知:场中的物体与有 组织的场地融合在一起进行体验。在一个场独立的感知模式中,个体 能够将物体从有组织的场地中分离出来感知。”( w i t l 【i n ,1 9 6 7 ) 场景图片中不同认知方式的视觉加工方式的眼动研究 场依存场独立是最广为熟悉的认知方式分类之一。场认知方式指 的是以一种分析或者整体的方式处理环境的倾向。在感知方面,场独 立的个体能够将一个图形看做一个非连续的物体从背景中区分处理, 而场依存的个体并不擅长将物体从背景中分化出来。 w i t k i n ,m o o r e ,g o o d e n o u 曲和c o x ( 1 9 7 7 ) 提出了场依存和场 独立认知方式的个体的一些特征。场依存个体的感知很大程度上由当 时的场主导,其倾向于附着在既定的场组织之上。他们更可能使用已 经给出的场的组织。场依存个体较为乐群。相反,场独立个体将物体 大致与周围场分离开来感知。当呈现在一个有主导组织的场面前,他 们更可能克服了场的组织或者重组场的组织。场独立个体也更可能强 加他们自己的结构或者组织。他们逻辑分析能力更好,对抽象或者理 论性的事物感兴趣。他们不为他们的同伴、老师或者权威的人物所影 响,他们被认为是更独立的。作为场独立的个体,他们被认为有更加 客观的定位,对社交潜在的内涵不敏感。 1 1 3 场认知风格的信息加工观点 为了说明认知方式上的差异,w i t k i l l 提出了心理分化理论。该理 论假设,分化是有机体系统的一个主要形态特征,分化较小的系统处 于较同质的状态,分化较大的系统处于较异质的状态。心理分化高低 直接影响认知改组技能、注意的监控技能、信息的组织和提取能力的 高低。场独立的心理分化水平较高。关于不同认知改组能力,已有的 研究主要集中在视空间任务和言语任务中。李力红等( 2 0 0 2 ) 研究了 不同认知方式被试对无意义字母串的记忆提取的效率,以及刘宁、李 场景图片中不同认知方式的视觉加工方式的眼动研究 寿欣在对不同认知方式被试记忆社会性信息的研究等研究结果,表明 场独立风格的被试在注意、编码及某些长时记忆方面的表现要好于场 依存者。k u s h 研究发现场独立风格个体在空间变形、图画完型以及 地图学习等方面的决策更为有效,认为场独立风格的个体具有成熟的 元认知技能,即注意监控技能和信息的提取组织能力都较强。 在对不同场认知风格个体的注意过程的研究中发现,在选择性注 意任务中,对于简单任务,两种风格的被试没有显著的差异,但是任 务难度加大时,场独立被试表现要好于场依存被试,场依存个体倾向 于犯更多的错误( a 矿o l i o 等,1 9 7 9 ) 。在视觉搜索任务中,场依存被 试比场独立被试的效率更低,因为他们更可能将注意点局限在某一有 限的区域( s h i n a r 等,1 9 7 8 ) 。这些研究都证明了场依存型与注意过 程问存在一定的联系。这点跟g o o d e n o u 曲( 1 9 7 6 ) 的假设是一致的, 在注意过程中,场独立型个体比场依存型个体更有效率。 此外,研究者从工作记忆的角度出发研究不同场认知风格被试的 差异( r o b i n s o n & b e n n i n k ,1 9 7 8 ;c o c h r a n d a v i s ,1 9 8 7 ) 。结果发现, 信息加工负荷较轻时,场依存型的个体和场独立型的个体没有显著差 异;当信息加工负荷较重时,场独立型个体效率更高,更准确。可以 认为场认知风格与信息编码过程是相关的。 1 1 4 场认知方式的测量工具 w i t k i n 等人( 1 9 7 4 ) 提到“场依存。独立可以通过控制的、客观 的程序评估 。w i t k i n 和他的同事发展出了大量的测验来测量场依存一 独立的认知方式。 场景图片中不同认知方式的视觉加工方式的眼动研究 ( 1 ) 棒框测验 在棒框测验中,被试安排到一个暗室里,在暗室里他们将看到一 个可移动的发光棒包含在一个可移动的发光框之中。任务是将棒放到 一个垂直的位置。场独立的被试倾向于将棒和框看做是分离的物体, 能够将棒操作到一个垂直的位置无论框的位置如何。而场依存的个+ 体,倾向于依照框( 即一个场) 来定位棒的位置。早期的实验中,使 用的机械设备通常太大了通常不能在室外使用,且需要一个暗室。在 1 9 6 8 年o l t m a n 发明出了一个更小的可移动的棒框测验的桌面版本, 该版本更为实用且不需要暗室。 ( 2 ) 身体调节测验 身体调节测验的结构与棒框测验类似。在该测验中“感知的物体 是身体而不是一个外部的物体,比如说一根棒,问题是人们如何决定 在空间中身体本身的位置”。被试坐在放置在小房间里的一张椅子上。 椅子和房间可以各自按顺时针或者逆时针的方向倾斜。在被试坐下之 后,椅子和房间将被旋转到一个预先准备好的倾斜的背景。要求被试 将椅子调节到一个他她认为是竖直的位置。场依存的个体当完全与 周围倾斜的房间定位一致时倾向于认为他们自身是竖直的,即使他们 距垂直还相差了整整有3 5 度。 ( 3 ) 镶嵌图形测验 在镶嵌图形测验中,显示给被试一个简单的几何图形,然后再拿 开这个简单的几何图形。再显示一个复杂的图形给被试,要求指出在 复杂图形中的简单图形。场独立的个体可以迅速地找到出现在复杂设 场景图片中不同认知方式的视觉加工方式的眼动研究 计中的简单图形。相反地,场依存的个体不能在给定的时间内将简单 图形辨认出来。镶嵌图形测验的分数是在1 2 个测验中从复杂设计中 找到简单图形的平均时间。镶嵌图形又发展出了l 童版和成人版。中 国引进镶嵌图形测验后,又根据我国的具体情况对其进行了修订,现 在国内研究多采用的是北京师范大学修订版的“镶嵌图形测验”。 1 1 5 场依存性认知方式的生理机制研究 场依存性认知方式的神经生理机制方面的研究,始于w i t 虹n 等 人提出的心理分化假说。心理分化假说认为,神经生理分化是心理机 能分化的生理基础。大脑两半球机能不对称,是指两个半球的存在着 不同的功能系统,个体存在着一种选择应用于某侧大脑半球机能相关 的心理过程的倾向。分化假说使我们可以预测,心理领域的特殊化可 能与神经生理领域的特殊化相关。根据心理分化理论,可以推断,场 独立个体相较场依存个体会表现出更明显的大脑半球一侧化。已经有 研究结果表明,较大的神经生理分化通常与场独立的认知方式相关, 这支持了心理分化假说。大脑两个半球在知觉、情感等方面存在的差 异,集中体现在左半球的工作方式是分析性的,而右半球的工作方式 是整体性的。从场依存一场独立维度上来看,左半球处理信息的方式 与场独立型相关,右半球与场依存型相关。0 l t 而a n 等人( 1 9 7 7 ) 的 对被试进行合成照片与正常面孔比较的任务的研究结果表明,场独立 型越强的被试,左视野越突出。b e e r ( 1 9 8 8 ) 用“你的思维和学习风 格”测验来评估半球一侧化,统计结果表明,在镶嵌图形测验中成绩 显著高的被试更倾向于右半球优势。这些结果都肯定了场认知风格与 场景图片中不同认知方式的视觉加工方式的眼动研究 大脑功能一侧化之问的关系,并且场独立的被试更倾向于右半球一侧 化。 1 1 6 认知方式与大脑额叶功能 人类的大脑额叶是是脑和整个神经系统功能最为高级的一部分。 大脑额叶的功能与认知方式表现出了的行为特点具有明显的相似性。 首先,w i t k i n 使用的身体调节测试与研究额叶损伤使用的任务类似。 其次,场依存一场独立认知方式的维度反映了相对依赖于外部或内部 线索的倾向,这与诺塔对额叶功能的研究结果是相类似的。基于此, 韦伯( w - a b e r ) 提出不同认知方式中的差异反应了额叶有关的认知过 程的技能变化,即认知方式表现出来的差异是有生理基础的。与额叶 有关的认知过程可能影响用于认知加工的感觉信息的特性。根据该感 觉信息的特性,与某一侧大脑半球有关的认知过程会选择性地参与加 工。自发的动作( 如眼动等) 或控制过程影响了感觉信息的性质,导 致了相应认知过程的参与。运用到视知觉领域,则是指,当对视觉信 息进行简单随意地搜索或者扫视时,那么提供的加工感觉信息相对结 构低级,主要由右半球的加工参与。当对视觉信息进行有目的地、策 略性地搜索时,会促使产生详细的感觉信息,由左半球参与加工。 1 1 7 场认知方式的应用研究 ( 1 ) 场认知风格与性别 国内外研究已经表明,场认知风格与性别和年龄之间是存在相关 的。威特金等人用棒框测验对成年男子和成年女子进行施测,测验结 果表明,成年男子表现出更强的场独立风格,这可能与男性和女性在 场景图片中不同认知方式的视觉加工方式的眼动研究 大脑一侧化程度上的差异有关。 ( 2 ) 场认知风格与抑制干扰 在信息加工过程中,加工者不仅需要激活有关的目标信息,还必 须抑制无关信息的干扰,才能实现对目标信息的准确有效的加工。抑 制是指阻止干扰信息进入工作记忆或将已激活的干扰信息从工作记 忆中清除出去的认知机制。关于干扰和抑制的关系,目前越来越多的 学者倾向于把二者区分开来,认为抑制是一种积极的压抑加工,是保 持干扰信息于工作记忆之外的过程;而干扰是在多重刺激条件下,加 工或反应之间的竞争。这说明干扰效应是抑制机制未能有效起作用的 反映。国内学者宋广文,韩树杰( 2 0 0 7 ) 通过s 仰0 p 任务的测验,讨 论了不同认知方式的个体在s t r o o p 任务中的表现,以及其在内部信息 加工的抑制机制。实验结果表明,场独立者能有效抑制无关信息的干 扰,所以能摆脱对整个场的依赖进行局部分析和加工,易于从整体场 信息( s t r o o p 任务) 中分离出目标刺激( 念字或唱色) ,因此在 s t r o o p 任务中作业时间较短。场依存者倾向于采用整体线索组织和加 工信息,易受场内无关信息的影响,即抑制干扰信息的效能较低,因 而在s t r o o p 任务中的作业时间会较长。这说明不同场认知方式的个 体信息加工抑制机制存在明显差异。 ( 3 ) 认知方式与视知觉 a t c h l e v 发现具有典型场独立性特征的飞行员能够保持较高的飞 行情景意识水平和对运动物体的追踪及判断能力。k u s h 研究发现场 独立型个体在空间透视、空间变形、图画完形及地图学习等方面能够 场景图片中不同认知方式的视觉加工方式的眼动研究 更有效地进行决策。游旭群等认为场独立性与空间认知特征间具有很 高相关,发现不同人格特征个体在空间视觉加工上存在显著差异。曹 晓华,曹立人,马恭湘等人( 2 0 0 5 ) 通过让不同认知方式的个体对先 后呈现的两幅不规则图片进行比较,讨论不同认知方式的个体在不规 则几何图形识别绩效上的差异,实验结果表明认知方式对不规则几何 图形识别绩效的影响差异显著。场独立性被试的作业绩效高于场依存 性被试。 1 2 场景知觉 1 2 1 场景的界定和特性 人类的视觉研究分为三个层面( h e n d e r s o n & h o l l i n g w o r t h ,1 9 9 9 ; 王福兴,申继亮等,2 0 0 9 ) : 第一,低水平视觉研究。主要关注物理属性,如深度、颜色等 ( m a n ,1 9 8 2 ) 。 第二,中间水平视觉研究。主要关注对形状和空间关系的提取, 这种提取不涉及意义但需要选择性或系列的加工( u 1 1 m a n ,1 9 9 6 ) 。 第三,高水平视觉研究。主要关注从视觉表征到意义的映射,主 要涉及和认知交互相关的加工和表征的研究,具体包括了信息的动态 获取、对视觉信息的记忆和对物体、场景的识别。 ( 1 ) 场景分类 场景( s c e n e ) 可以分为两大类:人工场景( a r t i f i c i a ls c e n e ) 和真实场 景( r e a l w o r l ds c e n e ) 。人工场景是指由简单的图形、字母或符号构成 的排列( c h u n ,2 0 0 0 ) 。真实场景是指由背景和按照一定的空间模式排 场景图片中不同认知方式的视觉加工方式的眼动研究 列其中的各种离散物体构成的语义一致的真实环境图像,通常用于对 高水平场景知觉的研究。人们对真实场景和人工场景的视觉加工和认 知存在重要的差别:真实场景是被作为一个有语义特征的复合体来认 识的,它能够反映场景中各个刺激物的全部信息:而人工场景没有明 。确的语义含义,无法从抽象的水平上分析视觉力口工过程 ( h e n d e r s o n f e r r e i r a ,2 0 0 4 ;康廷虎,白学军,2 0 0 8 ) 。因此不能用对 人工场景的视觉加工研究来代替对真实场景认知的研究。本文中将场 景限定为真实场景( r e a l w o d ds c e n e ) 。 ( 2 ) 背景的功能 , 背景是场景知觉研究中的一个重要概念。背景是场景中除特定的 物体外,与物体存在语义关系的连续体。一般情况下,物体不是单独 出现的,而是总是与其存在语义联系的背景同时出现的。在有利的条 件下,由物体自身的大量的线索( 颜色,形状,结构) 就能够足够清 楚地辨认物体的类别。在观察质量不好的情况下( 比如,距离远,或 者短时获得) 背景似乎在加强辨认的可靠性上扮演了主要的角色。在 真实世界场景中,本质物体信息通常由于闭合,照明,阴影,边缘视 觉和距离降级,导致了不佳的分辨率和或对比。在缺少足够有关一 个物体身份的局部证据时,场景结构和世界规律的先前知识提供了辨 认和定位物体的唯一信息。 1 2 2 自上而下和自下而上的加工方式 灵长类的视觉皮层是多水平选择过程的执行,其中自下而上 的刺激特征和自上而下的注意转变结合在一起,使得相关的信息能够 场景图片中不同认知方式的视觉加工方式的眼动研究 被持续地注意强调以及最终进行分析。自上而下是由意志控制和依赖 于任务目的的方式,相对缓慢,代表了有机体的内部状态;自下而上, 突显驱动和与任务目的无关的方式,相对快速,是输入感觉信号的性 质。这两种过程结合了感觉信息和注意转换来创造一个整合的视觉环 境的突显地图,该地图在网膜像上标记有兴趣的区域,并有助于指导 注视转换到其他位置。这种突显地图通过电路性质创造,如许多视觉 神经元的对抗中央环绕组织,和动态影响,如注意。导致的稀疏的视 觉环境表征反应了系统对最有关信息的最佳猜测。依赖于最突显的方 面可能并不总是合适的但是它是一种对有限加工资源的有效使用,因 为低突显的方面需要更多的加工因为它们的低信号噪音比率。突显地 图是的视觉系统整合大量的信息,即使在中央窝之外,因为它为感觉 输入中潜在最相关的信息提供了一个有效地编码图示。 1 2 3 场景知党加工的模型 研究者已经提出了不同的可能对视觉搜索时的注意指导起作用 的机制,深入地在建模和行为工作两方面进行了探索( b m c e , t s o t s o s ,2 0 0 5 ;i t t i ,k o c h n i e b u r ,1 9 9 8 ;l i ,2 0 0 2 ;t o r r a l b a ,2 0 0 3 ) 。许多 的研究显示局部统计与背景统计不同的区域更可能吸引一个观察者 的凝视:独特的颜色,动作,定向,或者大小构成了最普遍的突显属 性,至少在简单的显示中( w r o l f e & h o r o w 沱,2 0 0 4 ) 。有突显指导可 能也对复杂图像的早期注视起作用( i t t i & k b c h ,2 0 0 0 ;p a r l 【1 1 u r s t ,k l w & n i e b u r ,2 0 0 2 ;v a nz o e s t ,d o n k ,& t h e e u w e s ,2 0 0 4 ) ,尤其当场景背景 没有提示信息时( p a r k h u r s te ta 1 ,2 0 0 2 ;p e t e r s ,i y e r ,i t t i k b c h ,2 0 0 5 ) 场景图片中不同认知方式的视觉加工方式的眼动研究 或者在自由观察时。在自然图像中,注意到客体比起它的背景更突显 是很有意思的( t o r r a l b a ,0 l i v a ,c a s t e l h a n o ,& h e n d e r s o n ,2 0 0 6 ;e l a z a r y & i t t i ,2 0 0 8 ) ,所以动眼指导过程可能使用突显作为启发式来注视在场 景中的客体,而不是用背景。 除了由突显自下而上的指导,还有一个由任务调整的视觉注意的 白上而下组成。在搜索时,观察者可以选择注意更可能包括目标的场 景区域。在经典的搜索任务中,目标特征是一个普遍存在的指导资源 ( 1 1 r e i s m a n & g e l a d e ,1 9 8 0 ;w r 0 1 f e ,c a v e & f r a n z e l ,1 9 9 8 ;w r o l f e ,1 9 9 4 , 2 0 0 7 ;z e l i n s k 弘2 0 0 8 ) 例如,当观察者搜索一个红色的目标,注意快 速地捕捉到场景中的红色物体。尽管一个自然物体,比如一个行人, 没有单独的定义特征,仍然有统计可靠的性质( 向上的形式,圆的头, 竖直的身体) 可以由视觉注意选择。事实上,有真实世界搜索任务中 有相当的目标驱动注意指导的证据( e i n h a u s e re ta l ,2 0 0 8 ;p o m p l u n , 2 0 0 6 ;r a o ,z e l i n s k y ,h a y h o e & b a l l a r d ,2 0 0 2 ;r o d r i g u e z s a n c h e z , s i m i n e & t s o t s o s ,2 0 0 7 ) 。 另一个应用在生态搜索任务中的自上而下成分是场景背景。自然 场景的统计规律提供了目标位置和出现的丰富的线索( e c k s t e i n , d r e s c h e r s h i m o z a k i ,2 0 0 6 ;h o i e m ,e f r o s ,h e b e n ,2 0 0 6 ;,】1 0 r r a l b a 0 l i v a ,2 0 0 2 ;1 胁r r a l b a & 0 l i v a ,2 0 0 3 ;0 l i v a 卫d r r a l b a ,2 0 0 7 ) 。在一次扫 视中,整体信息可以提供关于空问布局和场景分类的有用的信息 ( j o u b e r t ,r o u s s e l e t ,f i z e & f a b r e t h o r p e ,2 0 0 7 ;g r e e n e 0 1 i v a ,2 0 0 9 ; r e n n i n g e r & m a l i l 【,2 0 0 4 ;m c c o t t e r ,g o s s e l i n ,s o w d e n ,s c h y n s , 场景图片中不同认知方式的视觉加工方式的眼动研究 2 0 0 5 、) 。分类的场景信息告诉了一个观察者哪个物体更可能出现在场 景中,会出现在哪儿( b a r ,2 0 0 4 ;b i e d e 咖a n ,m e z z a n o t t e ,& r a b i n o w i t z , 1 9 8 2 、l 。而且,整体特征可以足够快地提取出来从而影响早期搜索机 制和注视( c a s t e l h a n o h e n d e r s o n ,2 0 0 7 ; c h a u m o n , d r o u e t t a l l o n b a u d r y ,2 0 0 8 ) 。 目前,在预测搜索机制和注视方面准确度较高的三个模型分别为 突显模型,目标特征模型和场景背景地图模型。 ( 1 ) 突显指导模型 突显的计算模型通常基于一个原则:他们使用了一个局部图像特 征的混合( 比如,在不同空间水平的颜色和定向) 来决定局部异常值 的区域假定跨更大区域的图像的统计特征分布。这些模型之下的假设 是与附近区域性质不同的位置或者图像作为一个整体是最有信息性 的。确实,在一个图像中很少图像特征更可能有物体特征( e l a z a r y & i t t i ,2 0 0 8 ;t o r r a l b ae ta 1 ,2 0 0 6 ) ,而重复的图像特征或者大的同质区域 不可能是物体类( r o s e n h o l t z ,l i n a k a n o ,2 0 0 7 ;b r a v o & f a r i d , 2 0 0 4 ) 。计算突显包括了估计在图像中局部特征的分布最具代表的计 算模型是i t t i ,k o c h 提出的突显地图( s a l i e n c em a p ) 计算模型,即本 研究使用计算模型。 ( 2 ) 目标特征指导模型 搜索指导另一个普遍的资源是目标特征( w r o l f e ,2 0 0 7 ;z e l i n s k y , 2 0 0 8 ) 。辨别一个物体外表的相关仍然是一个困难的问题,尽管最近 计算机视觉方法在一些物体类别已经到了优秀的表现( 如,面孔, 场景图片中不同认知方式的视觉加工方式的眼动研究 u l l m a n ,d a l n a q u e t ,& s a l i ,2 0 0 2 ;车,p a p a g e o 唱i o u & p o g g i o ,2 0 0 0 ; 行人,d a l a l t r i g g s ,2 0 0 5 ;汽车,自行车和行人s e r r e ,w b l f b i l e s c h i , r i e s e n h u b e r p o g g i o ,2 0 0 7 ;t o m l b a ,f e r g l l s f r e e m a n ,2 0 0 8 ) 。目标 特征指导模型中最具代表性的是d a l a l t r i g g s ( 2 0 0 5 ) 和d a l a l , t r i g g s ,s c h m i d ( 2 0 0 6 ) 发展的人物探测器,其编码可以在网上获得, 而且以一个合理的速度陈述了人工探测表现。 d a l a l t h g g s ( d t ) 探测器是一个使用了一个扫描窗方法来探 索在所有位置和水平的分级器探测器。分级器萃取了来自于该窗口的 特征集且应用了一个线性支持向量机器( s v m ) 来分类属于目标或者 背景类别的窗口。特征是一个剃度导向的直方图( h o g ) 描述量。这 个探测量对竖直的人物形象整体敏感,但是相对对在手臂和腿姿势的 变量不那么敏感。 ( 3 ) 背景指导模型 背景指导模型情景中的目标搜索提供了一个概率框架。背景指导 模型执行了一个自上而下的限制选择了“相关”搜索任务的图像区域。 在一个人物搜索任务中自上而下的限制,举例来说,将选择对应人行 道的区域而不是天空或者树。在o l i v aa n dt o h a l b a ( 2 0 0 1 ) 中,采用了 一个使用“整体特征”的集的表征,该整体特征提供了图像中空间频 率和定向的空间组织的整体描述。 1 2 4lt ti ,k o c h 的突显地图( s alie n c em a p ) 模型 1 2 4 1 突显模型介绍 i t t i ,k o c h 的突显地图( s a l i e n c em a p ) 模型是突显指导模型中最 场景图片中不同认知方式的视觉加工方式的眼动研究 完善最具代表的计算模型,是本研究用于处理图片的计算模型。 突显指导的视觉注意模型建立在生物解释的结构之上,是由 k o c h 和u l l m a n 在基于一些模型的基础之上提出来的。本模型与“特 征整合理论”是相关的。“特征整合理论”理论提出解释人类视觉搜 索策略。第一次将视觉输入分解成为一个地形学特征的地图集。在每 个地图中,不同的空间位置为突显而竞争,只有从环境中局部突显出 来的位置才能持续。所有的特征地图整合到一个主要的“突显地图”, 以纯粹的自下而上的方式,突显地图在整个视觉场景中对局部显著进 行了地形学上的编码。在灵长类动物中,这种地图任务是位于后顶叶 区,同时也位于丘脑枕核。该模型的突显地图赋予了产生注意转换的 内部动态。因此,本模型表现的是一个完全的自下而上突显的解释, 且不需要任何白上而下的指导用以转换注意。这个框架提供了一个为 大规模平行执行的方法,该方法用于需要由更复杂和耗时的物体识别 过程分析的一些小部分的有意思图像位置提供的快速选择。再延伸一 下,这个方法,从更高级皮层区域反馈的“指导搜索”中( 如,关于 需要寻找的目标的知识) ,用于评估不同特征的重要性,从而只有高 权重的才能达到更高的加工过程。 1 2 4 2 模型的建构 模型的输入是静止彩色图像的形式。通过动态高斯金字塔创造九 个空间水平 1 1 ) ,该金字塔逐渐地低通过滤和提取输入图像的子样 本,产生从1 :1 ( 水平0 ) 到1 :2 6 5 ( 水平8 ) 八个度的水平和垂直的 图像折减系数。 场景图片中不同认知方式的视觉加工方式的眼动研究 每个特征通过一个线性“中心一周围”( c e n t e r s u r r o u n d ) 操作的 组计算,该操作类似于视觉接受场:典型的视觉神经元对视觉空间( 中 央) 的一个小区域是最敏感的,而呈现在更广阔、减弱的以中央为同 心圆的拮抗区域抑制了神经元的反应。这种结构,对局部空间的不连 续敏感,尤其适于探测从周围局部突显出来的位置,而且是在视网膜, 外侧膝状核和初级视觉皮层的一个通用的计算原则 1 2 】。“中央周围” 操作在模型中作为好的和粗糙水平之问的差异执行:中央是在水平 2 ,3 ,4 上的像素,周围则对应于在水平s = c + 6 水平上的像素,其中6 3 ,4 ) 。两个地图之间的跨水平差异,以下以“o ”表示,是由好的 水平和逐点减去的内插值得到的。不仅仅对c 使用一些水平,也对6 = s c 使用,从而产生了真正的多水平特征提取,通过包括中央和周围 区域之间不同的大小比例【5 】。 突显地图的早期视觉特征地图包括了三种性质的特征:色彩,方 向,密度。 ( 1 ) 色彩特征地图 。 色彩特征的提取用r ,g 和b 这三个字母表示。r ,g 和b 代表红, 绿和蓝三个输入图像的渠道,密度图像i 通过i = ( r + g + b ) 3 得到。i 用于创造一个高斯金字塔i ( o ) ,其中o 【o 8 是水平。r ,g 和b 渠 道通过i 标准化以从密度中解耦色彩。然而,因为色彩变量在很低的 亮度上不能被感知到( 因此是不突显的) ,标准化只用于在整个图像 中i 大于它的最大值的1 1 0 的位置( 其他位置产生0r ;g 和b ) 。创 造了四个大致调整的彩色渠道:红色是r = r 一( g + b ) 2 ,绿色是 场景图片中不同认知方式的视觉加工方式的眼动研究 g = g ( r + b ) 2 ,蓝色是b = b ( r + g ) 2 ,以及黄色y = ( r + g ) 2 一i r - g i 2 - b ( 负值设 为零) 。四个高斯金字塔r ( o ) ,g 从( o ) ,b ( o ) ,y ( o ) 从这些彩色渠道 中创造出来的。 中央一周围差异“o ”在一个“中央”好的水平c 和一个“周围” 粗糙点的水平s 产生了特征地图。特征地图的第一个集与密度对比是 相关的,密度对比在哺乳动物中是通过神经元要么对在明亮的背景的 暗的中央敏感,或者对在暗的背景的明亮的中央敏感。这里两种敏感 是同时计算的( 使用一种纠正) 在一个六个地图i ( c ,s ) ,其中c 2 ,3 ,4 ) ,s = c + 6 ,6 3 ,4 ) 的集中: i ( c ,s ) = l i ( c ) i ( s ) i( 1 - 1 ) 地图的第二个集与彩色渠道相似的建构起来,第二个集在皮层上 使用“彩色双竞争”系统表示:在他们接收场的中央,神经元由一个 颜色( 如红色) 兴奋,被另一个颜色( 如绿色) 抑制,然而在背景中 反之亦然。这种空间和颜色竞争存在于红绿,绿红,蓝黄和黄蓝色 对中在人类的初级视觉皮层中。相应地,地图r g ( c ,s ) 在模型中 创造出来以同时解释红绿,绿红双竞争( 等式2 ) ,和b y ( c ,s ) 解释蓝黄和黄蓝双竞争( 等式3 ) : 船( c ,j ) = l ( 月0 ) 一g ( c ) ) o ( g ) 一月o ) ) i ( 1 2 ) 缈( c ,s ) = i ( b ( c ) 一】,( c ) ) ( 】,o ) 一b o ) ) l ( 1 3 ) ( 2 ) 方向特征提取 场景图片中不同认知方式的视觉加工方式的眼动研究 局部方向信息使用方向高博o ( o ,o ) 金字塔的i ,其中o 【o 8 表示水平,o o 。,4 5 。,9 0 。,1 3 5 。) 表示方向。( 高博过 滤器,是余弦光栅和一个2 d 高斯遮盖,近似于在初级视觉接收场敏 感侧面图( 脉冲响应) ) 。方向特征地图,0 ( c ,s ,o ) ,以组为单位, 解码中央和背景水平之间的局部方向对比: o p ,5 ,9 ) ;l o ( c ,口) o ( s ,p ) l ( 1 4 ) 总共,需要计算4 2 个特征地图:六个密度特征地图,1 2 个色彩 地图和2 4 个方向地图。 突显地图的目的是用于以标量表示在视觉场中的每个位置的显 著或突显,以基于在突显的空间分布上指导注意位置的选择。一 个特征地图的整合提供了突显地图的白下而上的输入,为一个动态的 神经网络建模。 结合不同特征地图时的一个困难是他们表示的是一个先验 ( p r i o r i ) 的而不是可比较的模式,有不同的动态范围和提取机制。 而且,因为所有4 2 个特征地图进行了结合,只在一些地图中显得强 烈的突显物体,可能被呈现在更大范围的地图中的干扰或者不那么突 显的物体掩蔽里。 在缺乏白上而下的监督下,我们建立一个地图规范化操作,n ( ) , 同时整体压制了包含大量可比较高峰反应的地图。n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论