视网膜-视皮层映射模型在红外成像制导系统中的应用研究_第1页
视网膜-视皮层映射模型在红外成像制导系统中的应用研究_第2页
视网膜-视皮层映射模型在红外成像制导系统中的应用研究_第3页
视网膜-视皮层映射模型在红外成像制导系统中的应用研究_第4页
视网膜-视皮层映射模型在红外成像制导系统中的应用研究_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、_视网膜-视皮层映射模型在红外成像制导系统中的应用研究王立 张科 李言俊(西北工业大学航天工程学院导航制导教研室,西安,710072)本文以Schwartz提出的log-polar摘要 视网膜-视皮层映射是生物主动视觉的生理基础之一,映射模型为基础,结合生物视觉的大小视场系统,提出了一种基于红外成像系统视场角的LPT(log-polar transform)算法,构成了非均匀性的数据采集、传输结构模型,在成像制导信息处理中为解决视场角、分辨率、实时性三者间的矛盾提供了一条途径,本文基于此算法进行了相关验证,显示出利用此算法便于注意力机制在成像制导系统中的实现,并在目标跟踪方面也具有较好的应用前

2、景。关键词 视网膜-视皮层映射 LPT 视场角 *Retino-cortical mappings model and itsapplication in image-guiding system*Wang Li , Zhang Ke , Li Yanjun(Navigation and guidance lab of College of Astronautics,NPU ,Xian 710072,China)Abstract Retino-cortical mapping is a important attribute of human visual system, which enab

3、le human visual system can have the large visual field and high acuity on gaze point simultaneously. The aim of this paper is to use this mapping model in image-guiding system in order to resolve the conflict among “visual field angle”、 “acuity” and “real-time processing”. Based on Log-polar mapping

4、 model, this paper put forward a new algorithm of LPT. This algorithm is dependent on the visual field angle, then a non-uniformed data sampling、data transferring module is constructed. With this module, infrared image-guiding information processing system can realize the data reduction, especially

5、in tracking phase. In addition, it facilitates the visual attention system in image-guiding field.Key words: Retino-cortical mapping LPT Visual field angel * 高等学校博士学科点专项科研基金 (编号:20020699014) The project supported by the Higher University Doctor Subject Fund (No. 20020699014)_中国科技论文在线引言红外成像制导系统是目前精确制

6、导研究领域的重点,工程应用中一方面具有强烈的大视场要求以提高警戒、打击范围,另外要求有较高的目标分辨率以提高识别精度,此外还需要有实时处理图像信息,这是制导系统所必需的;但是目前的成像制导信息系统不具备信息采集、传输的空间可变特点,结果不可避免地出现了视场角、分辨率、实时性三者间的矛盾。针对这个问题,本文基于仿生的思路,研究视网膜-视皮层映射模型在成像制导系统中的应用,以探索对这一矛盾的解决途径。大自然是人类的老师,对人眼机制的探索和模拟已成为推动机器视觉研究的一条重要途径。其中主动视觉所模拟的生理机理集中在视网膜非均匀分布和眼动1,它使得人眼对感兴趣目标保持较高分辨率,而对周边背景的分辨逐渐

7、降低,从而保证了人类视觉系统在具有大视场的同时又可以高效的获取感兴趣的图像信息,这一视觉机制也被称为空间可变视觉2(space variant vision),当前研究最多的就是Schwartz45提出的对数极坐标变换(Log polar transformation),它源于对视网膜视皮层之间的映射关系的描述。2 视网膜-视皮层映射视网膜具有三层细胞结构:感受器、双极性细胞、节细胞;依离心率的大小又可以分为三个区域:窝区(<5o)、近窝区(5o-10o)、周边区(>10o)见图1.1;因为锥细胞(cone)是明视觉(photopic vision)的光感受器,所以下文以锥细胞的分

8、布作为讨论对象,其中窝区锥细胞的密度最大,并随离心率的增加锥细胞的密度快速降低,节细胞的分布也被证实有类似的非均匀分布特征,对应感受野的大小随离心率的增大而指数增大3,因此人眼是一种空间分辨率可变视觉系统,在视网膜窝区分辨率最高并依离心率大小呈指数下降,基于此人眼视觉也经常被分为窝视觉(fovea vision)和周边视觉(periphery vision)。此外,生物科学领域的研究成果还证实视皮层65%的区域对应着<5o的视网膜窝区,形成了下面的视网膜-视皮层映射示意图见图1.2。图1.1 人眼示意图 图1.2 视网膜-视皮层映射示意图Fig 1.1 A schematic repre

9、sentation of human eye Fig1.2 schematic representation of Retino-cortical mapping最早研究这种映射关系并提出模型的是Schwartz45,提出的模型被称为Log-polar映射模型,表达了一种图像描述的变化,其中笛卡尔坐标代表了视网膜(场景平面)坐标位置,而对数极坐标为对应的视皮层坐标位置见图2,描述关系的变换式如下:_中国科技论文在线笛卡尔坐标平面: z=x+iy (1)极坐标平面: =sqrt(x2+y2)=actag(y/x) (2)对数极坐标平面: =log = (3)图2.1 笛卡儿坐标表达 图2.2 对

10、数极坐标表达Fig 2.1 Representation of Cartesian coordinate Fig 2.2 responding representation of Log-polar coordinate对应位置见图2.2的z点=/3) 图2 对数极坐标变换映射示意图(图2.1的Z点与x轴方向夹角为60o,Fig 2 Schematic representation of log-polar transformation (point Z of Fig2.1, which has the angle 60o cross the Xaxis, respond to point z

11、 of Fig2.2 that coordinate =/3 )图2.1中的黑色区代表人眼注视区域(窝区),坐标圆点为注视点,图2.2为对数极坐标变换后的数据结构,可见LPT变换对注视区域数据进行了拉伸,表现为图2.2黑色区域放大;而对周边区域数据进行了压缩,表现为图2.1周边的环带数据在图2.2中的减缩;体现了人眼视觉系统对感兴趣区域(注视区)的高分辨率表达和对周边信息的低分辨描述。基于此模型本文给出人眼视觉系统图像的获取、传输信息流的简图图3。其中,视觉传感器就是视网膜的感受器层;LPT变换相当于由节细胞(ganglion cell)的轴突输出,并在视神经(optic nerve)、侧膝体

12、等中继结构传输的数据结构;视觉处理高端为视皮层(visual cortex),完成视觉信息的高级处理。此视觉信息流图描述了视觉系统中图像信息的非均匀性传递,同时也为机器视觉的图像高效获取提供了借鉴,下面基于图3研究LPT变换在主动视觉中的实现。图3 视觉系统的图像信息流简图Fig3 A chart of image information flow in visual system3 基于视网膜-视皮层映射的主动视觉实现因为工程中碰到的处理图像多属于离散数据结构,而Log-polar变换属于连续性的非线3_中国科技论文在线性变换,笛卡尔坐标与对数极坐标不存在一一映射关系,需要在距离轴和角度轴分

13、别离散化变换;另外图像对应的对数极坐标矩阵的大小反映了变换的缩减效率,而对数极坐标矩阵的大小可以根据工程的需要进行参数设定。为便于成像制导系统的应用,本文给出基于精确视场角的Log-polar变换实现,其中精确视场角的含义是在此角内需要保持高分辨率,而大于此角的区域分辨率快速较低。3.1 视场角与的关系设S为光学系统中心与目标的距离,光学系统的瞬时视场角为inst_,光轴中心对应的图像像素O点的笛卡尔坐标为(Center_x,Center_y),因为O点处于光轴之上,所以对应的视线角为零,从O 点向四周随距离的增大像素对应的视线角随之增大,距O点的最大距离设为max,则此处对应的视线角最大也就

14、是整个光学系统视场角的一半inst_/2。一般情形S较大,那么图像上任意点R(x,y)的视线角近似为: R()=Rinst_ 2max其中R= (4)上式的两个特例:R在O点时,R为0对应视线角为0;R处于距O点最大距离则R等于max,对应视线角为inst_/2。如果系统要求精确视场角为Min_,那么存在高分辨,根据(4)式求得: 率与周边低分辨的界限距离为c(此处视线角为Min_/2)c=InitmaxMin_ (5)距离注视点O小于c的点处于窝区,保持高分辨并存在数据拉伸;距离大于c的点处于周边区,分辨率降低存在数据减缩;距离等于c的点组成一个环为临界环,变换前后存在一一对应关系,数据没有

15、拉伸也没有减缩;关于这一点在3.2和3.3中有进一步的阐述。这样基于精确视场角的变换就可以转化为基于临界距离c的变换,下面在距离轴、角度轴分别做LPT变换。_中国科技论文在线3.2 距离轴离散化变换对数极坐标变换对距离进行了扭曲,扩张窝区(精确视场区域)、压缩周边区域,为了控 制数据量的减缩,增加参数k如下: =klog (6)下面讨论在精确视场角Min_的约束下,k值的确定,首先(6)式对距离求导'()=k/ (7) 极坐标平面的距离对应的对数极坐标平面的距离为:='()* (8)'()>1时,根据(8)式可见对数极坐标变换结果对原距离进行了拉伸,对应点的区域处

16、于注视区;反之()<1时,变换结果对原距离进行了压缩,对应点的区域处于周边区;临界距离为c,此距离下的圆环一一对应于变换矩阵里的一行像素,没有距离的拉伸和压缩因此:''(c)=1 (9) 结合(9)式和(7)式有:根据(5)式可得:k=c=k (10) maxc=InitMin_ (11) 那么对数极坐标矩阵距离轴离散化LPT变换公式如下式,其中以中括号代表取整运算符 =clog() (12) 假设图像对数极坐标矩阵的长为P,那么有:P=clog(max) (13)3.3角度轴离散化LPT变换对数极坐标变换为保角映射(conformal mapping),在极坐标平面的角

17、度:_中国科技论文在线=actag(y/x) (14) 根据上式的取值范围是-/2 /2,而图像的变换设计到整个圆周,本文通过平面四相限规格化处理,把整个环面的角度统一到0 2之内;为了对数极坐标矩阵进行角度轴离散化,增加参数L:=L (15)下面采用反推法,首先假设Min_约束下对数极坐标矩阵矩阵宽为Q,那么有:Q=L2 (16)对应系统LPT变换的可分辨最小角度为:min=2/Q (17)下面根据精确视场角Min_的约束讨论L的确定;场景图像可以认为由连续系列的同心圆环构成,随距离增大,圆环上的点逐步增多,点数为:N_point()=2 (18)圆环上像素间最小角度间隔,即完全分辨所需要的

18、分辨角近似为:min()=21= (19) Npo意义在于距离大于c的环完全分辨所需要的分辨角小因为距离为c的圆环为临界环,于min,因而无法完全分辨,呈现数据压缩模式;距离小于c的环完全分辨需要的分辨角大于min,因而对应超分辨率分辨,呈现数据扩张模式;临界环上像素点则对应正好可以分辨;因此结合式(17)、(19)有 min=min(c)=21= (20) N_point(c)c把(20)式结果代入式(19),得到:Q=2c (21)比较(21)和式(16),有L=c (22)因此角度轴的离散化LPT变换式:=c (23)这样就完成了对数极坐标变换中的角度轴离散化变换。3.4视觉高端对LPT

19、数据的还原在人类视觉系统中,高端处理主要集中在视皮层V1、V2、V3、V4、IT、MT等区域;比如V1区简单细胞、复杂细胞、超复杂细胞对空间域场景特征的识别处理,MT区对运动、V4对颜色等特征处理。基于图3所示的结构,LPT环节输出LPT矩阵,而LPT矩阵严格上 6_中国科技论文在线而言是一个传输中间环节,矩阵本身很难体现目标几何信息,而且由于存在对数极坐标变换对注视区域的拉伸作用,使得小于临界距离c的点在对数极坐标矩阵图上呈现离散状态(参见图4.2LPT矩阵图),因此视觉高端需要进行基于LPT矩阵的图像还原。根据式(12)(23),反运算得场景图像极坐标:=exp(/k) =/k (24)根

20、据式(2),场景图像笛卡尔坐标:x=cos() y=sin() (25) 还原图例见图4.3,因为还原图中像素直接源于LPT矩阵,而LPT矩阵是原图的缩减数据结构,因此表现为为一个离散的图像结构,中间保持高的分辨率,而周边采样率下降;图4.1 原红外图 图4.2 对数极坐标变换结果图 图4.3 对数极坐标变换还原图Fig4.1 Original infrared image Fig4.2 Log-polar image Fig4.3 Reverse mapping image此外人眼视觉系统具有非凡的填充能力,考虑人眼对盲点的填充可以体会出这一点,因此人对场景的实际感知图是一幅连续的图样图4.

21、4,图4.4是对图4.3进行的数据填充结果,进一步表达了人眼是一个分辨率空间可变的系统,在注视区保持高分辨而在周边分辨率快速降低。图4.4 实际感知的填充图样 图 5 扫描图(Ecc_=1o )Fig4.4 The perceptive image Fig5 Scanning image when Ecc_=1o4 视网膜映射算法在成像制导中的应用探索近年来,本教研室通过对蝇视觉系统的仿生研究取得了很多有价值的成果,发现蝇卓越的飞行能力是以其独特的视觉系统相关的,特性之一就是大场景系统和小场景系统的并行信息采集处理通道6,蝇复眼视觉系统具有几乎360o的视场角,大场景系统得到周边大范围区 7_

22、中国科技论文在线域的环境特征,进行飞行路线的控制,而小场景系统完成目标的识别、跟踪等任务;结合本文的模型,依据视场角的控制可以为大小场景系统提供一种有效的数学模型,实现灵活的图像信息获取。4.1 视场角大小与位置的控制本文第三部分提出了工程需要的基于精确视场角的离散LPT变换算法,为进一步在成像制导系统中的应用做好了准备。对于一套已有成像制导设备,根据3.1中(4)式控制Min_的大小就可以根据要求获得不同视场角的图样。本文以一套红外热像制导系统为例,它的瞬时视场角为3度,成像尺寸为140*140;根据式(4)式计算0.3o对应的k值约等于9和10之间,本文选择k为10,得到图4系列,原红外图

23、的数据量为19600个字节,经本文算法得到的对数极坐标矩阵数据量为1593个字节,是原数据量的1/12,可见实现了图像信息的高效抽取;这一点对于解决成像制导系统中视场角、分辨率、实时性三者间的矛盾是非常有意义的。本模型的另一个优势在于不必进行光轴的移动,仅通过选择注视点就可以实现对场景的扫描,这一点对于具有大视场角的制导系统有重要价值,因为制导系统视场角的扩大必然使得场境内出现多个感兴趣目标的机会更大了,通过扫描可以避免目标的遗漏。设G(Gaze_x、Gaze_y)为注视点的笛卡尔坐标,根据(4)式,定义扫描角度Ecc_为G点的视场角:Ecc_=G其中eInit_ maxe= (26)本文选择

24、为Ecc_=1o,得到对应的场景图样,见图5。把此模型用于成像制导系统,一方面选择较小的精确视场角,在保持较大视场而且没有牺牲注视区域分辨率的情况下,可以实现数据量大大缩减;另外,通过注视点的移动可以实现对场景的扫描,方便了进一步注意力机制的引入,并为将来大视场制导系统的信息获取和处理提供了解决途径。4.2 跟踪角的控制当制导系统处于跟踪阶段,对成像系统而言图像匹配算法被广泛应用,因为匹配算法的对于LPT矩阵,基于视场角与距离的关系,选择跟踪角,目的在于处理角内的场跟踪角对应的LPT矩阵距离轴位置 计算量较大,使得进行有效数据获取显得尤其重要,基于上述的模型可以方便的达到这一点。 景图像,而摒

25、弃跟踪角外的像素。_中国科技论文在线=klog()其中 = (27)对应LPT矩阵长度Ptrack=klog()LPT矩阵内<Ptrack的数据为跟踪区域,选择跟踪角=0.4o得到图6.1;当出现目标丢失,可以增加跟踪角来扩大视场,比如跟踪角为0.6o时的跟踪图还原,见图6.2。图6.1 跟踪图(=0.4o) 图6.2跟踪图(=0.6o)因为跟踪角的存在使得匹配算法所涉及的像素量大大缩减,而且可以结合波门跟踪的思 Fig6.1 Tracking image when=0.4o Fig6.2 Tracking image when=0.6o路进行跟踪角控制电路设计,通过调节跟踪角促进匹配运

26、算的实时完成。5 结论视网膜映射是视觉系统非均匀性的重要体现,也是视觉系统高效性的生理基础之一;本文基于仿生的思路,目的在于探索视网膜映射在红外成像制导系统中的应用,以提高成像制导系统数据处理的效率。文中提出了一种基于视场角概念的LPT离散化的算法,探讨了本算法在成像制导信息获取及处理中的应用前景;通过算例验证了视网膜映射模型在成像制导中可以有效的提取场景数据,另外通过调节精确视场角、跟踪角可以使系统具有灵活的数据获取及处理能力,当然基于本算法的红外成像系统运作策略仍然需要做进一步的研究工作。参考文献1 Gao Wen,Chen Xi-linComputer VisionBeijing: Tisinghua university Press(高文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论