论视觉模拟的应用与发展_第1页
论视觉模拟的应用与发展_第2页
论视觉模拟的应用与发展_第3页
论视觉模拟的应用与发展_第4页
论视觉模拟的应用与发展_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、论视觉模拟技术的应用与发展摘要:视觉模拟技术是自二十世纪六十年代中期迅速发展起来的一门新学科视觉模拟技术是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就 像人类和许多其他类生物每天所做的那样。由于算机视觉学在工农业生产、 地质学、天文学、气象学、医学及军事并学等领域有着极大的潜在应用价值,所以它在国际上越来越受人重视。本文简要地介绍了视觉模拟技术的研究内容,它同附近学科的关系,视觉模拟技术研究中面临的技术难点以及视觉模拟技术的 历史,现状和研究动向。关键字:视觉模拟技术 图像分割研究视觉模拟技术的研究Abstract the

2、 visual simulatio n tech no logy is since the middle of 1960's rapidly develop a new subject. Visual simulatio n tech no logy is to use computer and related equipme nt for the biological visual a simulati on .It is through the main task of gatheri ng pictures or video processed to obta in corres

3、p onding scene 3 d information, like humans and many other sort of do every day like that. Because the mach ine visi on to lear n in the in dustry and agriculture product ion, geology, astro nomy, meteorology, medical and military and lear n fields has a great potential application value, so it is m

4、ore and more people in the world by the attention. This article briefly introduced the research content of visual simulati on tech no logy, it n ear the relatio nship with discipli ne, visual simulatio n tech no logy research faced with in the tech ni cal difficulties and visual simulati on tech no

5、logy of history, prese nt situati on and tren ds.Key word :visual simulatio n tech no logy, image segme ntati on research, visual simulatio n tech no logy research1绪论视觉模拟技术既是工程领域,也是科学领域中的一个富有挑战性重要研究领 域。视觉模拟技术是一门综合性的学科,它已经吸引了来自各个学科的研究者参 加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数 学和统计学,神经生理学和认知科学等。视觉模拟技术学所研究

6、的对象,简单地说就是研究如何让计算机通过图象传 感器或其它光传感器来感知、分析和理解周围环境。人类感知外界环境主要通过视觉 ,听觉和触觉等四大感觉系统。其中视觉系 统是最复杂的。人类从外界获得的信息中视觉信号量最大。模仿人类的视觉系统 ,视觉模拟技术系统中信息的处理和分析大致可以分成 两个阶段: 图象处理阶段又称视觉处理中的低水平和中水平阶段; 图象分析、理 解阶段又称视觉处理中的高水平处理阶段。2 图像分割研究图像分割是图像处理与机器视觉的基本问题之一。其要点是 : 把图像划分成 若干互不交迭区域的集合。这些区域要么对当前的任务有意义,要么有助于说明它们与实际物体或物体的某些部分之间的对应关

7、系。图像分割的应用十分广泛 , 几乎出现在有关图像处理的所有领域 ,并涉及各种类型的图像。 例如 ,在遥感应中 , 合成孔径雷达图像中目标的分割 ;遥感云图中不同云系和背景分布的分割 ;在交通 图像分析中 ,把车辆目标从背景中分割出来。在这些应用中 ,分割通常是为了进一 步对图像进行分析、识别、压缩编码 ,分割的准确性直接影响后续任务的有效性。一般来讲 ,分割出的区域需同时满足均匀性和连通性的条件。其中均匀性是 指在该区域中的所有象素点都满足基于灰度、 纹理、彩色等特征的某种相似性准 则;连通性是指在该区域内存在任意两点的路径。尽管图像处理和机器视觉界的 研究者们为此付出了长期的努力 ,符合以

8、上两点的通用性分割仍面临着巨大的困 难;大部分研究成果都是针对某一类型图像、某一具体应用的分割。可以概括为 以下内容。3 视觉模拟技术的研究人类很多研究都是以延伸人类能力为目的的 ,早期的工作是在体力上延伸 ,计 算机发明以来 ,就拓展到对人类脑力和感知能力的延伸上。对人类视觉感知能力 的计算机模拟导致了视觉模拟技术的产生。 视觉模拟技术也经常被称为图像理解 是指研究完成一项任务所需的视觉信息及如何从图像中获取这些信息的研究领 域。其基本目的有三个 :(1) 根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;(2) 根据一幅或多幅二维投影图像计算出观察点到目标物体的运动参数 ;(3) 根

9、据一幅或多幅二维投影图像计算出观察点到目标物体的表面物理特 性。要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的某些功能。也就是利用二维投影图像来重构三维物体的可视部分。3.1 视觉模拟技术的应用领域视觉模拟技术的应用领域主要包括对照片、 视频资料如航空照片、 卫星照片、 视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器 人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。 早期进行数字图像处理的目的之一就是要通过采用数字技术提高照片的质 量,辅助进行航空照片和卫星照片的读取判别与分类。由于需要判读的照片数量 很多 ,于是希望有自动的视觉系统

10、进行判读解释 ,在这样的背景下 ,产生了许多航 空照片和卫星照片判读系统与方法。 自动判读的进一步应用就是直接确定目标的 性质 ,进行实时的自动分类 ,并与制导系统相结合。目前常用的制导方式包括激光 制导、电视制导和图像制导 ,在导弹系统中常常将惯性制导与图像制导结合 ,利用 图像进行精确的末制导。工业机器人的手眼系统是视觉模拟技术应用最为成功的领域之一 ,由于工业 现场的诸多因素 ,如光照条件、 成像方向均是可控的 ,因此使得问题大为简化 ,有利 于构成实际的系统。与工业机器人不同 ,对于移动机器人而言 ,由于它具有行为能 力 ,于是就必须解决行为规划问题 ,即是对环境的了解。 随着移动式机

11、器人的发展 , 越来越多地要求提供视觉能力 ,包括道路跟踪、回避障碍、特定目标识别等。目 前移动机器人视觉系统研究仍处于实验阶段 ,大多采用遥控和远视方法。在医学上采用的图像处理技术大致包括压缩、存储、传输和自动 /辅助分类 判读 ,此外还可用于医生的辅助训练手段。 与视觉模拟技术相关的工作包括分类、 判读和快速三维结构的重建等方面。长期以来 ,地图绘制是一件耗费人力、物力 和时间的工作。以往的做法是人工测量 ,现在更多的是利用航测加上立体视觉中 恢复三维形状的方法绘制地图 ,大大提高了地图绘制的效率。同时 ,通用物体三维 形状分析与识别一直是视觉模拟技术的重要研究目标 ,并在景物的特征提取、

12、表 示、知识的存储、检索以及匹配识别等方面都取得了一定的进展 ,构成了一些用 于三维景物分析的系统。近年来,基于生物特征(biometrics)的鉴别技术得到了广泛重视,主要集中在对 人脸、虹膜、指纹、声音等特征上 ,这其中大多都与视觉信息有关。与生物特征 识别密切相关的另一个重要应用是用于构成智能人机接口。 现在计算机与人的交 流还是机械式的 ,计算机无法识别用户的真实身份 ,除键盘、鼠标外,其他输入手段 还不成熟。 利用视觉模拟技术技术可以使计算机检测到用户是否存在、 鉴别用户 身份、识别用户的体势 (如点头、摇头 ) 。此外,这种人机交互方式还可推广到一切 需要人机交互的场合 ,如入口安

13、全控制、过境人员的验放等。4 对视觉模拟技术研究的认识视觉模拟技术研究经历了近 40 年的过程 ,仍面临许多问题。 主要由于这一方 向是多学科的交叉与结合 ,同时视觉是一个涉及生理、心理的复杂过程 ,不仅与眼 睛有关,还和大脑的推理、学习有关。研究视觉模拟技术的目的是要实现对人类 视觉的模拟和延伸。对于人类而言 ,视觉是一个轻而易举的功能 ,对机器却不同。 视觉过程很难用类似于问题求解的方法符号化。 随着计算机科学领域中对定量研 究的重视 ,这种状况会得到改善。在视觉模拟技术的研究过程中 ,应考虑将功能模 拟与认知模拟相结合。人类延伸其他能力的过程中 ,功能模拟起到了主要作用 ,但 视觉是涉及

14、心理和生理两方面的过程 , 因此必须在功能模拟的同时重视认知模 拟。计算理论的进步与感知手段的改进有助于视觉模拟技术的研究。 在视觉模拟 技术中计算理论占有十分重要的地位 ,计算理论的进步 ,新的计算模型的提出可以 解决以往一些困难的问题 ;另一方面 ,感知手段的进步也可以起到同样的作用。采 用主动视觉可从另一个侧面去处理面对的视觉问题。要实现完整的视觉系统,视觉知识的获取、 管理和利用是必不可少的。 一个相对完备的视觉系统同时也是一 个知识管理系统 ,在视觉过程中对一幅图像的理解需要大量的关于任务领域的知 识 ,这些知识不同于问题求解中的知识可以明确的显性表示 ,而且人类获取信息的 80%是

15、通过视觉得到的 ,因而这些知识涉及面之广难以预测 ,因此视觉系统中的知 识管理是一个重要问题。从以往的研究看 ,过去的几十年虽然提出、解决了一些问题 ,但是由于视觉问 题的特殊性和复杂性 ,还有大量的问题需要研究。研究的重点包括对新方法、新 手段的探索。当然 ,在原有问题上采用新的描述方法、求解手段也是一个可能的 突破点。在视觉领域中多数的问题不是问题本身正确与否 ,而是描述是否恰当以 及求解是否有效的问题 ,因而描述方式、求解手段的探索是十分重要的。总之 ,随 着对定量研究的重视 ,新的描述方式、 求解手段的研究 ,以及感知手段的改进 ,视觉 模拟技术的研究必将迎来一个更加繁荣的时代。参考文献 :1 陈熙霖. 视觉模拟技术:算法与系统原理 , 清华大学出版社 ,20002 高满屯. 视觉模拟技术研究中的投影理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论