计算机视觉技术_第1页
计算机视觉技术_第2页
计算机视觉技术_第3页
计算机视觉技术_第4页
计算机视觉技术_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机视觉技术1.概念计算机视觉(ComputerVision,CV)是一门研究如何让计算机达到人类那样“看”的学科。更准确点说,它是利用摄像机和电脑代替人眼使得计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,是人工智能领域的一个重要部分,它的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。计算机视觉是以图像处理技术、信号处理技术、概率统计分析、计算几何、神经网络、机器学习理论和计算机信息处理技术等为基础,通过计算机分析与处理视觉信息。几乎在每个计算机视觉技术的具体应用都要解决一系列相同的问题。这些经典的问题包括:识别:一个计算机视觉,图像处理和机器视觉所共有的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别,人脸识别,印刷或手写文件识别或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。广义的识别在不同的场合又演化成了几个略有差异的概念:识别(狭义的):对一个或多个经过预先定义或学习的物体或物类进行辨识,通常在辨识过程中还要提供他们的二维位置或三维姿态。鉴别:识别辨认单一物体本身。例如:某一人脸的识别,某一指纹的识别。监测:从图像中发现特定的情况内容。例如:医学中对细胞或组织不正常技能的发现,交通监视仪器对过往车辆的发现。监测往往是通过简单的图像处理发现图像中的特殊区域,为后继更复杂的操作提供起点。识别的几个具体应用方向:基于内容的图像提取:在巨大的图像集合中寻找包含指定内容的所有图片。被指定的内容可以是多种形式,比如一个红色的大致是圆形的图案,或者一辆自行车。在这里对后一种内容的寻找显然要比前一种更复杂,因为前一种描述的是一个低级直观的视觉特征,而后者则涉及一个抽象概念(也可以说是高级的视觉特征),即‘自行车’,显然的一点就是自行车的外观并不是固定的。姿态评估:对某一物体相对于摄像机的位置或者方向的评估。例如:对机器臂姿态和位置的评估。光学字符识别对图像中的印刷或手写文字进行识别鉴别,通常的输出是将之转化成易于编辑的文档形式。运动:基于序列图像的对物体运动的监测包含多种类型,诸如:自体运动:监测摄像机的三维刚性运动。图像跟踪:跟踪运动的物体。场景重建:给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景建立一个计算机模型/三维模型。最简单的情况便是生成一组三维空间中的点。更复杂的情况下会建立起完整的三维表面模型。图像恢复:图像恢复的目标在于移除图像中的噪声,例如仪器噪声,模糊等。2.原理计算机视觉就是用各种成像系统代替视觉器官作为输入信号,由计算机来代替人脑来完成、处理和解释。计算机视觉的最终研究目标就是使计算机能类似人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的终期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。计算机视觉学所研究的对象,简单地说就是研究如何让计算机通过图像传感器或其它光传感器来感知、分析和理解周围环境。模仿人类的视觉系统,计算机视觉系统中信息的处理和分析大致可以分成两个阶段:图像处理阶段又称视觉处理中的低水平和中水平阶段;图像分析、理解阶段又称视觉处理中的高水平处理阶段。计算机视觉系统中,视觉信息的处理技术主要依赖于图像处理方法,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。在图像处理阶段,计算机对图像信息进行一系列的加工处理,这主要是:1、 校正成像过程中系统引进的光度学和几何学的畸变抑制和去除成像过程中引进的噪声一统称为图像的恢复。2、 从图像信息如亮度分布信息中提取诸如边沿信息深度信息图像点沿轴方向的尺度,表面三维倾斜方向信息等反映客观景物特征的信息。3、 根据抽取的特征信息把反映三维客体的各个图像基元,如轮廓、线条、纹理、边缘、边界、物体的各个面等从图像中分离出来,并且建立起各个基元之间的拓扑学上的和几何学上的关系一称之基元的分割和关系的确定。在图像分析和理解阶段,计算机根据事先存贮在数据库中的预知识模型,识别出各个基元或某些基元组合所代表的客观世界中的某些实体称之为模型匹配以及根据图像中各基元之间的关系在预知识的指导下得出图像所代表的实际景物的含义,得出图像的解释或描述。在图像分析和理解阶段,计算机根据事先存贮在数据库中的预知识模型,识别出各个基元或某些基元组合所代表的客观世界中的某些实体称之为模型匹配以及根据图像中各基元之间的关系在预知识的指导下得出图像所代表的实际景物的含义,得出图像的解释或描述。必须强调,预知识在视觉系统中起着相当重要的作用。在预知识库中存放着各种实际可能遇到的物体的知识模型,和实际景物中各种物体之间的约束关系。计算机的作用是根据被分析的图像中的各基元及其关系,利用预知识作为指导,通过匹配、搜索和推理等手段,最终得到对图像的描述。在整个过程中预知识时刻提供处理的样板和证据。每一步的处理结果随时同预知识进行对比。有时,处理的中间结果和最终结果还要馈送给预知识库作为知识的更新和积累。计算机视觉也经常被称为图像理解,是指研究完成一项任务所需的视觉信息及如何从图像中获取这些信息的研究领域。其基本目的有三个:1,根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;根据一幅或多幅二维投影图像计算出观察点到目标物体的运动参数;根据一幅或多幅二维投影图像计算出观察点到目标物体的表面物理特性。要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的某些功能。也就是利用二维投影图像来重构三维物体的可视部分。3框架模仿人类的视觉系统,计算机视觉系统中信息的处理和分析大致可以分成两个阶段:视觉的图像处理阶段又称视觉处理中的低水平和中水平阶段;图像分析、理解阶段又称视觉处理中的高水平处理阶段。图像获取:一幅数字图像是由一个或多个图像感知器产生,这里的感知器可以是各种光敏摄像机,包括遥感设备,X射线断层摄影仪,雷达,超声波接收器等。取决于不同的感知器,产生的图片可以是普通的二维图像,三维图组或者一个图像序列。图片的像素值往往对应于光在一个或多个光谱段上的强度(灰度图或彩色图),但也可以是相关的各种物理数据,如声波,电磁波或核磁共振的深度,吸收度或反射度。预处理:在对图像实施具体的计算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采用来使图像满足后继方法的要求。例如:二次取样保证图像坐标的正确。平滑去噪来滤除感知器引入的设备噪声。提高对比度来保证实现相关信息可以被检测到。调整尺度空间使图像结构适合局部应用。特征提取:从图像中提取各种复杂度的特征。例如:线,边缘提取。局部化的特征点检测如边角检测,斑点检测。更复杂的特征可能与图像中的纹理形状或运动有关。检测/分割:在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,例如:筛选特征点。分割一幅或多幅图片中含有特定目标的部分。高级处理:到了这一步,数据往往具有很小的数量,例如图像中经先前处理被认为含有目标物体的部分。这时的处理包括:验证得到的数据是否符合前提要求。估测特定系数,比如目标的姿态,体积。对目标进行分类。视觉信息的处理技术主要依赖于图像处理方法,它包括图像增强、数据编码和传输、于图像处理方法,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。4.功能功能1:识别鉴别,对一个或多个经过预先定义或学习的物体或物类进行辨识,判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别,人脸识别,印刷或手写文件识别或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。广义的识别包括以下几个概念:(狭义的)识别,鉴别,监测,图像提取,姿态评估等等。功能2:运动,基于视频的对图像中运动物体的识别,监测,跟踪,轨迹等。功能3:

场景重建,给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景建立一个计算机模型/三维模型。功能4:图像恢复,是通过计算机处理,对质量下降的图像加以重建或恢复的处理过程。在图像恢复中,需建立造成图像质量下降的退化模型,然后运用相反过程来恢复原来图像,并运用一定准则来判定是否得到图像的最佳恢复。5.特点特点1:特点特点1:特点2:特点3:非接触、获得信息量大、作用距离远。多样性与不完善性。提高生产的柔性和自动化程度。在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉。特点4:可以快

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论