第1讲-计算机视觉总论课件_第1页
第1讲-计算机视觉总论课件_第2页
第1讲-计算机视觉总论课件_第3页
第1讲-计算机视觉总论课件_第4页
第1讲-计算机视觉总论课件_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机视觉概述计算机视觉概述1本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用本节内容人类视觉2百闻不如一见Onepictureisworthmorethantenthousandwords. 百闻不如一见Onepictureisworthmor3人类视觉视网膜外侧膝状体视皮层周围环境中的物体在可见光的照射下,在人眼的视网膜上形成图像,由感光细胞转换成神经脉冲信号,经神经纤维传入大脑皮层进行处理与理解。人类视觉视网膜外侧膝状体视皮层周围环境中的物体在可见光的照射4人类约有75%的信息是通过视觉系统获取的。视觉是思维的一种最基本的工具人类视觉人类约有75%的信息是通过视觉系统获取的。人类视觉5计算机视觉计算机视觉是一门研究如何使机器“看”的科学,即用摄影机和电脑代替人眼对目标进行识别、跟踪和测量。用计算机实现对视觉信息处理的全过程计算机视觉计算机视觉是一门研究如何使机器“看”的科学,即用摄6计算机视觉人类视觉是通过人眼来感知世界的过程

输入:通过眼睛对世界的观察

输出:对世界的感知计算机视觉人类视觉是通过人眼来感知世界的过程7计算机视觉计算机视觉是通过对图像和视频的分析处理,实现类似人类视觉感知能力的过程

输入:图像(images)或视频(video)输出:对象的恢复以及对对象信息的使用计算机视觉计算机视觉是通过对图像和视频的分析处理,实现类似人8本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用本节内容人类视觉9视觉的计算理论

——Marr的视觉计算理论框架DavidMarr(1945-1980)是英国心理学家。他将心理学、人工智能和神经生理学的结果结合起来,对视觉的研究做出了重要贡献。他是计算视觉的奠基人。DavidMarr70年代末在美国MIT提出了第一个较为完善的视觉系统框架此框架尽管存在很多缺陷,但过去20多年一直处于主导地位D.Marr,Vision,1982.中译本:视觉计算理论姚国正、刘磊、汪云九译,科学出版社,1988。视觉的计算理论

——Marr的视觉计算理论框架DavidM10Marr的视觉计算理论框架

——视觉系统研究的三个层次

Marr的视觉计算理论框架

——视觉系统研究的三个层次

11一个例子:超市的自动收银机(cashregister)1)计算理论它做的是加法。为什么它做加法而不是乘法?2)表达与算法

加法的输入输出是十进制的阿拉伯数字。加法的算法是满十进一。3)物理实现

由电线和晶体管组成的电子设备。一个例子:超市的自动收银机(cashregister)1)12Marr的视觉计算理论框架

——视觉信息处理的三个阶段低层视觉(Low-levelvision)

构成所谓的“要素图”(primarysketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等)Marr的视觉计算理论框架

——视觉信息处理的三个阶段低层视13Marr的视觉计算理论框架

——视觉信息处理的三个阶段低层视觉(Low-levelvision)

构成所谓的“要素图”(primarysketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等)Marr的视觉计算理论框架

——视觉信息处理的三个阶段低层视14Marr的视觉计算理论框架

——视觉信息处理的三个阶段低层视觉(Low-levelvision)

构成所谓的“要素图”(primarysketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等)Marr的视觉计算理论框架

——视觉信息处理的三个阶段低层视15Marr的视觉计算理论框架

——视觉信息处理的三个阶段中层视觉(Intermediate-levelvision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)Marr的视觉计算理论框架

——视觉信息处理的三个阶段中层视16Marr的视觉计算理论框架

——视觉信息处理的三个阶段中层视觉(Intermediate-levelvision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)Marr的视觉计算理论框架

——视觉信息处理的三个阶段中层视17Marr的视觉计算理论框架

——视觉信息处理的三个阶段中层视觉(Intermediate-levelvision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)Marr的视觉计算理论框架

——视觉信息处理的三个阶段中层视18Marr的视觉计算理论框架

——视觉信息处理的三个阶段高层视觉(High-levelvision)

从2.5维描述得到完整的三维描述(恢复、表示和识别三维物体)Marr的视觉计算理论框架

——视觉信息处理的三个阶段高层视19Marr模型的缺点:假定视觉系统是被动的,给什么图像就处理什么缺乏或者未足够重视高层知识的指导作用由局部信息到整体信息的单向过程,没有反馈Marr框架的计算机视觉三阶段Marr模型的缺点:Marr框架的计算机视觉三阶段20本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用本节内容人类视觉21图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。图像去噪计算机视觉与相关研究领域

——计算机视觉与图像处理图像处理(ImageProcessing):实现从输入图像22计算机视觉与相关研究领域

——计算机视觉与图像处理图像增强图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。计算机视觉与相关研究领域

——计算机视觉与图像处理图像增强图23计算机视觉与相关研究领域

——计算机视觉与图像处理图像修复图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。计算机视觉与相关研究领域

——计算机视觉与图像处理图像修复图24计算机视觉与相关研究领域

——计算机视觉与图像处理图像去模糊图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。计算机视觉与相关研究领域

——计算机视觉与图像处理图像去模糊25图像中多余物体的去除计算机视觉与相关研究领域

——计算机视觉与图像处理图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。图像中多余物体的去除计算机视觉与相关研究领域

——计算机视26图像处理(ImageProcessing):实现从输入图像到另一种图像的转换(把输入图像转换成具有所希望特性的另一幅图象)。图像处理:人是最终的解释者计算机视觉:计算机是图像的解释者计算机视觉系统需要图像处理模块(利用图像处理技术进行预处理和特征抽取)计算机视觉与相关研究领域

——计算机视觉与图像处理图像处理(ImageProcessing):实现从输入图像27计算机视觉与相关研究领域

——计算机视觉与计算机图形学计算机图形学(ComputerGraphics):从三维描述到二维图像显示。(给定关于景象结构、表面反射特性、光源配置及相机模型的信息,生成图像。

)计算机视觉:从二维图像数据到三维描述。(给定图象,推断景象特性实现的是从模型到图像的变换,也就是说从图象数据提取信息,包括景象的三维结构,运动检测,识别物体等。)在一定意义上讲,计算机视觉是计算机图形学的逆问题两者从最初相互独立的平行发展到最近的融合是一大趋势计算机视觉与相关研究领域

——计算机视觉与计算机图形学计算机28计算机视觉与相关研究领域

——计算机视觉与模式识别模式识别(PatternRecognition):研究各类模式的分类,其中模式可以有不同的物理意义和表现形式。例如,文字识别或指纹识别。字符识别计算机视觉与相关研究领域

——计算机视觉与模式识别模式识别(29计算机视觉与相关研究领域

——计算机视觉与模式识别模式识别(PatternRecognition):研究各类模式的分类,其中模式可以有不同的物理意义和表现形式。例如,文字识别或指纹识别。计算机视觉与相关研究领域

——计算机视觉与模式识别模式识别(30计算机视觉与相关研究领域

——计算机视觉与模式识别图像模式的分类是计算机视觉中的一个重要问题模式识别中的许多方法可以应用于计算机视觉中在计算机视觉中模式识别技术经常用于对图象中的某些部分(例如分割区域)的识别和分类。模式识别(PatternRecognition):研究各类模式的分类,其中模式可以有不同的物理意义和表现形式。例如,文字识别或指纹识别。计算机视觉与相关研究领域

——计算机视觉与模式识别图像模式的31计算机视觉与相关研究领域

——计算机视觉与人工智能人工智能(Artificialintelligence):主要研究智能系统的设计和有关智能的计算理论与方法AImaybeconsideredashavingthreestages:perception,cognitionandaction计算机视觉经常被视为AI的一个分支计算机视觉与相关研究领域

——计算机视觉与人工智能人工智能(32计算机视觉与相关研究领域

——计算机视觉与心理物理学心理物理学(Psychophysics):主要研究人类自身视觉系统的有关机理与现象计算机视觉与相关研究领域

——计算机视觉与心理物理学心理物理33闪烁的蓝点在你移动视线时,图中的蓝点似乎在闪烁。但如果盯住一个点,这种发光便消失踪影。德国阿伦验光研究所在1994年发现的闪烁网格错觉现象“蓝宝石之光”闪烁的蓝点在你移动视线时,图中的蓝点似乎在闪烁。但如果盯住一34第1讲-计算机视觉总论ppt课件35第1讲-计算机视觉总论ppt课件36怀特效应——1979年,塔斯马尼亚高级教育学院的迈克尔·怀特发现了一种错觉现象,彻底改变了视觉学的面貌。如图所示,左侧的灰条亮度超过右侧灰条。而实际上,所有灰条都是一样的。在怀特发现这种现象前,所有亮度错觉均被认为由拮抗过程所致,也就是说,灰色物体在被白色物体包围时看上去更为暗淡,被黑色物体包围时则显得更为明亮。但在这幅错觉图中,被白色包围的灰条亮度更高,被黑色包围时则更为暗淡。迄今为止,怀特效应背后的大脑机制仍旧是一个未知数。怀特效应——1979年,塔斯马尼亚高级教育学院的迈克尔·怀特37年度最佳错觉图结合了怀特效应(窗帘后面的花瓶似乎呈现出不同的颜色)和著名的面部-花瓶错觉(花瓶被换成获胜者的奖杯)构成。怀特效应---眼见未必为实年度最佳错觉图结合了怀特效应(窗帘后面的花瓶似乎呈现出不同的38第1讲-计算机视觉总论ppt课件39视觉错位本身就是摄影的一种艺术和创作视觉错位本身就是摄影的一种艺术和创作40计算机视觉与相关研究领域

——计算机视觉与心理物理学心理物理学(Psychophysics):主要研究人类自身视觉系统的有关机理与现象心理物理学的研究结果往往被用来作为建立计算机视觉模型的理论根据计算机视觉与相关研究领域

——计算机视觉与心理物理学心理物理41本节内容人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用本节内容人类视觉42计算机视觉的应用

零件识别与定位产品检验移动机器人导航遥感图像分析医学图像分析安全、监控与跟踪国防系统其它(动画、体育、考古)计算机视觉的应用零件识别与定位43空间探索空间探索44Sojourner火星车前部图,中部的两个小突出是两个黑白CCD摄像机Sojourner火星车前部图,中部的两个小突出是两个黑白45So

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论