计算机视觉预备知识_第1页
计算机视觉预备知识_第2页
计算机视觉预备知识_第3页
计算机视觉预备知识_第4页
计算机视觉预备知识_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机视觉预备知识第一页,共四十五页,2022年,8月28日人类视觉原理与特点

人类从外界环境获取信息,一般是通过视觉﹑触觉﹑听觉﹑嗅觉等感觉器官来实现的。其中,60%-80%的信息是由人的眼睛,即视觉来获得的。可见,视觉器官是人类的最重要的感知器官。第二页,共四十五页,2022年,8月28日人类的视觉系统1,眼睛2,视觉神经系统第三页,共四十五页,2022年,8月28日基本视觉信息

1.亮度:亮度是最基本的视觉信息,亮度是一种外界辐射的物理量在我们视觉中反映出来的心理物理量。2.形状:由物体在视觉空间上的亮度分布,颜色分布或运动状态不同而显示出来的。3.运动。4.颜色:是一种主观感觉,目前只在感受器细胞水平和心理物理的宏观水平上得到了较深入的研究。第四页,共四十五页,2022年,8月28日

例如:雪地上一张白纸,荒野中潜伏的狼,都比较难以觉察。相反,雪地上一张彩纸,绿草地上一朵红花,荒野中奔跑的狼,都比较容易发现,这是由于物体形状因亮度、颜色、运动等因素而突显出来,易于被人眼分辨出来。第五页,共四十五页,2022年,8月28日5.深度知觉:判断物体距离或深度的感觉。 例如:伸手拿一本书,躲开汽车或障碍物,把足球踢入球门等。 ——外界目标在视网膜上的象是二维的,而且同一物体在左右眼的视网膜上的成象有着微小的差异,这种差异为立体视觉提供了最基本的信息——视差。——还有许多单眼的信息可以产生深度信息的估计,如物体的重叠、透视(近大远小,近清晰远模糊,近亮远暗)、明暗、纹理及运动。第六页,共四十五页,2022年,8月28日视觉中的一些心理和生理特征与现象

1.视觉的相对性:视觉感知的结果不仅仅取决于刺激本身,同时还受经验、对比等的影响,这就是视觉的相对性。

例如:初升的旭日和正午的骄阳究竟何者离我们更近。2.视觉的选择性

例如:视而不见

第七页,共四十五页,2022年,8月28日3.视觉的整体性:整体性是指超越对部分感知之和而产生的一种整体知觉经验,即整体大于部分之和。

4.视觉的恒常性

1).亮度恒常性

例如:一匹黑布和一匹白布 原因:先验知识;本体反射率。

2).大小恒常性

例如:远处的牛比近处的狗要大

3).形状恒常性

4).颜色恒常性第八页,共四十五页,2022年,8月28日5.错视现象(a)高度错视;(b)长度错视;(c)平行线错视;(d)大小错视;(e)主从错视;第九页,共四十五页,2022年,8月28日第十页,共四十五页,2022年,8月28日第十一页,共四十五页,2022年,8月28日计算机视觉计算机视觉是指用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解。第十二页,共四十五页,2022年,8月28日图像输入人机交互处理

结果输出

图像理解

图像分析

图像处理数字化计算机视觉系统的组成及原理第十三页,共四十五页,2022年,8月28日计算机数字图象处理系统

帧存摄像头A/DLUT监视器D/A微机接口显示器系统总线内存显存CPU计算机图象采集卡第十四页,共四十五页,2022年,8月28日CCD摄像头

CCD(ChargeCouplingDevice)摄像头由一组离散的光敏元件阵列组成,当光线照到这个阵列上时,每个光敏元件上产生电荷。电荷的多少和光敏元件上的照度成正比,由此产生的电信号反映光强。这些电信号用两相时钟脉冲顺序传送,就产生代表图像的电压时间信号。第十五页,共四十五页,2022年,8月28日XOnYm视频图像构成原理分辨率m

×n如:480×640灰度图像I=f(x,y)彩色图像IR=fR(x,y)IG=fG(x,y)IB=fB(x,y)制式PAL/NTSC视频图像数字图像像素第十六页,共四十五页,2022年,8月28日图象数字化

黑白图象数字化彩色图象数字化第十七页,共四十五页,2022年,8月28日计算机视觉基本特点

分阶段信息处理,多层次信息表示绝大部分问题为病态问题

原始信息被污染,信息处理量巨大

一种知识导引与管理系统

多学科交叉与结合

第十八页,共四十五页,2022年,8月28日实用图像处理技术

灰度图像彩色图像二值化图像

第十九页,共四十五页,2022年,8月28日图像的增强

1.直方图的均衡化

第二十页,共四十五页,2022年,8月28日2.平滑滤波

原图噪声污染后的图像第二十一页,共四十五页,2022年,8月28日均值滤波后的图像中值滤波后的图像第二十二页,共四十五页,2022年,8月28日3.锐化(边缘检测)

第二十三页,共四十五页,2022年,8月28日彩色图像分割方法

三色学说假设人视网膜上有三种神经纤维,每种神经纤维的兴奋都引起红绿蓝原色中的一种的感觉。光作用在视网膜上虽然能同时引起三种纤维的兴奋,但波长不同,引起三种纤维的兴奋程度不同,人眼就产生不同的颜色感觉。

第二十四页,共四十五页,2022年,8月28日三种视神经兴奋曲线

红色纤维绿色纤维蓝色纤维红橙黄绿蓝紫第二十五页,共四十五页,2022年,8月28日颜色视觉和颜色空间理论

三色原理

现代色度学理论指出,人对任何一种颜色的感觉,都可以用红、绿、蓝三种单色加权混合产生,因此,红、绿、蓝三种单色称为三基色,这就是三色原理。颜色空间

各颜色的光都可以由红、绿、蓝三种基色光加权混合而成,因此,彩色空间是三维的线形空间,任何一种具有一定亮度的颜色光都是空间中的一个点(或向量),这个空间就是颜色空间。第二十六页,共四十五页,2022年,8月28日几种颜色空间RGB颜色空间

当我们选择具有确定光通量的红绿蓝三基色光作为三维颜色空间的基时,就构成了RGB颜色空间。颜色空间不是唯一的

格拉斯曼定律指出,人的视觉只能分辨颜色的三种变化(例如明度、色度、饱和度)。这就是说,通过对RGB颜色空间进行坐标变换,可以产生新的颜色空间。XYZ表色系统YIQ表色系统HSI表色系统

第二十七页,共四十五页,2022年,8月28日彩色视觉系统颜色分类

颜色信息提取

从理论上讲,在这个空间中的每一个点都代表一种颜色,因而,在这个空间中有16.7兆种颜色。但从实际上看,这16.7兆个点并不简单的划分为16.7兆种颜色。GRB255RGB颜色空间255255第二十八页,共四十五页,2022年,8月28日HIS颜色模型第二十九页,共四十五页,2022年,8月28日颜色空间的相互转换

第三十页,共四十五页,2022年,8月28日图5.30划分HSI空间的方法颜色模型的转换第三十一页,共四十五页,2022年,8月28日计算机视觉预备知识

暂时到此第三十二页,共四十五页,2022年,8月28日返回第三十三页,共四十五页,2022年,8月28日返回第三十四页,共四十五页,2022年,8月28日图像处理由于实际景物转换为图像信号时,总会引入各种噪声或畸变失真,一般需要先进行图像处理。这一过程借用了大量的图象处理技术和算法,如图象滤波、图像增强、边缘检测等,以便从图象中抽取诸如角点、边缘﹑线条、边界以及色彩等关于场景的基本特征;这一过程还包含了各种图象变换(如校正)、图象纹理检测、图象运动检测等;有时还采用图像编码压缩技术大大地减少信息量,以达到减少对计算机存储容量和传输通道的要求。

返回第三十五页,共四十五页,2022年,8月28日图象分析图象分析的主要任务是恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息。实现的途径有立体视觉、测距成象、运动估计、明暗特征、纹理特征等估计方法。系统标定、系统成象模型等研究内容一般也是在这个层次上进行的。

返回第三十六页,共四十五页,2022年,8月28日图象理解图象理解是在以物体为中心的坐标系中,在原始输入图象、图象基本特征、2.5维图的基础上,恢复物体的完整三维图,建立物体三维描述,识别三维物体并确定物体的位置和方向。

返回第三十七页,共四十五页,2022年,8月28日绝大部分问题为病态问题

由于视觉问题是成象过程的逆过程,成象是从三维向二维投影的过程,因而在这个过程中会把深度信息丢失,造成图象的多义性,同时诸如光照﹑材料特性、朝向、距离等信息都反映成唯一的测量值——灰度,因而要从这唯一的测量值恢复上述一个或几个反映物体本质特征的参数是一个病态的过程。成象中由于大气扰动、镜头因素、传感器噪声、传输噪声以及量化噪声等的干扰,都会使图象产生失真,这些干扰多具有随机性。以上这些病态性问题,在处理和分析过程中都会导致图象的解不唯一。

返回第三十八页,共四十五页,2022年,8月28日原始信息被污染,信息处理量巨大

灰度图象,彩色图象,深度图象的信息量十分巨大,比如分辨率为640×480的8位灰度图象的数据量为300K,同样分辨率的彩色图象的数据量是900K。如果处理的是图象序列,则数据量更大。巨大的数据量需要巨大的存贮空间,还不易实现快速处理。同时,由于光学成像通道和电子线路成像通道存在大量的随机噪声,使得原始信息被污染,这也增加了后续处理的难度。返回第三十九页,共四十五页,2022年,8月28日一种知识导引与管理系统在视觉过程中对一幅图象的理解需要大量的关于任务领域的知识,这些知识不同于问题求解中的知识可以明确地显式表示;人类获取信息的60%-80%是通过视觉得到的,因而这些知识涉及面之广难以预测。因此视觉系统中的知识管理是一个重要的问题。我们会看到,计算机视觉系统的最大特征是,在视觉的各个阶段,系统尽可能地进行自动运算。为此,系统需要使用各种知识,包括特征模型、成象模型、物体模型和物体间的关系等。如果计算机视觉系统不用这些知识,则其应用的范围及其功能将十分有限。返回第四十页,共四十五页,2022年,8月28日多学科交叉与结合

计算机视觉计算机科学心理学生理学物理学信号处理数学图象图形学模式识别与人工智能返回第四十一页,共四十五页,2022年,8月28日黑白图象数字化视频输入预处理A/D数字输出同步锁相采样脉冲形成地址形成地址输出返回第四十二页,共四十五页,2022年,8月28日彩色图象数字化

解码器彩色视频输入预处理A/DGD预处理A/DRD预处理A/DBD返回第四十三页,共四十五页,2022年,8月28日图像的灰度直方图n(I)--I为一幅图像的灰度直方图(图5﹒14)对灰度图像而言,一个图像的灰度直方图整体地描述了这幅图像的灰度分布设I1,I2,﹒﹒﹒IL为一幅给定图像的离散强度,则直方图的第j个值为:

其中,mj为灰度Ij的像素点的数目,m为图像总像素数。n(I)I图5﹒14一幅图像的灰度直方图返回第四十

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论