版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选优质文档-倾情为你奉上计算机视觉调研报告摘要:在信息时代高速发达的今天,计算机视觉作为计算机科学的一个分支,也在人们日常生活中也得到广泛的应用,给人们的生活带来许多的便利,促进了科学技术的发展,本文是主要介绍一下计算机视觉的发展、在工农业以及其他行业的应用,还简要介绍了该技术在今天所面临的一些问题。关键词:计算机视觉;发展;应用;面临的问题;1.概述计算机视觉就是一门研究如何使机器学会看的技术,简言之,就是使用视觉传感器或者计算机模拟人眼视觉的基本功能,即通过这种技术可以实现对外在世界实际场景的感知、采集、处理以及解释理解等功能。此类技术的研究初衷是采集、感知相关环境的图像,定位、辨识具体
2、目标,确认相关目标的排列分布组合、结构特点和相关目标间的关系,从而能够对外在世界里的实际场景和目标做出有意义的识别和判断;而且在今天计算机视觉是人工智能领域最热门的研究课题之一,它和专家系统、自然语言理解已成为人工智能最活跃的三大领域。尽管它还是一门年轻的学科,还没有形成完整的理论体系,在很多方面它解决问题的方法还是一种技巧,但它是实现工业生产高度自动化、机器人智能化、自主车导航、目标跟踪,以及各种工业检测、医疗和军事应用的核心内容之一,也是实现第五代智能机的关键因素之一。所以对于计算机视觉的研究是非常有意义的,成熟的计算机视觉技术对人类的发展会有相当大的促进作用。2. 计算机视觉的发展计算机
3、视觉是在20世纪50年代从统计模式识别开始的,主要集中在二维图像分析和识别上。20世纪60年代MIT的Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述。Roberts的研究工作开创了以理解三维场景为目的的三维计算机视觉的研究。20世纪70年代中期麻省理工学院人工智能实验室正式开设“计算机视觉”课程,由国际著名学者B.K.P.Horn教授讲授。David Marr教授于1973年应邀在MIT·AI实验室领导一个以博士生为主体的研究小组,1977年提出了不同于积木世界”分析方法的计算视觉理论该理论,称为马尔(
4、Marr)视觉理论,他认为视觉可分为三个阶段,第一阶段是早期视觉,其目的是抽取观察者周围景物表面的物理特性,第二阶段是二维半简图或本征图象;是在以观察者为中心的坐标系中描述表面的各种特性,根据这些描述可以重建物体边界、按表而和体积分割景物,但在以观察者为中心的坐标系中只能得到可见表面的描述,得不到遮挡表面的描述,故称二维半简图;第三阶段是三维模ICU、视觉信息处理的最后一个层次,是用二维半简图中得到的表面信息建立适用于视觉识别的三维形状描述,这个描述应该与观察者的视角无关,也就是在以物体为中心的坐标系中,以各种符号关系和几何结构描述物体的三维结构和空间关系。该理论在20世纪80年代成为计算机视
5、觉研究领域中的一个十分重要的理论框架。到20世纪80年代中期计算机视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现比如,基于感知特证群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等。而且自80年代以来,计算机视觉的研究已经实验室走向实际应用的发展阶段。而计算机水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究。目前,计算机视觉技术正在广泛的应用于几何计算、计算机图形学、图像处理、机器人学等多个领域中。3. 计算机视觉的应用在网络和信息时代非常发达的今天,计算机技术也在不断的发展与完善,使得它在人们的现实生活中扮演
6、的角色也越来越多,而且该技术的应用的领域也越来越广,它所表现出来的价值也越来越高。下面就简单的分析该技术在各个方面的应用,在介绍它在各个方面的应用之前简要的引入一些计算机图像处理的方法,因为计算机视觉的处理技术主要依赖于图像的处理方法。3.1计算机视觉图像处理方法3.1.1图像变换图像变换是许多图像处理与分析技术的基础,为了有效快速地对图像进行处理和分析,常需要将原定义在图像空间的图像以某种形式转换到另一些空间,并利用在这些空间的特有性质方便地进行一定的加工,最后再转换回图像空间以得到所需的效果。3.1.2图像增强图像增强目的是对图像进行加工,以得到对具体应用来说视觉效果更“好”更“有用”的图
7、像,从根本上说并没有图像增强的通用标准,观察者是某种增强技术优劣的最终判断者,由于视觉检查和评价是相当主观的过程,所谓“好图像”的定义在比较增强算法性能中实际上是非常多变不定的。3.1.3图像恢复图像恢复也称图像还原,就是尽可能地减少或者去除数字图像在获取过程中的降质,恢复被退化图像的本来面貌,从而改善图像质量。3.1.4图像编码图像编码也称图像压缩,图像数据量是非常巨大,无论传输或存储需要对图像数据进行有效的压缩,压缩数据量的重要方法是肖除冗余数据,对图像进行存储、处理和传输等之前进行,而在这之后需要将压缩了的图像解压缩以重建原始图像或其近似图像。3.1.5图像边缘锐化图像边缘锐化处王里主要
8、是加强图像中的轮廓边缘和细节,形成完整的物体边界,达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。3.1.6图像分割图像分割是指把一幅图像分成不同的区域。这些区域要么对当前的任务有意义,要么有助于说明它们与实际物体或物体的某些部分之间的对应关系,一般来讲,分割出的区域需同时满足均匀均匀性和连通性的条件。3.1.7图像识别图像识别是利用计算机识别出图像中的目标分类,用机器智能代替人的智能,目前用于图像识别的方法主要分为决策理论和结构方法。图像经过处理后输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。3.2计算机视觉技术在工业领
9、域的应用研究近年来,随着计算机集成制造系统的推广和应用,计算机视觉的应用已从国防工业转向民用工业,而且现在被广泛应用于电子、汽车、木材、纺织、包装和航空等工业领域之中,之所以能够得到广泛应用,是因为它易于同设计信息和加工控制信息集成,具有不与被检测表面接触、检测速度快、抗干扰能力强等优点;而且它可以保证产品质量,提高生产率,解放人力,降低生成成本。. 3.2.1产品形位尺寸检查计算机视觉在制造业中通常是检查产品的尺寸是否在容许的范围内或产品是否有正确形状。这类检查方法主要涉及到被检产品二维或三维的几何特性,例如表面形状、位置、圆度等特征,也就是空间特征的检查。3.2.2产品表面质量检查通过计算
10、机视觉对产品表面凹陷、划痕、裂纹以及磨损进行检查或对表面、粗糙度和纹理进行检测,从而对产品进行有效的评估或分级。3.2.3产品零部件缺失检测在生产线上,通过计算机视觉能准确地检查产品是否丢失零部件(螺钉、铆钉等)或检查产品是否混有外物、杂质。3.2.4零部件文字标记识别与检测 文字识别技术在工业自动化生产中有许多成功的应用实例。序列号作为零部件的唯一身份标志,通常打印在电子元器件、集成电路板、大型工件成品的外表面上,由数字、字母和汉字等组成(以数字和字母居多)。这些字符标号或编码,如采用人工方式用眼睛对这些字符进行观察识别,将不能满足高效率生产自动化的要求。由于字符在工件上的位置很多时候都不便
11、于人眼观察;人眼疲劳因素的作用也会使检测结果不能从根本上得到保证,有些情况下甚至不能进行正确识别。3.2.5视觉伺服系统计算机视觉技术应用于机器人领域,为机器人建立视觉系统,使得机器人能更灵活、更自主地适应所处的环境,以满足柔性生产中自动定位、装配、搬运和自动焊接的需要。3.3计算机视觉技术在农业领域的应用研究计算机视觉技术在农业上的应用研究,起始于20世纪70年代末期,主要应用于植物种类的鉴别、农产品品质检测与分级等。随着计算机软硬件技术、图形图像处理技术的迅猛发展,它在农业上的应用研究有了较大的突破,在农业领域的生产前、生产中、收获时和产后的各个环节中,均可以利用计算机视觉技术来实现这些农
12、业生产的视觉化。计算机视觉在产前的应用主要是检验种子质量;在产中的应用包括田间杂草识别、植物生长信息的监测、病虫害的监视和营养胁迫诊断等方面;在农作物收获时的应用主要体现在农业机器人的研制与开发上;在产后的应用包括水果分级和农产品的加工等。3.3.1在产前的应用计算机视觉技术在产前的应用主要是检验农作物种子质量,其检测方法有:净度图像分析、种子发芽图像分析、品种鉴定的图像分析和种子活力的漫射光测定。3.3.2在产中的应用杂草的识别是根据杂草的不同的种类可以采取光谱分析法、颜色分析法、纹理分析法或外形分析法,确定农产品中杂草密度和种类情况;利用计算机视觉技术对设施农业中动植物生长进行监测,不仅可
13、以检测设施内植物的叶面积、茎杆直径、叶柄夹角等外部生长参数,还可以根据果实表面颜色判别其成熟度,以及作物缺水缺肥等情况;3.3.3在产后的应用通过图像获取设备获取农产品图像,对图像进行去噪、分割处理后,可以从获取的图像中得到丰富的参数和数据信息。针对图像特征参数与农业产品的外部物理参数(例如颜色、形状或大小等)不用人眼依次测定对象便可对其进行质量判别、筛选和分类,而且和人工检验相比具有效率高、识别率高、标准统一的优点,因此计算机视觉技术动植物和农产品等生物体的自动化检测筛选系统中得到广泛的使用。3.4计算机视觉技术在其他领域的应用研究3.4.1计算机视觉技术在医学领域的应用研究X-CT、放射性
14、同位素扫描、B 型超声、核磁共振成像,是现代医学的四大成像技术。B 超检测系统通过有规律的发射超声波,接受从人体发射回来的声音信号,形成灰度声图像线密度值。将计算机视觉技术应用于临床医学,可以准确的诊断出患者的状况,从而提高准确性,避免误诊等现象。3.4.2计算机视觉技术在公安工作中的应用指纹识别、人像识别是视觉技术应用在公安工作中所取得的突出成果。将现场收集到的指纹录入计算机,提取指纹特征后再和指纹库里的指纹进行比对,就可以提供破案的线索。指纹识别也可用于出入海关的身份检验及指纹密码锁等方面,指纹印鉴已用于银行业。计算机人像组合技术可以根据目击者的描述,由计算机用不同的人面像部件组合出嫌疑人
15、的人面像协助破案。在公安刑侦中还应用了模糊图像复原技术对犯罪现场的模糊图像进行复原处理。4.对计算机视觉技术发展的认识与人体视觉系统相比,目前的计算机视觉系统无论从功能上来说还是从可靠性上来说都还很不健全,可以说仍处于很不成熟的阶段。原因是计算机视觉系统的研究过程面临着一系列技术上的难点:1.由于系统内部的和外界的各种干扰因素如噪声,物体表面的光学不均匀性,不理想的照明条件引起的阴影干扰,表面辉点及背干扰等,使得视觉系统中的图象处理阶段就很难得到满意的和可靠的结果,例如,至今尚无统一的方法来对付即使是并不复杂的但带有曲面的物体的图象,使得处理后能得到完整的轮廓线。真基元的丢失和假基元的增生有时
16、是无法避免的。这就给后阶段的分析带来了很大的困难。当然,利用强的预知识作为指导,可以改善各阶段处理的效果,但是这样做就意味着牺牲系统的通用性;2.计算机视觉系统在分析和理解景物时,必须要在一幅或多幅平面图象中提取了维特征信息深度信息或表面倾斜信息。这并不是一件简单的事情。应运而生一系列技术,如体视学,从运动图象重建物体的三维结构,从几个剪影恢复物体的三维信息等技术都是用来解决这一问题的。但是,上述这些技术都遇到了一个十分棘手的问题,就是如何在具有灰度失真,几何失真(包括透视、旋转、标尺变换等失真)和干扰的情况下求取两幅和多幅图象之间的对应特征(对应问题有时称匹配问题或套准问题)。遗憾的是,至今
17、尚无可靠的通用的求取对应特征的办法,尤其在图间失真和干扰比较严重的场合。利用照度学的信息可以从单幅图象得到深度信息,但是,必须对物体表面的光学特性作出严格的均匀性假定,对于照明条件也要作出严格的假定。这就同真实世界的情况相差很远。在景物分析中除了得到三维信息的困难外,在现实世界里,物体间相互遮挡,物体自身各部位间的遮挡,使得图象分拆更加复杂化了。目前对诸如积木世界等简单情况可以通过可见部分的信息有效地借助推理推得被遮挡部分的信息,但是这必须要有足够的预知识作为指导。一般的遮挡问题尚无有效办法解决。3.预知识的表达、获取、存放、更新和检索是很复杂的。人类的视觉系统具有惊人的分析理解能力。那怕是一
18、个学令前的儿童,就能从一群人的照片中不费力地找出他所熟识的人来。给一个成人看一张航空摄影照片,即使他从未去过那个地方,他也能指给你看那一部分是城区,那儿是山脉,那儿是海岸线。人之所以具有高超的视觉分析和理解能力,是同人的大脑中已经积累的大量知识有关的。人是如何精选、获取、更新视觉知识,以及如何利用这些知识来分析景物的,至今还远未研究透彻。4.实际工程上的困难。对于一幅典型的分辨率为的航空摄影照片,用一个最简单的33算子对其进行一次卷积操作,就要进行相当于次的乘法运算。对于每秒能进行50万次乘法运算的计算机(速度已属中等)得花200秒!对一幅或多幅图象进行处理分析其运算量不知要比这积卷积操作大多少倍,所花的计算时间之长是可想而知的。然而实用的系统必须要实时地进行分析处理。这就迫使图象系统的设计专家们放弃传统的序贯计算技术而采取并行处理技术。这实际上是以硬件的规模扩大来换取处理速度的提高。但是硬件的规模扩大并非无限制的。硬件规模扩大不仅大大地增加了费用而且增加体积和能量消耗。但在很多应用场合,留给视觉系统的空间和提供给它的电能都是有限的,如活动的机器人的视觉系统就是那样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院培训心得体会
- 会计金融求职介绍
- 登高作业培训
- 陕西省榆林市高新区2024-2025学年上学期九年级期中考试英语试卷(含笔试答案无听力音频)
- 2024-2025学年江苏省无锡市江阴市河塘中学九年级(上)10月阶级段性练习数学试卷(含答案)
- 全球液流电池集流板市场规模预测及发展方向研究报告2024-2030年
- T-ZFDSA 14-2024 天麻鱼头汤制作标准
- Windows Server网络管理项目教程(Windows Server 2022)(微课版)课件项目3 DHCP服务器的配置与管理
- Windows Server网络管理项目教程(Windows Server 2022)(微课版)8.2 任务1 RDS服务器的安装
- 甘肃省兰州市2018年中考语文真题试卷(含答案)
- 2024年供应链管理师技能竞赛理论考试题库(含答案)
- 《一只窝囊的大老虎》名师教案(第二课时)
- 新质生产力-讲解课件
- 30道计量员岗位常见面试问题含HR问题考察点及参考回答
- 四川省公需科目2024年度数字经济与驱动发展考试题库及答案
- 京瓷哲学培训课件
- 人工智能智慧树知到答案章节测试2023年复旦大学
- 吊篮运行试验记录表
- 2002全国水利预算定额
- 天煌教仪THMRJX2型柔性自动化生产线(西门子)使用说明书
- (西班牙语)户口本翻译模板
评论
0/150
提交评论