下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机视觉与图像处理、模式识别、机器学习学科之间的关系在我的理解里, 要实现计算机视觉必须有图像处理的帮助, 而图像处理倚仗与模式识别 的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。 纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。计算机视觉( computer vision ),用计算机来模拟人的视觉机理获取和处理信息的能力。 就是是指用摄影机和电脑代替人眼对目标进行识别、 跟踪和测量等机器视觉, 并进一步做图 形处理, 用电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉研究相关的理论和技术, 试图建立能够从图像或者
2、多维数据中获取 信息' 的人工智能系统。 计算机视 觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。 机器视觉需要图象信 号,纹理和颜色建模, 几何处理和推理, 以及物体建模。 一个有能力的视觉系统应该把所有 这些处理都紧密地集成在一起。图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又 称影像处理。 基本内容图像处理一般指数字图像处理。 数字图像是指用数字摄像机、 扫描仪 等设备经过采样和数字化得到的一个大的二维数组, 该数组的元素称为像素, 其值为一整数, 称为灰度值。图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描
3、述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析 等。图像处理一般指数字图像处理。模式识别 (Pattern Recognition) 是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的 )信息进行处理和分析 ,以对事物或现象进行描述、 辨认、分类和解释的过程 ,是信息 科学和人工智能的重要组成部分。 模式识别又常称作模式分类, 从处理问题的性质和解决问 题的方法等角度,模式识别分为有监督的分类(Supervised Classificati on)和无监督的分类(Un supervised Classificatio n)两种。模式还可分成
4、抽象的和具体的两种形式。前者如意识、思 想、议论等 ,属于概念识别研究的范畴 ,是人工智能的另一研究分支。我们所指的模式识别主 要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象 的具体模式进行辨识和分类。 模式识别研究主要集中在两方面,一是研究生物体 (包括人 )是如何感知对象的,属于认识科学的范畴,二是在给定的任务下 ,如何用计算机实现模式识别的理论和方法。应用计算机对一组事件或过程进行辨识和分类, 所识别的事件或过程可以是文字、 声音、 图像等具体对象, 也可以是状态、 程度等抽象对象。 这些对象与数字形式的信息相区 别,称为模式信息。模式识别与统计学、心理
5、学、语言学、计算机科学、生物学、控制论等 都有关系。它与人工智能、图像处理的研究有交叉关系。机器学习 (Machine Learning) 是研究计算机怎样模拟或实现人类的学习行为, 以获取新的 知识或技能, 重新组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径, 其应用遍及人工智能的各个领域, 它主要使用归纳、 综合而 不是演绎。 机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统, 但是以往的智能系统都普遍缺少学习的能力。 随着 人工智能的深入发展, 这些局限性表现得愈加突出。 正是在这种情形
6、下, 机器学习逐渐成为 人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、 自然语言理解、 模式识别、 计算机视觉、 智能机器人等领域。 机器学习的研究是根据生理学、 认知科学等对人类学习机理的了解, 建立人类学习过程的计算模型或认识模型, 发展各种学 习理论和学习方法, 研究通用的学习算法并进行理论上的分析, 建立面向任务的具有特定应 用的学习系统。这些研究目标相互影响相互促进。人类研究计算机的目的, 是为了提高社会生产力水平, 提高生活质量, 把人从单调复杂 甚至危险的工作中解救出来。 今天的计算机在计算速度上已经远远超过了人, 然而在很多方 面,特别是在人类
7、智能活动有关的方面例如在视觉功能、 听觉功能、 嗅觉功能、 自然语言理 解能力功能等等方面,还不如人。这种现状无法满足一些高级应用的要求。 例如, 我们希望计算机能够及早地发现路上的 可疑情况并提醒汽车驾驶员以避免发生事故,我们更希望计算机能帮助我们进行自动驾驶, 目前的技术还不足以满足诸如此类高级应用的要求, 还需要更多的人工智能研究成果和系统 实现的经验。什么是人工智能呢?人工智能, 是由人类设计并在计算机环境下实现的模拟或再现某些 人智能行为的技术。 一般认为, 人类智能活动可以分为两类: 感知行为与思维活动。 模拟感 知行为的人工智能研究的一些例子包括语音识别、 话者识别等与人类的听觉
8、功能有关的 “计 算机听觉”,物体三维表现的形状知识、 距离、速度感知等与人类视觉有关的 “计算机视觉” , 等等。 模拟思维活动的人工智能研究的例子包括符号推理、模糊推理、 定理证明等与人类思维有关的“计算机思维” ,等等。从图像处理和模式识别发展起来的计算机视觉研究对象之一是如何利用二维投影图像 恢复三维景物世界。 计算机视觉使用的理论方法主要是基于几何、 概率和运动学计算与三维 重构的视觉计算理论, 它的基础包括射影几何学、 刚体运动力学、概率论与随机过程、 图像 处理、人工智能等理论。计算机视觉要达到的基本目的有以下几个:(1) 根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;
9、(2) 根据一幅或多幅二维投影图像计算出目标物体的运动参数;(3) 根据一幅或多幅二维投影图像计算出目标物体的表面物理特性;(4) 根据多幅二维投影图像恢复出更大空间区域的投影图像。计算机视觉要达到的最终目的是实现利用计算机对于三维景物世界的理解, 即实现人的 视觉系统的某些功能。在计算机视觉领域里, 医学图像分析、 光学文字识别对模式识别的要求需要提到一定高 度。又如模式识别中的预处理和特征抽取环节应用图像处理的技术; 图像处理中的图像分析 也应用模式识别的技术。 在计算机视觉的大多数实际应用当中, 计算机被预设为解决特定的 任务, 然而基于机器学习的方法正日渐普及, 一旦机器学习的研究进一
10、步发展, 未来“泛用 型”的电脑视觉应用或许可以成真。人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?从而使 之完成特定的技术动作(例如:移动一个机器人通过某种特定环境) 。这一问题便与计算机 视觉问题息息相关。 在这里, 计算机视觉系统作为一个感知器, 为决策提供信息。 另外一些 研究方向包括模式识别和机器学习 (这也隶属于人工智能领域, 但与计算机视觉有着重要联 系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。机器学习是研究计算机怎样模拟或实现人类的学习行为, 以获取新的知识或技能, 重新 组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核
11、心, 是使计算机具有智能 的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演译。为了达到计算机视觉的目的, 有两种技术途径可以考虑。 第一种是仿生学方法, 即从分 析人类视觉的过程入手, 利用大自然提供给我们的最好参考系人类视觉系统, 建立起视 觉过程的计算模型, 然后用计算机系统实现之。 第二种是工程方法, 即脱离人类视觉系统框 框的约束, 利用一切可行和实用的技术手段实现视觉功能。 此方法的一般做法是, 将人类视 觉系统作为一个黑盒子对待, 实现时只关心对于某种输入, 视觉系统将给出何种输出。 这两 种方法理论上都是可以使用的, 但面临的困难是, 人类视觉系统对应某种输入的输出到底是什么,这是无法直接测得的。而且由于人的智能活动是一个多功能系统综合作用的结果,即使是得到了一个输入输出对, 也很难肯定它是仅由当前的输入视觉刺激所产生的响应,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 传感器课程设计仿真
- 美术连贯课程设计
- 热处理台车炉课程设计
- 认识中药的课程设计
- 旅游诗词鉴赏课程设计
- 庐山特训课程设计
- 简历项目经历课程设计
- 某小区供配电课程设计
- 嗓音康复课程设计
- 订单管理系统课程设计
- 【讲座】初中语文部编本教材解读课件
- 公开课听课教师签到表
- 开展新技术、新项目科室内讨论记录
- 主题班会-同学情教学课件
- 道德与法治《健康看电视》优秀课件
- 泌尿系统完整结构培训课件
- 规培体表肿物切除术
- 新教材北师大版高中数学必修一 2.3函数的单调性和最值 课时练(课后作业设计)
- DB32∕T 943-2006 道路声屏障质量检验评定
- 四年级(上册)综合实践活动课教学案(贵州科学技术出版社)
- 腹泻教学课件
评论
0/150
提交评论