自动识别技术05_第1页
自动识别技术05_第2页
自动识别技术05_第3页
自动识别技术05_第4页
自动识别技术05_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自动识别技术第五章图像识别技术第五章图像识别技术数字图像处理技术概述数字图像处理发展概况数字图像处理技术应用光学字符识别技术汽车牌照自动识别系统回顾自动识别技术根据识别对象的特征、识别原理和方式可以分为数据采集技术(定义识别)和特征提取技术(模式识别)两大类。自动识别系统的输入信息分为特定格式信息和图像图形格式信息两大类。特定格式信息就是采用规定的表现形式来表示规定的信息。如条码符号、IC卡中的数据格式等。图像图形格式信息则是指二维图像与一维波形等信息。如二维图像包括的文字、地图、照片、指纹、语音等。定义识别系统模式识别系统图像识别运用模式识别的原理对图像对象进行处理。图像信息获取图像预处理图像特征提取图像特征匹配结果人类通过眼、耳、鼻、舌、身等接受信息,感知世界。约有75%的信息是通过视觉系统获取的。图——物体透射或反射光的分布(图像场),是客观存在;像——人(的视觉系统)对(接收后在大脑中形成的)图的印象或认识,是人的感觉;图像——图像是图和像的有机结合,既反映物体的客观存在,又体现人的心理因素;图像是对客观存在物体的一种相似性的生动模仿或描述。一、数字图像处理技术概述图像的类型物体图像数学函数不可见的物理图像可见的图像光图像照片、图、画可见光成像和不可见光成像400nm700nm紫外光红外光546.1nm435.8nm780nm图像的产生工程技术人员以直尺和圆规来绘制各种图纸;美术家用画笔来复制客观世界;电视用画面来反映实地场景;……特性图是客观存在的,像是人的感觉,图像则是二者的结合,是客观实体的原型,包含了巨大的信息量。图像的传播虽然比语言文字的传播要复杂得多,但它能提供比较直观的模型,这不是语言文字的描述所能达到的。识别直接由人工或识别系统识别;经过处理,改善质量或提取出图像的某些数据特征后才能识别。数字图像处理DigitalImageProcessing又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。二、数字图像处理发展概况发展历程最早出现于20世纪50年代:计算机处理图形学科大约形成于20世纪60年代初期首次获得实际成功应用是美国喷气推进实验室1972年英国EMI公司用于头颅诊断的X射线计算机断层摄影装置——CT(ComputerTomography)——1979年诺贝尔生理学和医学奖从70年代中期开始理论和应用研究:视觉计算理论图像识别文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷体识别到手写体识别。数字图像处理和识别的研究开始于1965年,数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势。物体识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴,以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。方法研究图像识别问题的数学本质属于模式空间到类别空间的映射问题。图像识别主要有三种方法:统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术。图像分割的方法有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。从图像的类型来分有:灰度图像分割、彩色图像分割和纹理图像分割等。航天和航空技术第一幅月面图像就是我们对月球的直观感受和初步认识。左边是嫦娥一号卫星传回的第一幅月面图像。右边是第一幅月面图像的飞行效果图。三、数字图像处理技术应用“嫦娥一号”第一幅月面图像的处理过程:遥感和航空测量主要用于资源、矿藏勘探、国土规划、高速公路选线、灾害调查、农作物估产、气象预报以及军事目标监视等。气象卫星云图土地变化监测图云南大理森林火灾

遥感图生物医学领域X射线层析摄影(CT)、核磁共振(MRI)、超声成像、血管造影、细胞和染色体自动分类等。这些技术和设备大大提高了治疗诊断水平,减轻了病人的痛苦。三维快速血管造影成像头部CTCT脑血管医学图像三维重建加入对比剂脑血管扫描图像依次为第1、2、3层脑血管脑血管边缘提取依次为第1、2、3层脑血管重建的脑血管三维图像通信工程常见的数字图像和数字视频设备如可视电话、会议电视、卫星电视、数字电视、高清电视、VCD、DVD等。基于H.323标准的远程教学组网图工业与交通产品质量检测、生产过程的自动控制、CAD/CAM等。检查瓶装液体容量是否合格智能交通控制汽车牌照识别系统交通视频监控系统军事公安军事目标的侦察、制导和警戒系统、自动灭火器的控制及反伪装等等都需要用到图像处理技术;公安部门的现场照片、指纹、虹膜、面部、手迹、印章等的处理和辨识也要借助图像处理。导弹制导指纹门锁机器视觉机器视觉主要用于军事侦察、危险环境的自主机器人,邮政、医院和家庭服务的智能机器人,装配线工件识别、定位,太空机器人的自动操作等。

日本本田技研工业株式

会社研制的仿人机器人

ASIMO(阿西莫)踢球上楼梯虚拟现实当人们通过虚拟现实浏览、观赏时就如身临其境一般,并且可以选择任一角度,观看任一范围内的场景或选择观看物体的任一角度。虚拟漫游技术是虚拟现实(VR)技术的重要分支,在建筑、旅游、游戏、航空航天、医学等多种行业发展很快。四、光学字符识别技术OCR(OpticalCharacterRecognition)光学字符识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。亦即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。OCR的概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章,采用了模板匹配法识别了1000个印刷体汉字。工作流程一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。从影像到结果输出,需要经过影像输入、影像预处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。影像输入欲经过OCR处理的标的物须透过光学仪器,如影像扫描仪、传真机或任何摄影器材,将影像转入计算机。影像预处理影像预处理是OCR系统中,存在问题最多的一个模块。影像须先将图片、表格及文字区域分离出来,甚至可将文章的编排方向、文章的提纲及内容主体区分开,而文字的大小及文字的字体也要判断出来。对待识别图像进行二值化、图像降噪、倾斜校正等预处理,可以降低特征提取算法的难度,并能提高识别的精度。二值化:由于彩色图像所含信息量过于巨大,在对图像中印刷体字符进行识别处理前,需要对图像进行二值化处理,使图像只包含黑色的前景信息和白色的背景信息,提升识别处理的效率和精确度。图像降噪:由于待识别图像的品质受限于输入设备、环境、以及文档的印刷质量,在对图像中印刷体字符进行识别处理前,需要根据噪声的特征对待识别图像进行去噪处理,提升识别处理的精确度。倾斜校正:由于扫描和拍摄过程涉及人工操作,输入计算机的待识别图像或多或少都会存在一些倾斜,在对图像中印刷体字符进行识别处理前,就需要进行图像方向检测,并校正图像方向。文字特征抽取单以识别率而言,特征抽取可说是OCR的核心,用什么特征、怎么抽取,直接影响识别的好坏。特征可分为两类:统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了。结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对,市面上的线上手写输入软件的识别方法多以此种结构的方法为主。对比数据库:当输入文字算完特征后,不管是用统计或结构的特征,都须有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组。对比识别充分发挥数学运算理论的一个模块,根据不同的特征特性,选用不同的数学函数。较有名的比对方法:欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(DynamicProgramming,DP)、类神经网络的数据库建立及比对、HMM(HiddenMarkovModel)字词后处理:由于OCR的识别率并无法达到百分之百,或想加强比对的正确性及信心值,一些除错或甚至帮忙更正的功能,也成为OCR系统中必要的一个模块。字词后处理就是一例,利用比对后的识别文字与其可能的相似候选字群中,根据前后的识别文字找出最合乎逻辑的词,做更正的功能。字词数据库:为字词后处理所建立的词库。人工校正一个好的OCR软件,除了有一个稳定的影像处理及识别核心,以降低错误率外,人工校正的操作流程及其功能也影响OCR的处理效率。文字影像与识别文字的对照、屏幕信息摆放的位置、每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词,都是为使用者设计尽量少使用键盘的一种功能。结果输出有人要文本文件,有人要和输入文件一样的原文重现,有人注重表格内的文字……无论怎么变化,都只是输出档案格式的变化而已。识别系统性能的评价对一个手写数字识别系统,可以用三方面的指标表征系统的性能:正确识别率A=正确识别样本数/全部样本数*100%替代率(误识率)S=误识样本数/全部样本数*100%拒识率R=拒识样本数/全部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论