《模式识别入门》PPT课件.ppt_第1页
《模式识别入门》PPT课件.ppt_第2页
《模式识别入门》PPT课件.ppt_第3页
《模式识别入门》PPT课件.ppt_第4页
《模式识别入门》PPT课件.ppt_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、模式识别(Pattern Recognition),信息与通信工程学院 信息工程技术研究所 陈涛 E-mail: Tel办公地点:21号楼207房间,课程性质,任意选修课 授课对象:电子信息,通信工程,信息对抗, 微电子 学时:32(其中8学时实验) 考查方式:闭卷或开卷考试,教材及参考文献,教材 边肇祺,张学工. 模式识别(第二版).清华大学出版社,2000.1 参考文献 1 R.Duda,P.Hart,D.Stork,Pattern Classification, second edition,2000(有中译本) 2 蔡云龙,模式识别,西北电讯工程学院出版社,1

2、986. 3 李宏东,姚天翔译,Richard O. Duda著. 模式分类(第二版). 机械工业出版社,2003.9,教材及参考文献,参考文献 4李晶皎译,Sergios Theodoridis(希腊)著. 模式识别(第三版).电子工业出版社,2006.12 5黄凤岗,宋克欧. 模式识别. 哈尔滨工程大学出版社,1997 6杨淑莹. 图像模式识别-VC+技术实现. 清华大学出版社,2005.7 7杨淑莹. 模式识别与智能计算-MATLAB技术实现. 电子工业出版社,2008.1,机构、会议、刊物,1973年,IEEE发起了第一次关于模式识别的国际会议“ICPR” (此后两年一次) ,成立了国

3、际模式识别协会-IAPR” 1977年IEEE成立PAMI委员会,创立IEEE Trans. On PAMI,并支持ICCV,CVPR两个会议 -Pattern Recognition(PR) -Pattern Recognition Letters(PRL) -Pattern Analysis and Application (PAA) -International Joural of Pattern Recognition and Artificial Intelligence(IJPRAI),先修课程,概率论 本课程研究的主要内容:统计P. R. 线性代数 利用特征向量表示模式 矩阵计算

4、 图像处理、语音信号处理、人工智能、计算机视觉 ,教学目标,掌握模式识别的基本概念和基本方法 有效运用所学的知识和方法解决实际问题 为研究新的模式识别理论和方法打下基础,教学方法,着重讲述模式识别的基本概念,基本方法和算法原理 注重理论与实践紧密结合 实例教学:通过实例讲述如何将所学的知识运用到实际应用中 避免引用过多的、繁琐的数学推导,第1章 绪论,1.1 P. R. 基本概念 1.2 P. R. 发展简史 1.3 P. R. 应用 1.4 P. R. 分类 1.5 P. R. 系统,1.1 P. R. 基本概念,什么是模式?,什么是模式?,什么是模式?模式类?模式识别? 广义定义:存在于时

5、间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。 模式所指的不是事物本身,而是从事物获得的信息,因此模式往往表现为具有时间和空间的分布信息,什么是模式?,本课研究内容 用计算机模拟人的识别能力,提出识别具体客体的基本理论与实用技术。根据这一研究内容,可作狭义定义。 狭义定义:对感兴趣的客体的定量的或结构的描述。 模式:语音、图像、信号 模式的直观特性 可观察性 可区分性 相似性,什么是模式?,模式类? 具有某些共同特性的模式的集合。 模式识别? 利用计算机自动地(或者人进行少量干涉)把待识模式分到各自的模式类中去的技术。,模式识别研究的目的,利用计算机对物理对

6、象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合 Y=F(X) X定义域取自特征集 Y值域为类别的标号集 F是模式识别的判别方法,1.2 P. R. 简史,20世纪20年代出现,60年代发展为学科 1929年G.Tauschek发明阅读机,能够阅读0-9的数字. 30年代Fisher提出统计分类理论,奠定了统计模式识别的基础. 50年代Noam Chemsky提出形式语言理论,傅京荪提出了句法模式识别,1.2 P. R.简史,60年代L.A.Zadeh提出了模糊集理论,模糊模式识别方法得以发展和应用 80年代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络

7、复活,并在模式识别得到较广泛的应用。 90年代小样本理论,支持向量机也受到了很大的重视。,1.2 P. R.简史,21世纪以来,模式识别研究呈现一些新的特点 (1)贝叶斯学习理论越来越多的用来解决模式识别和模型选择问题,产生了良好的分类性能。 (2)传统的问题,如概率密度估计、特征选择、聚类等方法不断受到新的关注。新的方法或改进混合的方法 不断提出 (3)模式识别和机器学习相互渗透、特征提取和选择、分类、聚类、半监督学习的问题日益成为二者共同关注的热点。 (4)模式识别系统开始越来越多地用于现实生活,如车牌识别、手写字符识别、生物特征识别。,1.3 P. R.应用,生物学 自动细胞学、染色体特

8、性研究、遗传研究。 天文学 天文望远镜图像分析、自动光谱学 经济学 股票交易预测、企业行为分析 医学 心电图分析、脑电图分析、医学图像分析、癌细胞分类、X光片分析、CT片分析,P. R.应用,工程 产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析 军事 航空摄像分析、雷达和声纳信号检测和分类、自动目标识别 安全 人脸、掌纹、虹膜、手形、语音、签字、监视和报警系统,P. R.的应用领域,一、文字识别 始于1929年,较早 OCR(Optical Character Recognition),字符识别之牌照识别,字符识别之牌照识别,1.5 P. R.的应用领域,二、条码识别,P. R.的应

9、用领域,三、语音识别 语义识别 孤立词识别(较为成熟)、连续语音识别 身份识别 话者识别,语音识别应用之自动广告监播,P. R.的应用领域,四、遥感图像地物分类,原始影像 神经网络分类结果,P. R.的应用领域,五、身份识别之人脸识别,在不同环境条件下,人脸肤色分布始终近似服从高斯分布,P. R.的应用领域,五、身份识别之指纹识别,P. R.的应用领域,六、公共安全应用,检测流动高热人群,P. R.的应用领域,七、军事应用,图像制导,国产空地电视制导导引头,前苏联Kh-59M空地导弹导引头,图像制导AGM-130,美国AGM-130空对地导弹,AGM-130空地导弹 AGM-130是美国198

10、4年研制的空对地导弹,是GBU-15光电制导炸弹的装有动力装置的变型,具有远距离投放能力和强杀伤力。弹径460毫米(A),520毫米(B);弹重1323千克(A),1316千克(B),采用电视或红外成像+双数据传输装置制导方式。可装备F-111、F-4、F-15、F-16和F-10等飞机。在美英对伊拉克的空袭中,美国空军第一次在实战中使用AGM-130导弹。 AGM-130可由空勤人员保持其飞向目标的航向,也可利用电视或红外导引头自动导航。AGM-130同高速反辐射导弹(HARM)一样,也可用来摧毁雷达,使导弹发射器致盲,但是HARM的弹头很小,不能保证摧毁发射器,而AGM-130的弹头要大得

11、多,重约900公斤。它能完全一举摧毁防空雷达和导弹发射架。,图像制导AGM-130,AGM-130炸大桥,AGM-130机载发射,P. R.的应用领域,铁路油罐车罐口视觉定位系统,1.5 P. R.的应用领域,铁路油罐车罐口视觉定位系统,P. R.的应用领域,机器人拆垛系统,1.4 P.R.分类,要在特征空间和解释空间找到一种映射关系,这种映射称之为假说 特征空间-从模式得到的对分类有用的度量、属性或基元构成的空间. 解释空间-将 个类别表示为: 其中 为所属类别的集合,称为解释空间。,1.4 P.R.分类,假说的两种获得方法: (1)监督学习 (2)非监督学习,P.R.分类,监督学习、概念驱

12、动或归纳假说:在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说,也都必须在“未知”的样本上得到近似的结果。 (1)依靠已知所属类别的训练样本集,按他们的特征向量分布来确定假说(通常为一判别函数),在判别函数确定之后能用他对未知的模式进行分类; (2)对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练。,1.4 P.R.分类,非监督学习、数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的假说。 (1)在没有先验知识的前提下,通常采用聚类分

13、析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间距离及分散情况。 (2)如果特征向量聚集若干个群,可按群间距离远近把他们划分成类。 (3)这种按各类之间亲疏程度的划分,若事先能知道应划分几类,则可获得更好的分类效果。,P.R.分类的主要方法,(1)数据聚类。 (2)统计分类。 (3)结构模式识别。 (4)神经网络。,P.R.分类的主要方法,(1)数据聚类。 目标:用某种相似性度量的方法将原始数据组织成有意义 的和有用的各种数据集。 是一种非监督学习方法,解决的方案是数据驱动。,P.R.分类的主要方法,(2)统计分类。又称为决策理论识别方法。 基于概率统计模型得到各类别的特征向量的分

14、布,以取得 分类的方法。 特征向量分布的获得是基于一个类别已知的训练样本集。 是一种监督分类方法,分类器是概念驱动的。,P.R.分类的主要方法,(3)结构模式识别。 通过考虑识别对象各部分之间的联系来达到识别分类的目的。 识别采用结构匹配的方式,通过计算一个匹配程度值(matching score)来评估一个未知的对象或未知的对象的某些部分与某种典型形式的关系如何。 当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的结构模式识别方法句法模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。 创始人:傅京孙,1930-1985,美籍华人,傅京孙奖,符号串(树

15、):abcb,P.R.分类的主要方法,(4)神经网络 神经网络是受人脑组织的生理学启发而创立的。 是由一系列互相联系的、相同的单元(神经元)组成,相互间的联系可以在不同神经元之间传递增强或抑制信号。 增强或抑制是通过调整神经元相互间联系的权重系数(weight)实现. 神经网络可以实现监督和非监督学习条件下的分类。,模式的特征向量表示,样本:模式识别中,被观测的每个对象称为样本。如 手写字符识别中的每个手写字符。 特征:对于一个样本,每一个与识别有关的因素称为一个特征。模式是样本所具有的特征描述。 特征向量:模式的特征集由处于同一个特征空间中的特征向量表示,特征向量的每一个元素为一个特征。,模

16、式的特征向量表示,选择2个特征,选择3个特征,模式识别研究的问题即是在特征空间中如何将样本点分类,训练样本,监督模式识别,非监督模式识别,客体,1.5 模式识别系统,信息获取,预处理,特征提取和选择,分类器设计,分类决策,待识样本,通过各种传感器,训练过程,1、信息获取,为使计算机能够对客体进行分类识别,必须使用计算机能够接受的方式来表示客体。 (1)二维图像,如文字、指纹、照片等 CCD (Charge Coupled Device)、CMOS,徕卡M8,M8的柯达1030万像素CCD,CMOS图像传感器,1、信息获取,(2)一维波形:语音、机械振动波、心电图等,语音信号,利用MSP430设

17、计的12位心电放大器采集的心电图,(3)物理参量和逻辑值 体温、化验数据、各种实验数据、参量正常与否等。 通过测量、采样和量化,可以用矩阵表示2D图像,用向量表示1D波形,这就是信息的获取过程。 物理量 电信号,模拟信号 数字信号,1、信息获取,2、预处理,预处理的目的是去除噪声,加强有用的信息并对种种因素造成的退化现象进行复原。 图像预处理:直方图修正、平滑滤波、边缘检测、图像复原(已知退化模型),3、特征提取和选择,通过传感器获取的信息原始数据量一般比较大。 高速相机+IO Industries高速记录系统,采集速度:850MByte/s 1K*1K*1Byte,500f/s=500MBy

18、te/s,高速记录11280*1023,高速记录2508*508,高速记录31536*1024,高速记录41536*1024,3、特征提取和选择,为有效地实现分类识别,要对原始数据进行选择或者变换,得到最能反映分类本质的特征,构成特征向量。 特征形成 特征提取 特征选择,3、特征提取和选择,特征形成 根据被识别的对象产生出一组基本特征,它可以是计算出来的,也可以是仪表或者传感器测量出来的,这样产生出来的特征叫原始特征。一般将原始数据组成的空间叫测量空间。 信息获取阶段,如数字图像中的灰度值即可以看成是一种原始特征。,3、特征提取和选择,特征提取 原始特征数量可能很大,样本处于一个高维空间里。通

19、过映射或者变换的方法可以用低维空间来表示样本,这个过程叫特征提取。 如1K*1K的灰度图像相当于1K*1K维测量空间中的一个点。在高维空间中进行分类较为困难,且这种描述不能直接反映对象的本质(灰度会随着摄像机位置及照度等的变化而变化) 变换 测量空间 特征空间,通常为线性变换,如Fisher变换。,3、特征提取和选择,特征选择 从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,这个过程叫特征选择。 降维两大方法: 1、通过映射和变换把原始特征变为较少的新特征。 2、从原始特征中挑选出一些最有代表性的特征来。 特征提取与选择的原则 尽量减小特征间的相关性 一个极端的例子:圆识别,R

20、2R是两个极度相关的特征,4、分类器设计,为把待识别模式分配到各自的模式类中去,必须设计出一套分类判别规则。基本做法是:用一定数量的样本(称为训练样本集),确定出一套分类判别规则,使得按这套分类判别规则对待识模式进行分类所造成的错误识别率最小或引起的损失最小。 如数字识别,首先要用0-9的训练样本训练分类器。,5、分类决策,分类器按已确定的分类判别规则对待识模式进行分类判别,输出分类结果。 监督模式识别与非监督模式识别 对于监督模式识别,判别规则设计完成后转入分类决策。 对于非监督模式识别,没有训练样本,分类器设计只能依靠待识别样本集进行,分类器设计与决策一起完成,即设计完成后分类结果亦产生。 模式识别课程主要研究3、4、5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论