模式识别概述_第1页
模式识别概述_第2页
模式识别概述_第3页
模式识别概述_第4页
模式识别概述_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模式识别概述第一页,共五十九页,2022年,8月28日第一章:模式识别概述第二页,共五十九页,2022年,8月28日一个例子通过光学感知手段,将传送带上的鱼进行自动分类 鲈鱼

鱼类 鲑鱼3第三页,共五十九页,2022年,8月28日问题分析架设一台摄影像机,拍摄若干样品的图像提取用于区分两类鱼的有效特征(feature)长度光泽度宽度鳍的数目和形状嘴的位置,等等…….上述参数即是我们对两类鱼进行分类的备选特征4第四页,共五十九页,2022年,8月28日

预处理(preprocessing)去除干扰,图像增强采用图像分割技术将不同的鱼分离开来,或者将鱼同背景分开特征提取(featureextraction)将每条鱼的数据送入特征提取器,通过测量特定的“特征”或“属性”来简化原始数据类将特征送入分类器,以便进行分类5第五页,共五十九页,2022年,8月28日鲑鱼鲑鱼鲈鱼6第六页,共五十九页,2022年,8月28日分类(Classification)根据先验知识:鲈鱼长度一般要比鲑鱼大选择长度(length)作为可能的分类特征获取足够多的样本(训练样本)进行统计(直方图)确定合适的长度临界值L*作为分类标准7第七页,共五十九页,2022年,8月28日鲑鱼鲈鱼分类标准8第八页,共五十九页,2022年,8月28日单一的特征判据(长度)不足以完全正确分类无论怎样确定临界值,都有无法仅凭长度就把两类鱼截然分开9第九页,共五十九页,2022年,8月28日选择光泽度(lightness)作为分类特征获取足够多的样本(训练样本)进行统计(直方图)确定合适的光泽度临界值x*作为分类标准以光泽度为分类特征,两类鱼的分离性更好!10第十页,共五十九页,2022年,8月28日分类标准鲑鱼鲈鱼11第十一页,共五十九页,2022年,8月28日判别边界与判别代价

无论采用哪一种特征进行分类都有代价:误判上述判别边界假设将鲑鱼误判为鲈鱼和将鲈鱼误判为鲑鱼的代价相等(对称代价)非对称代价:调整判别边界的位置决策论12第十二页,共五十九页,2022年,8月28日鲑鱼鲈鱼调整判别边界,减小判别代价13第十三页,共五十九页,2022年,8月28日为获取更好的分类效果,组合运用多个特征选取光泽度(lightness)和宽度(width)作为分类特征鱼 xT=[x1,x2]特征向量:xT=[x1,x2]LightnessWidth14第十四页,共五十九页,2022年,8月28日鲑鱼鲈鱼判别标准:判别边界组合特征优于单一特征15第十五页,共五十九页,2022年,8月28日需要考虑的问题:特征越多分类性能越好吗?什么样的特征才是好的特征?特征的相关性与冗余?16第十六页,共五十九页,2022年,8月28日如何获取判别边界:判别模型?

什么样的判别边界才是最优的:模型优化?

17第十七页,共五十九页,2022年,8月28日复杂的模型鲑鱼鲈鱼18第十八页,共五十九页,2022年,8月28日复杂的模型可保证对所有训练样本正确分类过于复杂的模型将导致复杂的判别曲线新模式推广能力差19第十九页,共五十九页,2022年,8月28日分类系统的目标是对未知的样本正确分类,而不仅仅是对训练样本分类必须在模型复杂度和推广能力之间进行折中考虑最优模型20第二十页,共五十九页,2022年,8月28日鲑鱼鲈鱼优化的判别边界21第二十一页,共五十九页,2022年,8月28日什么是模式识别?定义利用机器(计算机)模仿人脑对现实世界各种事物进行描述、分类、判断和识别的过程。目标用计算机实现具有感知、识别、理解、自学习和自适应能力的灵活和智能的计算机器。22第二十二页,共五十九页,2022年,8月28日模式识别的产生与发展起源于20世纪40年代研究初期,模式识别被看作动物所具有的自然生理现象,很多人认为不值得研究。当人们试图使计算机去具有人脑的识别能力后,模式识别的难度和重要性才得以重视。23第二十三页,共五十九页,2022年,8月28日模式识别的产生与发展随着计算机技术的发展,60年代后模式识别迅速发展为一门相对独立的新兴交叉学科明确的问题定义、严格的数学基础、坚实的理论框架、丰富的理论和应用成果、广阔的应用前景24第二十四页,共五十九页,2022年,8月28日模式识别的相关学科模式识别人工智能计算机视觉机器学习认知科学心理生物学25第二十五页,共五十九页,2022年,8月28日模式识别的应用语音识别与理解(Speechrecognition)语音识别说话人识别语种识别语音情感识别特定人、非特定人母语、非母语孤立音、连续音26第二十六页,共五十九页,2022年,8月28日模式识别的应用字符识别(CharacterRecognition)手写体印刷体汉字、英文、阿拉伯数字27第二十七页,共五十九页,2022年,8月28日模式识别的应用生物特征识别指纹识别掌纹识别人脸识别虹膜识别28第二十八页,共五十九页,2022年,8月28日模式识别的应用生物医学信号识别心电图、心音、多普勒生物信号、染色体、DNA序列图像检索军事目标跟踪与识别遥感图像处理29第二十九页,共五十九页,2022年,8月28日研究模式识别的意义通过模式识别的研究和应用,提高和扩展计算机的应用能力和领域,促进人工智能的应用与发展促进人们对人脑识别过程的理解和认识30第三十页,共五十九页,2022年,8月28日模式识别存在的问题模式识别是一门快速发展的新兴学科,涉及到多学科、多领域的复杂问题和生物认知系统相比,现有人工模式识别系统的适应和识别能力还远远不能令人满意模式识别的许多理论和基本方法方面的问题还远没有得到解决新问题层出不穷传统方法均存在一定的局限性31第三十一页,共五十九页,2022年,8月28日模式识别的理论基础概率论与数理统计随机过程线性代数优化方法形式语言学32第三十二页,共五十九页,2022年,8月28日模式识别的基本方法模式识别方法经典方法现代方法统计决策方法句法方法神经网络方法模糊模式识别33第三十三页,共五十九页,2022年,8月28日模式识别的基本方法统计决策法基于模式的定量描述与统计规律的识别方法,是模式识别最经典、最成熟的方法,目前广泛应用于模式识别的各个领域原理:样本观测值特征概率统计决策准则分类34第三十四页,共五十九页,2022年,8月28日模式识别的基本方法统计方法鲑鱼鲈鱼决策标准:判别边界35第三十五页,共五十九页,2022年,8月28日模式识别的基本方法句法方法基于模式的空间结构特征的定性描述与形式语言学的方法,广泛应用于字符识别、图像识别等领域原理:样本基元字符串形式语言文法分类36第三十六页,共五十九页,2022年,8月28日模式识别的基本方法句法方法定义基元:37第三十七页,共五十九页,2022年,8月28日模式识别的基本方法模糊模式识别基于模糊数学和统计分析的识别方法,在不能明确描述模式特征和结构的复杂模式识别问题中得到了成功应用根据隶属度和模糊文法进行分类模糊模式类很像三角形的图形远大于2的整数清晰模式类三角形大于2的整数38第三十八页,共五十九页,2022年,8月28日模式识别的基本方法神经网络方法基于现代生物学和认识科学对人类信息处理的研究成果采用人工神经网络模型,使识别和处理过程更接近人类的思维过程39第三十九页,共五十九页,2022年,8月28日模式识别的基本方法输入层(i)输入层(j)输入层(k)W

ijW

jk神经网络方法40第四十页,共五十九页,2022年,8月28日模式识别的基本方法神经网络方法人工神经网络由相互广泛连接的神经元组成,信息分布于神经网络中每一节点的输入为前一层所有节点输出的加权和通过已知类别样本的学习,调整各节点之间的加权系数具有自适应学习能力,适用于并行计算与处理41第四十一页,共五十九页,2022年,8月28日模式识别的一般过程无论采用何种方法,模式识别一般都要包括下列两个基本过程模式识别学习过程(设计过程)识别过程(实现过程)42第四十二页,共五十九页,2022年,8月28日模式识别的一般过程学习过程通过一批已知类别的学习样本进行分析,推出分类准则。识别过程对末知类别的单个待识样本,根据分类准则进行识别分类。43第四十三页,共五十九页,2022年,8月28日模式识别的一般过程学习样本数据获取预处理特征提取统计分析分类准则待识样本数据获取预处理特征提取识别分类分类结果统计模式识别的过程44第四十四页,共五十九页,2022年,8月28日模式识别的一般过程数据获取采用传感器(摄像机或麦克风),通过测量、采样和量化,得到反映样本信息的原始数据(一维波形、二维图像等)数据质量依赖于传感器的特性和局限性(如带宽、分辩率、灵敏度、信噪比等)预处理采用特定方法,对样本数据进行分割、噪声滤除、边缘增加等处理预处理的方法与样本对象所属领域密切相关(如语音、图像)

45第四十五页,共五十九页,2022年,8月28日特征提取采用特定的方法提取反映样本本质特性的特征(Feature),压缩原始数据。统计分析采用一定的统计方法,通过学习样本的分布规律,建立识别模型,推断出分类准则。识别分类根据分类准则,对待识样本进行分类。模式识别的一般过程46第四十六页,共五十九页,2022年,8月28日模式识别的一般过程句法模式识别的过程学习样本数据获取预处理基元提取文法推断文法待识样本数据获取预处理基元提取句法分析分类结果47第四十七页,共五十九页,2022年,8月28日模式识别系统实现学习过程和识别过程的计算机系统称为模式识别系统,亦称为分类器。学习过程即是分类器的设计过程识别过程即是分类器的实现过程48第四十八页,共五十九页,2022年,8月28日分类器设计采集数据(Datacollection)选择特征(FeatureChoice)选择模型(ModelChoice)训练分类器(Training)评价分类器(Evaluation)计算复杂度(ComputationalComplexity)49第四十九页,共五十九页,2022年,8月28日开始采集数据选择特征选择模型训练分类器评价分类器结束先验知识50第五十页,共五十九页,2022年,8月28日采集数据(DataCollection)在开发模式识别系统费用中,数据据采集占到令人吃惊的比重为保证分类器的性能,必须有足够多的训练样本怎样才能知道已经采集到足够多有代表性的供训练和测试用的数据了呢? 分类器设计51第五十一页,共五十九页,2022年,8月28日选择特征(Featurechoice)怎么做才能把先验知识和训练数据有机结合起来,以发现有用的和有效的特征呢?分类器设计52第五十二页,共五十九页,2022年,8月28日特征选择(Featurechoice)依赖于具体的问题(语音识别、图像识别)选择反映模式本质特性的参数作为特征使样本类间距离较大、类内距离较小与类别信息不相关的变换(平移、旋转、尺度变换)具有不变性尽量选择相关性小的特征尽可能不受噪声的干扰53第五十三页,共五十九页,2022年,8月28日模型选择(ModelChoice)怎样选择合适的模型,得到识别分类的标准?模型是唯一的吗?什么样的模型更优呢?分类器设计54第五十四页,共五十九页,2022年,8月28日训练或学习(Training)利用样本数据来确定分类器的过程“基于样本的学习”的方法是设计分类器的最有效的方法。分类器设计55第五十五页,共五十九页,2022年,8月28日评价分类器(Evaluation)识别率误识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论