版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模式识别方法及其研究进展PatternRecorgnitionMethodAndItsResearchReview1主要内容有关组织与出版物模式识别的基本概念模式识别系统模式识别过程模式识别方法与进展未来展望2机构、会议、刊物1973年IEEE发起了第一次关于模式识别的国际会议“ICPR”(此后两年一次),成立了国际模式识别协会---“IAPR”1977年IEEE成立PAMI委员会,创立IEEETrans.onPAMI,并支持ICCV,CVPR两个会议其他刊物PatternRecognition(PR)PatternRecognitionLetters(PRL)PatternAnalysisandApplication(PAA)InternationalJournalofPatternRecognitionandArtificialIntelligence(IJPRAI)3统计学概率论线性代数(矩阵计算)形式语言机器学习人工智能图像处理计算机视觉…与模式识别相关的学科4什么是模式(Pattern)?5广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。模式的直观特性:可观察性可区分性相似性什么是模式?6模式识别–直观,无所不在,“人以类聚,物以群分”周围物体的认知:桌子、椅子人的识别:张三、李四声音的辨别:汽车、火车,狗叫、人语气味的分辨:炸带鱼、红烧肉人和动物的模式识别能力是极其平常的,但对计算机来说却是非常困难的。模式识别的概念7目的:利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。Y=F(X)X的定义域取自特征集Y的值域为类别的标号集F是模式识别的判别方法模式识别的研究81929年G.Tauschek发明阅读机,能够阅读0-9的数字。30年代Fisher提出统计分类理论,奠定了统计模式识别的基础。50年代NoamChemsky提出形式语言理论——傅京荪提出句法结构模式识别。60年代L.A.Zadeh提出了模糊集理论,模糊模式识别方法得以发展和应用。80年代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络复活,并在模式识别得到较广泛的应用。90年代小样本学习理论,支持向量机也受到了很大的重视。模式识别简史9生物学自动细胞学、染色体特性研究、遗传研究天文学天文望远镜图像分析、自动光谱学经济学股票交易预测、企业行为分析医学心电图分析、脑电图分析、医学图像分析模式识别的应用(一)10工程产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析军事航空摄像分析、雷达和声纳信号检测和分类、自动目标识别安全指纹识别、人脸识别、监视和报警系统模式识别的应用(二)11模式识别目标模式识别系统的目标:在特征空间和解释空间之间找到一种映射关系,这种映射也称之为假说。特征空间:从模式得到的对分类有用的度量属性或基元构成的空间。解释空间:将c个类别表示为 其中为所属类别的集合,称为解释空间。
12两种实现假说:归纳监督学习、概念驱动或归纳假说:在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说也都必须在“未知”的样本上得到近似的结果。依靠已知所属类别的的训练样本集,按它们特征向量的分布来确定假说(通常为一个判别函数),只有在判别函数确定之后才能用它对未知的模式进行分类;对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练。13两种实现假说:演绎非监督学习、数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说。在没有先验知识的情况下,通常采用聚类分析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间的距离及分散情况;如果特征向量集聚集若干个群,可按群间距离远近把它们划分成类;这种按各类之间的亲疏程度的划分,若事先能知道应划分成几类,则可获得更好的分类结果。14模式识别系统的基本构成模式识别系统数据获取特征提取和选择预处理分类决策分类器设计15数据获取:用计算机可以运算的符号来表示所研究的对象二维图像:文字、指纹、地图、照片等一维波形:脑电图、心电图、季节震动波形等物理参量和逻辑值:体温、化验数据、参量正常与否的描述预处理单元:去噪声,提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原模式识别系统组成(一)16特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征测量空间:原始数据组成的空间特征空间:分类识别赖以进行的空间模式表示:维数较高的测量空间->维数较低的特征空间分类决策:在特征空间中用模式识别方法把被识别对象归为某一类别基本做法:在样本训练集基础上确定某个判决规则,使得按这种规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小模式识别系统组成(二)17由训练样本所得特征空间分布图18光学传感器对鱼分类:鲈鱼(Seabass)鲑鱼(Salmon)模式识别过程实例19数据获取:架设一个摄像机,采集一些样本图像,获取样本数据预处理:去噪声,用一个分割操作把鱼和鱼之间以及鱼和背景之间分开特征提取和选择:对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量长度亮度宽度鱼翅的数量和形状嘴的位置,等等…分类决策:把特征送入决策分类器识别过程202122232425数据聚类、PCA统计模式识别结构模式识别(句法)神经网络支持向量机模糊理论特征提取理论分形理论小波分析模式分类的主要方法26目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。是一种非监督学习的方法,解决方案是数据驱动的。数据聚类2728基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。特征向量分布的获得是基于一个类别已知的训练样本集。是一种监督分类的方法,分类器是概念驱动的。统计模式识别29该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。识别采用结构匹配的形式,通过计算一个匹配程度值(matchingscore)来评估一个未知的对象或未知对象某些部分与某种典型模式的关系如何。当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的结构模式识别方法–句法模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。结构模式识别30神经网络是受人脑组织的生理学启发而创立的。由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。神经网络可以实现监督和非监督学习条件下的分类。神经网络31MP模型32多层感知器如果在输入和输出层间加上一层或多层的神经元(隐层神经元),就可构成多层前向网络,这里称为多层感知器。
33支持向量机基于统计学习理论的支持向量机(supportvectormachines,SVM),作为一种新的强大数据分类和函数估计工具以及神经网络领域中一种新的重要方法学,得到了巨大的发展。目前SVM已经达到了一个比较成熟的水平,被成功地应用于模式识别和目标检测、函数估计、基因分析等领域。34线性分类器f
xy+1-1f(x,w,b)=sign(w.x
-b)Howwouldyouclassifythisdata?35f
xy+1-1f(x,w,b)=sign(w.x
-b)Howwouldyouclassifythisdata?36f
x+1-1f(x,w,b)=sign(w.x
-b)Howwouldyouclassifythisdata?37f
x+1-1f(x,w,b)=sign(w.x
-b)Howwouldyouclassifythisdata?38f
xy+1-1f(x,w,b)=sign(w.x
-b)Anyofthesewouldbefine....butwhichisbest?39xy+1-1f(x,w,b)=sign(w.x
-b)线性分类器的间隔(margin):到超平面最近的样本与此超平面之间的距离。40最大间隔f
xy+1-1f(x,w,b)=sign(w.x
-b)具有最大间隔的线性分类器叫做最大间隔线性分类器。其就是一种最简单的支持向量机(SVM)(称为线性支持向量机,即LSVM)线性支持向量机41f
xy+1-1f(x,w,b)=sign(w.x
-b)支持向量(SupportVectors):是那些距离超平面最近的点。具有最大间隔的线性分类器叫做最大间隔线性分类器。其就是一种最简单的支持向量机(SVM)(称为线性支持向量机,即LSVM)线性支持向量机最大间隔42Why…最大间隔?+1-1f(x,w,b)=sign(w.x
-b)支持向量(SupportVectors):是那些距离超平面最近的点。具有最大间隔的线性分类器叫做最大间隔线性分类器。其就是一种最简单的支持向量机(SVM)(称为线性支持向量机,即LSVM)线性支持向量机直观上感觉很好.学习得到的线性分类器.其对未知样本的预测能力与分类器间隔有如下关系:43OverfittingandunderfittingProblem:howrichclassofclassificationsq(x;θ)touse.underfittingoverfittinggoodfitProblemofgeneralization:asmallempricalriskRempdoesnotimplysmalltrueexpectedriskR.44分形理论的创始人曼德布罗特(Mandelprot)曾说过:“浮云不呈球形,山峰不呈锥体,海岸线不是圆圈,树干不是光溜溜的,闪电永不会沿直线行进”,说的就是人们一般不应以简单的、理想的体系去对待实际体系。
大自然中存在的不规则的物体,可能存在不同尺度上的相似性,称为自相似性。例如:
1.布朗微粒轨迹图存在自相似性:虽然记录时间间隔相差很大,但它们仍都具有相同的复杂性。
2.不管漫步在海岸边以厘米量级观察,还是从人造卫星上以数千米跨度观察,海岸线的弯曲的复杂程度也可能是相同的。以不同尺度去测量都有相似结果说明,测量对象没有特征尺寸,它们具有尺度(标度)不变性。分形多姿的大自然体形45布朗微粒轨迹
皮兰(Perrin)于1908年用显微镜测量了布朗运动的轨迹,他每隔30秒记录一次某个微粒的位置,再将相继得到的两点位置连成直线,得到一幅由长短不等的直线段连接成的轨迹图。他又将测量时间间隔缩短为每隔3秒,画出的另外一幅微粒的轨迹图。将两图进行比较可以发现,两幅图虽不尽相同,它们具有同等的复杂程度。以不同尺度去测量都有相似结果说明,测量对象没有特征尺寸,它们具有尺度(标度)不变性。46大自然中的自相似体
不管漫步在海岸边以厘米量级观察,还是从人造卫星上以数千米跨度观察,海岸线的弯曲的复杂程度也可能是相同的。
大自然中的许多不规则物体,可能存在不同尺度上的相似性,称为自相似性。47多彩的大自然大自然是异常复杂、丰富多彩的,那些简单、正规的理想对象只是少数。人们不应以简单的、理想的体系去对待实际体系。48理不清的相轨线49奇妙的计算图形50基于测量对象体形上的自相似性与标度不变性,曼德布罗特提出了分形理论。1973年,在法兰商学院讲学期间提出了分形的几何学的基本思想,1977年,出版了第一本著作:《分形对象:形、机遇与维数》,1982年,出版了第二本著作:《自然界的形几何学》
分形的英文词是“fractal”,是曼德布罗特创造的,用以表征某些不规则的几何形体。分形定义“Afractalisashapemadeofpartssimslartothewholeinsomeway”,“分形是其组成部分以某种方式与整体相似的图形”,或者说:
分形是指一类体形复杂的体系,其局部与整体具有相似性。维数:与人们熟悉的整规体形的整数维不同,分形体的维数不一定是整数,它可取连续变化的各种数值,称为分形维数(简称分维)。根据分形体不同特征,分形维数的定义有多种,而且不同维数定义计算出的维数也有一些差别。分形的定义51分形的研究现已大大地超出了数学、物理学的范畴,它不仅广泛用于处理自然科学中相关问题,象雷电、相变、聚合物生长等等,而且在扩展到生态、生命、经济、人文的许多领域。在地震、气象的预报预测、石油的多次开采等应用领域,甚至在股票涨落分析等方面,分形也都得到了广泛的应用。分形与系统的混沌运动是密切相关的,是非线性科学的一个重要分支。分形研究领域有如下方面1.数学,这是分形的基础领域;2.物理学、化学等自然科学,如雷电、相变、聚合物生长、天文、地理地质、生态、生命等自然现象;3.非线性动力系统中的分形研究;4.人文、经济如股票涨落分析等;5.国民经济:如地震、气象的预报预测、石油的多次开采等领域。分形研究52小波分析时频分析局部化时频分析局部化的特点提高了信号分析的能力。Fourier变换无法做局部分析,小波分析正式为了克服Fourier变换这些不足而提出来的。具有多分辨率(multi-resolution),也叫多尺度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家政服务公司保洁服务合同1
- 2024年度二手房交易过程中涉及的家具家电购买合同3篇
- 粮食购销合同
- 铝业集团2024年度质量检测服务合同
- 洗车工位包租合同范例
- 糯米米酒采购合同范例
- 投资抖音帐号合作合同范例
- 房产活动合同模板
- 甘蔗合同模板
- 美发行业2024年度售后服务与客户满意度提升合同
- 腰椎术后脑脊液漏观察和护理
- 上交大《园林植物景观设计》包教学检测期末试卷《园林植物景观设计》试卷B卷
- 企业全面预算管理培训ppt课件
- 饲草项目实施方案【范文】
- 浙江农村生活污水治理项目设计施工参照要点
- 分式教材分析
- 预制梁场验收及质量管理实施细则
- HG20592-97法兰标准
- 煤矿避难硐室设计方案
- 防波堤抛石工程
- 海纳330kV变电站二次调试大纲
评论
0/150
提交评论