模式识别-第一章概论_第1页
模式识别-第一章概论_第2页
模式识别-第一章概论_第3页
模式识别-第一章概论_第4页
模式识别-第一章概论_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

王改华TelEmail:80103185@湖北工业大学电气学院具有某些属性的实体的集合苹果水果具体形式:实体抽象形式:概念1.模式和模式识别最简单的例子:对苹果和桔子的识别特征:颜色、形状颜色特征:RGB形状:测量图像顶部到最宽处的距离模式识别(PatternRecognition):确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。样本(Sample):一个具体的研究(客观)对象。如患者,某人写的一个汉字,一幅图片等。模式(Pattern):对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。

模式和模式识别特征(Features):能描述模式特性的量(测量值)。在统计模式识别方法中,通常用一个矢量表示,称之为特征矢量,记为模式类(Class):具有某些共同特性的模式的集合。模式识别是模拟人的某些功能模拟人的视觉:计算机+光学系统模拟人的听觉:计算机+声音传感器模拟人的嗅觉和触觉:计算机+传感器训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。测试集:在设计识别和分类系统时没有用过的独立样本集。系统评价原则:为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。人类具有很强的模式识别能力,时刻在完成某种模式识别的任务。模式识别是一门理论与应用并重的技术科学,有广泛的需求。模式识别是从样本到类别的映射。模式识别是从样本到类别的映射。2.人的模式识别能力人的视觉识别能力图像信息80%看书、看报、写字看电影、看风景…光学信息可见光图像、红外图像X射线图像、γ射线图像静态图像、动态图像2.人的模式识别能力人的听觉识别能力一听就知道是…为什么研究它?3、计算机模式识别问题生产实践的需要:需要智能机器人,另外人的工资高,而计算机的价格越来便宜。信息爆炸现象:用人来不及处理信息。如:卫星遥感,超级市场,邮政,银行,指纹库。危险地带:油漆、放射、高温、核电站。提高工效:自动化带来的好处已经显而易见。卫星地图符号化地图的分割方法图5.2“地图3”分割结果:(a)原始图像(b)分割的“路面”信息(c)分割的“湖泊”信息(d)分割的“植被”信息图5.3“地图6”分割结果:(a)原始图像(b)分割的“路面”信息(c)分割的“湖泊”信息(d)分割的“植被”信息图5.6分割后处理的结果图:(a1)分割得到的“路面”信息(a2)后处理之后的“路面”信息(b1)分割得到的“湖泊”信息(b2)后处理之后的“湖泊”信息(c1)分割得到的“植被”信息(c2)后处理之后的“植被”信息彩色地图后处理方法图5.7分割后处理的结果图:(a1)分割得到的“路面”信息(a2)后处理之后的“路面”信息(b1)分割得到的“湖泊”信息(b2)后处理之后的“湖泊”信息(c1)分割得到的“植被”信息(c2)后处理之后的“植被”信息彩色地图后处理方法美军排爆机器人执行任务智能娱乐机器人-童童骑自行车的机器人-村田顽童航天机器人对象空间模式空间特征空间类型空间各类空间(Space)的概念模式采集:从客观世界(对象空间)到模式空间的过程称为模式采集。特征提取和特征选择:由模式空间到特征空间的变换和选择。类型判别:特征空间到类型空间所作的操作。模式识别三大任务信息的获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象如文字,图象等;可以是一维的波形如声波,心电图,脑电图;也可以是物理量与逻辑值。预处理:包括A\D,二值化,图象的平滑,变换,增强,恢复,滤波等。1.2模式识别系统特征抽取和选择:在模式识别中,需要进行特征的抽取和选择,例如,一幅64x64的图象可以得到4096个数据,这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征,就是特征提取和选择的过程。分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。把这些判决规则建成标准库。分类决策:在特征空间中对被识别对象进行分类。

1.数据获取为了使计算机能够对客体进行分类识别,必须将客体用计算机所能接受的形式表示,通常从客体获得的信息有下列三种类型①二维图像,如文字、指纹、照片等;②一维波形,如语音、机械振动波、心电团等;③物理参量或逻辑值,如体温、各种实验数据等。通过测量、采样和量化,可以用矩阵或向量表示二维图象或一维波形,这就是信息获取过程。2.预处理预处理的目的是去除噪声,加强有用的信息,并对种种因素造成的退化现象进行复原。某人声音有杂音模糊图像清晰图像清晰声音图像预处理语音信号预处理3.特征抽取

由信息获取部分获得的原始数据量一般是相当大的。为了有效地实现分类识别,要对原始数据进行选择或变换,得到最能反应分类本质的待征,构成特征向量。这就是特征抽取的过程。人脸几何特征人脸部件规一化的点间距离和比率特征点如眼角、嘴角、鼻尖等人脸的颜色特征

黄皮肤、黑眼睛统计特征脸形模板和图象灰度的自相关性

4.分类器设计为了把待识模式分配到各自的模式类中去,必须设计出分类判别规则。基本作法是:用一定数量的样本(称为训练样本集)确定出一套分类判别规则,使得按这套分类判别规则对待识模式进行分类所造成的错误识别率最小或引起约损失最小。分类器按已确定的分类判别规则对待识模式进行分类判别,输出分类结果。§1-4模式识别的基本问题一、模式(样本)表示方法向量表示:假设一个样本有n个变量(特征)

x=(x1,x2,…,xn)T2.矩阵表示:N个样本,n个变量(特征)3.几何表示

一维表示

X1=1.5,X2=3

二维表示X1=(x1,x2)T=(1,2)T

X2=(x1,x2)T=(2,1)T

三维表示X1=(x1,x2,x3)T=(1,1,0)T

X2=(x1,x2,x3)T=(1,0,1)Tx1x2x3x1x24.基元(链码)表示:在右侧的图中八个基元分别表示:0,1,2,3,4,5,6,7,八个方向和基元线段长度。则右侧样本可以表示为X1=006666这种方法将在句法模式识别中用到。5一些基本问题模式类的紧致性:集合中任意两个内点可以用光滑线连接,在该连线上的点也属于这个集合。每个内点都有一个足够大的邻域,在该邻域中只包含同一集合中的点。紧致集要求临界点要比较少假若每个模式类都满足紧致性假设,则解决模式识别间题就不会碰到什么原则上的困难。但对于很多实际问题这个假设是不成立的。只要各个模式类是可分的,总存在这样一个空间,使变换到这个空间中的集合满足紧致性要求。5一些基本问题相似与分类:相似与分类问题远不像集合表达那样简单明了。集合的概念可用来表现已经分好的类,但对于怎样分类和归类则缺乏指导意义。

用各种距离表示相似性:已知两个样本

xi=(xi1,xi2,xi3,…,xin)Txj=(xj1,xj2,xj3,…,xjn)T

5一些基本问题5一些基本问题②欧几里德距离①绝对值距离③明考夫斯基距离其中当q=1时为绝对值距离,当q=2时为欧氏距离5一些基本问题④切比雪夫距离⑤夹角余弦x4x5x1x2x3因为x1,x2的夹角小,所以x1,x2最相似。其中Xi,Xj为特征向量,为协方差矩阵。使用于N个样本的集合中两个样本之间求M氏距离:⑤马哈拉诺比斯(Mahalanobis)距离N——样本个数例:马哈拉诺比斯(Mahalanobis)距离:设X1=(0,0)T,X2=(0,1)T,X3=(1,0)T,X4=(1,1)T.则N=4,两点之间的马氏距离X1X2X3X4两点之间的欧氏距离都具对称性。但数值不同。欧氏距离的计算步骤:1.求样本均值;2.求协方差矩阵;3.求协方差矩阵的逆矩阵;4。按公式求两点间马氏距离。如:1,3,5,7,9与2,4,6,8,10的相关系数为1;1,3,5,7,9与10,8,6,4,2的相关系数为-1;注意:在求相关系数之前,要将数标准化*相关系数分别的均值:其中,Xi=(xi1,xi2,…,xin),Xj=(xj1,xj2,…,xjn).分类的主观性和客观性①分类带有主观性:目的不同,分类不同。例如:鲸鱼,牛,马从生物学的角度来讲都属于哺乳类,但是从产业角度来讲鲸鱼属于水产业,牛和马属于畜牧业。②分类的客观性:科学性

判断分类必须有客观标准,因此分类是追求客观性的,但主观性也很难避免,这就是分类的复杂性。靠哪些特征决定相似并进行分类,取决于行为的目的和方法。5一些基本问题范例木板图象512×512d=3长度纹理亮度

c=2松木\桦木维数无限有限/很大R有限d不大c模式识别过程d<<R<无限模式采集模式空间特征提取/选择类型空间分类特征空间客观世界待识别对象识别过程错误概率检测制定分类的判决规则特征提取/选择方法校正学习过程采集方法校正已知对象预处理应用领域1.4模式识别的应用应用领域生物医学:血细胞计数,染色体分类,心电脑电图1.4模式识别的应用应用领域文字处理:文字识别(印刷体,手写体汉字识别);办公自动化(机器翻译);银行(支票识别);邮局(邮政信函的自动分拣)。遥感:资源普查(对地形地貌的分析,森林资源、海洋资源的普查,湖水面积的计算),地图识别……1.4模式识别的应用纸币识别器对纸币按面额进行分类

面额

系统实例5元10元20元50元100元 长度(mm)宽度(mm) 5元 136 63 10元 141 70 20元 146 70 50元 151 70 100元 156 77 磁性 金属条位置(大约) 5元 有 54/82 10元 有 54/87 20元 有 57/89 50元 有 60/91 100元 有 63/935元10元20元50元100元12345678反射光波形数据采集、特征提取:

长度、宽度、磁性、磁性的位置,光反射亮度、光透射亮度等等

特征选择:

长度、磁性及位置、反射亮度分类识别:

确定纸币的面额及真伪从摄像头获取包含车牌的彩色图象车牌定位和获取字符分割和识别输入图象特征提取粗略

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论