模式识别导论1_第1页
模式识别导论1_第2页
模式识别导论1_第3页
模式识别导论1_第4页
模式识别导论1_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/9/8,北京邮电大学信息工程学院,模式识别导论,盛立东 北京邮电大学信息工程学院,2020/9/8,第一章 概论 1-1 模式识别的基本概念,一.模式识别的基本定义 模式(pattern) -存在于时间,空间中可观察的事 物,具有时间或空间分布的信息。 模式识别(Pattern Recognition) - 用计算机实现 人对各种事物或现象的分析,描述,判断,识别。 模式识别与图象识别,图象处理的关系 模式识别是模拟人的某些功能 模拟人的视觉: 计算机+光学系统 模拟人的听觉: 计算机+声音传感器 模拟人的嗅觉和触觉: 计算机+传感器,2020/9/8,二.模式识别的发展史 1929

2、年 G. Tauschek发明阅读机 ,能够阅读0-9的数字。 30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。因此, 在6070年代,统计模式识别发展很快,但由于被识别的模式愈来愈复杂,特征也愈多,就出现“维数灾难”。但由于计算机运算速度的迅猛发展,这个问题得到一定克服。统计模式识别仍是模式识别的主要理论。 50年代 Noam Chemsky 提出形式语言理论,美籍华人付京荪 提出句法结构模式识别。 60年代 L.A.Zadeh提出了模糊集理论,模糊模式识别理论得到了较广泛的应用。,2020/9/8,80年代 Hopfield提出神经元网络模型理论。近些年人工神经元网络在模

3、式识别和人工智能上得到较广泛的应用。 90年代小样本学习理论,支持向量机也受到了很大的重视。,2020/9/8,三.关于模式识别的国内、国际学术组织 1973年 IEEE发起了第一次关于模式识别的国际会议“ICPR”,成立了国际模式识别协会-“IAPR”,每2年召开一次国际学术会议。 1977年 IEEE的计算机学会成立了模式分析与机器智能(PAMI)委员会,每2年召开一次模式识别与图象处理学术会议。 国内的组织有电子学会,通信学会,自动化协会,中文信息学会.。,2020/9/8,1-2 模式识别系统,信息获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象,如文字,图象等;

4、也可以是一维的波形,如声波,心电图,脑电图;还可以是物理量与逻辑值。 预处理:包括AD,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理。,2020/9/8,特征抽取和选择:在模式识别中,需要进行特征的抽取和选择。例如,一幅64x64的图象可以得到4096个数据,这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。这就是特征提取和选择的过程。 分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。把这些判决规则建成标准库。 分类决策:在特征空间中对被识别对象进行分类。,2020/9/8,1-3 模式识别的应用,字符识别:包括

5、印刷体字符的识别;手写体字符的识别(脱机),各种OCR设备例如信函分拣、文件处理、卡片输入、支票查对、自动排板、期刊阅读、稿件输入;在线手写字符的识别(联机),各种书写输入板。 医疗诊断:心电图,脑电图,染色体,癌细胞识别,疾病诊断,例如关幼波肝炎专家系统。 遥感:资源卫星照片,气象卫星照片处理,数字化地球,图象分辨率可以达到1米。 指纹识别与脸形识别。 检测污染分析,大气,水源,环境监测。,2020/9/8,自动检测:产品质量自动检测 语声识别,机器翻译,电话号码自动查询,侦 听,机器故障判断。 军事应用,2020/9/8,1-4 模式识别的基本问题,一.模式(样本)表示方法 向量表示 :

6、假设一个样本有n个变量(特征) = (X1,X2,Xn)T 矩阵表示: N个样本,n个变量(特征),2020/9/8,几何表示 一维表示 X1=1.5 X2=3 二维表示 X1=(x1,x2)T=(1,2)T X2=(x1,x2)T=(2,1)T 三维表示 X1=(x1,x2,x3)T=(1,1,0)T X2=(x1,x2 ,x3)T= =(1,0,1)T,2020/9/8,基元(链码)表示: 在右侧的图中八个基元分别表0,1,2,3,4,5,6,7,八个方向和基元线段长度。则右侧样本可以表示为X1=006666。 这种方法将在句法模式识别中用到。,2020/9/8,二.模式类的紧致性 紧致集

7、:同一类模式类样本的分布比较集中,没有或临界样本很少,这样的模式类称紧致集。 临界点(样本):在多类样本中,某些样本的值有微小变化时就变成另一类样本称为临界样本(点)。,2020/9/8,紧致集的性质 要求临界点很少 集合内的任意两点的连线,在线上的点属于同 一集合 集合内的每一个点都有足够大的邻域,在邻域内只包含同一集合的点 模式识别的要求:满足紧致集,才能很好的分类;如果不满足紧致集,就要采取变换的方法,满足紧致集.,2020/9/8,三.相似与分类 两个样本xi ,xj 之间的相似度量满足以下要求: 应为非负值 样本本身相似性度量应最大 度量应满足对称性 在满足紧致性的条件下,相似性应该

8、是点间距离的 单调函数 用各种距离表示相似性: 绝对值距离 已知两个样本 Xi=(xi1, xi2 , xi3,xin)T Xj=(xj1, xj2 , xj3,xjn)T,2020/9/8,欧几里德距离 明考夫斯基距离 其中当q=1时为绝对值距离,当q=2时为欧氏距离,2020/9/8,切比雪夫距离 q趋向无穷大时是明氏距离的极限情况 马哈拉诺比斯距离 其中xi ,xj为特征向量, 为协方差。使用的条件是 样本符合正态分布,2020/9/8,夹角余弦 即样本间夹角小的为一类。 例: x1 , x2 , x3的夹角如图: 因为x1 , x2 的夹角小,所以x1 , x2 最相似。,x1,x2,

9、x3,2020/9/8,相关系数 为xi xj的均值 注意:在求相关系数之前,要将数据标准化 分类的主 观性和客观性 分类带有主观性:目的不同,分类不同。例如:鲸鱼,牛,马从生物学的角度来讲都属于哺乳类,但是从产业角度来讲鲸鱼属于水产业,牛和马属于畜牧业。 分类的客观性:科学性判断分类必须有客观标准,因此分类是追求客观性的,但主观性也很难避免,这就是分类的复杂性。,2020/9/8,四.特征的生成 低层特征: 无序尺度:有明确的数量和数值。 有序尺度:有先后、好坏的次序关系,如酒分为上,中,下三个等级。 名义尺度:无数量、无次序关系,如有红,黄两种颜色 中层特征:经过计算,变换得到的特征 高层

10、特征:在中层特征的基础上有目的的经过运 算形成 例如:椅子的重量=体积*比重 其中体积与长,宽,高有关;比重与材料,纹 理,颜色有关。这里低、中、高三层特征都有了。,2020/9/8,五.数据的标准化 极差标准化,一批样本中,每个特征的最大值与最小值之差。 极差 极差标准化 方差标准化 Si 为方差 标准化的方法很多,原始数据是否应该标准化,应采用什么方法标准化,都要根据具体情况来定。,2020/9/8,1-5 模式识别应用举例,邮政编码是十个手写数字组成,属于比 较简单的手写体字符识别。但由于邮政编码的广 泛书写者及书写习惯大不相同,书写工具不同及 书写时的随机变化,同一数字的字形是多种多样

11、 的。在个别情况下,某一数字的字形变化会逐渐 接近别的数字,如下图:,不同数字之间字形的连续变化,2020/9/8,这种由量变到质变的过程给识别带来极大的困难。 下面我们简单介绍一种邮政编码的识别方法,对模式识别系统有初步了解。,2020/9/8,一.二值化处理 对于字符识别,字符图象不需要256个灰度级,只要黑白两级即可。因此图象的存贮量可以大大压缩,加快处理速度。二值化的方法是建立直方图如下。,0,IB:背景灰度 IW:图象灰度 IT:直方图谷点,IB,IT,IW,f(I),灰度,一.二值化处理 对于字符识别,字符图象不需要256个灰度级,只要黑白两级即可。因此图象的存贮量可以大大压缩,加

12、快处理速度。二值化的方法是建立直方图如下:,1-5 模式识别应用举例,2020/9/8,若取谷点IT作为阈值,则 这样就可以把一个多灰度级的图象变成二值图象。但实际上谷点IT常常是不明显的,而且是变化的,因此阀值IT的选择是非常重要的。根据图象的复杂程度,我们可以选取固定阀值和自动阀值。 固定阀值:取 IT为固定值。 手动阀值:用人工调节IT的大小。 自动阀值:根据图象变化,可自动调整二值化的阀值的大小,使图象最好。,I IT,I IT,2020/9/8,阀值IT的数学表示为: IT = T(X,Y),N(X,Y),g(X,Y) 其中(X,Y)为象素坐标,N(X,Y)为象素周围局部灰度特征,g

13、(X,Y)为灰度。 整体阀值选择:IT=Tg(X,Y),只由直方图谷点象素的灰度决定阀值,效果较差。 局部阀值选择:IT=Tg(X,Y),N(X,Y) 这种方法主要根据一点与其周围各点的平均关系来定阀值,所以只适合于噪声变化平缓的图象。 动态阀值选择:IT=T(X,Y),N(X,Y),g(X,Y)该方法的要点是通过对象素的灰度的反复调整,修改直方图,使谷点清晰或单峰变双峰。,2020/9/8,二.平滑处理 对于二值化后的图象,由于噪声的干扰,会存在一些黑白的孤立点和边缘上的凹凸点。 1.除孤立点外,用九点窗扫描,用逻辑式 : 若周围8个点为“0”,扫描点为“1”则把扫描点由“1” “0”。 若

14、周围8个点为“1”,扫描点为“0”则把扫描点由“0” “1”。,2020/9/8,2.除边缘凹凸点: 除凸点的四种情况 逻辑式 : 中心点由“1” “0”,2020/9/8,补凹点:四种情况,2020/9/8,三.细化处理 因为各种字符笔画粗细不同为抽取特征方便和减小信息量,希望把笔画宽度减小到一个象素的宽度,这样字符笔画就变成一个骨架,消除了笔画粗细对识别的影响。细化的方法很多,我们介绍的方法是逐渐去掉文字的边缘点。 方法:用3X3辅助矩阵去顺序扫描文字点阵的每个点,应用细化逻辑来判断所扫描的每个点应除掉还是保留。,2020/9/8,细化逻辑设计规则: (1)按上-下-左-右顺序去掉边缘点

15、第一次扫描只去掉上边缘点 第二次扫描只去掉下边缘点 第三次扫描只去掉左边缘点 第四次扫描只去掉右边缘点 上边缘点 下边缘点 左边缘点 右边缘点,2020/9/8,(2)不能使笔画断线,应保留连点 (3)保留端点,2020/9/8,(4)保留节点(三叉点,四叉点),2020/9/8,(5)保留左右角点 (6)保留上下角点,2020/9/8,根据以上规则,可以编制软件程序也可以设计硬件逻辑电路,经多次扫描细化就只剩下字符骨架了。如图1-4所示。,图1-4 文字经过平滑和细化变化情况,2020/9/8,四.跟踪和抽取特征 1.跟踪规则 (1)跟踪从任一端点开始每个端点只抽一次特征 (2)按逆时针方向

16、( )沿骨架移动一 周,直到重新回到原端点。 (3)跟踪方向的先后顺序由下列办法确定。 上次跟踪方向,检查下次跟踪方向的先后次序,2020/9/8,例如。上次跟踪方向是f7 ,下次跟踪次序为:,f1,f2,f3,f4,f5,f6,f7,f8,2020/9/8,2. 抽特征:每跟踪一步就要抽取方向特征,凹凸特征和分支特征。下面对这三种特征详细讨论。 (1)方向特征:按f1 f8 共8个跟踪方向可获得8个方向特征。 (2)线特征:包括凹凸平三种特征 方向增量f 定义如下:,2020/9/8,凹凸平定义状态图: 凹:f=-2 连续两个f=-1 凸:f=+2 连续两个f=+1 平:f=0,+1,+2凸

17、,+2凸,0平,0平,+1平,0平,+1平,+2凸,-1平,-2凹,-1平,-2凹,-1,-2凹,2020/9/8,(3)分支特征(点特征) 包括端点,三叉点,四叉点,连点 X=1时,d9 为端点 X=2时,d9 为三叉点 X=3时,d9 为四叉点 X=4时,d9 为连点,三叉点,规定811,2020/9/8,例如:d1=d2=d3=d5=d7=d9=1,2020/9/8,四.分类判决 采用序贯分类方法:跟踪一步抽取方向特征,点特征,线特征三种特征,用这三种特征进行分类判决,若不能确定,再跟踪一步抽取三种特征,再进行分类判决,直到确定类别为止。,判决,跟踪一步 抽取特征,判决,跟踪一步抽取特征,2020/9/8,1.建立训练样本标准库:假设有K个已知类别的训练样本,抽取特征序列L1,L2LK代表K个数字,用它建立训练样本标准库。 2.顺序逻辑判决:假设输入字符为X,它共有个端点,因此字符X由S1,S2,S条特征序列组成,而每一个特征序列又是由若干按一定顺序出现的特征组成:(由方向,分支和线特征组成),2020/9/8,(1)S1=L1? (2)X=L1?,T11符合L1?,T12符合L1?,T1e符合L1?,S1不符合L1,S1符合L1,否,否,否,是,是,是,S1符合L1?,S2符合L1?,S2符合L1?,X符

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论