版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第八章 图像识别 信息与通信工程学院 张洪刚2模式识别和模式的概念感知:从环境获取信息感知:从环境获取信息3计算机模式识别u模式识别:使计算机模仿人的感知能力,从感知数据中提取信息(判别物体和行为)的过程。数据获取模式分割模式识别姚明姚明ROCKETS11概念4模式识别的意义数字化感知数据:来源丰富、数量巨大概念5模式识别的难点感知数据:非结构化(像素、声波等)概念6模式与模式类u样本样本(sample, object):一类事物的一个具体体现,对具体的个别事物进行观测所得到的某种形式的信号。u模式模式(pattern):表示一类事物,如印刷体A与手写体A属同一模式。B与A则属于不同模式。u
2、样本是具体的事物,而模式是对同一类事物概念性的概括。u模式类与模式联合使用时,模式表示具体的事物,而模式类则是对这一类事物的概念性描述。u模式识别是从样本到类别的映射。概念模式确定性和随机性以人脸为例l确定性结构关系:眼睛、鼻子、嘴器官形状:眼睛形状、鼻子形状、嘴形状肤色:色调l随机性结构关系:距离、角度器官形状:大小、形状参数不同肤色:不同肤色,不同饱和度和光洁度7定义:模式类l模式(x) : 具有某些量化测量值或者特征l模式类 (vi):A collection of “similar” (not necessarily identical) objectsInter-class vari
3、abilityIntra-class variabilityl模式类的统计特性相似性-先验概率 :P (vi)类条件概率密度:p (x|vi)8The letter “T” in different typefacesCharacters that look similar9模式识别的基本问题模式识别的基本问题(1)特征如何提取?-特征产生特征产生(2)最有效的特征是那些特征?-特征选择特征选择(3)对特定任务,如何设计分类器? -分类器设计分类器设计(4)分类器设计后,如何评价分类器?分类错误率是多少? -分类器评价分类器评价10模式识别方法的分类模式识别方法的分类(1)监督与非监督模式识别
4、 A、监督模式识别 利用先验知识和训练样本来设计分类器。 B、非监督模式识别 利用特征向量的相似性来自动进行分类。11l有监督学习(supervised learning):用已知类别的样本训练分类器,以求对训练集数据达到某种最优,并能推广到对新数据的分类。l非监督学习(unsupervised learning) :样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)12模式分类 vs. 模式聚类Classification (known categories) Clustering (creation of new categories)Category
5、“A”Category “B”Classification (Recognition) (Supervised Classification) Clustering(Unsupervised Classification)模式识别方法13参数估计近邻法直接计算判别函数非参数方法有监督学习最小距离分层聚类无监督学习静态模式(不相关)HMM时序模式(相关的静态模式)统计模式识别模板匹配结构模式识别人工神经网络句法模式识别统计学习理论和支持向量机模糊模式识别14模板匹配Template MatchingTemplateInput scene15结构模式识别l用简单的基元(primitives)和结构
6、关系来描述复杂对象YNMLTXZSceneObjectBackgroundDELTXYZMNDE16句法模式识别l定义:描述待处理模式的结构信息,并用形式语言中的文法定义模式结构,并通过句法分析进行分类对象被描述为以基元为基本单位(符号化)的文法源自语言学,但不限于语言学应用l基本概念基元:预定义的不再包含细节结构信息的子结构文法:对模式的描述(基元为字符)字符串句法:对字符串进行判别,是否文法描述的“语言”17句法模式识别系统框架预处理基元分割或分解句法分析基元和关系选择文法结构及推理测试模式训练模式分类学习过程错误率检测基元及关系识别18人工神经网络l计算“仿生”智能计算机 大规模并行分布
7、式的计算学习,泛化和自适应容错,非确定,不精确的分类19模糊模式识别l1965年Zadeh提出模糊集理论是对传统集合理论的一种推广l传统:属于或者不属于l模糊:以一定的程度属于模糊逻辑:相对传统二值逻辑“是或不是”模糊数学:研究模糊集和模糊逻辑模糊系统:应用角度20模糊模式识别方法l隶属度函数对象x属于集合A的程度的函数,值域0, 1l模糊模式识别方法将模糊技术引入传统模式识别方法中l模糊特征l模糊分类:模糊子集代替确定子集l模糊评价21统计模式识别l模式识别最初从统计理论发展而来l基本思想:模式被描述为一组测量值组成的随机特征向量,用概率统计理论对其进行建模,用统计决策理论划分特征空间来进行
8、分类。22统计模式识别的一般过程预处理特征提取/选择分类预处理特征提取/选择学习分类规则测试模式训练模式分类训练错误率检测23统计模式识别基本过程l基本系统组成数据获取:测量预处理:利于特征提取和分类特征提取与选择l降维l选择有利于分类的特征,去除不利分类的特征分类决策l错误率最小l损失最小24统计模式识别统计模式识别 距离分类法距离分类法 1. 标准模式法标准模式法设由训练样例可获得c个模式类1, 2, c,且可获得各个模式类的标准模式M1, M2, MC。那么,对于待识模式X,可通过计算其与各标准模式的距离d(X, Mi) (i=1,2,c)来决定它的归属。具体分类规则为: d(X, Mj
9、)=min d(X, Mi) Xj i=1,2,c 即与X距离最小的标准模式所属的模式类即为X的所属模式类。25m1m2xg(x)=0m1m2x262. 平均距离法平均距离法平均距离法就是将待识模式X与模式类i (i=1,2,c) 中所有样例模式的距离平均值作为与X的距离,然后以距离最小的模式类作为X的类属。分类规则可描述为: ),(),(ijXdXdjXji其中, ksllkkYXdsXd1),(1),(k=1, 2, , c), sk为模式类k中的样例模式数。 273. 3. 最近邻法最近邻法最近邻法是将与待识模式X距离最近的一个样例模式的模式类作为X的类属。分类规则可描述为 ),(),(
10、ijXdXdjXji其中,sk为模式类k中的样例模式数。 ),(min),(, 2 , 1lslkYXdXdk2829几何分类法几何分类法一个模式类就是相应特征空间中的一个点集。一般来讲,在特征空间中一个模式类的点集总是在某种程度上与另一个模式类的点集相分离。因此,模式识别的另一个思路就是设法构造一些分界面(线),把特征空间Rn分割成若干个称为决策区域的子空间Ri (i=1,2,n),使得一个模式类刚好位于一个决策区域。这样,对于待识模式X,就可以利用空间中的这些分界面来判定X的类属。分界面(线)方程gi(X)=0中的函数gi(X)称为判别函数。显然,构造分界面的关键就是构造其判别函数。 分界
11、面(线)可分为平面(直线)和曲面,相应的判别函数为线性函数和非线性函数。30对于二分类问题, 显然只需一个分界平面。设判别函数为 g(X)=WTX+w0 其中W= (w1, w2, wn)T为X中各分量x1, x2, xn的系数组成的向量,称为权向量;w0为一个常数,称为阈值权。那么,分界平面方程为 g(X) = WTX+w0= 0 由几何知识知,位于这个分界平面两边的点X的判别函数值g(X)符号相反。于是, 可有分类规则: g(X)0 X1 g(X)0 X2 g(X)=0 X属于X1或X2 ,或者不可判别 31二分类问题的分界面(线)示意 32概率分类法概率分类法基于最小错误率的贝叶斯决策基
12、于最小错误率的贝叶斯决策因为模式属于哪一模式类存在不确定性,所以需要用概率来决策, 就是说对于待识模式X,如果它属于哪个类的概率大则它就属于哪一类。但如果直接使用各模式类的先验概率P(ci), 则会因先验概率所提供的信息量太少而导致把所有模式都归入先验概率最大的模式类的无效分类。因此, 应该考虑后验概率P(ci|X), 但通常概率P(ci|X)不易直接求得的。幸好, 概率论中的贝叶斯公式可以帮忙, 事实上, 由贝叶斯公式 cjjjiiicPcXpcPcXpXcP1)()|()()|()|(图解p(x|1)p(x|2)p(1|x)p(2|x)类条件概率密度函数后验概率最小错误率决策34模式识别过
13、程示例:Fish Classification预处理:image enhancement, separating touching/occluding fishes and finding the boundary of the fishExample from: R. Duda, P. Hart, D. Stork, “Pattern Classification”, second edition, 2000.35l先验知识: 鲈鱼一般比鲑鱼长l通过长度L是否超过了临界值L*来判断种类l为了确定恰当的L*值,必须先获得不同类别的鱼的若干样本(“设计样本”或”训练样本”)进行长度测量。3637l验证了平均意义上鲈鱼要比鲑鱼长的结论l令人失望的表明: 单一的特征判据是不足以完美分类的。l继续尝试别的特征,如: 鱼的平均光泽度。38392021-7-9l总体代价函数: 决策理论的中心任务是要确定一种决策,使该代价函数最小。l单一特征的分类效果不能令人满意,应考虑组合运用多种特征的方法。l特征组合: 光泽度x1和宽度x2,简化为一个二维的特征向量,或二维空间的一个点x1,x240412021-7-9出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 软件代理服务合同定制
- 工业气体订购协议详解
- 互联网广告发布合同
- 肉禽购销协议格式
- 房屋买卖合同签订法律咨询
- 物资采购合同评审表
- 动画制作招标文件
- 房屋宅基地买卖合同纠纷处理
- 2024哺乳期解除劳动合同协议书
- 农业科研成果与农民知识产权保护考核试卷
- 农业合作社全套报表(已设公式)-资产负债表-盈余及盈余分配表-成员权益变动表-现金流量表
- 高速公路施工交通组织专项方案
- 全国教师教学创新团队申报书(范例)
- GMP质量体系洁净度检测报告书
- YS/T 755-2011亚硝酰基硝酸钌
- LS 8010-2014植物油库设计规范
- GB/T 9119-2000平面、突面板式平焊钢制管法兰
- GB/T 4955-1997金属覆盖层覆盖层厚度测量阳极溶解库仑法
- GB/T 33143-2016锂离子电池用铝及铝合金箔
- GB/T 26316-2010市场、民意和社会调查服务要求
- GB/T 22427.7-2008淀粉粘度测定
评论
0/150
提交评论