版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、模式识别导论第1页,共52页,2022年,5月20日,6点27分,星期四Table of Contents电子信息学院第2页,共52页,2022年,5月20日,6点27分,星期四2.1 引言数据获取预处理特征提取与选择分类决策分类器设计信号空间特征空间第3页,共52页,2022年,5月20日,6点27分,星期四基本概念模式分类:根据识别对象的观测值确定其类别样本与样本空间表示:类别与类别空间:c个类别(类别数已知)引言第4页,共52页,2022年,5月20日,6点27分,星期四决策把样本x分到哪一类最合理?解决该问题的理论基础之一是统计决策理论决策:是从样本空间S,到决策空间的一个映射,表示为
2、 D: S - 引言第5页,共52页,2022年,5月20日,6点27分,星期四决策准则评价决策有多种标准,对于同一个问题,采用不同的标准会得到不同意义下“最优”的决策。Bayes决策常用的准则:最小错误率准则最小风险准则在限定一类错误率条件下使另一类错误率为最小的准则最小最大决策准则引言第6页,共52页,2022年,5月20日,6点27分,星期四2.2 基于判别函数的分类器设计判别函数 (discriminant function):相应于每一类定义一个函数,得到一组判别函数:gi(x), i = 1, 2, , c决策区域与决策面(decision region/surface):第7页,
3、共52页,2022年,5月20日,6点27分,星期四判别函数第8页,共52页,2022年,5月20日,6点27分,星期四决策规则(decision rule)规则表达1规则表达2判别函数第9页,共52页,2022年,5月20日,6点27分,星期四分类器设计分类器是某种由硬件或软件组成的“机器”:计算c个判别函数gi(x)最大值选择ARGMAXg1.g2gc.x1x2xna(x)多类识别问题的Bayes最小错误率决策:gi(x) = P (i |x)判别函数第10页,共52页,2022年,5月20日,6点27分,星期四2.3 Bayes最小错误率决策以两类分类问题为例:已知先验分布P(i)和观测
4、值的类条件分布p(x|i),i=1,2问题:对某个样本x,抉择x 1? x 2?该决策使得在观测值x下的条件错误率P(e|x)最小。 Bayes决策理论是最优的。以后验概率为判决函数:决策规则:即选择P(1|x),P(2|x)中最大值对应的类作为决策结果第11页,共52页,2022年,5月20日,6点27分,星期四后验概率P (i| x)的计算Bayes公式: 假设已知先验概率P(i)和观测值的类条件概率密度函数p(x|i),i=1,2。最小错误率决策第12页,共52页,2022年,5月20日,6点27分,星期四公式简化比较大小不需要计算p(x):最小错误率决策第13页,共52页,2022年,
5、5月20日,6点27分,星期四公式简化对数域中计算,变乘为加:判别函数中与类别i无关的项,对于类别的决策没有影响,可以忽略。最小错误率决策第14页,共52页,2022年,5月20日,6点27分,星期四Bayes最小错误率决策例解两类细胞识别问题:正常(1)和异常(2)根据已有知识和经验,两类的先验概率为:正常(1): P(1)=0.9异常(2): P(2)=0.1对某一样本观察值x,通过计算或查表得到: p(x|1)=0.2, p(x|2)=0.4如何对细胞x进行分类?最小错误率决策第15页,共52页,2022年,5月20日,6点27分,星期四Bayes最小错误率决策例解(2)利用贝叶斯公式计
6、算两类的后验概率:决策结果最小错误率决策第16页,共52页,2022年,5月20日,6点27分,星期四图解p(x|1)p(x|2)p(1|x)p(2|x)类条件概率密度函数后验概率最小错误率决策第17页,共52页,2022年,5月20日,6点27分,星期四决策的错误率条件错误率:(平均)错误率是条件错误率的数学期望(平均)错误率:最小错误率决策第18页,共52页,2022年,5月20日,6点27分,星期四决策的错误率(2)条件错误率P(e|x)的计算:以两类问题为例,当获得观测值x后,有两种决策可能:判定 x1 ,或者x2。条件错误率为:最小错误率决策第19页,共52页,2022年,5月20日
7、,6点27分,星期四决策的错误率(3)Bayes最小错误率决策使得每个观测值下的条件错误率最小,因而保证了(平均)错误率最小。Bayes决策是一致最优决策。最小错误率决策第20页,共52页,2022年,5月20日,6点27分,星期四决策的错误率(4)设t为两类的分界面,则在特征向量x是一维时,t为x轴上的一点。形成两个决策区域:R1(-,t)和R2(t,+)最小错误率决策第21页,共52页,2022年,5月20日,6点27分,星期四最小错误率决策第22页,共52页,2022年,5月20日,6点27分,星期四2.4 基于最小风险的Bayes决策决策的风险:risk,cost做决策要考虑决策可能引
8、起的损失。以医生根据白细胞浓度判断一个人是否患血液病为例:没病(1)被判为有病(2) ,还可以做进一步检查,损失不大;有病(2)被判为无病(1) ,错过诊治时机,损失严重。第23页,共52页,2022年,5月20日,6点27分,星期四损失矩阵损失的定义:(N类问题)做出决策D (x)=i,但实际上 x j,受到的损失定义为:损失矩阵或决策表:最小风险决策第24页,共52页,2022年,5月20日,6点27分,星期四条件风险与期望风险条件风险:获得观测值x后,决策D(x)造成的损失对x实际所属类别的各种可能的平均,称为条件风险R(D(x)|x)期望风险:条件风险对观测值x的数学期望最小风险决策第
9、25页,共52页,2022年,5月20日,6点27分,星期四基于最小风险的Bayes决策基于最小风险的Bayes决策:决策有代价,选择(条件)风险最小的决策。Bayes最小风险决策通过保证每个观测值下的条件风险最小,使得它的期望风险最小,是一致最优决策。决策规则:最小风险决策第26页,共52页,2022年,5月20日,6点27分,星期四最小风险决策的计算根据Bayes公式计算后验概率P(j|x)根据后验概率及给定的损失矩阵,算出每个决策的条件风险R(i|x)按最小的条件风险进行决策。损失矩阵在某些特殊问题,存在简单的解析表达式。实际问题中得到合适的损失矩阵不容易。最小风险决策第27页,共52页
10、,2022年,5月20日,6点27分,星期四两类问题最小风险Bayes决策用Bayes公式展开,最小风险Bayes决策得到:最小风险决策第28页,共52页,2022年,5月20日,6点27分,星期四Bayes最小风险决策例解两类细胞识别问题:正常(1)和异常(2)根据已有知识和经验,两类的先验概率为:正常(1): P(1)=0.9异常(2): P(2)=0.1对某一样本观察值x,通过计算或查表得到: p(x|1)=0.2, p(x|2)=0.411=0, 12=6, 21=1, 22=0按最小风险决策如何对细胞x进行分类?最小风险决策第29页,共52页,2022年,5月20日,6点27分,星期
11、四Bayes最小风险决策例解(2)后验概率: P(1|x) =0.818, P(2|x) =0.182决策结果最小风险决策第30页,共52页,2022年,5月20日,6点27分,星期四最小风险决策的一般性基于最小错误率的Bayes决策可作为最小风险Bayes决策的一种特殊情形。只需要定义损失为:决策正确时,损失为0决策错误时,损失为1最小风险决策第31页,共52页,2022年,5月20日,6点27分,星期四2.5 正态分布的最小错误率Bayes决策Bayes决策的三个前提:类别数确定各类的先验概率P(i)已知各类的条件概率密度函数p(x|i)已知Bayes决策中,类条件概率密度的选择要求:模型
12、合理性计算可行性最常用概率密度模型:正态分布观测值通常是很多种因素共同作用的结果,根据中心极限定理,它们(近似)服从正态分布。计算、分析最为简单的模型。第32页,共52页,2022年,5月20日,6点27分,星期四一元正态分布正态分布Bayes决策一元正态分布及其两个重要参数:均值(中心)方差(分散度)第33页,共52页,2022年,5月20日,6点27分,星期四多元正态分布观测向量x:实际应用中,可以同时观测多个值,用向量表示。多元正态分布:正态分布Bayes决策协方差矩阵均值向量第34页,共52页,2022年,5月20日,6点27分,星期四多元正态分布的性质参数和完全决定分布等概率密度轨迹
13、为超椭球面不相关性等价于独立性边缘分布和条件分布的正态性线性变换的正态性线性组合的正态性正态分布Bayes决策第35页,共52页,2022年,5月20日,6点27分,星期四参数和完全决定分布协方差矩阵是对称矩阵多元正态分布由n+n(n+1)/2个参数所完全决定正态分布Bayes决策第36页,共52页,2022年,5月20日,6点27分,星期四等概率密度轨迹为超椭球面等概率密度轨迹为超椭球面Mahalanobis距离正态分布Bayes决策第37页,共52页,2022年,5月20日,6点27分,星期四不相关性等价于独立性多元正态分布的任意两个分量互不相关,则它们一定独立不相关独立正态分布Bayes
14、决策第38页,共52页,2022年,5月20日,6点27分,星期四线性变换的正态性多元正态随机向量x对x进行线性变换得到多元正态随机向量y正态分布Bayes决策第39页,共52页,2022年,5月20日,6点27分,星期四线性组合的正态性多元正态随机向量x对x的分量进行线性组合得到随机标量y正态分布Bayes决策第40页,共52页,2022年,5月20日,6点27分,星期四正态分布的最小错误率Bayes决策观测向量的类条件分布服从正态分布:判别函数的定义与计算:判别函数中与类别i无关的项,对于类别的决策没有影响,可以忽略正态分布Bayes决策第41页,共52页,2022年,5月20日,6点27
15、分,星期四最小距离分类器与线性分类器第一种特例:判别函数的简化计算:最小距离分类器线性分类器正态分布Bayes决策第42页,共52页,2022年,5月20日,6点27分,星期四最小距离分类器与线性分类器第二种特例:判别函数的简化计算:Mahalanobis距离线性分类器正态分布Bayes决策第43页,共52页,2022年,5月20日,6点27分,星期四正态模型的Bayes决策面两类问题正态模型的决策面:决策面方程:g1(x)=g2(x)两类的协方差矩阵相等,决策面是超平面。两类的协方差矩阵不等,决策面是超二次曲面。正态分布Bayes决策第44页,共52页,2022年,5月20日,6点27分,星
16、期四正态模型的Bayes决策面正态分布Bayes决策第45页,共52页,2022年,5月20日,6点27分,星期四正态分布下的几种决策面的形式正态分布Bayes决策第46页,共52页,2022年,5月20日,6点27分,星期四正态分布的Bayes决策例解两类的识别问题:医生要根据病人血液中白细胞的浓度来判断病人是否患血液病。根据医学知识和以往的经验,医生知道:患病的人,白细胞的浓度服从均值2000,标准差1000的正态分布;未患病的人,白细胞的浓度服从均值7000,标准差3000的正态分布;一般人群中,患病的人数比例为0.5%。一个人的白细胞浓度是3100,医生应该做出怎样的判断?正态分布Ba
17、yes决策第47页,共52页,2022年,5月20日,6点27分,星期四数学表示:用表示“类别”这一随机变量,1表示患病, 2表示正常;x表示“白细胞浓度”这个随机变量。本例医生掌握的知识非常充分,他知道:1) 类别的先验分布:P(1) = 0.5%P(2) = 99.5%先验分布:没有获得观测数据(病人白细胞浓度)之前类别的分布正态分布的Bayes决策例解正态分布Bayes决策第48页,共52页,2022年,5月20日,6点27分,星期四2) 观测数据白细胞浓度分别在两种情况下的类条件分布: P(x|1) N(2000,10002) P(x|2) N(7000,30002)P(3100|1)
18、 = 2.1785e-004P(3100|2) = 5.7123e-005计算后验概率P(1|3100)=1.9%P(2|3100)=98.1%医生的判断:正常正态分布的Bayes决策例解正态分布Bayes决策第49页,共52页,2022年,5月20日,6点27分,星期四2.6 讨论基于Bayes决策的最优分类器Bayes决策的三个前提:类别数确定各类的先验概率P(i)已知各类的条件概率密度函数p(x|i)已知问题的转换:基于样本估计概率密度基于样本直接确定判别函数第50页,共52页,2022年,5月20日,6点27分,星期四习题试简述先验概率,类条件概率密度函数和后验概率等概念间的关系: 试写出利用先验概率和分布密度函数计算后验概率的公式EX2.5EX2.15写出最小错误率和最小风险决策规则相应的判别函数(两类问题)。用Matlab计算两类识别问题:根据血液中白细胞的浓度来判断病人是否患血液病。第51页,共52页,2022年
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年多功能酸洗缓蚀剂项目可行性研究报告
- 2025江西省安全员A证考试题库及答案
- 2025年度汽车配件销售定制合同范本
- 2024年网络安全保密技术支持与服务合同3篇
- 2024年运输公司驾驶员劳务合同与安全保障责任协议3篇
- 二零二五年度健康食品供应合同范本3篇
- 2025年度办公楼员工宿舍管理与维修合同3篇
- 2024智能城市综合管理平台建设合同
- 2024年短视频内容创作与授权合同带眉脚
- 2024版商业物业租赁协议附加条款版
- 仓库管理培训课件
- 2024年居间服务合同:律师事务所合作与业务推广
- 大型活动音响设备保养方案
- 安全生产专(兼)职管理人员职责
- 公检法联席会议制度
- 成都大学《Python数据分析》2022-2023学年期末试卷
- 保险理赔岗位招聘面试题与参考回答(某大型央企)2024年
- 上海市市辖区(2024年-2025年小学五年级语文)部编版期末考试(上学期)试卷及答案
- 第10课《我们不乱扔》(教学设计)-部编版道德与法治二年级上册
- 期末试卷(试题)-2024-2025学年五年级上册数学人教版
- 护理安全警示教育-新-
评论
0/150
提交评论