2_贝叶斯决策理论_第1页
2_贝叶斯决策理论_第2页
2_贝叶斯决策理论_第3页
2_贝叶斯决策理论_第4页
2_贝叶斯决策理论_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 贝叶斯决策理论2.1 引言2.2 几种常用的决策规则2.2.1 基于最小错误率的贝叶斯决策2.2.2 基于最小风险的贝叶斯决策2.2.3 限定一类错误率,使另一类错误率最小2.2.4 最小最大决策2.2.5 分类器、判别函数及决策面2.3 正态分布时的统计决策12.1 引言模式识别的目的就是要确定某一个给定的模式样本属于哪一类可以通过对被识别对象的多次观察和测量,构成特征向量,并将其作为某一个判决规则的输入,按此规则来对样本进行分类2作为统计判别问题的模式分类在获取模式的观测值时,有些事物具有确定的因果关系,即在一定的条件下,它必然会发生或必然不发生例如识别一块模板是不是直角三角形,只

2、要凭“三条直线边闭合连线和一个直角”这个特征,测量它是否有三条直线边的闭合连线并有一个直角,就完全可以确定它是不是直角三角形这种现象是确定性的现象3但在现实世界中,由许多客观现象的发生,就每一次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性只有在大量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性特征值不是一个确定的向量,而是一个随机向量此时,只能利用模式集的统计特性来分类,以使分类器发生错误的概率最小作为统计判别问题的模式分类4统计识别的基本方法贝叶斯决策应用贝叶斯决策的前提条件已知各类别总体的概率分布已知决策分类的类别数在已知相关概率(类别先验概率和

3、类条件概率分布)的情况下,特征空间中一个观察量的类别归属问题52.2 几种常用的决策规则主要学习最小错误率Bayes错误和最小风险决策;了解在更复杂情况下的几种决策规则讨论决策规则用于模式识别的几个问题62.2.1 基于最小错误率的贝叶斯决策从尽量减少错误的角度出发,利用贝叶斯公式得出使错误最小的分类原则以癌细胞识别的例子引出贝叶斯决策7贝叶斯决策的出发点癌细胞识别,两类别问题细胞正常与异常若仅利用先验概率进行分类统计的角度得出的两类细胞的出现概率无法实现正常与异常细胞的分类目的先验概率提供的信息太少,要结合样本观测信息,为此需要利用类条件概率8贝叶斯公式p9各类样本的分布情况10贝叶斯决策的

4、几种表达形式11两类模式集分类问题对一大批人进行癌症普查,患癌者以1类代表,正常人以2类代表设被试验的人中患有癌症的概率为0.005,即P(1)=0.005,当然P(2)=1-0.005=0.995现任意抽取一人,要判断他是否患有癌症。显然,因为P(2) P(1),只能说是正常的可能性大。如要进行判断,只能通过化验来实现应用实例12设有一种诊断癌症的试验,其结果为“阳性”和“阴性”两种反应若用这种试验来对一个病人进行诊断,提供的化验结果以模式x代表,这里x为一维特征,且只有x=“阳”和x=“阴”两种结果寻找样本观测量13假设根据临床记录,发现这种方法有以下统计结果患有癌症的人试验反应为阳性的概

5、率=0.95,即p(x=阳|1)=0.95患有癌症的人试验反应为阴性的概率=0.05,即p(x=阴|1)=0.05正常人试验反应为阳性的概率=0.01,即p(x=阳|2)=0.01正常人试验反应为阴性的概率=0.99,即p(x=阴|2)=0.99观测量的类条件概率14应用贝叶斯决策问题若被化验的人具有阳性反应,他患癌症的概率为多少,即求P(1| x=阳)=?这里P(1)是根据以往的统计资料得到的,为患癌症的先验概率。现在经过化验,要求出P(1| x=阳),即经过化验后为阳性反应的人中患癌症的概率,称为后验概率计算0.32315最小错误率的证明以一维情况为例证明贝叶斯决策确实对应最小错误率统计意

6、义上的错误率,即平均错误率,用P(e)表示16最小错误率的证明17错误率图示以t为界确实使错误率最小,因为P(e/x)始终取最小这个图在哪见过?与图像分割中最优阈值对应的错误分割结果类似,最优阈值同样是基于最小错误概率图像分割蕴含了与模式识别类似的思想,即判定给定像素属于目标还是背景18多类问题的贝叶斯决策192.2.2 基于最小风险的贝叶斯决策问题的提出:风险的概念风险与损失紧密相连,如病情诊断、商品销售等问题日常生活中的风险选择,所谓是否去冒险最小风险贝叶斯决策考虑各种错误造成损失不同而提出的一种决策规则“宁可错杀一千,也不放走一个”20以决策论的观点决策空间:所以可能决策组成的集合每个决

7、策都将带来一定的损失,可表示为决策和自然状态的函数21一般决策表22相关的数学表示23条件期望损失引入损失的概念,制定决策不能仅考虑最小错误率,而是要考虑采取的决策相应的损失是否最小损失的数学表示,跟决策相关条件期望损失,条件风险对于特定的x采取决策i 的期望损失24期望风险25最小风险贝叶斯决策26最小风险贝叶斯决策步骤27对两类问题28对两类问题29最小风险贝叶斯决策示例30最小风险贝叶斯决策示例31上一节的例子检验呈阳性者患病概率是0.323若按最小错误率决策:正常2采用最小风险决策,需要用到损失函数损失的评估是个关键问题宁可虚惊一百不可漏诊一人32最小风险贝叶斯决策的讨论除了知道最小错

8、误贝叶斯决策也需要的先验概率和类条件概率外,损失函数的确定往往也是一个难题与最小错误贝叶斯决策的关系差别在于是否考虑风险,即错误损失最小风险决策可看作加权形式的最小错误决策,加权值即损失函数取特定形式时二者可能等价,如损失函数取0-1形式33定义损失函数342.2.3 限定一类错误率,使另一类错误率最小35条件极值问题利用拉格朗日乘子法将条件极值转化为无条件极值36条件极值问题3738似然比决策规则比较最终结果的似然比表示形式最小错误率Bayes决策的表示形式最小风险Bayes决策的表示形式39似然的含义似然likelihood表明在其他条件都相等的情况下,使得 较大的 更有可能是真实的类别4

9、02.2.4 最小最大决策41以两类情况下的最小风险Bayes决策为例进行讨论总风险公式42假定决策域已经确定,我们以 表示分类器判为 时的特征空间中的区域,同样有 和 ,于是总风险用条件风险的形式表示为43一旦 和 确定,风险 就是先验概率 的线性函数,可表示为由于)(1wP在0和1之间取值,所以期望风险有baRa+44由上式可见,当类条件概率密度、损失函数ij 、类域Ri 取定后,R是P(1)的线性函数。考虑P(1)的各种可能取值情况,为此在区间(0,1)中取若干个不同的P(1)值,并分别按最小损失准则确定相应的最佳决策类域R1、R2,然后计算出其相应的最小平均损失R*,从而可得最小平均损

10、失R*与先验概率P(1)的关系曲线。45最小最大决策图示最小风险R*与先验概率的关系曲线先验概率取固定值的最小风险先验概率为 的最小风险分类结果对应各种先验概率的风险变化为何为切线?尽管对应 的最小风险相对其他先验概率最大,但不管先验概率如何变化,此种分类风险恒定,从而使所有可能的最大风险最小化46小结:各种情况下的方法选择在某些实际问题中,可能存在以下几种情况:不知道各类的先验概率)(iPw难于确定误判的代价ijl某一种错误较另一种错误更为重要针对,可以采用最小最大损失准则或简单令各类先验概率相等针对,N-P准则针对,如果允许的话,可以避开使用损失函数 而采用最小误判概率准则472.2.5

11、分类器、判别函数及决策面应用前述Bayes决策规则,设计分类器对观察量实施分类用于表达决策规则的某些函数称为判别函数;是直接用来对模式样本进行分类的准则函数对于c类问题,按照决策规则把d维特征空间分成c个决策域,划分决策域的边界面称为决策面48多类问题最小错误率决策规则49多类问题判别函数50多类问题决策面51多类问题分类器52两类情况决策规则53两类问题判别函数54两类问题决策面55两类问题分类器56例题:教材23页,套公式572.3 正态分布时的统计决策贝叶斯分类器的结构可由条件概率密度和先验概率来决定最受青睐的密度函数正态分布,也称高斯分布合理性:中心极限定理表明,在相当一般的条件下,当

12、独立随机变量的个数增加时,其和的分布趋于正态分布简易性582.3.1 正态分布的定义及性质单变量正态分布由两个参数完全确定,即均值和方差59正态分布概率密度函数在整个定义域上积分为1服从正态分布的样本聚集在均值附近,其散布程度与标准差(方差)有关60多元正态分布均值向量协方差矩阵多元正态分布的概率密度函数定义61协方差矩阵的计算计算公式,计算协方差矩阵。已知62协方差矩阵的性质对称非负定阵元素正负?元素含义:对角线和非对角线协方差:用来度量变量之间“协同变异”大小的总体参数,即二者相互影响大小的参数;绝对值越大,相互影响越大对角阵情形;去相关63多元正态分布的性质均值向量和协方差矩阵共同决定分

13、布均值向量有d个分量协方差矩阵独立元素个数为d(d+1)/2多元正态分布由d+d(d+1)/2个参数完全决定,常表示为64多元正态分布的性质等密度点的轨迹是超椭球面65多元正态分布的性质马氏距离: 到 的Mahalanobis距离等密度点轨迹是到均值向量的马氏距离为常数的超椭球面样本离散度由 决定;同单变量正态分布类似,方差影响样本分布的疏密程度66椭圆主轴的确定为简单处理,将椭球中心移至原点来求椭球长短轴67设 在超椭球上, 到超椭球中心的距离为 ,求主轴长度即是求其条件极值,构造Lagrange函数68对 的椭圆第 i 个主轴的长度与的第 i 个特征值的平方根成正比,方向由对应特征向量的方

14、向决定69多元正态分布的性质不相关性等价于独立性70边缘分布和条件分布的正态性线形变换的正态不变性通过变换,能使本来相关的随机变量在新的坐标系中独立;便于处理多元正态分布的性质71多元正态分布的性质线形组合的正态不变性线性变换的特例722.3.2 多元正态下的最小错误率决策73下面根据上式对以下三种情况进行讨论。决策面方程74(1) ,即每类的协方差矩阵都相等,而且类内各特征间相互独立,具有相等的方差 如果先验概率不等,那么平方距离(欧氏距离)必须通过方差进行归一化,并通过增加 进行修正。75 如果先验概率相等称其为最小距离分类器。76可看作线性分类器77对其,我们用一个二维二类模式例子,设先验概率相等,从几何上表示其关系(不相等的情况请参照教材P32)78(2) ,即各类的协方差矩阵都相等如果先验概率相等,只要计算 到各类的均值点 的马氏距离平方,然后把 归于 距离平方最小的类别。79对以上两类情况进行化简80决策面方程只要协方差矩阵相等,先验概率相等,就对应最小距离分类器,包括欧式距离和马氏距离81对其,我们用一个二维二类模式例子,设先验概率相等,从几何上表示其关系82(2)各类的协方差矩阵不相等83二维模式,12的几种情况R1R2(a) 圆,2类的方差小R1R2(b) 椭圆, 2类的方差小R1R2(c) 抛物线,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论