第7讲贝叶斯决策论.ppt_第1页
第7讲贝叶斯决策论.ppt_第2页
第7讲贝叶斯决策论.ppt_第3页
第7讲贝叶斯决策论.ppt_第4页
第7讲贝叶斯决策论.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第7讲 贝叶斯决策论,主要内容,引言 贝叶斯决策论-连续特征 最小误差率分类 分类器、判别函数及判定面 正态密度,资料来自:Richard O.Duda, 李宏东等译.模式分类,机械工业出版社. 2003.,7.1引言,1)贝叶斯决策论的概念 贝叶斯决策论:利用概率的不同分类决策与相应的决策代价之间的定量折中。 假设:决策问题可以用概率的形式来描述,并假设所有有关的概率结构均已知。 2)鱼类分类的例子:鲈鱼,鲑鱼(续),(鲑鱼),(鲈鱼),使用长度作为特征,(鲑鱼),(鲈鱼),使用光泽度作为特征,(鲑鱼),(鲈鱼),判别边界,决策理论的任务是:使总体代价函数最小。,(鲈鱼),(鲑鱼),使用光泽

2、度和宽度特征的散布图,(鲈鱼),(鲑鱼),复杂模型,最优折中,Center problem in pattern recognition,3)几个概念 如果用w表示类别状态,那么当w=w1时是鲈鱼,当w=w2时是鲑鱼,可由概率来描述特性的随机变量。 先验概率:P(w1)表示鲈鱼的先验概率, P(w2)表示鲑鱼的先验概率,满足P(w1) + P(w2) =1。 类条件概率密度:假设x是一连续随机变量,其分布取决于类别的状态,表示成p(x|w)的形式,也称状态条件密度。,图7-1假定的类条件概率密度函数图,显示了模式处于类别wi时的观测某个特定特征值x的概率密度。如果x代表鱼的长度,那么这两条曲线

3、可描述两种鱼的长度区别。概率函数已归一化。因此每条曲线下的面积为1。,假设已知先验概率P(wj),也知道条件概率密度p(x|wj),且j=1,2。通过观察和测量,发现某个特征(一条鱼的光泽度)为x。则联合概率密度可写成 p(wj, x)=P(wj|x)p(x)=p(x|wj)P(wj) 于是可得贝叶斯公式: P(wj|x)=p(x|wj)P(wj)/p(x) 在两类问题下:,贝叶斯公式可用非正式的英语表示成,其中,p(x|wj)称为wj关于x的似然函数。证据因子p(x)可看成一个标量因子。,图7-2 在先验概率P(w1)=2/3,P(w2)=1/3及图7-1给出的类条件概率密度的条件下的后验概

4、率图.,4)决策规则-最小化误差概率条件下的贝叶斯决策规则 决策规则:如果某个观测值x使得P(w1|x)比P(w2|x)大,则判断类别是w1,反之,则判断w2。 误差概率:,(4),平均误差,(4)式可写成:,可得到完全等价的判断规则,7.2贝叶斯决策论-连续特征,推广: 允许使用多于一个特征 允许多于两种类别状态的情形 允许有其他行为而不是仅仅判断类别 通过引入一个更一般的损失函数来替代误差概率 注:损失函数:精确地阐述了每种行为所付出的代价大小,并且用于将概率转换为一种判决。,令w1,wc表示有限个c个类别集,1,a表示有限的a种可能采取的行为集,风险函数(i|wj)描述类别状态为wj时采

5、取行动i的风险。特征向量x表示一个d维随机变量。令p(x|wj)表示x的状态条件概率密度函数,则后验概率可表示成:,证据因子已知,如果观测到某个特定模式x并且采取行为i,如果真实的类别为wj,通过定义将有损失(i|wj),则相应损失为,称为条件风险,可以通过选择最小化条件风险的行为来使预期的损失最小化。 贝叶斯决策过程实际上提供了一个总风险的优化过程。,总风险为:,两类分类问题,ij=(i|wj)表示当前实际类别为wj时误判为wi所引起的损失。 条件风险为: 如果,也表述为:如果,则判定为w1,利用贝叶斯规则,则等价于,如果,则判定为w1。,另一种表达方式为:如果下式成立,则判定为w1。,似然

6、比,称为,7.3最小误差率分类,如果采取行为i,而实际类别为wj,那么在i=j的情况下判定是正确的,如果ij,则产生误判。如果要避免误判,自然要寻找一种判决规则使误判概率最小化。 对称损失函数或0-1损失函数,条件风险:相当于平均误差概率,为了最小化平均误差概率,需要选取i使得后验概率P(wi|x)最大,也即基于最小误差概率,有,图7-3 图7-1所示的分布的似然函数比p(x|w1)/p(x|w2)。如果引入一个0-1损失或分类损失,那么判决边界将由a决定,7.4分类器、判别函数及判定面,7.4.1多类情况 常用的判别函数为gi(x), i=1,c的形式,如果对于所有的ji,有 gi(x) g

7、j(x) 则此分类器将这个特征向量x判为wi 分类器可视为一个网络或机器(图7-5)。,图7-5 一个包含d个输入c个判决函数gi(x)的一般的统计模式分类器的体系结构。接下来的步骤是确定哪个判别函数值最大,并相应的对输入作分类。箭头表示信息流的方向。,具有一般风险的情况下,让gi(x)=-R(i|x) 在最小误差概率情况下,让gi(x)=P(wi|x) 在最小误差概率情况下,一些常用选择:,图7-6在这个二维的两类问题的分类器中,概率密度为高斯分布,判决边界由两个双曲线构成,因此判决区域R2并非是简单的连通的。椭圆轮廓线标记出1/e乘以概率密度的峰值。,7.4.2两类情况:二类分类器 判别函

8、数 如果 则判为w1,否则判为w2 。 常用的个g(x)函数如下:,7.5正态密度,f(x)的数学期望,7.5.1单变量密度函数,单变量正态密度函数,期望值:,方差:,记为:,图7-7单变量正态分布大约有95%的区域在|x-|2范围内,如图所示。此分布的峰值为,7.5.2多元密度函数,d维多元正态密度的形式,其中,记为,协方差矩阵:,图7-8 特征空间中的一个线性变换将一个任意正态分布变换成另一个正态分布。,正态分布的性质: 服从正态分布的随机变量的线性组合还是一个正态分布。,白化变换,直线投影,图7-9从一个以均值为中心的云团内的二维高斯分布中取出的样本。椭圆显示了等概率密度的高斯分布轨迹。

9、,多元正态密度完全由d+d(d+1)/2个参数确定。从一正态分布中所抽取的样本点趋向于落在一个单一的云团或聚类中。等密度点的轨迹为一超椭圆体,这些椭圆体的主轴由的本征向量给出,本征值决定这些长轴的长度。,称为从x到的Mahalanobis距离或马氏距离。,等密度分布的边界是一些到 的恒定马氏距离的超椭圆体,且这些超椭圆体的体积决定了均值附近的样本的离散程度。 与Mahalanobis距离r对应的超椭圆体的体积为,其中Vd是一个d维单位超球体的体积,7.6正态分布的判别函数,可获得:,下面分几种特殊情况来讨论,最小误差概率分类可通过使用判决函数获得,情况1,省略无关常数后,可得简单的判别函数,表

10、示欧几里德范数,二次型展开可得:,,,和,可得等价的线性判别函数,wi0称为第i个方向的阈值或偏置。,超平面此方程可写成,图7-10 如果两种分布的协方差矩阵相等并且与单位阵成比例,那么它们成d维球状分布,其判决边界是一个d-1维归一化超平面,垂直于两个中心的连线。在这些一维,二维,三维的例子中,是假设在P(w1)=P(w2)的情况下来显示p(x|wi)和判决边界的。,其中,情况2,可简化为,将二次型展开,可得线性判别函数:,边界面方程为,判决边界是超平面,图7-11随着先验概率的改变,判决边界也随之改变;对于差别较大的离散先验概率而言,判决边界不会落于这些一维,二维及三维球状高斯分布的中心点之间,图7-12相等但非对称的高斯分布的概率密度及判决区域。判决超平面未必和均值连线垂直正交,情况3,去掉常量后,判别函数为二次型:,其中,在两类问题中,对应的判定面是超二次曲面。,图7-13在方差不相等的一维高斯分布情况下,可能产生并非单连通的判决区域,如P(w1)=P(w2)时这里所示的情况,判决区域不连通的情形,图7-14任意高斯分布导致一般超二次曲面的贝叶斯判决边界。反之,给定任意超二次曲面,就能求出两个高斯分布,其贝叶斯判决边界就是超二次曲面。它们的方差由常概率密度的围线表示,二维的例子,图7-15任意的三维高斯分布产生二维的超二次曲面的贝叶斯判决边界

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论