《贝叶斯决策理论》PPT课件.ppt_第1页
《贝叶斯决策理论》PPT课件.ppt_第2页
《贝叶斯决策理论》PPT课件.ppt_第3页
《贝叶斯决策理论》PPT课件.ppt_第4页
《贝叶斯决策理论》PPT课件.ppt_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章 贝叶斯决策理论,2.1 引言 2.2 几种常用的决策规则 2.2.1 基于最小错误率的贝叶斯决策 2.2.2 基于最小风险的贝叶斯决策 2.2.3 限定一类错误率,使另一类错误率最小 2.2.4 最小最大决策 2.2.5 分类器、判别函数及决策面 2.3 正态分布时的统计决策,2.1 引言,模式识别的目的就是要确定某一个给定的模式样本属于哪一类 可以通过对被识别对象的多次观察和测量,构成特征向量,并将其作为某一个判决规则的输入,按此规则来对样本进行分类,作为统计判别问题的模式分类,在获取模式的观测值时,有些事物具有确定的因果关系,即在一定的条件下,它必然会发生或必然不发生 例如识别一块模板是不是直角三角形,只要凭“三条直线边闭合连线和一个直角”这个特征,测量它是否有三条直线边的闭合连线并有一个直角,就完全可以确定它是不是直角三角形 这种现象是确定性的现象,但在现实世界中,由许多客观现象的发生,就每一次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性 只有在大量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性 特征值不是一个确定的向量,而是一个随机向量 此时,只能利用模式集的统计特性来分类,以使分类器发生错误的概率最小,作为统计判别问题的模式分类,统计识别的基本方法贝叶斯决策,应用贝叶斯决策的前提条件 已知各类别总体的概率分布 已知决策分类的类别数 在已知相关概率(类别先验概率和类条件概率分布)的情况下,特征空间中一个观察量的类别归属问题,2.2 几种常用的决策规则,主要学习最小错误率Bayes错误和最小风险决策;了解在更复杂情况下的几种决策规则 讨论决策规则用于模式识别的几个问题,2.2.1 基于最小错误率的贝叶斯决策,从尽量减少错误的角度出发,利用贝叶斯公式得出使错误最小的分类原则 以癌细胞识别的例子引出贝叶斯决策,贝叶斯决策的出发点,癌细胞识别,两类别问题细胞正常与异常 若仅利用先验概率进行分类 统计的角度得出的两类细胞的出现概率 无法实现正常与异常细胞的分类目的 先验概率提供的信息太少,要结合样本观测信息,为此需要利用类条件概率,贝叶斯公式,p,各类样本的分布情况,贝叶斯决策的几种表达形式,两类模式集分类问题 对一大批人进行癌症普查,患癌者以1类代表,正常人以2类代表 设被试验的人中患有癌症的概率为0.005,即P(1)=0.005,当然P(2)=1-0.005=0.995 现任意抽取一人,要判断他是否患有癌症。显然,因为P(2) P(1),只能说是正常的可能性大。如要进行判断,只能通过化验来实现,应用实例,设有一种诊断癌症的试验,其结果为“阳性”和“阴性”两种反应 若用这种试验来对一个病人进行诊断,提供的化验结果以模式x代表,这里x为一维特征,且只有x=“阳”和x=“阴”两种结果,寻找样本观测量,假设根据临床记录,发现这种方法有以下统计结果 患有癌症的人试验反应为阳性的概率=0.95,即p(x=阳|1)=0.95 患有癌症的人试验反应为阴性的概率=0.05,即p(x=阴|1)=0.05 正常人试验反应为阳性的概率=0.01,即p(x=阳|2)=0.01 正常人试验反应为阴性的概率=0.99,即p(x=阴|2)=0.99,观测量的类条件概率,应用贝叶斯决策,问题 若被化验的人具有阳性反应,他患癌症的概率为多少,即求P(1| x=阳)=? 这里P(1)是根据以往的统计资料得到的,为患癌症的先验概率。现在经过化验,要求出P(1| x=阳),即经过化验后为阳性反应的人中患癌症的概率,称为后验概率 计算0.323,最小错误率的证明,以一维情况为例证明贝叶斯决策确实对应最小错误率 统计意义上的错误率,即平均错误率,用P(e)表示,最小错误率的证明,错误率图示,以t为界确实使错误率最小,因为P(e/x)始终取最小 这个图在哪见过? 与图像分割中最优阈值对应的错误分割结果类似,最优阈值同样是基于最小错误概率 图像分割蕴含了与模式识别类似的思想,即判定给定像素属于目标还是背景,多类问题的贝叶斯决策,2.2.2 基于最小风险的贝叶斯决策,问题的提出:风险的概念 风险与损失紧密相连,如病情诊断、商品销售等问题 日常生活中的风险选择,所谓是否去冒险 最小风险贝叶斯决策考虑各种错误造成损失不同而提出的一种决策规则 “宁可错杀一千,也不放走一个”,以决策论的观点,决策空间:所以可能决策组成的集合 每个决策都将带来一定的损失,可表示为决策和自然状态的函数,一般决策表,相关的数学表示,条件期望损失,引入损失的概念,制定决策不能仅考虑最小错误率,而是要考虑采取的决策相应的损失是否最小 损失的数学表示,跟决策相关条件期望损失,条件风险,对于特定的x采取决策i 的期望损失,期望风险,最小风险贝叶斯决策,最小风险贝叶斯决策步骤,对两类问题,对两类问题,最小风险贝叶斯决策示例,最小风险贝叶斯决策示例,上一节的例子,检验呈阳性者患病概率是0.323 若按最小错误率决策:正常2 采用最小风险决策,需要用到损失函数 损失的评估是个关键问题,宁可虚惊一百 不可漏诊一人,最小风险贝叶斯决策的讨论,除了知道最小错误贝叶斯决策也需要的先验概率和类条件概率外,损失函数的确定往往也是一个难题 与最小错误贝叶斯决策的关系 差别在于是否考虑风险,即错误损失 最小风险决策可看作加权形式的最小错误决策,加权值即损失函数取特定形式时二者可能等价,如损失函数取0-1形式,定义损失函数,2.2.3 限定一类错误率,使另一类错误率最小,条件极值问题,利用拉格朗日乘子法将条件极值转化为无条件极值,条件极值问题,似然比决策规则比较,最终结果的似然比表示形式 最小错误率Bayes决策的表示形式 最小风险Bayes决策的表示形式,似然的含义,似然likelihood 表明在其他条件都相等的情况下,使得 较大的 更有可能是真实的类别,2.2.4 最小最大决策,以两类情况下的最小风险Bayes决策为例进行讨论,总风险公式,假定决策域已经确定,我们以 表示分类器判为 时的特征空间中的区域,同样有 和 ,于是总风险用条件风险的形式表示为,一旦 和 确定,风险 就是先验概率 的线性函数,可表示为,由上式可见,当类条件概率密度、损失函数ij 、类域Ri 取定后,R是P(1)的线性函数。 考虑P(1)的各种可能取值情况,为此在区间(0,1)中取若干个不同的P(1)值,并分别按最小损失准则确定相应的最佳决策类域R1、R2,然后计算出其相应的最小平均损失R*,从而可得最小平均损失R*与先验概率P(1)的关系曲线。,最小最大决策图示,最小风险R*与先验概率的关系曲线,先验概率取固定值的最小风险,先验概率为 的最小风险分类结果对应各种先验概率的风险变化,为何为切线?,尽管对应 的最小风险相对其他先验概率最大,但不管先验概率如何变化,此种分类风险恒定,从而使所有可能的最大风险最小化,小结:各种情况下的方法选择,在某些实际问题中,可能存在以下几种情况:,2.2.5 分类器、判别函数及决策面,应用前述Bayes决策规则,设计分类器对观察量实施分类 用于表达决策规则的某些函数称为判别函数;是直接用来对模式样本进行分类的准则函数 对于c类问题,按照决策规则把d维特征空间分成c个决策域,划分决策域的边界面称为决策面,多类问题最小错误率决策规则,多类问题判别函数,多类问题决策面,多类问题分类器,两类情况决策规则,两类问题判别函数,两类问题决策面,两类问题分类器,例题:教材23页,套公式,2.3 正态分布时的统计决策,贝叶斯分类器的结构可由条件概率密度和先验概率来决定 最受青睐的密度函数正态分布,也称高斯分布 合理性:中心极限定理表明,在相当一般的条件下,当独立随机变量的个数增加时,其和的分布趋于正态分布 简易性,2.3.1 正态分布的定义及性质,单变量正态分布由两个参数完全确定,即均值和方差,正态分布概率密度函数,在整个定义域上积分为1 服从正态分布的样本聚集在均值附近,其散布程度与标准差(方差)有关,多元正态分布,均值向量,协方差矩阵,多元正态分布的概率密度函数定义,协方差矩阵的计算,计算公式,,计算协方差矩阵。,已知,协方差矩阵的性质,对称非负定阵 元素正负? 元素含义:对角线和非对角线 协方差:用来度量变量之间“协同变异”大小的总体参数,即二者相互影响大小的参数;绝对值越大,相互影响越大 对角阵情形;去相关,多元正态分布的性质,均值向量和协方差矩阵共同决定分布 均值向量有d个分量 协方差矩阵独立元素个数为d(d+1)/2 多元正态分布由d+d(d+1)/2个参数完全决定,常表示为,多元正态分布的性质,等密度点的轨迹是超椭球面,多元正态分布的性质,马氏距离: 到 的Mahalanobis距离 等密度点轨迹是到均值向量的马氏距离为常数的超椭球面 样本离散度由 决定;同单变量正态分布类似,方差影响样本分布的疏密程度,椭圆主轴的确定,为简单处理,将椭球中心移至原点来求椭球长短轴,设 在超椭球上, 到超椭球中心的距离为 ,求主轴长度即是求其条件极值,构造Lagrange函数,对 的椭圆,第 i 个主轴的长度与的第 i 个特征值的平方根成正比,方向由对应特征向量的方向决定,多元正态分布的性质,不相关性等价于独立性,边缘分布和条件分布的正态性 线形变换的正态不变性 通过变换,能使本来相关的随机变量在新的坐标系中独立;便于处理,多元正态分布的性质,多元正态分布的性质,线形组合的正态不变性 线性变换的特例,2.3.2 多元正态下的最小错误率决策,下面根据上式对以下三种情况进行讨论。,决策面方程,(1) ,即每类的协方差矩阵都相等,而且类内各特征间相互独立,具有相等的方差, 如果先验概率不等,那么平方距离(欧氏距离)必须通过方差进行归一化,并通过增加 进行修正。, 如果先验概率相等 称其为最小距离分类器。,可看作线性分类器,对其,我们用一个二维二类模式例子,设先验概率相等,从几何上表示其关系(不相等的情况请参照教材P32),(2) ,即各类的协方差矩阵都相等,如果先验概率相等, 只要计算 到各类的均值点 的马氏距离平方,然后把 归于 距离平方最小的类别。,对以上两类情况进行化简,决策面方程,只要协方差矩阵相等,先验概率相等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论